DeepSeek против OSS от OpenAI: История двух моделей с открытым исходным кодом

Два крупных игрока недавно представили новые модели с открытым исходным кодом, но они представляют две принципиально разные философии. OpenAI, признанный лидер, с помпой вернулся на сцену открытого исходного кода со своей моделью gpt-oss-20b. Вскоре после этого китайский стартап DeepSeek незаметно выпустил v3.1. Если один релиз был медиа-событием, то другой — всего лишь одним твитом. Первоначальные результаты практического тестирования оказались явно односторонними. Производительность «из коробки»: Явный победитель Если оценивать модель как инструмент, который можно использовать прямо сейчас, сравнение даже близко не стоит. В ходе многочисленных практических тестов DeepSeek v3.1 стабильно демонстрировал превосходные результаты: ...

27 августа, 2025 · 3 минуты · 624 слова · Юрий Акинин

За пределами интерфейса: 5 ключевых отличий современных моделей ИИ

Пользователи видят окно чата. Иногда это голосовое взаимодействие, иногда работа с изображениями. Но за этим привычным интерфейсом скрываются радикально разные архитектуры и возможности. Вот пять ключевых параметров, которые отличают ведущие модели ИИ в 2025 году: 1. Память (окно контекста) Этот параметр определяет, какой объем информации модель может сохранять в рамках одного диалога. GPT-4o: 128 тысяч токенов (~300 страниц текста) Claude 3 Opus и Gemini 2.5 Pro: До 1 миллиона токенов (~2000 страниц) DeepSeek-VL Mini: ~8 тысяч токенов (~20 страниц) Больший объем памяти обеспечивает лучший контекст и снижает галлюцинации, но также требует более мощного оборудования. ...

19 апреля, 2025 · 2 минуты · 354 слова · Юрий Акинин