DeepSeek против OSS от OpenAI: История двух моделей с открытым исходным кодом

Два крупных игрока недавно представили новые модели с открытым исходным кодом, но они представляют две принципиально разные философии. OpenAI, признанный лидер, с помпой вернулся на сцену открытого исходного кода со своей моделью gpt-oss-20b. Вскоре после этого китайский стартап DeepSeek незаметно выпустил v3.1. Если один релиз был медиа-событием, то другой — всего лишь одним твитом.

Первоначальные результаты практического тестирования оказались явно односторонними.

Производительность «из коробки»: Явный победитель

Если оценивать модель как инструмент, который можно использовать прямо сейчас, сравнение даже близко не стоит. В ходе многочисленных практических тестов DeepSeek v3.1 стабильно демонстрировал превосходные результаты:

Кодирование: DeepSeek с первой попытки сгенерировал функциональный, без ошибок код для сложной игры. В отличие от этого, gpt-oss-20b либо выдавал ошибку по таймауту, либо производил неработающий, непригодный для использования результат.
Креативное письмо: DeepSeek создал убедительную, логически последовательную историю. Модель OpenAI произвела абстрактное, философски перегруженное повествование, содержащее резкие логические ошибки.
Рассуждение: Столкнувшись с детективной загадкой, DeepSeek правильно решил ее с четкой цепочкой рассуждений. gpt-oss-20b застрял в ошибочных логических циклах, исчерпал все свое контекстное окно, не дав ответа, или просто не смог понять задачу.
Обработка деликатных тем: При столкновении с деликатным сценарием, связанным с зависимостью, OpenAI по умолчанию отвечал общим «Я не могу помочь с этим». DeepSeek распознал человеческий кризис, стоящий за запросом, отказался давать вредные советы и вместо этого предложил сострадательные ресурсы по снижению вреда. Он продемонстрировал уровень эмоционального интеллекта, полностью отсутствующий у его конкурента.

С чисто продуктовой точки зрения, DeepSeek v3.1 является победителем. Он просто работает.

Стратегическое поле битвы: За пределами кода

История не заканчивается на тестах производительности. Контекст, стоящий за этими моделями, раскрывает более глубокое стратегическое соперничество.

Эффективность DeepSeek — это не просто функция; это стратегическая необходимость. Разработанный под давлением экспортного контроля США, ограничивающего доступ к высококлассному оборудованию, DeepSeek оптимизировался для иной реальности. Их успех доказывает, что чистая вычислительная мощность — не единственный путь вперед; алгоритмические инновации в условиях ограничений являются мощным двигателем. Они строят будущее, в котором должны быть самодостаточными, с акцентом на совместимость с появляющимися китайскими отечественными чипами.

И наоборот, невыразительная производительность gpt-oss подтверждается академическим анализом. Всесторонняя оценка показала, что модели относятся к «среднему уровню», причем самым удивительным результатом стало то, что меньший вариант gpt-oss-20b стабильно превосходит массивный вариант gpt-oss-120b. Это явный случай «обратного масштабирования», предполагающий, что простое добавление большего количества параметров без архитектурного усовершенствования может привести к уменьшению или даже отрицательной отдаче.

Спасательный круг кастомизации для OpenAI

Здесь OpenAI одерживает свою единственную, но потенциально решающую победу. Истинная сила модели с открытым исходным кодом заключается не только в ее первоначальных возможностях, но и в том, что с ней делает сообщество.

Разработчики уже приняли gpt-oss-20b, создавая урезанные, специализированные версии для математики, юриспруденции и исследований. Они удалили слои цензуры, чтобы создать истинную базовую модель, открывая двери для тонкой настройки и новых вариантов использования. Модель с открытым исходным кодом, которая привлекает разработчиков, может развиваться далеко за пределы своего первоначального состояния.

DeepSeek, будучи более новой, лишена этой экосистемы. Сообщество решает окончательную судьбу модели, и импульс в настоящее время на стороне OpenAI, несмотря на ее техническое превосходство на старте.

Мой вердикт: Продукт против Потенциала

Мы рассматриваем два разных актива:

DeepSeek v3.1 — это превосходный продукт. Это хорошо выполненная инженерная разработка, которая приносит немедленную ценность и представляет собой мощное новое направление в разработке ИИ, ориентированное на эффективность.
gpt-oss-20b от OpenAI — это основа. Его текущая производительность разочаровывает, но его ценность — это ставка на экосистему открытого исходного кода. Его будущее будет написано тысячами разработчиков, а не только OpenAI.

Настоящий победитель — это отрасль. Нарратив о том, что прогресс ИИ заключается только в создании все более крупных моделей с безграничным оборудованием, оспаривается. Конкуренция больше не только о масштабе, но об эффективности, архитектуре и сообществе. DeepSeek доказал, что «лучшая мышеловка» может появиться откуда угодно, в то время как OpenAI напомнил нам, что в мире открытого исходного кода платформа с наибольшим количеством разработчиков часто выигрывает в долгосрочной перспективе.

Производительность «из коробки»: Явный победитель#

Стратегическое поле битвы: За пределами кода#

Спасательный круг кастомизации для OpenAI#

Мой вердикт: Продукт против Потенциала#

Производительность «из коробки»: Явный победитель

Стратегическое поле битвы: За пределами кода

Спасательный круг кастомизации для OpenAI

Мой вердикт: Продукт против Потенциала