OpenAI совершила значительный шаг, выпустив GPT-OSS — свое первое семейство по-настоящему открытых больших языковых моделей со времен GPT-2. С разрешительной лицензией Apache 2.0 это не просто минорный релиз; это фундаментальное изменение, которое возвращает реальную мощь в руки разработчиков.

Семейство включает две модели Mixture-of-Experts (MoE): gpt-oss-20b и gpt-oss-120b, разработанные для высокопроизводительного вывода с мощными возможностями рассуждения.

Почему это меняет правила игры

В течение многих лет самые мощные модели от OpenAI были заблокированы за API. Это означало необходимость иметь дело с ограничениями по запросам, непрозрачным ценообразованием и отправкой потенциально конфиденциальных данных третьей стороне. GPT-OSS полностью меняет это уравнение.

  • Полный контроль: Самостоятельное размещение этих моделей означает, что вы диктуете условия. Вы контролируете задержку, стоимость и конфиденциальность ваших приложений. Для любого, кто создает серьезные, готовые к производству системы, это не подлежит обсуждению.

  • Разрешительная лицензия: Лицензия Apache 2.0 имеет решающее значение. Она разрешает коммерческое использование, модификацию и распространение. Это открывает возможность создавать и продавать продукты на основе передовой модели OpenAI без ограничений, присущих API-сервисам.

  • Достойная производительность: Модель 120B — это серьезная инженерная разработка. Сообщается, что она работает наравне с некоторыми из лучших закрытых моделей в своем классе и эффективно функционирует на установке с 2xH100 GPU. Ее архитектура MoE с 4-битным квантованием создана для скорости.

Практичность самостоятельного размещения

Конечно, запуск модели со 117 миллиардами параметров — задача нетривиальная. Она требует значительных ресурсов GPU и технической настройки. Однако экосистема быстро развивается, чтобы решить именно эту проблему.

Платформы, такие как Northflank, упрощают этот процесс, предлагая шаблоны для развертывания GPT-OSS в один клик с такими инструментами, как vLLM для оптимизированного вывода и Open WebUI для взаимодействия. Ключевой вывод заключается в том, что барьер для самостоятельного размещения мощных моделей снижается, что делает это жизнеспособной стратегией для большего числа команд.

Для модели GPT-OSS-120B рекомендуемая установка — это кластер с 2xH100 GPU для обработки размера модели и достижения высокой пропускной способности.

Моё мнение

Это большая победа для сообщества открытого исходного кода в области ИИ. Она знаменует возвращение к принципам открытости, которые питали первоначальный бум ИИ. Для разработчиков и инженеров наличие открытой, высокопроизводительной модели от такого ключевого игрока, как OpenAI, обеспечивает новую основу для создания надежных, независимых систем ИИ. Свободу от ограничений по запросам и возможность глубокой интеграции модели в архитектуру продукта невозможно переоценить.

Этот шаг подталкивает всю индустрию к большей открытости, и я с нетерпением жду, что разработчики создадут с этой вновь обретенной свободой.

На основе информации из руководства по развертыванию Northflank.

Ссылка 1