OpenAI совершила значительный шаг, выпустив GPT-OSS — свое первое семейство по-настоящему открытых больших языковых моделей со времен GPT-2. С разрешительной лицензией Apache 2.0 это не просто минорный релиз; это фундаментальное изменение, которое возвращает реальную мощь в руки разработчиков.
Семейство включает две модели Mixture-of-Experts (MoE): gpt-oss-20b и gpt-oss-120b, разработанные для высокопроизводительного вывода с мощными возможностями рассуждения.
Почему это меняет правила игры
В течение многих лет самые мощные модели от OpenAI были заблокированы за API. Это означало необходимость иметь дело с ограничениями по запросам, непрозрачным ценообразованием и отправкой потенциально конфиденциальных данных третьей стороне. GPT-OSS полностью меняет это уравнение.
Полный контроль: Самостоятельное размещение этих моделей означает, что вы диктуете условия. Вы контролируете задержку, стоимость и конфиденциальность ваших приложений. Для любого, кто создает серьезные, готовые к производству системы, это не подлежит обсуждению.
Разрешительная лицензия: Лицензия Apache 2.0 имеет решающее значение. Она разрешает коммерческое использование, модификацию и распространение. Это открывает возможность создавать и продавать продукты на основе передовой модели OpenAI без ограничений, присущих API-сервисам.
Достойная производительность: Модель 120B — это серьезная инженерная разработка. Сообщается, что она работает наравне с некоторыми из лучших закрытых моделей в своем классе и эффективно функционирует на установке с 2xH100 GPU. Ее архитектура MoE с 4-битным квантованием создана для скорости.
Практичность самостоятельного размещения
Конечно, запуск модели со 117 миллиардами параметров — задача нетривиальная. Она требует значительных ресурсов GPU и технической настройки. Однако экосистема быстро развивается, чтобы решить именно эту проблему.
Платформы, такие как Northflank, упрощают этот процесс, предлагая шаблоны для развертывания GPT-OSS в один клик с такими инструментами, как vLLM
для оптимизированного вывода и Open WebUI
для взаимодействия. Ключевой вывод заключается в том, что барьер для самостоятельного размещения мощных моделей снижается, что делает это жизнеспособной стратегией для большего числа команд.
Для модели GPT-OSS-120B рекомендуемая установка — это кластер с 2xH100 GPU для обработки размера модели и достижения высокой пропускной способности.
Моё мнение
Это большая победа для сообщества открытого исходного кода в области ИИ. Она знаменует возвращение к принципам открытости, которые питали первоначальный бум ИИ. Для разработчиков и инженеров наличие открытой, высокопроизводительной модели от такого ключевого игрока, как OpenAI, обеспечивает новую основу для создания надежных, независимых систем ИИ. Свободу от ограничений по запросам и возможность глубокой интеграции модели в архитектуру продукта невозможно переоценить.
Этот шаг подталкивает всю индустрию к большей открытости, и я с нетерпением жду, что разработчики создадут с этой вновь обретенной свободой.
На основе информации из руководства по развертыванию Northflank.