DeepSeek против OSS от OpenAI: История двух моделей с открытым исходным кодом

Два крупных игрока недавно представили новые модели с открытым исходным кодом, но они представляют две принципиально разные философии. OpenAI, признанный лидер, с помпой вернулся на сцену открытого исходного кода со своей моделью gpt-oss-20b. Вскоре после этого китайский стартап DeepSeek незаметно выпустил v3.1. Если один релиз был медиа-событием, то другой — всего лишь одним твитом. Первоначальные результаты практического тестирования оказались явно односторонними. Производительность «из коробки»: Явный победитель Если оценивать модель как инструмент, который можно использовать прямо сейчас, сравнение даже близко не стоит. В ходе многочисленных практических тестов DeepSeek v3.1 стабильно демонстрировал превосходные результаты: ...

27 августа, 2025 · 3 минуты · 624 слова · Юрий Акинин

Новые модели NVIDIA с открытым исходным кодом устраняют языковой разрыв в ИИ

Подавляющее большинство разработок в области ИИ сосредоточено на нескольких языках, что создает значительный разрыв в возможностях для большей части мира. NVIDIA устраняет этот дисбаланс с помощью нового набора моделей и инструментов с открытым исходным кодом, предназначенных для расширения высококачественного речевого ИИ, с первоначальным акцентом на 25 европейских языках. Эта инициатива выходит за рамки простого выпуска моделей; она предоставляет базовые компоненты для создания локализованных, многоязычных ИИ-приложений. Цель состоит в том, чтобы дать разработчикам возможность создавать надежные инструменты, такие как многоязычные чат-боты, службы перевода в реальном времени и интеллектуальные боты для обслуживания клиентов для языков, часто игнорируемых основными технологиями, включая хорватский, эстонский и мальтийский. ...

16 августа, 2025 · 2 минуты · 376 слов · Юрий Акинин

DeepSeek-V3: Тихий релиз с впечатляющей локальной производительностью

DeepSeek в очередной раз применил свою стратегию «тихого релиза», представив новую модель DeepSeek-V3-0324 на Hugging Face без каких-либо громких анонсов. Вместо маркетингового шума они просто предоставили сообществу готовое решение для оценки. Я протестировал модель локально на Mac Studio, оснащенном чипом M3 Ultra, и был впечатлен производительностью, генерирующей более 20 токенов в секунду. Это знаменует собой значительное ускорение для запуска мощных моделей на локальном оборудовании, делая их жизнеспособным вариантом для разработчиков. ...

27 марта, 2025 · 1 минута · 104 слова · Юрий Акинин