#БЯМ | Главная

GPT-OSS от OpenAI: Важный шаг к возвращению к «открытости»

OpenAI совершила значительный шаг, выпустив GPT-OSS — свое первое семейство по-настоящему открытых больших языковых моделей со времен GPT-2. С разрешительной лицензией Apache 2.0 это не просто минорный релиз; это фундаментальное изменение, которое возвращает реальную мощь в руки разработчиков. Семейство включает две модели Mixture-of-Experts (MoE): gpt-oss-20b и gpt-oss-120b, разработанные для высокопроизводительного вывода с мощными возможностями рассуждения. Почему это меняет правила игры В течение многих лет самые мощные модели от OpenAI были заблокированы за API. Это означало необходимость иметь дело с ограничениями по запросам, непрозрачным ценообразованием и отправкой потенциально конфиденциальных данных третьей стороне. GPT-OSS полностью меняет это уравнение. ...

Контекстное окно Claude Sonnet 4 на 1 миллион токенов: Практический взгляд для разработчиков

Anthropic только что объявила об увеличении контекстного окна Claude Sonnet 4 в 5 раз, доведя его до 1 миллиона токенов. Хотя большие числа в ИИ являются обычным явлением, этот шаг имеет ощутимые, практические последствия для тех из нас, кто создает сложные системы. С моей точки зрения, это не просто количественный скачок; это качественный скачок, который открывает новый класс проблем, которые мы можем решить. Переход от анализа файлов к пониманию на уровне системы Возможность загрузить всю кодовую базу — более 75 000 строк с исходными файлами, тестами и документацией — в один запрос является значительным изменением. Ранее анализ кода с помощью ИИ часто ограничивался отдельными файлами или небольшими модулями. Мы могли проверять ошибки или рефакторить конкретную функцию, но ИИ не хватало целостного представления. ...

Claude Opus 4.1: Сфокусированное Обновление в Кодировании и Взвешенная Позиция в Отношении Автономии

Anthropic выпустила Claude Opus 4.1 — инкрементальное, но важное обновление, которое оттачивает возможности флагманской модели в конкретных, высокоценных областях: агентные задачи, реальное кодирование и рассуждение. Это не полная переработка, а сфокусированное улучшение для профессиональных и разработческих сценариев использования. Улучшенное Кодирование и Рассуждение Основное улучшение заключается в производительности кодирования. Opus 4.1 достигает 74,5% на бенчмарке SWE-bench Verified. Углубляясь в технические детали, модель решила в среднем 18,4 задачи из сложного подмножества, по сравнению с 16,6 для Claude Opus 4. ...

DeepSeek-V3: Тихий релиз с впечатляющей локальной производительностью

DeepSeek в очередной раз применил свою стратегию «тихого релиза», представив новую модель DeepSeek-V3-0324 на Hugging Face без каких-либо громких анонсов. Вместо маркетингового шума они просто предоставили сообществу готовое решение для оценки. Я протестировал модель локально на Mac Studio, оснащенном чипом M3 Ultra, и был впечатлен производительностью, генерирующей более 20 токенов в секунду. Это знаменует собой значительное ускорение для запуска мощных моделей на локальном оборудовании, делая их жизнеспособным вариантом для разработчиков. ...