За пределами интерфейса: 5 ключевых отличий современных моделей ИИ

Пользователи видят окно чата. Иногда это голосовое взаимодействие, иногда работа с изображениями. Но за этим привычным интерфейсом скрываются радикально разные архитектуры и возможности. Вот пять ключевых параметров, которые отличают ведущие модели ИИ в 2025 году: 1. Память (окно контекста) Этот параметр определяет, какой объем информации модель может сохранять в рамках одного диалога. GPT-4o: 128 тысяч токенов (~300 страниц текста) Claude 3 Opus и Gemini 2.5 Pro: До 1 миллиона токенов (~2000 страниц) DeepSeek-VL Mini: ~8 тысяч токенов (~20 страниц) Больший объем памяти обеспечивает лучший контекст и снижает галлюцинации, но также требует более мощного оборудования. ...

19 апреля, 2025 · 2 минуты · 354 слова · Юрий Акинин

DeepSeek-V3: Тихий релиз с впечатляющей локальной производительностью

DeepSeek в очередной раз применил свою стратегию «тихого релиза», представив новую модель DeepSeek-V3-0324 на Hugging Face без каких-либо громких анонсов. Вместо маркетингового шума они просто предоставили сообществу готовое решение для оценки. Я протестировал модель локально на Mac Studio, оснащенном чипом M3 Ultra, и был впечатлен производительностью, генерирующей более 20 токенов в секунду. Это знаменует собой значительное ускорение для запуска мощных моделей на локальном оборудовании, делая их жизнеспособным вариантом для разработчиков. ...

27 марта, 2025 · 1 минута · 104 слова · Юрий Акинин