Google EmbeddingGemma: Новый Претендент для RAG на Устройствах

Обычно я использую OpenAI для эмбеддингов, но новая модель Google EmbeddingGemma — это заметное событие. Это не просто еще одна модель; это стратегический шаг, который демонстрирует реальные перспективы для улучшения конвейеров Retrieval-Augmented Generation (RAG), особенно в приложениях на устройствах и на периферии. Что такое EmbeddingGemma? Google выпустила EmbeddingGemma как легкую, эффективную и многоязычную модель эмбеддингов. С объемом всего в 308 миллионов параметров, она разработана для высокой производительности в условиях ограниченных ресурсов. Речь идет не просто о создании меньшей модели; речь идет о создании способной маленькой модели. ...

5 сентября, 2025 · 2 минуты · 1 слово · Юрий Акинин

Векторный поиск достигает своих пределов. Что дальше?

Векторные базы данных стали ключевым компонентом современного ИИ, особенно для реализации генерации с дополненной выборкой (RAG) через поиск по сходству. Однако по мере создания более сложных приложений становятся очевидными ограничения использования исключительно векторных представлений. С моей точки зрения, основная проблема заключается в том, что продвинутые системы ИИ должны понимать больше, чем просто семантическое сходство. Им необходимо более глубокое понимание данных, включающее структурированные атрибуты, текстовую точность и взаимосвязи внутри и между различными модальностями, такими как текст, изображения и видео. Опора только на базовый векторный поиск создает значительные слепые зоны. ...

13 августа, 2025 · 4 минуты · 656 слов · Юрий Акинин

Мой взгляд на GPT-5, стратегию OpenAI и наступление «эпохи ИИ»

Недавняя статья Джона Свиоклы в Forbes дала название тому, что многие из нас в сфере ИИ давно ощущали: переход к «эпохе ИИ» (AI Time). Это идея о том, что темп инноваций и организационных операций больше не диктуется человеческой скоростью, а определяется почти мгновенным циклом кремниевого интеллекта. Запуск GPT-5 от OpenAI — это мастер-класс в этой новой реальности. Это было не просто обновление модели; это было многостороннее стратегическое развертывание, которое меняет конкурентную среду. Я рассматриваю это как «квадрупл-плей», устанавливающий новую базовую линию для отрасли. ...

13 августа, 2025 · 3 минуты · 557 слов · Юрий Акинин

MCP: Распространенные ошибки и почему это будущее интеграции ИИ

Хотя фреймворк Модель-Контекст-Промпт (MCP) является мощным прорывом, его реализация сопряжена с трудностями. Избегание распространенных ошибок крайне важно для раскрытия его полного потенциала. Распространенные ошибки, которых следует избегать 1. Плохо определенный контекст Самая частая ошибка — плохо определенный контекст. Эффективность любой модели ИИ, использующей MCP, полностью зависит от качества, ясности и релевантности получаемого ею контекста. Статический против динамического контекста: Распространенная ошибка — жесткое кодирование статических значений. Контекст должен быть динамическим, отражая состояния системы в реальном времени, чтобы быть эффективным. Перегрузка или недогрузка данных: Отправка слишком большого, слишком малого или нерелевантного объема данных приводит к снижению производительности и непредсказуемым результатам. Сосредоточьтесь на качестве, а не на количестве. 2. Пренебрежение безопасностью Неспособность защитить конфиденциальную контекстную информацию открывает двери для значительных рисков конфиденциальности и соответствия требованиям. Крайне важно обеспечить строгий контроль доступа и защиту данных с самого начала, а не в качестве второстепенной задачи. ...

13 августа, 2025 · 2 минуты · 255 слов · Юрий Акинин

Контекстное окно Claude Sonnet 4 на 1 миллион токенов: Практический взгляд для разработчиков

Anthropic только что объявила об увеличении контекстного окна Claude Sonnet 4 в 5 раз, доведя его до 1 миллиона токенов. Хотя большие числа в ИИ являются обычным явлением, этот шаг имеет ощутимые, практические последствия для тех из нас, кто создает сложные системы. С моей точки зрения, это не просто количественный скачок; это качественный скачок, который открывает новый класс проблем, которые мы можем решить. Переход от анализа файлов к пониманию на уровне системы Возможность загрузить всю кодовую базу — более 75 000 строк с исходными файлами, тестами и документацией — в один запрос является значительным изменением. Ранее анализ кода с помощью ИИ часто ограничивался отдельными файлами или небольшими модулями. Мы могли проверять ошибки или рефакторить конкретную функцию, но ИИ не хватало целостного представления. ...

13 августа, 2025 · 2 минуты · 424 слова · Юрий Акинин

Почему Docker называет MCP «кошмаром безопасности» — и как это исправить

Почему Docker называет MCP «кошмаром безопасности» — и как это исправить Протокол контекста модели (Model Context Protocol, MCP) был представлен как универсальный стандарт — «USB-C для приложений ИИ» — для обеспечения беспрепятственного взаимодействия агентов ИИ с внешними инструментами, API и данными. Крупные игроки, такие как Microsoft, Google и OpenAI, быстро приняли его, и появились тысячи серверных инструментов MCP. Обещание было простым: написать интеграцию один раз, и любой агент ИИ сможет ее использовать. ...

6 августа, 2025 · 4 минуты · 654 слова · Юрий Акинин

Как я нанимаю людей в свою команду

Для меня главное — человек, а не резюме. В первую очередь я обращаю внимание на мотивацию и энергию. Если человек безразличен, это немедленное «нет», даже если у него есть нужные навыки. Мне нужно понять, что им движет, почему они хотят быть в команде и что для них значит работа. Мягкие навыки на первом месте Я уделяю первостепенное внимание пониманию того, как кандидат мыслит, общается и реагирует на изменения. Я ищу инициативность, системный подход и способность брать на себя ответственность. Если человек просто ждет, когда ему поручат задачи, он не подходит моей команде. ...

2 августа, 2025 · 2 минуты · 296 слов · Юрий Акинин

AVELIN запущен: трехлетний путь к новому ИИ

Сегодня мы официально запускаем *AVELIN* — искусственный интеллект, который моя команда и я создавали последние три года. Наш путь начался со скромных пилотных проектов, экспериментов с первыми моделями GPT и проведения базовых тестов. Мы быстро эволюционировали от простых чат-ботов с одной моделью до разработки нашей собственной проприетарной системы обучения, включающей поглощение знаний, хранение документов и наши первые реализации генерации с дополненной выборкой (RAG). ...

17 июля, 2025 · 2 минуты · 279 слов · Юрий Акинин

Дневник основателя: 10 дней до запуска AVELIN

Я хотел поделиться тем, каково это — финальный этап перед запуском ИИ-продукта. До выхода AVELIN в свет осталось всего 10 дней, давление колоссальное, и реальность представляет собой смесь контролируемого хаоса и предельной сосредоточенности. Наша команда чувствует напряжение. По мере того как задачи накапливаются, а сроки поджимают, усталость становится реальным фактором. Мы постоянно боремся с дилеммой: добавить «еще одну вещь» или зафиксировать дату релиза и двигаться вперед. ...

7 июля, 2025 · 2 минуты · 345 слов · Юрий Акинин

Дневник ИИ-стартапа

Эта серия постов будет моим способом документирования пути создания одного из самых амбициозных продуктов нашей команды: интеллектуального помощника A.V.E.L.I.N. Чтобы дать вам немного контекста, моя команда разработчиков и я в настоящее время бета-тестируем проект в рамках нашей AI-платформы Mozgii Ecosystem. Наше основное внимание сосредоточено на A.V.E.L.I.N. — интеллектуальном персональном помощнике в Telegram, созданном для решения как базовых, так и сложных задач, включающих поиск, обработку и анализ информации с использованием ИИ. ...

1 мая, 2025 · 1 минута · 1 слово · Юрий Акинин