Google MLE-STAR: Агенты ИИ, автоматизирующие машинное обучение
Исследовательская группа Google Cloud представила MLE-STAR (Machine Learning Engineering via Search and Targeted Refinement) — систему агентов искусственного интеллекта, которая знаменует собой значительный шаг к полной автоматизации создания конвейеров машинного обучения. Для тех, кто провел бесчисленные часы за разработкой признаков, выбором моделей и оптимизацией гиперпараметров, это развитие заслуживает пристального внимания.
По своей сути, MLE-STAR выходит за рамки ограничений традиционного AutoML. Вместо того чтобы полагаться на заранее определенный набор моделей и методов, он использует инновационный подход, который сочетает внешние знания с внутренней оптимизацией.
Ключевое новшество: разработка с использованием веб-поиска
Самая новаторская особенность MLE-STAR — это его способность использовать веб-поиск для формирования своей стратегии. Он активно извлекает из интернета современные модели, фрагменты кода и лучшие практики. Это гарантирует, что создаваемые им решения не только статистически обоснованы на основе обучающих данных, но и основаны на последних достижениях в этой области.
Это фундаментальный сдвиг. Это означает, что система может адаптироваться и совершенствоваться по мере публикации новых исследований и методов сообществом ML, предотвращая устаревание ее основных возможностей.
Как это работает: Усовершенствованная архитектура
MLE-STAR использует сложную многоуровневую стратегию для достижения своих результатов:
- Вложенные циклы уточнения: Система использует двухуровневую архитектуру для систематической идентификации и оптимизации наиболее критически важных компонентов конвейера ML, от предварительной обработки данных до ансамблирования моделей.
- Самосовершенствующиеся ансамбли: Она выходит за рамки простого усреднения моделей, разрабатывая новые стратегии метаобучения для создания высокоэффективных ансамблевых моделей.
- Надежность и безопасность: Специализированные агенты занимаются такими важными задачами, как отладка, предотвращение утечки данных и обеспечение эффективного и правильного использования данных — ключевой фактор для систем, готовых к производству.
Производительность, говорящая сама за себя
Эффективность MLE-STAR была подтверждена в 22 сложных соревнованиях Kaggle, авторитетном бенчмарке для оценки производительности ML. Результаты впечатляют:
- Процент медалей: Достигнут 63,6% процент медалей по сравнению с 25,8% для лучших базовых систем.
- Золотые медали: Завоеваны золотые медали в 36,4% соревнований, что почти в три раза превышает показатель 12,1% у конкурентов.
- Надежность: Обеспечена 100% валидная подача результатов, что подчеркивает ее надежность и устойчивость по сравнению с базовым показателем 78,8%.
Почему это важно для индустрии
MLE-STAR — это больше, чем просто академический проект; он указывает на будущее прикладного ИИ. Автоматизируя сложные, трудоемкие задачи машинного обучения, он потенциально может значительно снизить барьер для входа для компаний и разработчиков. Это ускоряет циклы инноваций и демократизирует доступ к высокопроизводительному машинному обучению.
Кроме того, Google открыл исходный код, построенный на базе Agent Development Kit (ADK). Это дает разработчикам прямую возможность развивать, экспериментировать и ускорять свои собственные проекты, используя эту новую агентно-ориентированную структуру.
Это представляет собой четкий шаг к интеллектуальным, самосовершенствующимся системам, которые строят другие интеллектуальные системы — тенденция, которая определит следующее поколение развития ИИ.
Источник: Google Research Blog - MLE-STAR: A state-of-the-art machine learning engineering agent