Система ASI-EVOLVE: ИИ, который сам себя улучшает, превосходя человеческие разработки

Система ASI-EVOLVE: ИИ, который сам себя улучшает, превосходя человеческие разработки

Разработка и исследование систем искусственного интеллекта (ИИ) традиционно требуют значительных ручных усилий инженеров на каждом этапе: от выдвижения гипотез до экспериментов и анализа. Новая платформа ASI-EVOLVE, созданная исследователями из Лаборатории исследований генеративного искусственного интеллекта (SII-GAIR), призвана устранить это узкое место, автоматизируя полный цикл оптимизации обучающих данных, архитектур моделей и алгоритмов обучения. Эта агентная система для исследования «ИИ для ИИ» работает по непрерывному циклу «обучение-проектирование-эксперимент-анализ», автоматизируя оптимизацию базового стека ИИ.

В ходе экспериментов цикл самосовершенствования системы ASI-EVOLVE самостоятельно выявил новые разработки, значительно превзошедшие передовые аналоги, созданные человеком. Система предложила инновационные архитектуры языковых моделей, улучшила конвейеры данных для предварительного обучения, что позволило повысить контрольные показатели более чем на 18 баллов, а также спроектировала высокоэффективные алгоритмы обучения с подкреплением. Для корпоративных команд, постоянно оптимизирующих свои ИИ-системы, платформа предоставляет возможность сократить ручные инженерные издержки, при этом достигая или превосходя производительность решений, разработанных человеком.

Ограничения текущих подходов к ИИ

Инженерные команды способны исследовать лишь малую долю огромного пространства возможных архитектур и настроек ИИ-моделей. Выполнение экспериментальных рабочих процессов требует значительных ручных усилий и частого вмешательства человека. Кроме того, знания, полученные в ходе этих дорогостоящих циклов, зачастую остаются в рамках индивидуальной интуиции или опыта, что затрудняет их систематическое сохранение и передачу для будущих проектов или между командами. Эти ограничения замедляют темпы и масштаб инноваций в области ИИ.

Искусственный интеллект добился впечатляющих успехов в научных открытиях – от специализированных инструментов, решающих конкретные биологические задачи, до агентных систем, отвечающих на базовые научные вопросы. Однако существующие фреймворки по-прежнему испытывают трудности с открытой инновационной деятельностью в области ИИ и в основном ограничены узкой оптимизацией в рамках очень специфических условий.

Развитие основных возможностей ИИ значительно сложнее. Оно включает модификацию крупных взаимозависимых кодовых баз, выполнение ресурсоемких экспериментов, потребляющих десятки и сотни часов работы графических процессоров (GPU), а также анализ многомерной обратной связи от динамики обучения.

По словам исследователей, существующие фреймворки пока не продемонстрировали, что ИИ может эффективно работать в таком режиме унифицированным образом, а также что он способен генерировать значимые достижения по трём основным столпам разработки ИИ, а не только в одной узкоспециализированной области.

Как ASI-EVOLVE учится исследовать

Для преодоления ограничений ручной научно-исследовательской работы система ASI-EVOLVE функционирует в непрерывном цикле, объединяющем предыдущие знания, генерацию гипотез, эксперименты и их уточнение. Система изучает релевантную информацию и исторический опыт из существующих баз данных, разрабатывает программу-кандидат, представляющую её следующую гипотезу, проводит эксперименты для получения оценочных сигналов и анализирует результаты, преобразуя их в многократно используемые, понятные человеку уроки, которые затем возвращаются в её базу знаний.

Ключевые компоненты ASI-EVOLVE

Работу ASI-EVOLVE обеспечивают несколько ключевых компонентов:

  • База знаний (Cognition Base) выступает в роли фундаментальной экспертной системы. Для ускорения поиска она предварительно загружается человеческими знаниями, эвристиками, относящимися к задачам, и известными ошибками, извлеченными из существующей литературы. Это направляет процесс исследования в перспективные направления с первой же итерации.
  • Анализатор (Analyzer) обрабатывает сложную многомерную обратную связь от экспериментов. Он разбирает журналы обучения, результаты бенчмарков и данные об эффективности, превращая их в компактные, действенные выводы и причинно-следственные анализы.
  • Агент-исследователь (Researcher) анализирует предыдущие знания из Базы знаний и прошлые экспериментальные результаты для генерации новых гипотез, предлагая либо локальные модификации кода, либо написание совершенно новых программ.
  • Компонент-инженер (Engineer) проводит фактические эксперименты. Поскольку эксперименты по обучению ИИ крайне затратны, Инженер оснащен мерами эффективности, такими как ограничения по времени выполнения и быстрые тесты для раннего отсева, чтобы отфильтровать ошибочные программы-кандидаты до того, как они потребят чрезмерное количество часов работы GPU.
  • База данных (Database) служит постоянной памятью системы, храня код, исследовательские мотивации, исходные результаты и окончательные отчеты Анализатора для каждой итерации, обеспечивая систематическое накопление знаний с течением времени.

Объединяя эти компоненты, ASI-EVOLVE гарантирует, что ИИ-агент систематически учится на сложной, реальной экспериментальной обратной связи, не требуя постоянного вмешательства человека. В отличие от предыдущих фреймворков, разработанных для эволюции решений, ASI-EVOLVE «эволюционирует само познание», отмечают исследователи. Накопленный опыт и полученные знания непрерывно сохраняются и извлекаются для информирования будущих исследований, что обеспечивает рост системы не только в качестве её решений, но и в способности рассуждать о том, где искать дальше.

Результаты экспериментов

В ходе своих экспериментов исследователи продемонстрировали, что ASI-EVOLVE успешно улучшает курирование данных, архитектуры моделей и алгоритмы обучения, способствуя созданию более совершенных систем ИИ.

Курирование данных

Для реальных корпоративных приложений высококачественные данные являются постоянным узким местом. При разработке стратегий очистки для массовых корпусов данных предварительного обучения, специфичных для разных категорий, ASI-EVOLVE инспектировала образцы данных и диагностировала проблемы качества, такие как артефакты HTML и несоответствия форматирования. Система автономно сформулировала пользовательские правила курирования, обнаружив, что систематическая очистка в сочетании с правилами сохранения, учитывающими специфику предметной области, значительно эффективнее агрессивной фильтрации.

В контрольных тестах модели с 3 миллиардами параметров, обученные на данных, курированных ИИ, показали средний прирост баллов почти на 4 пункта по сравнению с моделями, обученными на необработанных данных. Наибольший прирост наблюдался в задачах, требующих глубоких знаний, где производительность увеличилась более чем на 18 баллов в тесте «Масштабное многозадачное языковое понимание» (MMLU) – бенчмарке для больших языковых моделей (LLM), охватывающем задачи из областей естественных наук, технологий, инженерии, математики (STEM), гуманитарных и социальных наук.

Проектирование архитектуры

Помимо работы с данными, система продемонстрировала высокую эффективность в проектировании нейронных архитектур. За 1773 автономных раунда исследования она сгенерировала 105 новых архитектур линейного внимания, которые превзошли DeltaNet – высокоэффективную, разработанную человеком базовую модель. Для достижения этих результатов ASI-EVOLVE разработала многомасштабные механизмы маршрутизации, которые динамически корректируют вычислительный бюджет модели в зависимости от конкретного содержания входных данных.

Алгоритмы обучения с подкреплением

Наконец, в области проектирования алгоритмов обучения с подкреплением ASI-EVOLVE обнаружила новые механизмы оптимизации. Она разработала алгоритмы, которые превзошли конкурентный стандарт GRPO на сложных математических тестах, таких как AMC32 и AIME24. Один из успешных вариантов представил «Динамический радиус с ограничением бюджета», который удерживает обновления модели в рамках заданного бюджета, эффективно стабилизируя обучение на зашумленных данных.

Значение для корпоративного ИИ

Рабочие процессы в корпоративном ИИ постоянно требуют оптимизации существующих систем – от тонкой настройки моделей с открытым исходным кодом на собственных данных до внесения небольших изменений в архитектуры и алгоритмы. Как правило, вычислительные ресурсы и инженерные часы, необходимые для таких усилий, огромны и выходят за рамки возможностей большинства организаций. В результате многие вынуждены использовать неоптимизированные версии стандартных моделей ИИ.

По словам исследовательской группы, фреймворк разработан таким образом, чтобы предприятия могли интегрировать собственные отраслевые знания в репозиторий знаний ASI-EVOLVE и позволить автономному циклу выполнять итерации на внутренних ИИ-системах. Кроме того, исходный код ASI-EVOLVE был открыт, что делает базовую платформу доступной для разработчиков и создателей продуктов по всему миру.