Microsoft разработала Memora — систему эффективной долгосрочной памяти для ИИ-агентов

Подразделение Microsoft Research представило исследовательский проект Memora. Это новая архитектура памяти, призванная сделать долгосрочное хранение и извлечение информации ИИ-агентами более надежным и масштабируемым. В отличие от существующих решений, система организует знания вокруг абстракций и подсказок, а не просто хранит историю переписки в сыром виде.

Современные ИИ-агенты должны удерживать контекст на протяжении недель или даже месяцев. В обычных условиях это приводит к фрагментации данных, дублированию информации и замедлению работы системы по мере накопления базы знаний. По заявлению разработчиков, Memora решает эту проблему, разделяя процесс хранения данных и механизмы их поиска.

Ограничения современных архитектур памяти

Несмотря на высокую вычислительную мощность, современные большие языковые модели (LLM) часто начинают каждую сессию «с чистого листа». Длительные диалоги заставляют модели повторно перечитывать всю историю сообщений, что требует огромных вычислительных ресурсов. Существующие методы решения этой задачи имеют свои недостатки:

Системы RAG (генерация с расширенным поиском) индексируют фрагменты текста, что сохраняет детали, но приводит к потере логической связности.
Методы суммаризации сжимают данные в краткие отчеты, из-за чего теряются важные нюансы, числовые значения и специфические детали.
Графовые системы накладывают структуру поверх контента, но часто требуют жестких правил, которые плохо адаптируются к новым задачам.

Принцип разделения памяти и поиска

Архитектура Memora предлагает новый подход: каждая запись в памяти состоит из двух компонентов. Первый — это «первичная абстракция», короткая фраза из 6–8 слов, описывающая суть информации. Второй — «значение памяти», содержащее подробный контекст. Благодаря такому разделению новые данные по теме объединяются с уже существующими записями под одной абстракцией, что исключает появление частичных дубликатов.

Для поиска информации используются «якорные подсказки» — контекстно-зависимые теги, которые создаются автоматически. В системе также реализован механизм итеративного поиска. Вместо того чтобы просто выдавать наиболее похожие результаты, алгоритм уточняет запрос и расширяет зону поиска через подсказки, пока не соберет достаточно данных для ответа.

В обзоре экспертов отмечается, что ключевой недостаток текущих систем — подмена понятия «память» обычным «поиском». По словам аналитиков, корпоративному ИИ-агенту недостаточно просто находить похожий текст; он должен понимать, что изменилось, что остается актуальным, а какую информацию в конкретной ситуации использовать нельзя.

Результаты тестирования и производительность

Microsoft протестировала Memora на специализированных бенчмарках (наборах тестов) с длинным контекстом. В тесте LoCoMo, где диалоги в среднем длятся 600 реплик, точность составила 86,3%. В тесте LongMemEval с контекстом объемом 115 000 токенов (единиц текста) система показала точность 87,4%, опередив популярные решения, такие как RAG и Mem0.

Ключевые показатели эффективности системы:

Снижение потребления токенов контекста до 98% по сравнению с полной обработкой всей истории.
Сокращение количества записей в памяти почти в два раза по сравнению с аналогами.
Поддержание высокой точности ответов при значительном объеме накопленных данных.

Перспективы и вызовы для бизнеса

Несмотря на впечатляющие показатели экономии токенов, эксперты предупреждают, что это не всегда напрямую конвертируется в снижение затрат. Основной режим поиска Memora работает медленнее стандартных методов: обработка запроса занимает около 5–6 секунд из-за многоэтапности процесса, в то время как простые семантические модели справляются менее чем за секунду.

На текущий момент Memora остается исследовательским проектом, хотя Microsoft уже опубликовала исходный код на GitHub для ознакомления. Организациям, планирующим внедрение подобных технологий, потребуется разработать политику управления данными. Необходимо четко регламентировать, кто имеет право записывать данные в память ИИ, кто может их считывать и как долго они должны храниться, чтобы соответствовать требованиям регуляторов в области защиты персональных данных.