Модель TRM: Как компактная 7M модель превосходит крупные AI в задачах рассуждения

Itinai.com two developers coding side by side in a minimalist 9e46852c 56ad 43df b8ce 5a8451c13b63 3

Понимание Tiny Recursive Model (TRM)

Tiny Recursive Model (TRM) — это компактная модель с 7 миллионами параметров, разработанная Samsung SAIT (Монреаль). Она демонстрирует превосходные способности к рассуждению по сравнению с более крупными моделями, такими как DeepSeek-R1, Gemini 2.5 Pro и o3-mini, на бенчмарках ARC-AGI 1 и ARC-AGI 2. TRM достигает точности тестирования 44.6-45% на ARC-AGI-1 и 7.8-8% на ARC-AGI-2, превосходя более крупные модели с значительно большим количеством параметров.

Ключевые инновации TRM

TRM вводит несколько архитектурных новшеств:

Единый малый рекуррентный ядро: TRM заменяет двухмодульную иерархию Модели Иерархического Рассуждения (HRM) на единую двухслойную сеть, которая поддерживает скрытую память z и текущее встраивание решения y.
Глубоко контролируемая рекурсия: Модель использует блок «думай-действуй», который разворачивается до 16 раз с глубоким контролем, что позволяет эффективно передавать сигналы на всех этапах.
Полное обратное распространение через цикл: В отличие от HRM, TRM осуществляет обратное распространение через все рекурсивные шаги, что является ключевым для обобщения.

Метрики производительности

Производительность TRM на различных бенчмарках вызывает интерес:

ARC-AGI-1: 44.6% точности
ARC-AGI-2: 7.8% точности
Sudoku-Extreme: 87.4% точности, что превышает 55.0% HRM
Maze-Hard: 85.3% точности, по сравнению с 74.5% HRM

Почему модель с 7 миллионами параметров может обойти более крупные LLM

Архитектура TRM позволяет ей превосходить более крупные модели благодаря:

Подход «решение-тогда-исправление»: TRM сначала формирует полное кандидатное решение, а затем уточняет его через итеративные проверки согласованности, что снижает предвзятость.
Эффективная глубина за счет рекурсии: Глубина модели достигается через рекурсию, а не за счет наслоения слоев, что приводит к лучшему обобщению при постоянных вычислениях.
Более строгая индуктивная предвзятость для рассуждений по сетке: Для меньших фиксированных сеток, таких как Судоку, TRM использует смешение без внимания для повышения производительности.

Заключение

Tiny Recursive Model представляет собой значительный шаг в направлении архитектурной эффективности, демонстрируя, что компактная модель может достигать конкурентоспособной производительности в сложных задачах рассуждения. Исследовательская группа разместила код на GitHub, что способствует дальнейшему изучению эффективных моделей ИИ.

Часто задаваемые вопросы

1. Какова основная цель TRM?

Основная цель TRM — предоставить эффективное решение для задач рассуждения с минимальным количеством параметров.

2. Как TRM достигает высокой точности на бенчмарках?

TRM достигает высокой точности благодаря своей уникальной архитектуре и глубокому контролю на каждом этапе рассуждения.

3. В чем преимущества использования TRM в бизнесе?

TRM может значительно сократить затраты на вычисления и время, необходимое для получения решений, что делает его идеальным для автоматизации бизнес-процессов.