Модель TAG: улучшенная генерация с до 65% точности и 3.1 раза быстрее выполнение запросов на естественном языке.

 Table-Augmented Generation (TAG): A Breakthrough Model Achieving Up to 65% Accuracy and 3.1x Faster Query Execution for Complex Natural Language Queries Over Databases, Outperforming Text2SQL and RAG Methods

“`html

Искусственный интеллект и базы данных

Искусственный интеллект (ИИ) и системы управления базами данных все чаще сливаются, что имеет значительный потенциал для улучшения взаимодействия пользователей с большими наборами данных. Недавние достижения направлены на то, чтобы позволить пользователям задавать вопросы на естественном языке напрямую базам данных и получать детальные, сложные ответы. Однако текущие инструменты ограничены в решении реальных задач. Традиционные модели ИИ, такие как языковые модели (LM), обладают мощными способностями рассуждения, в то время как базы данных обеспечивают высокую точность вычислений в масштабе. Основная задача заключается в объединении этих двух возможностей для расширения области и точности ответов, которые пользователи могут получить от запросов, основанных на базах данных.

Проблемы существующих методов

Одной из насущных проблем в этой области является недостаточность существующих методов, таких как Text2SQL и Retrieval-Augmented Generation (RAG). Text2SQL фокусируется на простых переводах естественноязыковых запросов в SQL, что ограничивает его способность отвечать на более сложные, контекстно-ориентированные запросы, требующие семантического рассуждения. Например, бизнес-пользователи часто должны отвечать на вопросы вроде “Почему у нас упали продажи в прошлом квартале?” или “Какие отзывы клиентов о продукте X положительные?” Text2SQL не может адекватно отвечать на такие вопросы, поскольку они требуют понимания естественного языка за пределами простых реляционных данных. Аналогично, системы RAG выполняют базовые поисковые запросы в базах данных, но они неэффективны в обработке более широких, многоэтапных запросов, требующих взаимодействия с несколькими строками данных или агрегации результатов из нескольких таблиц. Этот недостаток сложности в текущих моделях затрудняет их применение в реальном мире, особенно в бизнес-контекстах, где анализ и интерпретация данных выходят за рамки простого извлечения данных.

Метод Table-Augmented Generation (TAG)

Исследователи из Университета Калифорнии в Беркли и Стэнфордского университета предложили новый метод под названием Table-Augmented Generation (TAG). TAG разработан для объединения семантических способностей языковых моделей с масштабируемой вычислительной мощностью баз данных, что позволяет более сложным взаимодействиям между ними. Этот метод учитывает, что реальные пользователи часто задают вопросы, выходящие за возможности Text2SQL и RAG. Сначала TAG преобразует естественноязыковый запрос пользователя в исполняемый запрос базы данных, который затем обрабатывается базой данных для извлечения соответствующих данных. Извлеченные данные объединяются с исходным запросом, и языковая модель генерирует подробный ответ. Этот процесс позволяет TAG обрабатывать запросы, требующие мирового знания, логического рассуждения и точных вычислений над большими наборами данных.

Преимущества TAG

Модель TAG разбивает процесс вопросно-ответной системы на три ключевых этапа: синтез запроса, выполнение и генерация ответа. Сначала система интерпретирует естественноязыковой запрос и переводит его в запрос к базе данных. Затем этот запрос выполняется в базе данных, извлекая соответствующие строки данных. Наконец, языковая модель обрабатывает эти извлеченные данные, генерируя подробный и контекстно-связанный ответ для пользователя. Этот трехэтапный процесс позволяет TAG обрабатывать широкий спектр вопросов, которые были бы слишком сложны для существующих методов. Исследователи продемонстрировали способность системы через бенчмарк-тесты, показав, что модель TAG могла правильно отвечать на до 65% сложных запросов, что является значительным улучшением по сравнению с 20% успешности лучших существующих моделей.

Результаты и преимущества

В дополнение к превосходству над Text2SQL и RAG, TAG универсален в типах запросов, которые он может обрабатывать. Исследователи тестировали систему в различных областях, включая бизнес-аналитику, анализ настроений клиентов и анализ финансовых тенденций. Например, один запрос сводился к обобщению отзывов о самом прибыльном фильме о любви, считающемся классикой. TAG синтезировал соответствующие данные, включая название фильма, доход и отзывы, и предоставил детальный ответ, что традиционные системы не смогли сделать. Система была протестирована на 80 запросах, охватывающих такие области, как Формула 1, использование дебетовых карт и образование. В большинстве случаев производительность TAG превзошла производительность существующих моделей, подтверждая его более широкую применимость.

Результаты бенчмарка показали, что TAG достиг средней точности точного совпадения 55% по различным типам запросов, при этом конкретные типы, такие как сравнительные запросы, достигли точности 65%. В сравнении Text2SQL в большинстве случаев не удалось достичь 20%, а RAG во многих случаях не смог предоставить ни одного правильного ответа. Ручная реализация пайплайна TAG, построенная на основе времени выполнения LOTUS, также продемонстрировала преимущество во времени выполнения, завершая большинство задач в среднем за 2,94 секунды, в 3,1 раза быстрее, чем традиционные методы. Эта эффективность, в сочетании с улучшенной точностью, делает TAG высоко перспективным инструментом для будущего управления базами данных на основе ИИ.

Заключение

Путем объединения языковых моделей с базами данных TAG открывает новые возможности для ответов на сложные запросы на естественном языке, требующие детального рассуждения и точных вычислений. Этот подход решает ключевое ограничение текущих моделей, позволяя им обрабатывать более широкий спектр запросов более точно и эффективно. Способность TAG обрабатывать вопросы, требующие мирового знания, логики и семантического рассуждения, демонстрирует его потенциал для трансформации принятия решений на основе данных в различных областях, включая бизнес-аналитику, анализ отзывов клиентов и прогнозирование тенденций. Через этот инновационный подход исследователи решили давнюю проблему интеграции ИИ и баз данных, и проложили путь для дальнейших достижений в области взаимодействия пользователей с данными в масштабе.

Источник изображения

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также, не забудьте подписаться на нас в Twitter и LinkedIn. Присоединяйтесь к нашему Telegram-каналу.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему сообществу на Reddit.

Источник: MarkTechPost


“`

Полезные ссылки: