Новый AI-фреймворк ExCoT от Snowflake: оптимизация LLM для текстового SQL через структурированное рассуждение

Введение в ExCoT

Snowflake предлагает ExCoT — новую структуру ИИ, которая итеративно оптимизирует открытые LLM, сочетая рассуждения по цепочке (CoT) с оптимизацией предпочтений, основываясь исключительно на точности выполнения как обратной связи.

Проблема перевода текста в SQL

Перевод текстовых запросов в структурированные SQL-запросы является важной задачей для упрощения взаимодействия с базами данных. Однако этот процесс включает в себя множество сложностей, таких как связывание схем, обработка составного синтаксиса SQL и разрешение неоднозначностей в запросах пользователей. Хотя большие языковые модели (LLM) продемонстрировали хорошие результаты в различных областях, эффективность структурированных методов рассуждения, таких как CoT, в контексте перевода текста в SQL остается ограниченной.

Решение ExCoT

ExCoT представляет собой структурированную рамку, предназначенную для оптимизации открытых LLM путем сочетания рассуждений CoT и итеративной оптимизации предпочтений, используя как off-policy, так и on-policy DPO, ориентируясь исключительно на обратную связь по точности выполнения. ExCoT не использует внешние модели вознаграждения и аннотации от человека, полагаясь на внутренние шаги рассуждения и результаты выполнения.

Этапы работы ExCoT

Метод работает в два основных этапа: сначала он генерирует кандидатные данные CoT, проверенные с помощью off-policy DPO, что служит основой для контролируемой донастройки. Затем модель итеративно генерирует и уточняет данные CoT через on-policy DPO, постепенно улучшая точность на основе обратной связи от правильности выполнения.

Стратегия деления и завоевания

ExCoT использует детализированные рассуждения CoT, применяя стратегию деления и завоевания, где сложные запросы разбиваются на более простые подзапросы. Каждый подзапрос анализируется и решается независимо, прежде чем быть интегрированным в окончательный запрос. Эта структурированная декомпозиция позволяет модели более эффективно управлять сложностью и вложенными структурами, характерными для операций SQL.

Проверка выполнения

Проверка на основе выполнения служит основным механизмом для оценки правильности, где сгенерированные запросы проверяются путем сравнения их результатов выполнения с эталонными результатами. Неправильные и правильные запросы систематически сопоставляются, предоставляя явные сигналы для обучения на основе предпочтений.

Результаты экспериментов

Экспериментальная оценка ExCoT показала значительные улучшения в точности выполнения. Например, с моделью LLaMA-3.1 70B ExCoT повысил точность выполнения на наборе данных BIRD с 57.37% до 68.51%, а производительность на тестовом наборе Spider увеличилась с 78.81% до 86.59%. Сравнимые улучшения были зафиксированы и с моделью Qwen-2.5-Coder 32B.

Заключение

ExCoT представляет собой методическое продвижение в оптимизации структурированных рассуждений для открытых LLM, применяемых к задачам перевода текста в SQL. Интегрируя структурированные рассуждения CoT с оптимизацией предпочтений, ExCoT эффективно решает ограничения, выявленные в предыдущих методах.

Практическое применение ИИ

Изучите, как технологии искусственного интеллекта могут трансформировать ваш подход к работе. Найдите процессы, которые можно автоматизировать, и моменты взаимодействия с клиентами, где ИИ может добавить наибольшую ценность.

Ключевые показатели эффективности

Определите важные KPI, чтобы убедиться, что ваши инвестиции в ИИ действительно оказывают положительное влияние на бизнес. Выбирайте инструменты, которые соответствуют вашим потребностям и позволяют настраивать их под ваши цели.

Начало работы с ИИ

Начните с небольшого проекта, соберите данные о его эффективности и постепенно расширяйте использование ИИ в вашей работе. Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru.

Пример решения на основе ИИ

Посмотрите на практический пример решения на основе ИИ: бот продаж от itinai.ru/aisales, предназначенный для автоматизации общения с клиентами круглосуточно и управления взаимодействиями на всех этапах клиентского пути.

AI Framework ExCoT