Введение в ExCoT
Snowflake предлагает ExCoT — новую структуру ИИ, которая итеративно оптимизирует открытые LLM, сочетая рассуждения по цепочке (CoT) с оптимизацией предпочтений, основываясь исключительно на точности выполнения как обратной связи.
Проблема перевода текста в SQL
Перевод текстовых запросов в структурированные SQL-запросы является важной задачей для упрощения взаимодействия с базами данных. Однако этот процесс включает в себя множество сложностей, таких как связывание схем, обработка составного синтаксиса SQL и разрешение неоднозначностей в запросах пользователей. Хотя большие языковые модели (LLM) продемонстрировали хорошие результаты в различных областях, эффективность структурированных методов рассуждения, таких как CoT, в контексте перевода текста в SQL остается ограниченной.
Решение ExCoT
ExCoT представляет собой структурированную рамку, предназначенную для оптимизации открытых LLM путем сочетания рассуждений CoT и итеративной оптимизации предпочтений, используя как off-policy, так и on-policy DPO, ориентируясь исключительно на обратную связь по точности выполнения. ExCoT не использует внешние модели вознаграждения и аннотации от человека, полагаясь на внутренние шаги рассуждения и результаты выполнения.
Этапы работы ExCoT
Метод работает в два основных этапа: сначала он генерирует кандидатные данные CoT, проверенные с помощью off-policy DPO, что служит основой для контролируемой донастройки. Затем модель итеративно генерирует и уточняет данные CoT через on-policy DPO, постепенно улучшая точность на основе обратной связи от правильности выполнения.
Стратегия деления и завоевания
ExCoT использует детализированные рассуждения CoT, применяя стратегию деления и завоевания, где сложные запросы разбиваются на более простые подзапросы. Каждый подзапрос анализируется и решается независимо, прежде чем быть интегрированным в окончательный запрос. Эта структурированная декомпозиция позволяет модели более эффективно управлять сложностью и вложенными структурами, характерными для операций SQL.
Проверка выполнения
Проверка на основе выполнения служит основным механизмом для оценки правильности, где сгенерированные запросы проверяются путем сравнения их результатов выполнения с эталонными результатами. Неправильные и правильные запросы систематически сопоставляются, предоставляя явные сигналы для обучения на основе предпочтений.
Результаты экспериментов
Экспериментальная оценка ExCoT показала значительные улучшения в точности выполнения. Например, с моделью LLaMA-3.1 70B ExCoT повысил точность выполнения на наборе данных BIRD с 57.37% до 68.51%, а производительность на тестовом наборе Spider увеличилась с 78.81% до 86.59%. Сравнимые улучшения были зафиксированы и с моделью Qwen-2.5-Coder 32B.
Заключение
ExCoT представляет собой методическое продвижение в оптимизации структурированных рассуждений для открытых LLM, применяемых к задачам перевода текста в SQL. Интегрируя структурированные рассуждения CoT с оптимизацией предпочтений, ExCoT эффективно решает ограничения, выявленные в предыдущих методах.
Практическое применение ИИ
Изучите, как технологии искусственного интеллекта могут трансформировать ваш подход к работе. Найдите процессы, которые можно автоматизировать, и моменты взаимодействия с клиентами, где ИИ может добавить наибольшую ценность.
Ключевые показатели эффективности
Определите важные KPI, чтобы убедиться, что ваши инвестиции в ИИ действительно оказывают положительное влияние на бизнес. Выбирайте инструменты, которые соответствуют вашим потребностям и позволяют настраивать их под ваши цели.
Начало работы с ИИ
Начните с небольшого проекта, соберите данные о его эффективности и постепенно расширяйте использование ИИ в вашей работе. Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru.
Пример решения на основе ИИ
Посмотрите на практический пример решения на основе ИИ: бот продаж от itinai.ru/aisales, предназначенный для автоматизации общения с клиентами круглосуточно и управления взаимодействиями на всех этапах клиентского пути.