Исследователи Microsoft предлагают фреймворк Auto Evol-Instruct для создания наборов данных инструкций с использованием больших языковых моделей без участия человека.

 Microsoft Researchers Propose Auto Evol-Instruct: An End-to-End AI Framework that Evolves Instruction Datasets Using Large Language Models without Any Human Effort

“`html

Большие языковые модели (LLM) в искусственном интеллекте

Большие языковые модели (LLM) играют центральную роль в развитии искусственного интеллекта, сосредотачиваясь на улучшении способности моделей следовать детальным инструкциям. Эта область исследований охватывает методы улучшения качества и сложности наборов данных, используемых для обучения LLM, что в конечном итоге приводит к созданию более сложных и универсальных систем искусственного интеллекта.

Основные проблемы и решения

Одной из основных проблем в этой области является зависимость от высококачественных наборов данных для инструкций, которые сложно размечать в масштабе. Ручные методы требуют значительной экспертизы и ресурсов, что затрудняет достижение последовательных улучшений в различных задачах. Для преодоления этого ограничения исследователи активно ищут способы улучшения сложности и разнообразия наборов данных без необходимости обширного вмешательства человека.

Auto Evol-Instruct: автоматизированное улучшение инструкционных наборов данных

Auto Evol-Instruct – это инновационный подход, который использует LLM для автономного создания методов эволюции, обеспечивая экономичную адаптацию к различным задачам путем изменения входных данных. Этот фреймворк начинается с универсального начального метода эволюции, который автономно анализирует входные инструкции и формулирует правила эволюции. Затем эти правила итеративно оптимизируются оптимизатором LLM, который выявляет и устраняет проблемы в методах эволюции, обеспечивая минимальное количество неудач и улучшая сложность и разнообразие набора данных.

Результаты и перспективы

Auto Evol-Instruct продемонстрировал впечатляющие результаты на нескольких бенчмарках, превзойдя человечески созданные методы и показав свой потенциал для развития области искусственного интеллекта. Его эффективность в улучшении следования инструкциям, математического рассуждения и генерации кода подтверждается впечатляющими результатами на различных бенчмарках.

Подробнее о работе можно узнать в статье. Вся заслуга за это исследование принадлежит его авторам. Также не забудьте подписаться на наш Twitter.

Присоединяйтесь к нашему каналу в Telegram и группе в LinkedIn.

Если вам понравилась наша работа, вам понравится и наша рассылка.

Не забудьте присоединиться к нашему сообществу в Reddit.


“`

Полезные ссылки: