Ученые университета Цинхуа предлагают ADELIE: улучшение извлечения информации с помощью выравненных больших языковых моделей вокруг задач, ориентированных на человека

 Tsinghua University Researchers Propose ADELIE: Enhancing Information Extraction with Aligned Large Language Models Around Human-Centric Tasks

“`html

Извлечение информации с помощью искусственного интеллекта

Извлечение информации (IE) – это ключевая область искусственного интеллекта, которая преобразует неструктурированный текст в структурированные, действенные данные. Традиционные большие языковые модели (LLM) зачастую не способны точно понимать и выполнять тонкие инструкции, необходимые для точного извлечения информации.

Проблемы и решения

Задачи IE заставляют модели различать и классифицировать текст в форматах, соответствующих заранее определенным структурам, таким как распознавание именованных сущностей и классификация отношений. Однако существующие LLM обычно терпят неудачи при выполнении тонкого понимания и выравнивания, необходимых для эффективного IE.

Исследователи из Университета Цинхуа представили новый подход под названием ADELIE (Aligning large language moDELs on Information Extraction). Этот подход использует специализированный набор данных IEInstruct, включающий более 83 000 примеров различных форматов IE, включая тройки, естественноязыковые ответы и JSON-выводы.

Результаты и применение

Метрики показывают, что модели ADELIE достигают лучших результатов. В оценках по удерживаемым наборам данных модель ADELIESFT показывает улучшение среднего F1-показателя на 5% по сравнению с стандартными выводами LLM в закрытых задачах IE. Улучшения более заметны для открытого IE, где модели ADELIE превосходят современные альтернативы на 3-4% в плане устойчивости и точности извлечения.

В заключение, методичное обучение и оптимизация ADELIE приводят к мощному выравниванию LLM с задачами IE, демонстрируя потенциал установления новых стандартов в извлечении информации и делая его ценным инструментом для множества приложений, от академических исследований до обработки реальных данных.

Подробнее о исследовании.

“`

Полезные ссылки: