Исследователи из Университета Вашингтона и Meta AI представили простой метод контекстно-ориентированной декодирования (CAD), чтобы заставить языковую модель обращать внимание на свой контекст во время генерации.

 Researchers from the University of Washington and Meta AI Present a Simple Context-Aware Decoding (CAD) Method to Encourage the Language Model to Attend to Its Context During Generation

Исследователи из Университета Вашингтона и Meta AI представили простой метод контекстно-ориентированной декодировки (CAD), чтобы стимулировать языковую модель обращать внимание на свой контекст во время генерации.

Проблема контекстно-ориентированной декодировки (CAD)

Языковые модели (LM) показали выдающуюся эффективность в генерации последовательных и связных продолжений запроса или префикса документа. Однако они часто испытывают трудности в балансировании знаний, полученных в процессе предварительного обучения, и контекстуальных знаний, предоставленных во входном контексте, что приводит к недостоверной или галлюцинационной генерации текста.

Решение контекстно-ориентированной декодировки (CAD)

Исследователи представили контекстно-ориентированную декодировку (CAD) в качестве практического решения для решения этих проблем. CAD использует контрастное распределение вывода, которое усиливает разницу между вероятностями вывода, когда модель используется с контекстом и без него. Это стимулирует LM уделять достаточное внимание своему контексту во время генерации, что приводит к существенным улучшениям в задачах, где разрешение конфликта знаний является важным.

CAD эффективно уменьшает вес предварительных знаний, когда предоставляется более актуальная контекстуальная информация, не требуя дополнительного обучения. Он может использоваться с предварительно обученными LM и экспериментально показал превосходство над стандартными алгоритмами декодирования на различных наборах данных и семействах LM, включая OPT, GPT, LLaMA и FLAN-T5 для задач суммаризации.

Применение CAD к LLAMA30B в CNN-DM привело к увеличению ROUGE-L на 21%, увеличению factKB на 14,3% и увеличению BERT-P на 7,8%, демонстрируя его способность улучшать качество и достоверность сгенерированных резюме.

Практические решения искусственного интеллекта для бизнеса

Для бизнеса, стремящегося использовать искусственный интеллект, важно определить возможности автоматизации, определить KPI, выбрать подходящие решения и поэтапно их внедрить. ИИ может переосмыслить процессы продаж и взаимодействия с клиентами, предлагая практические решения, такие как AI Sales Bot от itinai.com/aisalesbot, разработанный для автоматизации взаимодействия с клиентами 24/7 и управления взаимодействиями на всех этапах путешествия клиента.

Для консультаций по управлению KPI и непрерывных идей по использованию ИИ бизнесы могут связаться с itinai.com по электронной почте hello@itinai.com или следить за обновлениями в Telegram t.me/itinainews и Twitter @itinaicom.

Список полезных ссылок:

AI Lab в Telegram @aiscrumbot – бесплатная консультация

Researchers from the University of Washington and Meta AI Present a Simple Context-Aware Decoding (CAD) Method to Encourage the Language Model to Attend to Its Context During Generation

MarkTechPost

Twitter – @itinaicom

Полезные ссылки: