Набор данных FinTextQA: ответы на длинные вопросы в финансовой сфере

 FinTextQA: A Long-Form Question Answering LFQA Dataset Specifically Designed for the Financial Domain

“`html

Расширение систем вопросно-ответных (QA) на основе искусственного интеллекта (ИИ) в финансовой сфере

Значимость и практические решения

Расширение систем вопросно-ответных (QA) на основе искусственного интеллекта (ИИ) в финансовой сфере обусловлено растущим спросом на анализ и управление финансовыми данными. Эти технологии помогают улучшить обслуживание клиентов, управлять рисками и предоставлять индивидуальные рекомендации по акциям. Для точных и полезных ответов на финансовые данные необходимо глубокое понимание финансовой области из-за сложности данных, специфической терминологии и концепций, рыночной неопределенности и процессов принятия решений.

В связи с сложными задачами, такими как поиск информации, суммирование, анализ данных, понимание и рассуждение, сценарии длинных вопросов и ответов (LFQA) имеют особое значение в этой области.

Хотя существует несколько наборов данных LFQA в открытом доступе, таких как ELI5, WikiHowQA и WebCPM, ни один из них не адаптирован для финансового сектора. Этот пробел на рынке значителен, поскольку сложные вопросы открытой области часто требуют обширных ответов в виде абзацев и соответствующего извлечения документов. Текущие стандарты финансовых QA, которые сильно полагаются на числовые расчеты и анализ настроений, часто испытывают трудности в обработке разнообразия и сложности таких вопросов.

В свете этих трудностей исследователи из HSBC Lab, Гонконгского университета науки и технологий (Гуанчжоу) и Гарвардского университета представляют FinTextQA, новый набор данных для тестирования моделей QA по вопросам общих финансов, регулирования или политики. Этот набор данных состоит из LFQA, взятых из учебников по этой области, а также веб-сайтов правительственных агентств. 1 262 пары вопрос-ответ и контексты документов, составляющие FinTextQA, отличаются отличным качеством и имеют указанное источник. Выбранные из пяти раундов человеческой проверки, они включают шесть категорий вопросов с средней длиной текста 19,7 тыс. слов. Включение финансовых правил и регуляций в LFQA делает этот набор данных вызовом для моделей с более сложным содержанием и представляет собой прорывную работу в этой области.

Команда представила набор данных и провела бенчмаркинг моделей последнего поколения (SOTA) с использованием FinTextQA для установления стандартов для будущих исследований. Многие существующие системы LFQA зависят от предварительно обученных языковых моделей, таких как GPT-3.5-turbo, LLaMA2, Baichuan2 и т. д. Однако эти модели не всегда способны отвечать на сложные финансовые запросы или предоставлять исчерпывающие ответы. Они часто используют RAG-фреймворк в качестве ответа. Система RAG может улучшить производительность и объяснительные возможности LLMs путем предварительной обработки документов в различных этапах и предоставления им наиболее актуальной информации.

Исследователи отмечают, что у FinTextQA меньше пар вопрос-ответ, несмотря на его профессиональную кураторскую работу и высокое качество, по сравнению с более крупными наборами данных, созданными с использованием ИИ. Из-за этого ограничения модели, обученные на нем, могут не быть распространены на более общие реальные сценарии. Получение высококачественных данных затруднительно, и авторские ограничения часто мешают их распространению. Следовательно, передовые подходы к дефициту данных и увеличению данных должны быть основной целью будущих исследований. Также может быть полезно исследовать более сложные возможности RAG и методы извлечения и расширить набор данных, включив в него более разнообразные источники.

Тем не менее, команда считает, что эта работа представляет собой значительный шаг в улучшении понимания финансовых концепций и поддержки путем представления первого набора данных LFQA для финансовой сферы и проведения обширных бенчмарков на его основе. FinTextQA предоставляет прочную и тщательную основу для разработки и тестирования систем LFQA в общей финансовой сфере. Помимо демонстрации эффективности различных конфигураций моделей, экспериментальные исследования подчеркивают важность улучшения существующих подходов для создания систем вопросно-ответных в финансовой сфере более точными и понятными.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему SubReddit с 42 тыс. подписчиков.

Статья FinTextQA: A Long-Form Question Answering LFQA Dataset Specifically Designed for the Financial Domain была опубликована на MarkTechPost.

“`
“`html

Применение ИИ в финансовой сфере

Практические советы и решения

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте FinTextQA: A Long-Form Question Answering LFQA Dataset Specifically Designed for the Financial Domain.

Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI.

Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.

Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI.

На полученных данных и опыте расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам на https://t.me/itinai. Следите за новостями о ИИ в нашем Телеграм-канале t.me/itinainews или в Twitter @itinairu45358.

Попробуйте AI Sales Bot https://itinai.ru/aisales. Этот AI ассистент в продажах, помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru будущее уже здесь!

“`

Полезные ссылки: