Исследователи FutureHouse представляют PaperQA2: первый искусственный интеллект, проводящий полный обзор научной литературы самостоятельно

 FutureHouse Researchers Introduce PaperQA2: The First AI Agent that Conducts Entire Scientific Literature Reviews on Its Own

“`html

Искусственный интеллект в научных исследованиях

Искусственный интеллект (ИИ) трансформирует способы проведения научных исследований, особенно через языковые модели, которые помогают ученым обрабатывать и анализировать огромные объемы информации. Большие языковые модели (LLM) все чаще применяются для задач, таких как поиск литературы, резюмирование и обнаружение противоречий. Эти инструменты разработаны для ускорения темпа исследований и позволяют ученым более глубоко взаимодействовать с сложной научной литературой, не просматривая каждую деталь вручную.

Основные проблемы в научных исследованиях

Одной из ключевых проблем научных исследований сегодня является навигация в огромном объеме опубликованных работ. По мере того, как проводится все больше исследований и публикуется больше статей, ученым требуется помощь в выявлении актуальной информации, обеспечении точности своих выводов и выявлении противоречий в литературе. Эти задачи занимают много времени и часто требуют экспертных знаний. В то время как ИИ-инструменты были введены для помощи в решении некоторых из этих задач, им часто не хватает точности и фактической надежности для строгих научных исследований. Поэтому требуется решение, которое позволит заполнить этот разрыв и эффективнее поддерживать ученых.

Новое решение: PaperQA2

Исследователи из компании FutureHouse Inc., Университета Рочестера и Института Фрэнсиса Крика представили новый инструмент под названием PaperQA2. Этот языковой модельный агент разработан для улучшения фактичности и эффективности научных исследований. PaperQA2 был разработан для выполнения трех конкретных задач: поиска литературы, резюмирования научных тем и обнаружения противоречий в опубликованных исследованиях. Используя надежный бенчмарк под названием LitQA2, инструмент был оптимизирован для выполнения на уровне или выше уровня человеческих экспертов, особенно в областях, где существующие системы ИИ не справляются.

Преимущества и результаты

Инструмент PaperQA2 продемонстрировал впечатляющие результаты в широком спектре задач. В рамках комплексной оценки с использованием LitQA2 инструмент достиг точности 85,2% и точности 66%. Кроме того, PaperQA2 смог обнаруживать противоречия в научных статьях, выявляя в среднем 2,34 противоречия в статьях по биологии. Он также анализировал в среднем 14,5 статей на вопрос в рамках задачи поиска литературы. Одним из значительных результатов исследования стала способность инструмента идентифицировать противоречия с точностью 70%, что было подтверждено человеческими экспертами. По сравнению с человеческой производительностью, PaperQA2 превзошел точность экспертов в задачах поиска, показав свой потенциал для более эффективного выполнения масштабных обзоров литературы по сравнению с традиционными методами, основанными на человеческом труде.

Способность инструмента создавать резюме, превосходящие по фактической точности статьи, написанные людьми, является еще одним ключевым достижением. PaperQA2 был применен для резюмирования научных тем, и полученные резюме были оценены как более точные, чем существующий контент, созданный людьми. Продвинутая способность модели писать цитируемые резюме на основе широкого спектра научной литературы подчеркивает ее способность поддерживать будущие исследовательские усилия в высоконадежном режиме. Более того, PaperQA2 мог выполнять все эти задачи за долю времени и затрат, которые потребовались бы ученым, демонстрируя значительные экономические преимущества интеграции таких ИИ-инструментов в процесс исследований.

Заключение

Инструмент PaperQA2 представляет собой значительный шаг в использовании ИИ для поддержки научных исследований. Этот инструмент предлагает ученым мощный метод навигации в растущем объеме научных знаний, решая критические проблемы поиска литературы, резюмирования и обнаружения противоречий. Разработанный компанией FutureHouse Inc. в сотрудничестве с академическими учреждениями, PaperQA2 демонстрирует, что ИИ может превзойти человеческую производительность в ключевых исследовательских задачах, предлагая масштабное и высокоэффективное решение для будущих научных открытий. Производительность системы в задачах резюмирования и обнаружения противоречий показывает большой потенциал для расширения роли ИИ в исследованиях, что потенциально может изменить способы взаимодействия ученых с сложными данными в будущем.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Твиттер и присоединиться к нашему Телеграм-каналу и группе в LinkedIn.

Не забудьте присоединиться к нашему сообществу в Reddit с более чем 50 тыс. участников.

БЕСПЛАТНЫЙ ВЕБИНАР ПО ИИ: “SAM 2 для видео: как настроить на ваши данные” (Ср, 25 сентября, 4:00 – 4:45 EST)

Источник: MarkTechPost


“`

Полезные ссылки: