Ученые из NASA и IBM представляют INDUS: набор крупных языковых моделей для научных исследований

Легче сразу спросить 💭

AI снижает операционные расходы на 20–40% 📊 за 6 месяцев. А что бы вы сделали с этими деньгами?

Опишите задачу — обсудим, как это можно реализовать у вас.

ИИ автоматизирует 70% рутинных задач 🤖 за 3 месяца. Какие процессы в вашем бизнесе скинуть роботу?
Персонализированные AI-кампании увеличивают клиентскую базу на 30% 📈. Как это работает?
AI-аналитика сокращает ошибки в прогнозах на 50% 📉. Расскажите подробнее!
 NASA and IBM Researchers Introduce INDUS: A Suite of Domain-Specific Large Language Models (LLMs) for Advanced Scientific Research

«`html

Большие языковые модели (LLM), обученные на огромных объемах данных, показали удивительные способности в генерации и понимании естественного языка.

Они могут быть применены в различных областях, но для специализированных доменов требуются модели, учитывающие специфическую лексику и контекст.

INDUS: набор специализированных LLM

INDUS — набор LLM, специализированных для научных областей, таких как науки о Земле, астрономия, физика, астрофизика, гелиофизика, планетные науки и биология. Он включает в себя несколько моделей, разработанных для различных потребностей:

  • Модель-кодировщик: обучена на домен-специфической лексике для задач понимания естественного языка.
  • Модель встраивания общего текста на основе контрастного обучения: использует разнообразные наборы данных для улучшения производительности в задачах информационного поиска.
  • Уменьшенные версии моделей: созданы с использованием техник дистилляции знаний для применения в условиях ограниченных ресурсов.

Новые научные наборы данных

Команда также разработала три новых научных набора данных для продвижения исследований в междисциплинарных областях:

  • CLIMATE-CHANGE NER: набор данных для распознавания сущностей, связанных с изменением климата.
  • NASA-QA: набор данных, посвященный темам, связанным с NASA, используемый для извлечения ответов на вопросы.
  • NASA-IR: набор данных для информационного поиска в контенте, связанном с NASA.

Основные результаты

Экспериментальные исследования показали, что модели INDUS проявляют высокую производительность как на новых бенчмарках, так и на существующих домен-специфических задачах.

Заключение

INDUS представляет собой значительный прогресс в области искусственного интеллекта, предоставляя профессионалам и исследователям в различных научных областях мощный инструмент для выполнения точных и эффективных задач обработки естественного языка.

Подробнее ознакомьтесь с научной статьей и блогом.

Вся заслуга за это исследование принадлежит исследователям этого проекта.

Также не забудьте подписаться на наш Twitter.

Присоединяйтесь к нашему Telegram-каналу и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наш новостной бюллетень.

Не забудьте присоединиться к нашему SubReddit с более чем 46 тысячами подписчиков.

Источник: MarkTechPost.

«`

Полезные ссылки:

Новости в сфере искусственного интеллекта