Эта статья AI от MIT исследует масштабирование моделей глубокого обучения для химических исследований.

Itinai.com user using ui app iphone 15 closeup hands photo ca 5ac70db5 4cad 4262 b7f4 ede543ce98bb 1

Исследование МИТ рассматривает масштабирование моделей глубокого обучения для химических исследований. Увеличение мощности нейронных сетей сулит новые возможности в химии. Это один шаг ближе к созданию более эффективных лекарств и материалов. Невероятно волнующее!

Исследование MIT: масштабирование моделей глубокого обучения для химических исследований

Введение

Исследователи из MIT провели исследование поведения масштабирования больших химических языковых моделей, сосредоточившись на генеративных предварительно обученных трансформерах (GPT) для химии (ChemGPT) и графовых нейронных сетях для моделирования силовых полей (GNN). В работе представлена концепция нейронного масштабирования, где производительность моделей характеризуется эмпирическими законами масштабирования, особенно в отношении потерь, масштабирующихся по степенному закону относительно количества параметров модели, размера набора данных или вычислительных ресурсов. Исследование рассматривает проблемы и возможности, связанные с масштабированием больших химических моделей, с целью предоставить понимание оптимального распределения ресурсов для улучшения потерь при предварительном обучении.

Описание исследования

Для моделирования химических языков исследователи разработали ChemGPT — модель в стиле GPT-3 на основе GPT-Neo, с токенизатором для встроенных строк с автоприменением (SELFIES) представлений молекул. Модель предварительно обучается на молекулах из PubChem, и исследуется влияние размера набора данных и модели на потери при предварительном обучении.

Помимо языковых моделей, в статье рассматриваются графовые нейронные сети для задач, требующих молекулярной геометрии и трехмерной структуры. Рассматриваются четыре типа графовых нейронных сетей, начиная от моделей с внутренними слоями, манипулирующими только E(3)-инвариантными величинами, до моделей, использующих E(3)-эквивариантные величины с увеличивающейся физически информированной архитектурой модели. Авторы оценивают возможности этих графовых нейронных сетей, определенные в терминах глубины и ширины, в ходе экспериментов по нейронному масштабированию.

Для эффективной обработки гиперпараметров оптимизации (HPO) для глубоких химических моделей в статье представлена техника, называемая оценкой производительности обучения (TPE), адаптированная из метода, используемого в архитектурах компьютерного зрения. TPE использует скорость обучения для оценки производительности в различных областях и размерах модели/набора данных. В статье подробно описаны экспериментальные настройки, включая использование графических процессоров NVIDIA Volta V100, PyTorch и распределенного параллельного ускорения для реализации и обучения модели.

Выводы

В целом, исследование представляет собой всестороннее исследование нейронного масштабирования в контексте больших химических языковых моделей, рассматривая как генеративные предварительно обученные трансформеры, так и графовые нейронные сети для моделирования силовых полей. Оно также представляет эффективный метод оптимизации гиперпараметров. Экспериментальные результаты и выводы способствуют пониманию эффективности использования ресурсов различных модельных архитектур в научных приложениях глубокого обучения.

Если вам нужны рекомендации по управлению ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей об ИИ, подписывайтесь на наш Telegram-канал t.me/itinairu.

Посмотрите на практический пример решения на основе ИИ: бот для продаж от itinai.ru/aisales, созданный для автоматизации общения с клиентами круглосуточно и управления взаимодействием на всех этапах пути клиента.

Изучите, как искусственный интеллект может улучшить ваши продажи и общение с клиентами. Познакомьтесь с нашими решениями на сайте itinai.ru

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

29.11.2023

Владимир Дьячков PhD

Лучшие ИИ

LLM, ИИ, Инновации

23.04.2025

Лучшие ИИ

VoltAgent: Эффективный фреймворк для разработки и управления AI-агентами на TypeScript

Представляем VoltAgent: Фреймворк AI на TypeScript для создания и управления масштабируемыми AI-агентами VoltAgent — это открытый фреймворк на TypeScript, который упрощает создание приложений на основе AI, предоставляя модульные…
02.11.2024

Лучшие ИИ

Новые подходы к использованию и оптимизации многомодальной системы RAG для промышленных применений.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
20.12.2023

Лучшие ИИ

Точность распознавания изображений: невидимая проблема, сбивающая с толку современные ИИ.

Сегодняшние системы искусственного интеллекта имеют проблемы с точностью распознавания изображений из-за неожиданных вызовов. Новые вызовы требуют новых решений! #искусственныйинтеллект #распознаваниеизображений

LLM, ИИ, Инновации
04.06.2024

Лучшие ИИ

Университет Висконсина-Мэдисон: новый подход машинного обучения для улучшения устойчивости нулевого обучения.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
30.07.2025

Лучшие ИИ

FastVLM: Оптимизация торговой модели разрешения, задержки и точности для бизнеса

Введение в FastVLM: Революция в моделях визуального языка Технологии искусственного интеллекта стремительно развиваются, и одним из самых захватывающих направлений является интеграция визуальных и текстовых данных. Новая разработка от…
14.12.2023

Лучшие ИИ

LimeWire возвращается с музыкой, созданной с помощью искусственного интеллекта.

Эх, ЛаймВайр вернулся с музыкой, созданной искусственным интеллектом? Уверен, многие вспомнят ностальгию за обменом файлами в 2000-х. Но что на счет качества этой музыки?

LLM, ИИ, Инновации
29.09.2024

Лучшие ИИ

Улучшение моделей генерации изображений с помощью искусственного интеллекта: новый подход.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
26.12.2024

Лучшие ИИ

Глубокое обучение и анализ голосовых связок: роль набора данных GIRAFE

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

Эта статья AI от MIT исследует масштабирование моделей глубокого обучения для химических исследований.

Исследование MIT: масштабирование моделей глубокого обучения для химических исследований

Введение

Описание исследования

Выводы

Изучите, как искусственный интеллект может улучшить ваши продажи и общение с клиентами. Познакомьтесь с нашими решениями на сайте itinai.ru

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Как вести Telegram-канал с юмором и зарабатывать

Использование AI для специалистов по питанию

Продажа цифровых продуктов через AI-платформу

Как блогеру о психологии начать зарабатывать

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Агент для анализа видеоконтента : извлечение данных из записей

ИИ-Специалист по соблюдению норм : автоматизация проверки документов

ИИ-Агент по автоматизации отчетности : генерация финансовых и операционных отчетов

ИИ-Специалист по автоматизации бухгалтерии : обработка счетов и налоговых деклараций

Как администратору обучить нового продавца за 1 день: искусственный интеллект составит план экспресс-обучения

Как адаптировать ИТ-обучение для немассовых пользователей: ИИ предложит текст и формат “просто о сложном”

Как восстановить диалог с «пропавшим» клиентом: искусственный интеллект предложит 3 текста касания

Как продавать через Telegram без навязчивости: искусственный интеллект предложит 5 рабочих шаблонов сообщений

Как кадровику быстро проверить трудовой договор на ошибки: искусственный интеллект найдет 5 ключевых рисков

Скрипт для отработки возражения “мы уже работаем с другими”: искусственный интеллект предложит 3 варианта отстройки

Лучший ИИ онлайн

VoltAgent: Эффективный фреймворк для разработки и управления AI-агентами на TypeScript

Новые подходы к использованию и оптимизации многомодальной системы RAG для промышленных применений.

Точность распознавания изображений: невидимая проблема, сбивающая с толку современные ИИ.

Университет Висконсина-Мэдисон: новый подход машинного обучения для улучшения устойчивости нулевого обучения.

FastVLM: Оптимизация торговой модели разрешения, задержки и точности для бизнеса

LimeWire возвращается с музыкой, созданной с помощью искусственного интеллекта.

Улучшение моделей генерации изображений с помощью искусственного интеллекта: новый подход.

Глубокое обучение и анализ голосовых связок: роль набора данных GIRAFE

Реклама

О нас

FAQ

Условия использования

Подписка

Политика комментариев