Генерация кристаллических структур из описаний на естественном языке: иерархический подход

 GenMS: An Hierarchical Approach to Generating Crystal Structures from Natural Language Descriptions

“`html

Применение искусственного интеллекта для генерации кристаллических структур из естественного языка

Генеративные модели значительно продвинулись и теперь могут создавать разнообразные типы данных, включая кристаллические структуры. В области материаловедения эти модели могут объединять существующие знания для предложения новых кристаллов, используя свою способность к обобщению из больших наборов данных. Однако текущие модели часто требуют подробного ввода или большого количества образцов для генерации новых материалов. Исследователи разрабатывают методы, переводящие описания на естественном языке в кристаллические структуры для решения этой проблемы.

Генерация кристаллических структур из естественного языка

Исследователи из Google DeepMind представили Generative Hierarchical Materials Search (GenMS), метод для генерации структур из естественного языка. GenMS объединяет LLM, диффузионную модель и GNN для создания кристаллических структур на основе описаний на естественном языке. LLM генерирует химические формулы, диффузионная модель создает детальные кристаллические структуры, а GNN предсказывает их свойства. GenMS формулируется как задача многокритериальной оптимизации, обеспечивая соответствие сгенерированных структур требованиям пользователя и низкую энергию образования. Эксперименты показывают высокую успешность GenMS в генерации сложных структур и превосходство над традиционными методами.

Преимущества и применение

GenMS решает проблему генерации кристаллических структур из описаний на естественном языке, используя иерархический подход, объединяющий языковую модель для генерации химических формул, диффузионную модель для получения детальных кристаллических структур и графовую нейронную сеть для предсказания свойств. Процесс включает выборку промежуточных формул и их дальнейшее уточнение через эвристические функции для оптимизации высокоуровневых и низкоуровневых критериев. Дизайн GenMS также включает эффективные техники выборки с использованием компактного представления кристалла и продвинутые методы поиска для улучшения контекста и производительности, обеспечивая точную и эффективную генерацию структур.

Результаты и перспективы развития

Исследователи оценили производительность GenMS в генерации кристаллических структур из высокоуровневых описаний. GenMS систематически превосходил базовые модели в тестах на конечных этапах, производя более действительные и уникальные структуры с более низкой энергией образования, несмотря на временные трудности с уникальностью. Качественные оценки показали, что GenMS эффективно удовлетворяет конкретные запросы пользователя. Исследование также анализировало компоненты GenMS, выявляя, что ввод на естественном языке значительно влияет на генерацию формулы, а retrieval augmented generation (RAG) улучшает ее правильность и соответствие. Компактное представление кристалла GenMS и стратегия выборки best-of-N также улучшают его правильность и энергоэффективность по сравнению с предыдущими методами и донастраиваемыми LLM.

Заключение

GenMS представляет подход для генерации физически реальных кристаллических структур на основе естественных языковых подсказок, демонстрируя эффективность семейств, таких как пирохлоры и спинели. Однако это представляет вызовы с комплексными структурами, экспериментальной проверкой, синтезируемостью и расширением на другие химические системы. Путем объединения языковой модели, диффузионной модели и графовой нейронной сети GenMS выполняет многокритериальную оптимизацию для генерации и оценки кристаллических структур, превосходя традиционные методы и заложив основу для передового материаловедения.

Посмотреть статью и проект

Вся заслуга за это исследование принадлежит авторам проекта. Также не забудьте подписаться на нас в Twitter и присоединиться к нашему каналу в Telegram и группе в LinkedIn. Если вам нравится наша работа, вам понравится наш newsletter.

Не забудьте присоединиться к нашему сообществу в SubReddit.

Бесплатный вебинар по ИИ: “SAM 2 для видео: как настроить под ваши данные” (Ср, 25 сентября, 4:00 – 4:45 EST)

Статья была опубликована на MarkTechPost.

“`

Полезные ссылки: