Модель Evo: предсказание и генерация на геномном уровне

 This AI Paper Introduces Evo: A Genomic Foundation Model that Enables Prediction and Generation Tasks from the Molecular to Genome-Scale

“`html

Геномные исследования: практические решения и ценность

Геномные исследования – это критическая область, которая фокусируется на понимании структуры, функций и эволюции геномов. Они включают в себя изучение последовательностей ДНК, генетических вариаций и сложных механизмов, управляющих экспрессией и регуляцией генов. Эта область имеет глубокие последствия для биотехнологии, медицины и эволюционной биологии, предлагая понимание генетических расстройств, потенциальных терапий и фундаментальных процессов жизни.

Проблема и решение

Одной из критических проблем является необходимость в продвинутых моделях для прогнозирования и генерации биологических последовательностей. Текущие методы могут быть более сложными и масштабируемыми для точного моделирования геномных функций. Исследователи ищут решения для улучшения точности и эффективности этих моделей для лучшего понимания и манипулирования биологическими системами.

Практические решения

Исследователи из университетов Стэнфорда, Arc Institute, TogetherAI, CZ Biohub и Университета Калифорнии, Беркли, представили Evo – геномную базовую модель, разработанную для выполнения задач прогнозирования и генерации от молекулярного до геномного уровня. Evo использует новую архитектуру глубокой обработки сигналов для обработки обширных геномных наборов данных с высокой точностью. Архитектура Evo включает гибрид механизмов внимания и операторов свертки, позволяя ей обрабатывать последовательности с разрешением одного нуклеотида в течение длинных контекстов. Обученная на 7 миллиардах параметров с данными от целых прокариотических геномов, Evo может обобщаться на модальности ДНК, РНК и белка, позволяя ей прогнозировать функции генов и генерировать сложные биологические системы.

Архитектура Evo включает 29 слоев данных-управляемых операторов свертки, переплетенных с много-головы слоями внимания, оснащенными вращающимися позиционными вложениями, улучшая ее способность запоминать информацию о длинных последовательностях.

Производительность Evo превосходит в задачах прогнозирования и генерации. Она может генерировать синтетические молекулярные комплексы CRISPR-Cas и транспозиционные системы, прогнозировать геновую существенность с высокой точностью и создавать кодирующие последовательности длиной до 650 килобаз. Эти возможности превосходят существующие модели языка, подчеркивая продвинутую производительность Evo в различных геномных задачах.

В заключение, Evo представляет значительное продвижение в области геномных исследований, обещая улучшить наше понимание и контроль биологических систем на различных уровнях.

Подробнее ознакомьтесь с документом.

Все права на это исследование принадлежат его авторам. Также не забудьте подписаться на нас в Twitter.

Если вам нравится наша работа, вам понравится наш новостной бюллетень.

“`

Полезные ссылки: