Google AI представляет DataGemma: набор открытых моделей для работы с общими данными через методы RIG и RAG.

 Google AI Introduces DataGemma: A Set of Open Models that Utilize Data Commons through Retrieval Interleaved Generation (RIG) and Retrieval Augmented Generation (RAG)

“`html

Google представила инновацию под названием DataGemma, разработанную для борьбы с одной из основных проблем современного искусственного интеллекта: галлюцинациями в больших языковых моделях (LLM).

Галлюцинации возникают, когда ИИ уверенно генерирует информацию, которая является неверной или выдуманной. Эти неточности могут подрывать полезность ИИ, особенно в исследованиях, разработке политики или других важных процессах принятия решений.

Практические решения и ценность

Google DataGemma направлена на укоренение LLM в реальных мировых статистических данных с помощью ресурсов Data Commons.

Введены две специфические варианты: DataGemma-RAG-27B-IT и DataGemma-RIG-27B-IT, представляющие передовые достижения в методологиях Retrieval-Augmented Generation (RAG) и Retrieval-Interleaved Generation (RIG).

Data Commons содержит более 240 миллиардов точек данных по многим статистическим переменным, включая данные от таких доверенных источников, как Всемирная организация здравоохранения, Центры по контролю и профилактике заболеваний и различные национальные бюро переписи населения.

Методология RIG обеспечивает проверку фактов по авторитетным источникам, а методология RAG обогащает контекст информации для более полезных ответов.

Значение для общества

Google DataGemma решает проблему галлюцинаций в больших языковых моделях (LLM), обеспечивая точность и достоверность информации, создаваемой ИИ. Это важный шаг к тому, чтобы ИИ стал надежным партнером в исследованиях, принятии решений и поиске знаний.

Google делает DataGemma доступной для исследователей и разработчиков, предоставляя им модели и заметки для быстрого старта обеих методологий RIG и RAG.

“`

Полезные ссылки: