SalesForce AI Research представила LlamaRank: передовой реранкер для улучшенного поиска документов и кода, превосходящий Cohere Rerank v3 и Mistral-7B QLM по точности.

 SalesForce AI Research Introduced LlamaRank: A State-of-the-Art Reranker for Enhanced Document Retrieval and Code Search, Outperforming Cohere Rerank v3 and Mistral-7B QLM in Accuracy

“`html

Продвинутые модели для эффективного ранжирования документов и поиска кода

Ранжирование документов остается одной из ключевых задач в разработке информационного поиска и обработки естественного языка. Эффективное ранжирование документов имеет большое значение для улучшения работы поисковых систем, систем вопросов и ответов, а также систем Retrieval-Augmented Generation (RAG). Традиционные модели ранжирования часто нуждаются в балансе между точностью результатов и вычислительной эффективностью, особенно при работе с большими наборами данных и различными типами запросов. Вместо этого возникает потребность в продвинутых моделях с возможностью в реальном времени предоставлять точные и контекстно-релевантные результаты из постоянных потоков данных и все возрастающей сложности запросов.

Преимущества модели LlamaRank

Исследовательская группа Salesforce AI Research представила новую модель реранжирования, LlamaRank, которая значительно улучшает ранжирование документов и поиск кода на различных наборах данных. LlamaRank основана на архитектуре Llama3-8B-Instruct и объединяет линейные и откалиброванные механизмы оценки для достижения скорости и интерпретируемости.

Модель LlamaRank разработана в качестве специализированного инструмента для ранжирования релевантности документов. Обучение модели включает в себя синтезированные данные высокого качества из Llama3-70B и Llama3-405B, а также аннотации, охватывающие области от поиска по темам и вопросам-ответам до поиска кода.

Архитектура LlamaRank построена на базе Llama3-8B-Instruct, где обучающие данные включают как синтетические данные, так и примеры с аннотациями от людей. Обширный и разнообразный корпус позволяет LlamaRank успешно выполнять различные задачи, от общего поиска документов до более специализированных запросов для поиска кода.

LlamaRank была продемонстрирована на нескольких публичных наборах данных и показала высокие результаты в оценке производительности. Модель также обладает линейной калибровкой оценок, что делает ее более интерпретируемой для пользователей.

Технические преимущества LlamaRank

Модель поддерживает до 8 000 токенов на документ, что значительно превосходит конкурентов. Она также обеспечивает низкую задержку при ранжировании документов и имеет линейную калибровку оценок релевантности, что делает ее более понятной для пользователей.

Таким образом, модель LlamaRank представляет собой важный шаг в развитии технологии реранжирования и обещает значительно улучшить эффективность систем RAG в различных областях применения.

Подробнее об этом и других инновационных решениях в области искусственного интеллекта вы можете узнать на нашем сайте.

“`

Полезные ссылки: