Salesforce AI представляет семейство трех моделей Judge размером 8 миллиардов параметров 8B, 12B и 70B, созданных с помощью Meta Llama 3 и Mistral NeMO.

 Salesforce AI Introduces SFR-Judge: A Family of Three Judge Models of 8-Billion Parameters 8B, 12B, and 70B Size, Built with Meta Llama 3 and Mistral NeMO


Как использовать Salesforce AI Introduces SFR-Judge для автоматизации оценки крупных языковых моделей

Практические решения и ценность:

1. Оценка качества моделей: SFR-Judge предлагает семейство трех моделей-судей на базе LLM, облегчая процесс оценки выходов LLM. Модели обучены для выполнения различных задач оценки, таких как попарные сравнения, одиночные рейтинги и бинарная классификация.

2. Преодоление предвзятостей: SFR-Judge использует метод обучения Direct Preference Optimization для уменьшения предвзятости, что обеспечивает стабильные и сбалансированные оценки.

3. Превосходные результаты: Модели SFR-Judge продемонстрировали лучшую производительность на множестве бенчмарков, устанавливая новые стандарты в оценке LLM.

4. Повышение производительности: Обучение SFR-Judge включает несколько форматов данных, что улучшает способность модели к производству детальных и точных оценок.

5. Низкий уровень предвзятости: Модели SFR-Judge показали значительно меньший уровень предвзятости по сравнению с конкурентами, что делает их надежным решением для автоматизированной оценки LLM.


Полезные ссылки: