Qilin: Мультимодальный датасет для улучшения систем поиска и рекомендаций

Введение в мультимодальные системы поиска и рекомендаций

Поисковые системы и системы рекомендаций играют ключевую роль на платформах онлайн-контента. Традиционные методы поиска сосредоточены на текстовом контенте, что создает значительный разрыв в обработке иллюстрированных текстов и видео, которые стали важными компонентами сообществ, создающих пользовательский контент (UGC).

Проблемы существующих подходов

Существующие наборы данных для задач поиска и рекомендаций содержат только текстовую информацию или статистически плотные характеристики, что ограничивает развитие эффективных мультимодальных сервисов. Сигналы на уровне сессии содержат ценную контекстуальную информацию о поведении пользователей, что напрямую влияет на удовлетворенность и удержание клиентов.

Предложение Qilin

Исследователи из Xiaohongshu Inc. и Университета Цинхуа предложили Qilin — набор данных для мультимодального поиска информации, который отвечает на растущую потребность в улучшении сервисов поиска и рекомендаций. Набор данных собран с платформы Xiaohongshu, популярной социальной сети с более чем 300 миллионами активных пользователей в месяц.

Структура набора данных Qilin

Набор данных включает APP-уровневые сессии от 15,482 пользователей, что значительно больше и разнообразнее, чем существующие наборы данных, такие как Amazon и JD Search. Qilin предоставляет оригинальный контент заметок (заголовок + основной текст + изображения), что обеспечивает полноту и подлинность данных.

Результаты и выводы

Результаты задач поиска и рекомендаций показывают, что модели, такие как BERT и Vision-Language Models (VLM), демонстрируют высокую эффективность. Однако существуют ограничения, связанные с использованием псевдозапросов в рекомендациях, что требует большей устойчивости моделей.

Практические рекомендации для бизнеса

Изучите, как технологии искусственного интеллекта могут изменить ваш подход к работе:

  • Автоматизируйте процессы, чтобы повысить эффективность.
  • Определите ключевые показатели эффективности (KPI) для оценки влияния инвестиций в ИИ.
  • Выбирайте инструменты, которые соответствуют вашим потребностям и позволяют настраивать их под ваши цели.
  • Начните с небольшого проекта, собирайте данные о его эффективности и постепенно расширяйте использование ИИ.

Контактная информация

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Подписывайтесь на наш Telegram, чтобы быть в курсе последних новостей в области ИИ.

Пример решения на основе ИИ

Посмотрите практический пример решения на основе ИИ: бот для продаж, разработанный для автоматизации взаимодействия с клиентами на всех этапах их пути.


Новости в сфере искусственного интеллекта