Эффективный метод вычисления скрытых представлений запросов и элементов для приближенного вычисления оценок совпадения.

Itinai.com it company office background blured photography by 83d4babd 14b1 46f9 81ea 8a75bac63327 0

Sparse-Matrix Factorization-based Method: Efficient Computation of Latent Query and Item Representations to Approximate CE Scores

Эффективное вычисление скрытых представлений запросов и элементов для приближения оценок CE

Кросс-энкодеры (CE) оценивают сходство, кодируя одновременно пару запрос-элемент, превосходя dot-product с моделями на основе встраивания при оценке релевантности запроса-элемента. Текущие методы выполняют поиск k-NN с CE, приближая CE-сходство пространством векторных встраиваний, соответствующим двойным энкодерам (DE) или факторизацией матрицы CUR. Однако методы на основе DE сталкиваются с проблемами низкой полноты из-за плохой обобщенности новых доменов и отделения тестового времени извлечения с DE от CE. Таким образом, методы на основе DE и CUR недостаточны для определенной конфигурации приложения в поиске k-NN.

Разреженная факторизация матриц

Разреженная факторизация матриц широко используется для оценки низкорангового приближения плотных расстояний и матриц, не являющихся положительно определенными, а также для заполнения пропущенных записей в разреженных матрицах.

Новый метод на основе разреженной факторизации матриц

Исследователи из Университета Массачусетса в Амхерсте и Google DeepMind представили новый метод на основе разреженной факторизации матриц. Этот метод оптимально вычисляет скрытые представления запросов и элементов для приближения CE-оценок и выполняет поиск kNN, используя приближенное CE-сходство. В сравнении с методами на основе CUR, предложенный метод генерирует качественное приближение, используя лишь часть вызовов CE-сходства.

Эксперименты и оценка

Методы и базовые значения тщательно оцениваются на задачах, таких как поиск k-ближайших соседей для моделей CE и связанных задачах. Важно отметить, что модели CE используются для задач, таких как связывание сущностей без обучения и информационный поиск без обучения, демонстрируя, как различные решения влияют на время индексации данных и точность извлечения во время тестирования.

Заключение

Исследователи из Университета Массачусетса в Амхерсте и Google DeepMind представили метод на основе разреженной факторизации матриц, который эффективно вычисляет скрытые представления запросов и элементов. Этот метод оптимально выполняет поиск k-NN с кросс-энкодерами, эффективно приближая оценки кросс-энкодера с помощью скалярного произведения изученных тестовых встраиваний запроса и элемента.

Подробнее см. статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему подпишитесь на наш SubReddit.

Автор: MarkTechPost

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

10.05.2024

Владимир Дьячков PhD

Лучшие ИИ

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

20.07.2024

Лучшие ИИ

Влияет ли генеративное искусственное интеллект на индивидуальное творчество, но уменьшает коллективную новизну?

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
04.09.2025

Лучшие ИИ

OLMoASR: Открытая Альтернатива Whisper для Распознавания Речи

Что такое OLMoASR и как он сравнивается с Whisper от OpenAI в распознавании речи? В эпоху стремительного роста технологий распознавания речи, OLMoASR поднимает планку открытых решений. Созданный Институтом…
29.09.2025

Лучшие ИИ

Запуск Claude Sonnet 4.5: Новые достижения в программировании и агентной работе

Введение в Claude Sonnet 4.5 от Anthropic В мире технологий, где автоматизация и искусственный интеллект становятся неотъемлемой частью бизнеса, выход нового продукта от Anthropic — Claude Sonnet 4.5…
10.08.2024

Лучшие ИИ

Выпущена система Parler-TTS: полностью открытая модель текст в речь с передовым синтезом речи для сложных и легких приложений.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
11.05.2024

Лучшие ИИ

Топ 50 инструментов для написания с использованием ИИ в 2024 году

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
27.03.2024

Лучшие ИИ

Искусственный интеллект стремится к беспрецедентной мощи. Сможет ли ядерный синтез удовлетворить его амбиции?

AI tools, AI Новости, Innovation, LLM, ИИ
26.06.2024

Лучшие ИИ

Новая открытая модель текст в речь MARS5 с улучшенной интонацией.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
15.06.2024

Лучшие ИИ

Новый метод разрежения модели dReLU увеличивает разреженность до 90% с сохранением производительности, обеспечивая 2-5× ускорение вывода.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

Эффективный метод вычисления скрытых представлений запросов и элементов для приближенного вычисления оценок совпадения.

Эффективное вычисление скрытых представлений запросов и элементов для приближения оценок CE

Разреженная факторизация матриц

Новый метод на основе разреженной факторизации матриц

Эксперименты и оценка

Заключение

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Монетизация Telegram-канала с цитатами и мотивацией

Как зарабатывать на блоге в Instagram про стиль жизни

Как эксперт по маркетингу может начать с AI

Инфлюенсер и AI — монетизация личного бренда

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Маркетолог по контенту : генерация SEO-оптимизированных текстов

ИИ-Агент для автоматизации медицинских записей : структурирование данных пациентов

ИИ-Агент по обработке клиентских запросов : автоматизация поддержки и анализа диалогов

ИИ-Специалист по автоматизации технической поддержки : диагностика и решение проблем

Как оценить рентабельность нового продукта: ИИ построит расчет ROI и Unit-экономику

Как написать понятную инструкцию “Как начать работать с продуктом”: ИИ сформирует пошаговый onboarding-текст

Как оформить чек-лист первичной диагностики проблемы: ИИ предложит список вопросов по типу обращения

Как офис-менеджеру быстро оформить командировку сотрудника: искусственный интеллект подскажет порядок и документы

Как собрать потребности в обучении от руководителей: ИИ предложит форму опроса и шаблон презентации

Как быстро реагировать на жалобы покупателей: искусственный интеллект предложит шаблоны ответов на типовые претензии

Лучший ИИ онлайн

Влияет ли генеративное искусственное интеллект на индивидуальное творчество, но уменьшает коллективную новизну?

OLMoASR: Открытая Альтернатива Whisper для Распознавания Речи

Запуск Claude Sonnet 4.5: Новые достижения в программировании и агентной работе

Выпущена система Parler-TTS: полностью открытая модель текст в речь с передовым синтезом речи для сложных и легких приложений.

Топ 50 инструментов для написания с использованием ИИ в 2024 году

Искусственный интеллект стремится к беспрецедентной мощи. Сможет ли ядерный синтез удовлетворить его амбиции?

Новая открытая модель текст в речь MARS5 с улучшенной интонацией.

Новый метод разрежения модели dReLU увеличивает разреженность до 90% с сохранением производительности, обеспечивая 2-5× ускорение вывода.

Редакционная политика

Отказ от ответственности

Реклама

FAQ

Контакты

О нас