✅ Исследователи из Amazon предлагают KD-Boost: новый алгоритм сжатия знаний, разработанный для сопоставления семантики в реальном времени. (28 слов)

Исследователи Amazon предлагают KD-Boost: новый алгоритм знаниевой дистилляции, специально разработанный для мгновенного семантического сопоставления в реальном времени. Интересное решение для улучшения точности и эффективности! #Amazon #исследования

Amazon Researchers предлагают KD-Boost: новый алгоритм дистилляции знаний, разработанный для реального времени семантического сопоставления

Поиск в Интернете и поиск товаров в электронной коммерции — это две основные области применения, которые зависят от точного семантического сопоставления в режиме реального времени. В случае поиска товаров сложность заключается в устранении семантического разрыва между запросами пользователей и связанными результатами. Процедура сопоставления обычно состоит из двух шагов: поиск товаров (Product Sourcing, PS) и автоматическая реформулировка запросов. Поиск товаров находит соответствующие результаты для заданного запроса, которые часто называются продуктами в контексте поиска товаров. Затем автоматическая реформулировка запросов преобразует плохо сформулированные запросы пользователей в семантически схожие и хорошо сформулированные запросы для расширения охвата результатов.

Семантическое сопоставление

Семантическое сопоставление — это процесс, при котором поисковые системы распознают и связывают элементы с сопоставимыми значениями. С помощью семантического сопоставления запросы пользователей возвращают не просто любые результаты, а наиболее релевантные в заданном контексте. Модели на основе трансформера показали себя очень успешными в кодировании запросов и группировке их вместе в пространстве вложений с семантически связанными элементами, такими как запросы или результаты. Однако проблемы задержки делают большие модели трансформера непрактичными для сопоставления в реальном времени из-за высокой вычислительной сложности.

Решение проблемы

Для решения этих проблем команда исследователей из Amazon представила KD-Boost, новую технику дистилляции знаний, специально разработанную для решения проблем семантического сопоставления в реальном времени. KD-Boost использует истинные значения и мягкие метки от модели-учителя для обучения точных моделей с низкой задержкой. Парные сигналы запрос-продукт и запрос-запрос, полученные из прямых проверок, исследований поведения пользователей и данных на основе таксономии, являются источником мягких меток. Для правильного направления процесса обучения были использованы специальные функции потерь.

Исследователи сообщили, что в исследовании использовались различные источники сигналов сходства и несходства, чтобы удовлетворить совместные потребности реформулировки запросов и поиска товаров. Редакционные ординальные метки соответствия для пар запрос-продукт, информация о поведении пользователей, такая как клики и продажи, и таксономия товаров — некоторые примеры таких сигналов. Чтобы убедиться, что модель учится представлять нюансы релевантности и сходства, были использованы специальные функции потерь.

Команда поделилась, что тесты проводились на внутренних и внешних наборах данных электронной коммерции, которые продемонстрировали значительное улучшение на 2-3% в показателе ROC-AUC (Receiver Operating Characteristic – Area Under the Curve) по сравнению с прямым обучением модели-ученика. KD-Boost показал результаты лучше как современных стандартов дистилляции знаний, так и моделей-учителей.

В симулированных онлайн-тестах A/B с использованием KD-Boost для автоматической реформулировки запросов были замечены обнадеживающие результаты. Сопоставление запрос-запрос увеличилось на 6,31%, что свидетельствует об улучшенном семантическом понимании. Релевантность также улучшилась на 2,19%, что говорит о более точных и контекстно релевантных совпадениях, а покрытие продуктов увеличилось на 2,76%, что указывает на более широкий спектр релевантных результатов.

В заключение, это исследование решает проблемы задержки, связанные с обширным поиском товаров, акцентируя внимание на улучшении как поиска товаров, так и автоматической реформулировки запросов. Оно признает недостатки текущих моделей на основе трансформера и помогает изучить использование дистилляции знаний в качестве решения.

Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте присоединиться к нашему сообществу в Telegram, Facebook и Discord, где мы делимся последними новостями о искусственном интеллекте и интересными проектами.

Если вам нужны рекомендации по управлению ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей об ИИ, подпишитесь на наш Telegram-канал t.me/itinairu.

Посмотрите на практический пример решения на основе ИИ: бот для продаж от itinai.ru/aisales, созданный для автоматизации общения с клиентами круглосуточно и управления взаимодействием на всех этапах пути клиента.

Изучите, как искусственный интеллект может улучшить ваши продажи и общение с клиентами. Познакомьтесь с нашими решениями на сайте itinai.ru.

Исследователи из Amazon предлагают KD-Boost: новый алгоритм сжатия знаний, разработанный для сопоставления семантики в реальном времени. (28 слов)

Amazon Researchers предлагают KD-Boost: новый алгоритм дистилляции знаний, разработанный для реального времени семантического сопоставления

Семантическое сопоставление

Решение проблемы

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

AI-боты в онлайн-образовании

Монетизация для фитнес тренера с помощью искусственного интеллекта

Использование AI для специалистов по питанию

AI-помощник для дизайнера-фрилансера

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Агент для анализа данных о клиентах : выявление скрытых сегментов

ИИ-Специалист по автоматизации электронной коммерции : оптимизация карточек товаров

ИИ-Специалист по автоматизации интеграции систем : настройка API и потоков данных

ИИ-Агент по автоматизации отчетности : генерация финансовых и операционных отчетов

Как составить FAQ по обучению для сотрудников: ИИ предложит 20 вопросов и шаблоны ответов

Как администратору оформить акт о недостаче: искусственный интеллект сформирует текст под ситуацию

Как системному аналитику составить структуру ТЗ: ИИ предложит разделы и шаблон на основе ГОСТ 34

Как внедрить OKR в отдел продаж: искусственный интеллект предложит цели, ключевые результаты и формулировки

Как бухгалтеру оформить авансовый отчет за командировку в 2025 году: пошаговый гайд и образец

Как провести оценку эффективности обучения по модели Киркпатрика: ИИ предложит чек-лист и шаблон отчета

Лучший ИИ онлайн

ADOPT: Універсальный адаптивный метод градиента для надежной сходимости без настройки гиперпараметров

Как ускорить обработку обращений: ИИ предложит типовые шаблоны для самых частых запросов

Гемини против GPT-4: кто владеет будущим генеративного контента?

Площадка GenAI-Arena для оценки генеративных ИИ-моделей сообществом

Обучение и развитие искусственных агентов в разнообразных средах: AGENTGYM на пути к общему искусственному интеллекту

25 лучших инструментов ИИ для увеличения продаж в 2025 году

Оценка эффективности искусственного интеллекта и человеческой работы при редких заболеваниях

Политика конфиденциальности

Доступность

Карта сайта

О нас

Куки-политика

Политика комментариев