“`html
Агенты веб-навигации: новый метод для повышения адаптивности и эффективности
Агенты веб-навигации разрабатываются для автономных систем, способных выполнять задачи, такие как поиск, покупки и извлечение информации из интернета. Они используют передовые языковые модели для интерпретации инструкций и навигации в цифровых средах, принимая решения о выполнении задач, обычно требующих вмешательства человека. Однако агенты по-прежнему испытывают трудности с выполнением сложных задач, требующих последовательности взаимозависимых действий на длительный период.
Преодоление ограничений
Одной из основных проблем в разработке этих агентов является их неспособность извлекать уроки из предыдущих задач. Они могут хорошо справляться с задачами, на которых были специально обучены, но часто действуют неэффективно в случае незнакомых задач. Традиционные методы решения этих проблем оказываются недостаточными для обеспечения гибкости и обучения, которые требуются для эффективного выполнения задач в различных областях.
Новый метод: Agent Workflow Memory (AWM)
Исследовательская группа из Университета Карнеги-Меллон и Массачусетского технологического института представила новый метод под названием “Agent Workflow Memory” (AWM) для решения этих проблем. AWM помогает агентам извлекать и сохранять последовательности действий из ранее решенных задач, что позволяет повторно использовать их в различных контекстах. Этот метод способен значительно улучшить эффективность и адаптивность агентов в различных цифровых задачах.
Практические результаты и применение
Тестирование метода на двух крупных бенчмарках – Mind2Web и WebArena – продемонстрировало значительное улучшение базовой производительности. AWM существенно повысил успешность задач на бенчмарке Mind2Web на 24,6% и на WebArena на 51,1%. Кроме того, AWM сократил количество шагов, необходимых для выполнения задач на WebArena, достигнув улучшения на 22,5% по сравнению с традиционными методами.
Исследователи также обнаружили, что AWM улучшает обобщение через задачи, веб-сайты и области. В кросс-задачных и кросс-доменных оценках AWM превзошел другие методы на 8,9-14,0 процентных пунктов. Эта способность к обобщению особенно важна, поскольку показывает, что AWM может адаптироваться к задачам, существенно отличающимся от тех, на которых агент изначально обучался.
Agent Workflow Memory представляет собой многообещающее решение для преодоления ограничений существующих агентов веб-навигации. Учитывая потенциал метода для улучшения производительности и сокращения шагов при выполнении задач, его внедрение может привести к революции в веб-навигации и повышению гибкости систем в обработке различных задач и областей.
Исследование доступно по ссылке. Подробности о проекте исследования можно найти на нашем Twitter, в нашем Telegram-канале и LinkedIn-группе. Подписывайтесь на нашу рассылку.
Не забудьте присоединиться к нашему Reddit-сообществу ML SubReddit.
Бесплатный вебинар по ИИ: ‘SAM 2 for Video: How to Fine-tune On Your Data’ (Ср, 25 сентября, 11:00 – 11:45 GMT+3)
Ознакомьтесь с AI Sales Bot, который поможет вам повысить эффективность работы с клиентами и снизить нагрузку на ваш отдел продаж.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!
“`