“`html
Автономная навигация в Интернете
Автономная навигация в Интернете направлена на разработку искусственного интеллекта, способного выполнять сложные онлайн-задачи. Она включает в себя автоматизацию задач, таких как поиск данных, отправка форм, поиск дешевых авиабилетов или бронирование размещения. За счет использования больших языковых моделей (LLM) и других методов искусственного интеллекта, автономная навигация в Интернете направлена на повышение производительности как в потребительской, так и в корпоративной сферах путем автоматизации задач, которые обычно выполняются вручную и занимают много времени.
Проблемы существующих веб-агентов
Традиционные веб-агенты сталкиваются с проблемами при работе с шумными и обширными моделями объектов документов HTML (DOM) и динамическим характером современных веб-страниц. Они часто не могут выполнять задачи точно из-за неспособности эффективно обрабатывать сложность и изменчивость веб-контента. Это является значительным препятствием для практического применения автономных веб-агентов в реальных приложениях, где надежность и точность играют важную роль.
Решение – Agent-E
Исследователи в Emergence AI представили Agent-E, новый веб-агент, разработанный для преодоления недостатков существующих систем. Иерархическая архитектура Agent-E разделяет фазы планирования и выполнения задач на два отдельных компонента: агент-планировщик и агент навигации браузера. Это позволяет каждому компоненту сосредоточиться на своей специфической роли, улучшая эффективность и производительность. Agent-E разбивает задачи на подзадачи, которые затем выполняются агентом навигации браузера с использованием передовых техник обработки DOM.
Результаты и преимущества
Оценки с использованием бенчмарка WebVoyager показали, что Agent-E значительно превосходит предыдущие веб-агенты. Agent-E достиг успеха в 73,2%, что на 20% превышает результаты предыдущих веб-агентов, и на 16% – мультимодальных веб-агентов. На сложных сайтах, таких как Wolfram Alpha, улучшение производительности Agent-E достигло 30%. Кроме того, Agent-E в среднем затрачивает 150 секунд на успешное выполнение задачи и 220 секунд на неудачные задачи, что подчеркивает его эффективность и эффективность.
Заключение
Исследование, проведенное в Emergence AI, представляет собой значительное достижение в области автономной навигации в Интернете. Agent-E устанавливает новый стандарт производительности и надежности, преодолевая неэффективности существующих веб-агентов через иерархическую архитектуру и передовые техники управления DOM. Успех Agent-E в достижении 73,2% успешного выполнения задач и эффективный процесс выполнения задач подчеркивают его потенциал для трансформации веб-навигации и автоматизации.
Проверьте статью и GitHub. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашему Telegram-каналу и группе в LinkedIn. Если вам понравилась наша работа, вам понравится наш новостной бюллетень.
Не забудьте присоединиться к нашему сообществу Reddit.
Найдите предстоящие вебинары по ИИ здесь.
Оцените AI Sales Bot здесь.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab здесь.