Proxy Lite: Эффективный инструмент автоматизации веб-взаимодействий с открытыми весами

В современном цифровом мире автоматизация взаимодействия с веб-контентом представляет собой сложную задачу. Существующие решения часто требуют значительных ресурсов и подходят только для узкоспециальных задач, что ограничивает их более широкое применение. Разработчики сталкиваются с необходимостью балансировать между вычислительной эффективностью и универсальностью моделей для работы с различными веб-сайтами. Традиционные системы, полагающиеся на предсказание по запросу, часто не обладают необходимым уровнем рефлексивного мышления для работы в непредсказуемой веб-среде. Кроме того, проприетарные модели обычно ограничивают доступ к своим внутренним механизмам, что затрудняет исследование и развитие в открытом сообществе. Эти проблемы подчеркивают необходимость разработки инструмента автоматизации, который был бы как эффективным, так и доступным.

Компания Convergence представила Proxy Lite: мини-версию своего известного помощника Proxy с открытыми весами. Эта модель Vision-Language с 3 миллиардами параметров предназначена для расширения возможностей веб-автоматизации для сообщества с открытым исходным кодом. Proxy Lite предлагает сбалансированный подход, сочетающий эффективность с надежностью, и позволяет выполнять разнообразные веб-задачи без значительных вычислительных затрат.

Proxy Lite выделяется своим прозрачным дизайном и открытым подходом к весам, что побуждает сообщество исследовать, модифицировать и улучшать его. Интегрированная система для взаимодействия модели Vision-Language и браузера позволяет точно управлять задачами в браузере. Конфигурация модели поддерживает практические приложения — от рутинного извлечения данных до более сложных навигационных задач, при этом контролируя потребление ресурсов.

Технические аспекты и их преимущества

Proxy Lite основан на модели с 3 миллиардами параметров, построенной на основе Qwen2.5-VL-3B-Instruct. Эта модель использует трехфазный процесс для генерации ответов:

  • Наблюдение: Модель анализирует текущее состояние веб-страницы, например, проверяет, что оверлей или баннер конфиденциальности были закрыты.
  • Размышление: Затем она методично определяет следующий шаг, взвешивая различные возможности в зависимости от контекста.
  • Вызов инструмента: Наконец, она отдает точную команду для выполнения выбранного действия в браузере.

Такой структурированный подход не только повышает надежность выполнения задач, но и способствует способности модели обобщать различные типы веб-взаимодействий. Proxy Lite имитирует процессы человеческого мышления, обеспечивая баланс между простотой и сложностью. Кроме того, его дизайн поддерживает простую интеграцию как в интерфейсы командной строки, так и в приложения Streamlit.

Информация о производительности и практические оценки

Proxy Lite была тщательно оценена с использованием бенчмарка WebVoyager, который включает в себя набор задач для тестирования возможностей веб-автоматизации. Модель достигла общего балла 72.4%, что является хорошим показателем производительности, учитывая ее открытые веса. Подробная статистика производительности на различных веб-сайтах подтверждает ее продуманный дизайн:

  • Allrecipes: 87.8% успеха с 10.3 обменами сообщений в среднем, демонстрирует эффективность в контентно насыщенных средах.
  • Amazon: 70.0% успеха подчеркивает способность модели работать на более сложных динамических платформах электронной коммерции.
  • Значимые высокопрофильные сайты: Успехи в низких 80-х на таких платформах, как Apple и GitHub, показывают надежность модели на различных сайтах.
  • Сервисы Google: Хотя некоторые области, такие как Google Flights, дают более низкие показатели, общая производительность остается конкурентоспособной.

Эти результаты отражают сбалансированную производительность, при которой Proxy Lite эффективно управляет задачами без нагрузки, обычно связанной с более крупными проприетарными моделями. Всеобъемлющая оценка подчеркивает как текущую полезность, так и потенциал для улучшений за счет доработок сообществом.

Заключение

Proxy Lite выступает как продуманный инструмент в области веб-автоматизации. Решая ключевые проблемы — такие как ограниченность ресурсов, обобщение и прозрачность — он предлагает практическое решение для автоматизации рутинных онлайн-заданий. Открытый подход и модульный дизайн приглашают к сотрудничеству и дальнейшему развитию, предоставляя ценную ресурс как для академических исследований, так и для коммерческих проектов.

Посмотрите технические детали и модель здесь. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также, не стесняйтесь подписываться на нас в Twitter и не забудьте присоединиться к нашему ML SubReddit с более чем 80 тысячами участников.

Изучите, как технологии искусственного интеллекта могут изменить ваш подход к работе, например: Convergence Releases Proxy Lite: A Mini, Open-Weights Version of Proxy Assistant Performing Pretty Well on UI Navigation Tasks.

Посмотрите вокруг и найдите процессы, которые можно автоматизировать. Определите моменты взаимодействия с клиентами, где искусственный интеллект может добавить наибольшую ценность.

Выделите важные ключевые показатели эффективности (KPI), чтобы убедиться, что ваши инвестиции в ИИ действительно положительно влияют на бизнес.

Выберите инструменты, которые соответствуют вашим потребностям и позволяют настраивать их в соответствии с вашими целями.

Начните с небольшого проекта, соберите данные о его эффективности и постепенно расширяйте использование ИИ в вашей работе.

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей ИИ, подпишитесь на наш Telegram https://t.me/itinai.

Посмотрите практический пример решения на основе ИИ: бот для продаж с https://itinai.ru/aisales, предназначенный для автоматизации взаимодействия с клиентами круглосуточно и управления взаимодействиями на всех этапах клиентского пути.