Современные AI-агенты, способные работать в браузере, становятся все более популярными, обещая изменить способы взаимодействия компаний с интернетом. Эти инструменты могут самостоятельно перемещаться по сайтам, находить информацию и даже выполнять транзакции. Однако первые тесты показывают, что между обещаниями и реальной производительностью есть существенный разрыв.
Оглавление
Основные направления использования
Хотя примеры для обычных пользователей, такие как заказ пиццы или покупка билетов, привлекают внимание, главный вопрос заключается в том, как эти технологии будут применяться в бизнесе.
- Автоматизация рутинных задач. Например, поиск самых выгодных цен на товары или бронирование отелей.
- Интеграция с другими инструментами. Такими как Deep Research, что позволяет проводить более сложные исследования и выполнять задачи в интернете.
Ключевые игроки на рынке
Рынок AI-агентов для браузеров быстро развивается, и на нем уже представлены как крупные компании, так и стартапы:
| Название | Дата запуска | Особенности |
|---|---|---|
| OpenAI Operator | Январь 2025 | Доступен для подписчиков ChatGPT Pro ($200/месяц), ориентирован на потребителей |
| Convergence Proxy | Декабрь 2024 | Бесплатный доступ с ограничениями (5 сессий/день) или $20/месяц без ограничений |
| Google Project Mariner | В разработке | Доступен по предварительной регистрации |
| Anthropic Computer Use | Октябрь 2024 | Ожидается обновление |
| Microsoft OmniParser V2 | Февраль 2025 | Открытый проект для анализа скриншотов интерфейсов |
| ByteDance UI-TARS | В разработке | Требует глубокого доступа к системе, что вызывает вопросы безопасности |
| Browser-Use | В разработке | Позволяет выбирать модели AI, включая Google Gemini 2.0 Flash |
Наиболее продвинутыми на данный момент являются Operator и Proxy, которые готовы к использованию «из коробки». Другие решения, такие как Browser-Use, больше подходят для разработчиков и корпоративных клиентов, предлагая возможность настройки моделей.


Результаты тестирования
В ходе тестирования выяснилось, что способность AI-агентов к логическому мышлению важнее, чем просто автоматизация.
Проверь свои знания в наших бесплатных тестах по ИИ! Пройди тест и узнай, насколько хорошо ты разбираешься в технологиях искусственного интеллекта!
- Пример 1: Поиск пяти самых популярных статей на weisslog.com.
- Operator столкнулся с трудностями, попав в бесконечный цикл поиска.
- Proxy справился лучше, выбрав статьи с главной страницы как наиболее популярные.
- Пример 2: Бронирование столика в ресторане.
- Operator искал сначала ресторан, а затем проверял доступность, что привело к тупику.
- Proxy использовал OpenTable для поиска доступных вариантов и предложил более высоко оцененный ресторан.
- Пример 3: Поиск цены на YubiKey 5C NFC на Amazon.
- Proxy справился быстрее и точнее, чем Operator.
Проблемы и ограничения
- Блокировка автоматических действий. Некоторые сайты блокируют автоматический доступ или требуют CAPTCHA.
- Вопросы безопасности. Такие инструменты, как UI-TARS, требуют глубокого доступа к системе, что может быть рискованно.
- Необходимость ручного вмешательства. Например, ввод логинов или CAPTCHA.
Перспективы для бизнеса
AI-агенты могут значительно изменить подход к автоматизации задач в компаниях.
- Снижение затрат. Замена виртуальных ассистентов на AI-агенты может сократить расходы.
- Интеграция с RPA. Использование AI-агентов в сочетании с другими инструментами автоматизации.
- Конкуренция и цены. Доступность открытых моделей, таких как DeepSeek-R1, стимулирует развитие и снижение цен.
Для компаний, рассматривающих внедрение AI-агентов, важно сосредоточиться на конкретных задачах, где такие инструменты могут принести наибольшую пользу. Технологии развиваются быстро, но успех будет зависеть от их адаптации к реальным бизнес-потребностям.
2025 год станет ключевым для внедрения AI-агентов в корпоративной среде, а конкуренция между крупными игроками и стартапами будет стимулировать инновации и снижение цен.




