Супер агент Генспарка поднимает ставку в гонке общего агента искусственного интеллекта

admin

Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше


Общий ландшафт AI-агента в внезапно гораздо более переполнен и амбициозен.

На этой неделе стартап на основе Пало-Альто Генспарк выпустил то, что он называет Super Agent, быстро движущейся автономной системой, предназначенной для выполнения реальных задач в широком диапазоне доменов, включая некоторые, которые поднимают бровей, такие как телефонные звонки в рестораны, используя реалистичный синтетический голос.

Запуск добавляет топливо к тому, что формирует, чтобы стать важным новым фронтом в конкурсе ИИ: кто построит первого надежного, гибкого и по-настоящему полезного агента общего назначения? Возможно, более срочно, что это значит для предприятий?

Запуск Genspark Super Agent произошел всего через три недели после другого китайского стартапа Manus, привлек внимание к своей способности координировать инструменты и источники данных для полных асинхронных облачных задач, таких как бронирование путешествий, скрининг резюме и анализ запасов-все они без ручных, типичных для большинства современных агентов.

Генпарк теперь утверждает, что идет еще дальше. По словам соучредителя Эрика Цзина, супер агент построен на трех столпах: концерт из девяти различных LLM, более 80 инструментов и более 10 проприетарных наборов данных-все они работают вместе в скоординированном потоке. Он выходит за рамки традиционных чат -ботов, обрабатывая сложные рабочие процессы и возвращая полностью выполненные результаты.

В демонстрации агент Генспарка запланировал полную пятидневную поездку в Сан-Диего, рассчитанные расстояния ходьбы между достопримечательностями, нанести на карту варианты общественного транспорта, а затем использовал голосовой агент для бронирования ресторанов, включая обработку пищевой аллергии и предпочтения для сидения. Другая демонстрация показала, что агент создает видео кулинарного видео, генерируя шаги рецептов, видео сцен и аудиооверлей. В третьем он написал и выпустил анимационный эпизод в стиле Южного парка, в результате чего политический скандал в стиле Signalgate включал в себя совместное использование военных планов с политическим репортером.

Это может звучать ориентирован на потребителей, но они демонстрируют, куда движется технология-к многомодальной многоэтапной автоматизации задач, которая размывает грань между творческим генерацией и исполнением.

«Решение этих реальных проблем гораздо сложнее, чем мы думали,-говорит Цзин в видео,-но мы взволнованы прогрессом».

Одна убедительная особенность: Super Agagt четко визуализирует свой мыслительный процесс, отслеживая то, как он рассматривает каждый шаг, какие инструменты он вызывает и почему. Наблюдение за этой логикой в ​​режиме реального времени заставляет систему чувствовать себя не похожим на черный ящик и больше похож на партнера. Это также может вдохновить разработчиков предприятия на создание аналогичных прослеживаемых рассуждений в свои собственные системы ИИ, что делает приложения более прозрачными и заслуживающими доверия.

Супер агент также был впечатляюще легко попробовать. Интерфейс запускается плавно в браузере без технической настройки. Genspark позволяет пользователям начать тестирование, не требуя личных учетных данных. Напротив, Manus по -прежнему требует, чтобы кандидаты присоединились к списку ожидания и раскрывали социальные учетные записи и другую личную информацию, добавляя трение к экспериментам.

Мы впервые написали о Генспаке еще в ноябре, когда он запустил финансовые отчеты Claude. Он собрал не менее 160 миллионов долларов в двух раундах и поддержан нами и сингапурскими инвесторами.

Посмотрите последнюю видео обсуждение между разработчиком агента искусственного интеллекта Сэм Виттивином и мной, чтобы более глубокое погружение в то, как подход Генспарка сравнивается с другими агентскими рамками и почему он имеет значение для команд AI Enterprise.

Как Genspark это снимает?

Подход Genspark выделяется, потому что он навигает на давнюю задачу искусственного интеллекта: оркестрование инструментов в масштабе.

Большинство нынешних агентов ломаются при жонглировании большей, чем несколько внешних API или инструментов. Супер агент Genspark, по-видимому, управляет этим лучше, вероятно, используя модель маршрутизации и выбора на основе поиска для выбора инструментов и подмоделей динамически на основе задачи.

Эта стратегия повторяет новые исследования в области Cotools, новой основы из Университета Суохоу в Китае, которая расширяет то, как LLM используют обширные и развивающиеся наборы инструментов. В отличие от более старых подходов, которые в значительной степени зависят от быстрой инженерии или жесткой точной настройки, Cotools сохраняет базовую модель «замороженной», в то же время обучая более мелкие компоненты для суждения, извлечения и эффективного вызова инструментов.

Другим фактором является протокол контекста модели (MCP)менее известный, но все более принятый стандарт, который позволяет агентам переносить более богатый инструмент и контексты памяти по шагам. В сочетании с запатентованными наборами данных Genspark MCP может быть одной из причин, по которой его агент появляется более «управляемый», чем альтернативы.

Как это сравнивается с Manus?

Genspark не первый стартап, продвигающий общих агентов. Manus, запущенный в прошлом месяце компанией из Китая Monica, сделал волны со своей многоагентной системой, которая автономно запускает такие инструменты, как веб-браузер, редактор кода или двигатель электронной таблицы для выполнения многоступенчатых задач.

Эффективная интеграция Manus о частях с открытым исходным кодом, включая веб-инструменты и LLM, такие как Claude From Antropric, была удивительной. Несмотря на то, что он не создал запатентованный модельный стек, он по-прежнему превзошел Openai на эталоне GAIA-синтетический тест, предназначенный для оценки автоматизации реальной задачи агентами.

Генпарк, однако, утверждает, что спрыгнул Manus, набрав 87,8% на Gaia — что -то из Мануса сообщила 86% — и сделав это с архитектурой, которая включает в себя собственные компоненты и более обширный охват инструмента.

Большие технологические игроки: все еще играете в безопасное место?

Между тем, крупнейшие американские компании ИИ были осторожны.

Основное предложение Microsoft AI, Copilot Studio, фокусируется на тонких настраиваемых вертикальных агентах, которые тесно связаны с предприятиями, такими как Excel и Outlook. Агент Openai SDK предоставляет строительные блоки, но останавливается на доставке своих собственных полнофункциональных, Агент общего назначения. АмаНедавно объявленный Закон о NOVA Zon использует подход, основанный на разработчике, предлагая действия на основе атомных браузеров через SDK, но тесно связанный со своей новой инфраструктурой и облачной инфраструктурой.

Эти подходы являются более модульными, более безопасными и четко ориентированы на использование предприятия. Но им не хватает амбиций — или автономии — пятна в демонстрации Генскарка.

Одной из причин может быть отвращение к риску. Затраты на репутацию могут быть высокими, если общий агент из Google или Microsoft книги «Неправильный рейс» или говорит что -то странное на голосовом вызове. Эти компании также заблокированы в своих собственных модельных экосистемах, ограничивая их гибкость для экспериментов с многомодерной оркестровкой.

Стартапы, такие как Genspark, напротив, имеют свободу смешивать и сочетать LLMS — и двигаться быстро.

Должны ли предприятия заботиться?

Это стратегический вопрос. Большинству предприятий не нужен агент общего назначения, чтобы сделать бронирование ужина или производить сатирические мультфильмы. Но вскоре им могут понадобиться агенты, которые могут выполнять конкретные многоэтапные задачи, такие как всплывание и форматирование данных соответствия, организовывая адаптацию клиентов или создание контента в нескольких форматах.

В этом контексте работа Генспарка становится более актуальной. Чем более беспроблемные и автономные общие агенты становятся — и чем больше они интегрируют голос, память и внешние инструменты — тем больше они могут начать конкурировать с устаревшими приложениями SaaS и платформами RPA.

И они делают это с более легкой инфраструктурой. Например, Genspark утверждает, что его агент «супер управляемый» и пригоден для использования маркетологами, учителями, рекрутерами, дизайнерами и аналитиками — все с минимальной установкой.

Эра общего агента больше не является гипотетической. Это здесь — и он движется быстро.

Посмотрите видео видео:



Источник

Рекомендуем

Оставить комментарий