«Кофейный режим» Zencoder — это будущее кодирования: нажмите кнопку и позвольте AI написать ваши модульные тесты

admin

Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше


Сегодня Zencoder представляет свои агенты по кодированию и тестированию AI следующего поколения, позиционируя компанию из Сан-Франциско в качестве грозного претендента на известных игроков, таких как Github Copilot и новички, такие как Cursor.

Компания, основанная бывшим генеральным директором WRIKE Эндрю Фалев, интегрирует свои агенты искусственного интеллекта непосредственно в популярные среды разработки, включая код Visual Studio и JetBrains IDES, наряду с глубокими интеграциями с Jira, Github, Gitlab, Sentry и более чем 20 другими инструментами разработки.

«Мы начали с тезиса о том, что трансформаторы являются мощными компьютерными строительными блоками, но если вы поместите их в более агентскую среду, вы можете получить гораздо больше от них», — сказал Filev в эксклюзивном интервью VentureBeat. «Под агентом я имею в виду две ключевые вещи: во -первых, давая обратную связь с искусственным интеллектом, чтобы она могла улучшить свою работу, а во -вторых, оснастить ее инструментами. Как и человеческий интеллект, ИИ становится значительно более способным, когда в нем есть правильные инструменты».

Почему разработчикам не нужно будет отказываться от своих любимых IDE для помощи ИИ

Несколько помощников по кодированию ИИ появились в прошлом году, но подход Zencoder различает себя, работая в рамках существующих рабочих процессов, а не требует, чтобы разработчики переключали платформы.

«Нашим основным конкурентом является курсор. Курсор — это собственная среда разработки по сравнению с тем, что мы предоставляем те же самые мощные агентские возможности, но в существующих средах разработки», — сказал Filev VentureBeat. «Для некоторых разработчиков это не имеет значения. Но для некоторых разработчиков они либо хотят, чтобы они приходились к существующей среде».

Это различие имеет значение для разработчиков предприятий, работающих на Java и C#, языках, для которых специализированные IDE, такие как Jetbrains ‘Intellij и Rider, предлагают более надежную поддержку, чем обобщенная среда.

Как агенты ИИ Zencoder бьют современные тесты по двузначной марже

Компания претендует на значительные преимущества эффективности по сравнению с конкурентами, подкрепленными результатами стандартных отраслевых значений. Согласно FileV, агенты Zencoder могут решить 63% вопросов по проверке SWE-Bench, разместив его среди трех лучших исполнителей, несмотря на использование более практичного подхода с одним траекторием, а не выполнять несколько параллельных попыток, таких как некоторые ориентированные на исследования системы.

«Наш агент отличительна, потому что мы сосредоточены на создании лучшего трубопровода для реального использования разработчиков»,-сказал Файлв. «Что делает наш подход особенным, так это то, что наш агент работает на том, что мы называем единой дорожкой, единой траекторией. Для одного траектории агента успешно разрешить 63% этих сложных проблем, удивительно впечатляет».

Еще более примечательно, что компания сообщает о успехе примерно на 30% на более новом мультимодальном эталонном этаже Swe-Bench, который, по-видимому, в два раза превышает предыдущий результат менее 15%. На недавно внедренном Swe-Lancer IC Diamond Benchmark в Openai Zencoder сообщает более чем на 30% успеха-более чем на 20% лучше, чем лучший результат Openai.

Секретный соус: технология «repo grokking», которая понимает всю вашу кодовую базу

Производительность Zencoder проистекает из ее проприетарной технологии «Repo Grokking», которая анализирует и интерпретирует крупные кодовые базы для обеспечения критического контекста агентам ИИ.

«Все эти агенты обладают различными возможностями, сформированными языковыми моделями, встроенными в них», — пояснил Файлв. «Будь то пограничная модель или модель с открытым исходным кодом, LLM сам по себе ничего не знает о вашем конкретном проекте в подавляющем большинстве сценариев. Он может работать только с контекстом, который ему предоставлен».

Подход Zencoder сочетает в себе несколько методов, помимо простых встроенных ИИ для семантического поиска. «Он использует традиционный полный текстовый поиск, он использует пользовательский повторный рейнкер, использует LLM, использует синтетическую информацию. Таким образом, он делает много вещей, чтобы создать лучшее понимание репозитории клиентов»,-сказал Filev.

Это контекстуальное понимание помогает системе избежать общей критики помощников по кодированию ИИ — что они вводят больше проблем, чем решают путем неправильного понимания структур или зависимостей проектов.

«Режим кофе»: как разработчики могут, наконец, сделать перерывы, пока ИИ пишет свои модульные тесты

Возможно, наиболее привлечением внимания особенность-это то, что Zencoder называет «кофейным режимом», что позволяет разработчикам отойти, в то время как агенты искусственного интеллекта работают автономно.

«Вы можете буквально нажать эту кнопку и пойти на кофе, и агент выполнит эту работу само по себе», — сказал Filev VentureBeat. «Как нам нравится говорить в компании, вы можете навсегда наблюдать за водопадом, сжиганием огня и агентом, работающим в кофейном режиме».

Эта функция может быть применена как для написания кода, так и для создания модульных тестов — при этом последнее оказывается особенно ценным, поскольку многие разработчики предпочитают создавать новые функции по сравнению с написанием тестового покрытия.

«Я не видел разработчика, который похож на:« Боже мой, я хочу написать кучу тестов для моего кода », — сказал Файлв. «Им обычно нравится создание вещей, а тестирование — это как бы поддерживает творение, а не процесс творения».

Навигация по циклу шумиха: почему инструменты кодирования ИИ нужны квалифицированным разработчикам, чтобы сиять

Запуск Zencoder наступает в критический момент, когда разработчики и компании ориентируются на то, как эффективно интегрировать инструменты кодирования ИИ в существующие рабочие процессы. Отраслевой ландшафт включает скептиков, которые указывают на ограничения ИИ в производстве готового производства кода и энтузиастов, которые переоценивают свои возможности.

«Сейчас много эмоций, много эмоций, сдерживающих эмоций на стороне ИИ», — заметил Файлв. «Вы видите людей в обоих лагерях, как один из них, говорящий:« Эй, это лучшее после нарезанного хлеба, я собираюсь белый код, мой следующий Salesforce ». А потом у вас есть скептики, которые пытаются доказать, что они все еще самые умные дети в блоке … пытаясь найти сценарии, в которых он ломается ».

FileV выступает за более измеренный подход, рассматривая инструменты кодирования ИИ как сложные инструменты, требующие надлежащего навыка для эффективного использования. «Это инструмент. Это сложный инструмент, очень мощный инструмент. И поэтому инженеры должны создавать навыки, используя это. Это еще не так, чтобы это заменить инженера, по крайней мере, в крупных, сложных предприятиях».

Дорожная карта: готовая к производству генерация кодов искусственного интеллекта со встроенными проверками безопасности

Заглядывая в будущее, Zencoder планирует продолжить повышение производительности своих агентов на контрольных показателях, одновременно расширяя поддержку на большем количестве языков программирования и сосредотачиваясь на образовании кода, готового к производству со встроенным тестированием и проверкой безопасности.

«То, что вы увидите до конца года, большая часть этого будет сосредоточена на том, чтобы убедиться, что программное обеспечение, которое мы создаем для вас и с вами, вы уверены в нем», — сказал Файлв. «Мы хотим убедиться, что этот код проверяется с помощью ИИ или инструментами CI/CD, который протестирован кодом либо вашим CI/CD, либо с помощью ИИ, что вы знаете, что нет очевидных уязвимостей безопасности».

FileV предсказывает значительные изменения в ландшафте разработки программного обеспечения до конца 2025 года: «Я уверен, что к концу этого года индустрия программного обеспечения будет выглядеть совсем иначе, и что вся эта категория займет еще один поворот… до того, как календарь закончится, поэтому в ближайшие девять месяцев мы увидим еще одно поколение помощи кодирующему ИИ, кодирующие агенты ИИ».

Компания предлагает три уровня ценообразования: бесплатную базовую версию, бизнес -уровни в месяц в месяц с расширенными функциями кодирования и тестирования, а также уровня предприятия по 39 долларов США за пользователя в месяц, который включает в себя поддержку премиум -класса и функции соответствия.

Для индустрии, которая все еще обсуждает, заменит ли ИИ разработчиков или просто увеличит их, подход Zencoder предлагает третий путь: ИИ, который встречает разработчиков, где они находятся, помогает им пропустить утомительные части и позволяет им наслаждаться кофе в мире.



Источник

Рекомендуем

Оставить комментарий