Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
Groq и Playai объявили о партнерстве сегодня, чтобы принести Dialog, расширенную модель текста в речь, на рынок через высокоскоростную платформу вывода Groq.
Партнерство объединяет опыт Playai в Voice AI со специализированной инфраструктурой обработки GROQ, создавая то, что компании утверждают, что является одной из самых естественных и отзывчивых систем текста в речь.
«Groq предоставляет полную систему с низкой задержкой для автоматического распознавания речи (ASR), Genai и текста в речь, все в одном месте»,-сказал Ян Эндрюс, директор по доходам в GROQ, в эксклюзивном интервью VentureBeat. «С помощью диалога, работающего на Groqcloud, это означает, что клиентам не придется использовать несколько поставщиков для одного варианта использования — GROQ — это решение для одной остановки».
Groq Powers First Arabic Voice AI, расширение технического присутствия на Ближнем Востоке
Диалог примечательна для того, чтобы быть доступным как на английском, так и на арабском языке, а арабская версия представляет первый Voice AI, специально предназначенный для региона Ближнего Востока. Включение арабского языка в качестве одного из первоначальных предложений было стратегическим для обеих компаний.
«Арабский язык является четвертым по разглашенным языкам во всем мире — партнерство с Playai, чтобы предложить арабскую модель TTS, Groq открывает ключевой мировой рынок и обеспечивает более широкий доступ к быстрому выводу AI», — сказал Эндрюс VentureBeat.
Компании утверждают, что в своем решении рассматриваются ключевые недостатки в существующих технологиях Voice AI, особенно в отношении естественных речевых моделей и скорости отклика. Согласно эталоному тестированию, проведенному сторонним оценщиком Podonos, пользователи предпочитали диалог со скоростью 10: 1 против Elevenlabs v2.5 Turbo и более 3: 1 против Elevenlabs Multyringual V2.0.
Инновационный «адаптивный речь контекстуализатор» преобразует разговорную ИИ
То, что отличает диалоговое окно, — это его сложный подход к контексту. Вместо того, чтобы рассматривать каждое вокализацию как изолированное событие, система поддерживает осознание всего потока разговоров.
«Мы создали новую архитектуру, которую мы называем« адаптивной речевой контекстуализатором »(ASC), которая позволяет модели использовать полный контекст и историю разговора»,-сказал Махмуд Фелфель, соучредитель и генеральный директор Playai, в интервью VentureBeat. «Это означает, что каждый ответ не просто отдельный выход; он обогащен соответствующей просодией, тоном и эмоциями, которые отражают поток разговора».
Для предприятий, стремящихся реализовать разговорную ИИ, задержка — задержка между запросом и ответом — была постоянной проблемой. Специализированные языковые подразделения GROQ (LPU), по -видимому, дают значительное преимущество в этой области.
«Основываясь на начальном внутреннем тестировании, GROQ доставляет до 140 символов в секунду на модели диалога Playai, значительный импульс по сравнению с той же моделью, работающей на графических процессорах со скоростью 86 символов в секунду», — объяснил Эндрюс. «Это означает, что диалог генерирует текст в 10 раз быстрее, чем в режиме реального времени».
GROQ обеспечивает 1,5 миллиарда долларов США в инвестиции в области инфраструктуры ИИ мирового класса
Партнерство происходит во время значительного расширения для GROQ, которое недавно получило обязательства в размере 1,5 миллиарда долларов от Саудовской Аравии для финансирования дополнительной инфраструктуры. Компания создала центр обработки данных в Dammam, который она описывает как «крупнейший кластер лонгионов региона».
«Партнерство с Groq было нелегким; они лидером отрасли в области продвинутой инфраструктуры вывода искусственного интеллекта»,-сказал Фелфель. «С TTS и агентами низкая задержка является ключевым. Мы уже оптимизировали диалоговое окно для этих приложений в реальном времени, но партнерство с GROQ позволяет нам предоставить на рынке самую низкую задержку голосовой модели».
Рынок AI Voice показал быстрый рост, поскольку предприятия стремятся автоматизировать взаимодействие с клиентами, сохраняя при этом естественный, похожий на человека опыт. Приложения варьируются от обслуживания клиентов и автоматизации продаж до голосовых и функций доступности для визуальных нарушений.
Корпоративные приложения выходят за рамки традиционных вариантов обслуживания клиентов
«Помимо обслуживания клиентов, другие варианты использования предприятия включают в себя автоматизацию планирования продаж и назначений, бортовых и личных помощников, создание голосовых овер на существующий контент, перевод английского аудио-контента на арабский язык, увеличение доступности веб-сайта и статического контента для визуальных нарушений и многого другого»,-сказал Эндрюс.
Для Playai, которая была основана предпринимателями из региона Ближнего Востока и Северной Африки, включение арабских языковых способностей было особенно значимым.
«Как основатели MENA, мы знаем, что регион в значительной степени инвестирует в возможности ИИ и инфраструктуру, как зараженные инвестициями, такими как GROQ, но также и ведущее в мире принятие»,-сказал Фелфель. «Арабский язык — это глобальный деловой язык и тот, о котором мы выросли, так что это был естественный выбор в качестве одного из наших основных языков».
Компании сделали технологию диалога доступной через многоуровневую модель обслуживания Groqcloud, которая включает как бесплатные, так и платные варианты. Этот подход позволяет разработчикам экспериментировать с технологией, прежде чем принять участие в более крупных реализациях.
«Groqcloud предлагает как бесплатные, так и платные планы. Любой может создать учетную запись и бесплатно создать код API», — пояснил Эндрюс. «Наш уровень платного разработчика является самообслуживанием, то есть любой, у кого есть кредитная карта, может зарегистрироваться».
Поскольку голос становится все более важным интерфейсом для систем искусственного интеллекта, это партнерство позиционирует обе компании, чтобы использовать растущий спрос на более естественный и отзывчивый разговор. Решая технические проблемы задержки и природных речевых моделей, Groq и Playai, возможно, сняли значительные барьеры для более широкого внедрения Voice AI в условиях предприятия.
Источник
