Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
Google Cloud обнародовал свой блок обработки тензора седьмого поколения (TPU)Ironwood, в среду. Этот пользовательский ускоритель ИИ, утверждает компания, Предоставляет более 24 раза больше вычислительной мощности самого быстрого суперкомпьютера в мире при развертывании в масштабе.
Новый чип, анонсированный в Google Cloud Next ’25, представляет собой значительный поворот в десятилетней стратегии развития чипов ИИ в Google. В то время как предыдущие поколения TPU были разработаны главным образом как для рабочих нагрузок обучения, так и для выводов, Ironwood является первым специально построенным специально для вывода-процесс развертывания обученных моделей ИИ для прогнозирования или генерации ответов.
«Ironwood создан для поддержки следующего этапа генеративного ИИ и его огромных вычислительных и коммуникационных требований», — сказал Амин Вахдат, вице -президент Google и генеральный директор ML, Systems и Cloud AI, на виртуальной пресс -конференции перед событием. «Это то, что мы называем« возрастом вывода », когда агенты искусственного интеллекта будут активно извлекать и генерировать данные для совместной работы и ответов, а не только данные».
Разрушительные вычислительные барьеры: внутри 42,5 Exaflops of Ai Muscle Ironw
Технические характеристики Железного дерева поразительны. При масштабировании до 9 216 чипов на капсула Ironwood предоставляет 42,5 экзафлопа вычислительной мощности — карлинг El Capitan 1,7 Exaflops, в настоящее время самый быстрый суперкомпьютер в мире. Каждый отдельный чип Ironwood обеспечивает пиковой вычисление 4614 терафлопов.
Ironwood также имеет значительные улучшения памяти и полосы пропускания. Каждый чип поставляется с 192 ГБ памяти с высокой пропускной способностью (HBM), в шесть раз больше, чем Trillium, объявил TPU предыдущего поколения Google в прошлом году. Пропускная способность памяти достигает 7,2 терабит в секунду на чип, улучшение 4,5x по сравнению с Trillium.
Возможно, самое главное, в эпоху центров обработки данных, ограниченных электроэнергией, Ironwood обеспечивает вдвое больше производительности за ватт по сравнению с Trillium и почти в 30 раз больше энергии, чем первый облачный TPU Google с 2018 года.
«В то время, когда доступная мощность является одним из ограничений для предоставления возможностей ИИ, мы обеспечиваем значительно больше емкости на ватт для рабочих нагрузок клиентов», — пояснил Вахдат.
От построения моделей до «мышления машин»: почему Focus Google вывод имеет значение сейчас имеет значение
Акцент на вывод, а не на тренировке представляет собой значительную точку перегиба на временной шкале ИИ. Индустрия была зациклена на создании все более масштабных моделей фундамента в течение многих лет, и компании конкурируют в основном за размер параметров и возможности обучения. Оптимизация вывода Google предполагает, что мы вступаем в новый этап, на котором эффективность развертывания и возможности рассуждений занимают центральное место.
Этот переход имеет смысл. Обучение проводится один раз, но операции по выводу происходят в ежедневные в день, когда пользователи взаимодействуют с системами искусственного интеллекта. Экономика ИИ все чаще связана с затратами на вывод, особенно в том, что модели становятся более сложными и вычислительно интенсивными.
Во время пресс-конференции Vahdat сообщил, что Google наблюдал 10-кратное увеличение спроса на вычисление ИИ за последние восемь лет-ошеломляющий фактор в целом в 100 миллионов. Никакое количество закона Мура не могло удовлетворить эту кривую роста без специализированных архитектур, таких как Ironwood.
Что особенно заметно, так это акцент на «моделях мышления», которые выполняют сложные аргументированные задачи, а не простое распознавание закономерности. Это говорит о том, что Google видит будущее ИИ не только в более крупных моделях, но и в моделях, которые могут разбить проблемы, разумно посредством нескольких шагов и имитировать человеческие мыслительные процессы.
Двигатель мышления Gemini: как модели Google следующего поколения используют расширенное оборудование
Google позиционирует Ironwood как основу для своих самых передовых моделей ИИ, включая Gemini 2.5, которые компания описывает как «мыслительные возможности изначально встроенные».
На конференции Google также объявил Gemini 2.5 Flash, более рентабельную версию своей флагманской модели, которая «корректирует глубину рассуждений на основе сложности подсказки». В то время как Gemini 2.5 Pro предназначен для сложных вариантов использования, таких как обнаружение лекарств и финансовое моделирование, Flash Gemini 2.5 расположена для повседневных приложений, где реагирование имеет решающее значение.
Компания также продемонстрировала свой полный набор моделей генеративных медиа, в том числе текст к изображению, текстовый к видео и недавно объявленную возможность текста в музыку, называемую Lyria. Демонстрация показала, как эти инструменты можно использовать вместе для создания полного рекламного видео для концерта.
За пределами кремния: комплексная стратегия инфраструктуры Google включает в себя сеть и программное обеспечение
Ironwood является лишь одной частью более широкой стратегии инфраструктуры ИИ Google. Компания также объявила Cloud WAN, управляемую сетевую службу широкой области, которая дает предприятиям доступ к частной сетевой инфраструктуре Google.
«Cloud WAN — это полностью управляемая, жизнеспособная и безопасная основная сеть корпоративных сетей, которая обеспечивает до 40% повышения производительности сети, а также снижение общей стоимости владения на эти же 40%», — сказал Вахдат.
Google также расширяет свои программные предложения для рабочих нагрузок, включая Pathways, свое время выполнения машинного обучения, разработанное Google DeepMind. Pathways on Google Cloud позволяет клиентам масштабировать модель, обслуживающую сотни TPU.
Экономика ИИ: как облачный бизнес Google за 12 миллиардов долларов планирует выиграть войну за эффективность
Эти аппаратные и программные объявления приходится на решающее время для Google Cloud, которое сообщило о доходах за 4 миллиарда долларов в 4 квартале 2024 года, что на 30% за год в своем последнем отчете о прибыли.
Экономика развертывания ИИ все больше становится дифференцирующим фактором в облачных войнах. Google сталкивается с интенсивной конкуренцией со стороны Microsoft Azure, которая вложила свое партнерство Openai на огромную позицию на рынке, и Amazon Web Services, которые продолжают расширять свои предложения Trainium и Conferentia Chips.
Что разделяет подход Google, так это его вертикальная интеграция. В то время как конкуренты имеют партнерские отношения с производителями чипов или приобретенными стартапами, Google более десяти лет разрабатывает TPU. Это дает компании беспрецедентный контроль над своим стеком ИИ, от кремния до программного обеспечения и услуг.
Предоставляя эту технологию для корпоративных клиентов, Google делает ставку на то, что его трудолюбивый опыт создания чипов для поиска, Gmail и YouTube приведет к конкурентным преимуществам на рынке предприятия. Стратегия ясна: предложите ту же инфраструктуру, которая владеет собственным ИИ Google в масштабе, всем, кто хочет заплатить за это.
Многоагентная экосистема: дерзкий план Google для систем искусственного интеллекта, которые работают вместе
Помимо аппаратного обеспечения, Google обрисовал в общих чертах видение ИИ, сосредоточенного на многоагентных системах. Компания объявила о наборе для разработки агента (ADK), который позволяет разработчикам создавать системы, где несколько агентов искусственного интеллекта могут работать вместе.
Возможно, наиболее важно, что Google объявил о «протоколе взаимодействия агента в агенту» (A2A), который позволяет агентам искусственного интеллекта, созданным на разных рамках, и разными поставщиками общаться друг с другом.
«2025 год будет переходным годом, когда генеративные AI перемещаются от ответа на отдельные вопросы к решению сложных задач с помощью агрессивных систем», — предсказал Вахдат.
Google сотрудничает с более чем 50 лидерами отрасли, включая Salesforce, ServiceNow и SAP, для продвижения этого стандарта взаимодействия.
Проверка реальности предприятия: что означает власть и эффективность Ironwood для вашей стратегии искусственного интеллекта
Для предприятий, развертывающих ИИ, эти объявления могут значительно снизить стоимость и сложность запуска сложных моделей ИИ. Повышенная эффективность Ironwood может сделать модели расширенного рассуждения более экономичными, в то время как протокол взаимодействия агента может помочь предприятиям избежать блокировки поставщиков.
Настоящее влияние этих достижений не должно быть недооценено. Многие организации неохотно развертывают передовые модели ИИ из -за непомерных затрат на инфраструктуру и потребления энергии. Если Google сможет выполнить свои обещания в течение вата, мы могли бы увидеть новую волну принятия искусственного интеллекта в отраслях, которые до сих пор остались в стороне.
Многоагентный подход одинаково значим для предприятий, ошеломленных сложностью развертывания ИИ в разных системах и поставщиках. Стандартизируя, как общаются системы искусственного интеллекта, Google пытается разрушить бункеры, которые имеют ограниченное воздействие ИИ на предприятие.
Во время пресс -конференции Google подчеркнул, что более 400 историй клиентов будут переданы в следующем 25 годах, что демонстрирует реальное влияние на бизнес из своих инноваций в области искусственного интеллекта.
Силиконовая гонка вооружений: изменят ли индивидуальные чипы Google и открытые стандарты будущее?
По мере продвижения ИИ его инфраструктура станет все более важной. Инвестиции Google в специализированное оборудование, такие как Ironwood и его инициативы по взаимодействию с агентами, показывают, что компания позиционирует себя на будущее, когда ИИ становится более распределенным, более сложным и более глубоким интеграцией в бизнес -операции.
«Ведущие модели мышления, такие как Gemini 2.5 и Nobel -Prize, получившие Alphafold, все работают сегодня на TPU», — отметил Вахдат. «С Ironwood мы не можем дождаться, чтобы увидеть, какие прорывы ИИ вызваны нашими разработчиками и клиентами Google Cloud, когда он станет доступным в конце этого года».
Стратегические последствия выходят за рамки собственного бизнеса Google. Направляя открытые стандарты в связи с агентом, сохраняя при этом запатентованные преимущества в оборудовании, Google пытается сделать деликатный баланс. Компания хочет, чтобы более широкая экосистема процветала (с инфраструктурой Google внизу) при сохранении конкурентной дифференциации.
В предстоящие месяцы ключевые факторы будут включать в себя, как быстро конкуренты реагируют на достижения аппаратного обеспечения Google и объединяются ли отрасль вокруг предлагаемых стандартов совместимости агента. Если история является каким-либо руководством, мы можем ожидать, что Microsoft и Amazon будут противостоять своими стратегиями оптимизации выводов, возможно, создать трехстороннюю гонку для создания наиболее эффективного стека инфраструктуры ИИ.
Источник
