Ironwood: новое поколение TPU от Google для задач логического вывода в ИИ

На мероприятии Google Cloud Next 2025 компания Google представила Ironwood — новое поколение Tensor Processing Units (TPU), разработанное специально для крупномасштабных задач логического вывода в области искусственного интеллекта. Этот релиз знаменует стратегический сдвиг в сторону оптимизации инфраструктуры для логического вывода, отражающий растущий операционный фокус на развёртывание моделей ИИ, а не на их обучение.

Ironwood — это седьмое поколение архитектуры TPU от Google, которое приносит значительные улучшения в вычислительной производительности, объёме памяти и энергоэффективности. Каждый чип обеспечивает пиковую пропускную способность 4 614 терафлопс (TFLOPs) и включает 192 ГБ памяти высокой пропускной способности (HBM), поддерживая пропускную способность до 7,4 терабит в секунду (Tbps). Ironwood может быть развёрнут в конфигурациях из 256 или 9 216 чипов, причём более крупный кластер предлагает вычислительные мощности до 42,5 эксафлопс, что делает его одним из самых мощных ускорителей ИИ в отрасли.

В отличие от предыдущих поколений TPU, которые балансировали нагрузки на обучение и логический вывод, Ironwood спроектирован специально для логического вывода. Это отражает более широкую тенденцию в отрасли, где логический вывод, особенно для больших языковых и генеративных моделей, становится доминирующей нагрузкой в производственных средах. В таких сценариях критически важны низкая задержка и высокая пропускная способность, и Ironwood разработан для эффективного удовлетворения этих требований.

Ключевым архитектурным достижением в Ironwood является улучшенный SparseCore, который ускоряет разрежённые операции, часто встречающиеся в задачах ранжирования и поиска. Эта целевая оптимизация уменьшает необходимость чрезмерного перемещения данных по чипу и улучшает как задержку, так и энергопотребление для конкретных случаев использования с интенсивным логическим выводом.

Ironwood также значительно улучшает энергоэффективность, предлагая более чем вдвое лучшую производительность на ватт по сравнению с предшественником. По мере масштабирования развёртывания моделей ИИ использование энергии становится всё более важным ограничением — как с экономической, так и с экологической точки зрения. Улучшения в Ironwood способствуют решению этих проблем в крупномасштабной облачной инфраструктуре.

TPU интегрирован в более широкую платформу Google AI Hypercomputer — модульную вычислительную платформу, объединяющую высокоскоростные сети, специализированные микросхемы и распределённое хранилище. Эта интеграция упрощает развёртывание ресурсоёмких моделей, позволяя разработчикам запускать приложения реального времени на базе ИИ без необходимости обширной настройки или тюнинга.

Этот запуск также сигнализирует о намерении Google оставаться конкурентоспособной в сфере инфраструктуры для ИИ, где такие компании, как Amazon и Microsoft, разрабатывают свои собственные внутренние ускорители ИИ. Хотя лидеры отрасли традиционно полагались на графические процессоры, особенно от Nvidia, появление специализированных кремниевых решений меняет ландшафт вычислений в области ИИ.

Выпуск Ironwood отражает растущую зрелость инфраструктуры ИИ, где эффективность, надёжность и готовность к развёртыванию теперь так же важны, как и сырая вычислительная мощность. Сосредоточив внимание на дизайне, ориентированном на логический вывод, Google стремится удовлетворить растущие потребности предприятий, использующих базовые модели в производстве — будь то для поиска, генерации контента, рекомендательных систем или интерактивных приложений.

Таким образом, Ironwood представляет собой целенаправленную эволюцию в дизайне TPU. Он отдаёт приоритет потребностям задач с интенсивным логическим выводом, улучшая вычислительные возможности, эффективность и интеграцию с инфраструктурой Google Cloud. По мере того как ИИ переходит в операционную фазу во всех отраслях, аппаратное обеспечение, специально разработанное для логического вывода, будет играть всё более важную роль в масштабируемых, отзывчивых и экономически эффективных системах ИИ.

Источник

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *