Метка: вычислительная производительность

  • Apriel-5B: инновационное семейство малых языковых моделей от ServiceNow AI

    По мере увеличения размера и сложности языковых моделей растут и требования к ресурсам, необходимым для их обучения и использования. Хотя крупномасштабные модели демонстрируют впечатляющие результаты в различных тестах, они часто недоступны для многих организаций из-за ограничений инфраструктуры и высоких операционных затрат. Этот разрыв между возможностями и практическим применением представляет собой серьёзную проблему, особенно для предприятий,…

  • Ironwood: новое поколение TPU от Google для задач логического вывода в ИИ

    На мероприятии Google Cloud Next 2025 компания Google представила Ironwood — новое поколение Tensor Processing Units (TPU), разработанное специально для крупномасштабных задач логического вывода в области искусственного интеллекта. Этот релиз знаменует стратегический сдвиг в сторону оптимизации инфраструктуры для логического вывода, отражающий растущий операционный фокус на развёртывание моделей ИИ, а не на их обучение. Ironwood —…