Google DeepMind во вторник представила новую языковую модель Gemini Robotics On-Device, способную выполнять задачи непосредственно на роботах без необходимости подключения к интернету.
Развивая предыдущую модель Gemini Robotics, выпущенную в марте [https://techcrunch.com/2025/03/12/google-deepmind-unveils-new-ai-models-for-controlling-robots/], новая версия позволяет управлять движениями роботов. Разработчики могут настраивать модель под различные задачи, используя текстовые инструкции на естественном языке.
По заявлениям компании, в тестах локальная модель демонстрирует результаты, близкие к облачной версии Gemini Robotics. Google также утверждает, что она превосходит другие аналогичные решения для устройств, хотя конкретные модели-конкуренты не названы.
[https://techcrunch.com/wp-content/uploads/2025/06/image.png?w=680]Image Credits: Google
В демонстрации роботы с локальной моделью выполняли действия вроде расстёгивания сумок и складывания одежды. Изначально модель обучалась для роботов ALOHA [https://aloha-2.github.io/], но позже была адаптирована для двурукого робота Franka FR3 [https://franka.de/franka-research-3] и гуманоида Apollo от Apptronik [https://apptronik.com/apollo].
По словам Google, Franka FR3 успешно справлялся с новыми сценариями и объектами, например, сборкой на промышленном конвейере [https://www.nist.gov/el/intelligent-systems-division-73500/robotic-grasping-and-manipulation-assembly/assembly].
Google DeepMind также выпустила Gemini Robotics SDK [https://github.com/google-deepmind/gemini-robotics-sdk]. С его помощью разработчики могут обучать модели новым задачам, демонстрируя роботам 50–100 примеров действий в симуляторе MuJoCo.
Другие компании тоже активно развивают ИИ для робототехники. Nvidia создаёт платформу для базовых моделей гуманоидов [https://techcrunch.com/2024/03/18/nvidia-enlists-humanoid-robotics-biggest-names-for-new-ai-platform-gr00t/]. Hugging Face разрабатывает открытые модели и датасеты [https://techcrunch.com/2025/06/04/hugging-face-says-its-new-robotics-model-is-so-efficient-it-can-run-on-a-macbook/], а также собственных роботов [https://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/]. Корейский стартап RLWRLD при поддержке Mirae Asset работает над базовыми моделями для робототехники [https://techcrunch.com/2025/04/14/rlwrld-raises-14-4m-to-build-foundation-model-for-robotics/].