Nano Banana Pro, также известная как Gemini 3 Pro Image, — это новая модель Google DeepMind для генерации и редактирования изображений, созданная на основе Gemini 3 Pro. Она позиционируется как современная система для создания и редактирования изображений, учитывающая структуру, мировые знания и расположение текста, а не только стиль.
Nano Banana Pro и её предшественница
Nano Banana, основанная на Gemini 2.5 Flash Image, была ориентирована на быстрое и непринуждённое редактирование изображений, например, восстановление фотографий и создание фигурок. Nano Banana Pro сохраняет этот подход, но работает на базе Gemini 3 Pro, что обеспечивает более обоснованные выводы и знания о реальном мире в стеке изображений.
Модель может превращать прототипы, таблицы данных и рукописные заметки в диаграммы и инфографику, отражающие основную информацию, а не только декоративные элементы.
Генерация на основе рассуждений и поиск, основанный на фактах
Ключевой особенностью Nano Banana Pro является генерация на основе рассуждений. Используя Gemini 3 Pro, модель может обрабатывать текст, структурированный контент и ссылки, а затем планировать изображение в качестве объяснения этого контента. Nano Banana Pro также может подключаться к Google Search, используя поисковый индекс в качестве источника знаний в реальном времени.
Чёткий текст и многоязычные макеты
Текст внутри изображений — это давняя проблема для многих генераторов, основанных на диффузии. Nano Banana Pro решает эту проблему. Google утверждает, что это лучшая модель в семействе Gemini для создания изображений с правильно отображённым и разборчивым текстом, как для коротких слоганов, так и для полных абзацев.
Многоязычные рассуждения Gemini 3 Pro встроены в модель изображения. Nano Banana Pro может отображать текст на нескольких языках, а также переводить текст, который уже присутствует в продуктах или плакатах.
Контроль студийного уровня, согласованность и масштабирование
Nano Banana Pro предоставляет набор элементов управления, ориентированных на рабочие процессы проектирования и производства, а не на одноразовые художественные подсказки. Модель может использовать до 14 входных изображений и поддерживать согласованность и сходство до 5 человек в одном рабочем процессе. Это поддерживает такие задачи, как объединение эталонных фотографий в единое модное издание, преобразование эскизов в снимки продукции или сохранение одного и того же актёрского состава в нескольких сценах.
Основные выводы
Nano Banana Pro — это модель генерации и редактирования изображений Gemini 3 Pro Image, оптимизированная для более высокого качества и контроля. Модель объединяет рассуждения Gemini 3 Pro и Google Search, позволяя превращать фактический контент, документы и данные в реальном времени в инфографику, рецепты, диаграммы процессов и другие визуалы, насыщенные информацией.
Nano Banana Pro обеспечивает качественную визуализацию текста и многоязычную поддержку, создавая разборчивую типографику на изображениях и позволяя переводить или локализовать существующий текст на изображении, сохраняя при этом макет и дизайн.
Модель поддерживает до 14 входных изображений и сохраняет сходство до 5 человек, с элементами управления в студийном стиле для угла камеры, глубины резкости, освещения, соотношения сторон и масштабирования до разрешений 1k, 2k и 4k.
Модель Nano Banana Pro внедряется в приложение Gemini, режим AI в поиске, NotebookLM, Google Ads, приложения Workspace, Gemini API, Google AI Studio, Vertex AI, Antigravity и Flow. Все выходные данные маркируются с помощью SynthID, а также добавляются видимые водяные знаки, соответствующие уровню.
Редакционные комментарии
Nano Banana Pro позиционирует Gemini 3 Pro Image как систему для производства, которая связывает рассуждения Gemini 3 Pro, Google Search и структурированные элементы управления для макета, текста и масштабирования. Она напрямую решает давние проблемы рендеринга текста, многоязычной локализации и согласованности объектов, сохраняя SynthID и видимые водяные знаки в качестве сигналов происхождения по умолчанию на всех уровнях и поверхностях.
Этот запуск приближает Google к созданию интегрированной визуальной платформы для разработчиков и предприятий, ориентированной на API.
1. Какие ключевые особенности отличают Nano Banana Pro от её предшественницы Nano Banana?
Nano Banana Pro отличается от Nano Banana тем, что работает на базе Gemini 3 Pro, что обеспечивает более обоснованные выводы и знания о реальном мире в стеке изображений. Nano Banana Pro может обрабатывать текст, структурированный контент и ссылки, а затем планировать изображение в качестве объяснения этого контента. Также Nano Banana Pro может подключаться к Google Search, используя поисковый индекс в качестве источника знаний в реальном времени.
2. Какие задачи может решать Nano Banana Pro в области генерации изображений на основе текста?
Nano Banana Pro может превращать прототипы, таблицы данных и рукописные заметки в диаграммы и инфографику, отражающие основную информацию. Она также может использовать текст и структурированный контент для планирования изображений, которые объясняют этот контент.
3. Какие преимущества предоставляет Nano Banana Pro для работы с текстом на изображениях?
Nano Banana Pro обеспечивает качественную визуализацию текста и многоязычную поддержку, создавая разборчивую типографику на изображениях и позволяя переводить или локализовать существующий текст на изображении, сохраняя при этом макет и дизайн. Это решает давнюю проблему рендеринга текста внутри изображений для многих генераторов, основанных на диффузии.
4. Какие возможности предоставляет Nano Banana Pro для контроля и масштабирования в процессе генерации изображений?
Nano Banana Pro предоставляет набор элементов управления, ориентированных на рабочие процессы проектирования и производства. Модель может использовать до 14 входных изображений и поддерживать согласованность и сходство до 5 человек в одном рабочем процессе. Это поддерживает такие задачи, как объединение эталонных фотографий в единое модное издание, преобразование эскизов в снимки продукции или сохранение одного и того же актёрского состава в нескольких сценах.
5. Какие приложения и сервисы поддерживают интеграцию с Nano Banana Pro?
Nano Banana Pro внедряется в приложение Gemini, режим AI в поиске, NotebookLM, Google Ads, приложения Workspace, Gemini API, Google AI Studio, Vertex AI, Antigravity и Flow. Это позволяет использовать её в различных приложениях и сервисах для генерации и редактирования изображений.