AI

Google запустил «Nano-Banana» в Gemini — нейросеть для генерации изображений

Google запустил «Nano-Banana» в Gemini — нейросеть для генерации изображений

подтвердил, что вирусная модель «Nano-Banana» — это новый образ модели для генерации и редактирования изображений 2.5 Flash Image.

Функции уже добавлены в приложение Gemini на вебе и в мобильных версиях, и доступны как бесплатным, так и платным пользователям. Разработчики могут использовать модель через Gemini API, Google AI Studio и Vertex AI.

Читайте также: 10 нейросетей для дизайнеров

Что именно умеет «Nano-Banana» и как ей пользоваться бесплатно

Теперь у пользователей появляется более «послушный» редактор изображений, который сохраняет внешность и стиль персонажей, поддерживает локальные правки по текстовым подсказкам и умеет объединять несколько снимков в один. Это закрывает главную боль прежних моделей — стабильность образов и точность многошаговых правок.

Попробовать можно прямо сейчас в приложении Google AI Studio. Для этого просто введите запрос в чат, модель подключиться сама и нарисует картинку. В окне справа, вы увидите как расходуются токены.

Google запустил «Nano-Banana» в Gemini — нейросеть для генерации изображений

Возможности «Nano-Banana»:

  1. Сохранение идентичности и стиля. Модель надёжно сохраняет черты лица, одежду и общий вид персонажа при любых изменениях.
  2. Точные локальные правки по тексту. Удалить объект, поменять позу, освещение, фон или цвет — всё это можно через обычный промпт.
  3. Мульти-фьюжн. Объединение нескольких изображений: добавление предметов, коллажи и сложные сцены с фотореалистичным результатом.
  4. Многошаговые правки. Модель хорошо справляется с последовательными изменениями без «потери» персонажа.
  5. Маркировка контента. Все отредактированные изображения получают невидимый водяной знак SynthID (а в некоторых случаях — видимый значок «AI»).

В приложении Gemini: функции доступны всем пользователям бесплатно, но возможны лимиты. Для разработчиков: $30 за 1 млн выходных токенов. Изображение 1024×1024 обойдётся примерно в $0,039.

Весной Google начал внедрять AI-редактирование в Gemini, а летом запустил генерацию видео из фото с водяными знаками. SynthID — фирменная технология от Google DeepMind — теперь используется для всех типов медиа. «Nano-Banana» — логичное продолжение курса на прозрачность и управляемость генерации.

Модель вышла 26 августа 2025 года. Уже работает в Gemini (веб и мобильное приложение), Gemini API, Google AI Studio и Vertex AI. В документации проходит как Gemini 2.5 Flash Image (preview), кодовое имя — «nano-banana».

Ранее NotebookLM позволил создавать видеообзоры на 80 языках.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

12 + 13 =

Кнопка «Наверх»