Blog
nano bananagemini 2.5image generationprompt editingsynthidvisual reasoning

Gemini 2.5 Flash Image (Nano Banana): Sujetos Consistentes y Edición Basada en Prompts

4 min
Gemini 2.5 Flash Image (Nano Banana): Sujetos Consistentes y Edición Basada en Prompts

Gemini 2.5 Flash Image de Google (nombre en clave “Nano Banana”) está atrayendo mucha atención, y con razón. Combina una generación rápida de imágenes con una potente edición y razonamiento visual, lo que lo hace ideal para aplicaciones que necesitan tanto creatividad como control.

En este post, cubriremos qué hace que Nano Banana sea especial, mostraremos casos de uso prácticos, detallaremos las expectativas de precios y proporcionaremos una guía de inicio rápido para que puedas probarlo de inmediato en NextDocs.

Por qué Nano Banana

  • Identidad del sujeto, mantenida: Genera personajes y productos consistentes en múltiples imágenes. Ideal para activos de marca y tomas de productos desde diferentes ángulos.
  • Edición inteligente basada en prompts: Aplica ediciones específicas con texto simple (eliminar objetos, cambiar poses, ajustar la iluminación) sin selecciones complejas.
  • Razonamiento visual: Ve más allá de la generación. El modelo comprende escenas, instrucciones y relaciones para seguir prompts de edición complejos.
  • Confianza y Seguridad (SynthID): Las imágenes tienen una marca de agua invisible para indicar claramente la generación por IA, apoyando el uso responsable.

Capacidades Principales

Personajes y Sujetos Consistentes

Mantén un personaje o producto consistente en diferentes escenas y ángulos. Esto es especialmente útil para:

  • Series de marketing y guiones gráficos (storyboards)
  • Catálogos de productos y variaciones
  • Mascotas de marca y personajes recurrentes

Edición Basada en Prompts (Local y Global)

Convierte texto en ediciones. Ejemplos:

  • "Elimina el fondo y mantén las sombras suaves"
  • "Cambia la pose del sujeto a una vista de tres cuartos"
  • "Haz que la iluminación tenga un tono cálido de atardecer"

Razonamiento Visual para Tareas Complejas

Combina comprensión y generación:

  • Sigue instrucciones de edición de varios pasos en contexto
  • Comprende objetos y relaciones en una escena
  • Crea composiciones que respeten tus restricciones

Confianza y Seguridad con SynthID

Todos los resultados incluyen una marca de agua invisible de SynthID. Está diseñada para que el contenido generado por IA sea auditable sin dejar de ser discreto para los espectadores.

Precios (De un Vistazo)

Nano Banana está disponible en NextDocs a través de nuestra integración con fal.ai. Los precios aparecen en el panel lateral antes de ejecutar un trabajo. A partir de esta actualización:

  • Generación (1024×1024): normalmente alrededor de $0.10 por imagen
  • Ediciones (1024×1024): normalmente alrededor de $0.10 por imagen

Los cargos reales dependen de la selección del modelo y el tamaño; consulta siempre la estimación que se muestra junto a la acción Ejecutar (Run).

Guía de Inicio Rápido para Desarrolladores

A continuación se muestra un ejemplo mínimo adaptado de la documentación de Google. Puedes usar el panel de Medios de NextDocs (pestaña IA) para probar prompts de forma interactiva, o llamar a la API directamente en tus propios scripts.

import PIL.Image
from google import genai
from google.genai import types
from io import BytesIO

client = genai.Client()

prompt = """
Show me a picture of a nano banana dish in a fancy restaurant with a Gemini theme
"""

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt],
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = PIL.Image.open(BytesIO(part.inline_data.data))
    image.save("generated_image.png")

Pruébalo en NextDocs

Abre el panel de Medios → IA → selecciona "Nano Banana" (o déjalo en Auto) → ingresa tu prompt → revisa el costo estimado → Ejecutar (Run). Para ediciones, elige "Editar", escribe la instrucción (por ejemplo, "eliminar fondo") y previsualiza el resultado antes de insertar.

Casos de Estudio e Inspiración

  • Personajes de marca consistentes en todas las campañas
  • Imágenes principales de productos en múltiples entornos
  • Pruebas A/B visuales para páginas de destino

Relacionado

— El equipo de NextDocs