Blog
nano bananagemini 2.5image generationprompt editingsynthidvisual reasoning

Gemini 2.5 Flash Image (Nano Banana): Konsistente Motive und Prompt-basierte Bearbeitung

3 min
Gemini 2.5 Flash Image (Nano Banana): Konsistente Motive und Prompt-basierte Bearbeitung

Googles Gemini 2.5 Flash Image (Codename „Nano Banana“) erregt viel Aufmerksamkeit – und das aus gutem Grund. Es kombiniert schnelle Bildgenerierung mit leistungsstarker Bearbeitung und visuellem logischem Denken, was es ideal für Apps macht, die sowohl Kreativität als auch Kontrolle erfordern.

In diesem Beitrag werden wir behandeln, was Nano Banana so besonders macht, praktische Anwendungsfälle zeigen, Preiserwartungen skizzieren und einen Schnellstart bereitstellen, damit Sie es sofort in NextDocs ausprobieren können.

Warum Nano Banana

  • Identität des Motivs bleibt erhalten: Generieren Sie konsistente Charaktere und Produkte über mehrere Bilder hinweg. Ideal für Marken-Assets und Produktaufnahmen aus verschiedenen Blickwinkeln.
  • Intelligente, Prompt-basierte Bearbeitung: Wenden Sie gezielte Bearbeitungen mit einfachem Text an – entfernen Sie Objekte, ändern Sie Posen, passen Sie die Beleuchtung an – ohne komplexe Auswahlwerkzeuge.
  • Visuelles logisches Denken: Gehen Sie über die reine Generierung hinaus. Das Modell versteht Szenen, Anweisungen und Beziehungen, um komplexen Bearbeitungs-Prompts zu folgen.
  • Vertrauen & Sicherheit (SynthID): Bilder werden unsichtbar mit einem Wasserzeichen versehen, um die KI-Generierung klar zu kennzeichnen und eine verantwortungsvolle Nutzung zu unterstützen.

Kernfunktionen

Konsistente Charaktere und Motive

Halten Sie einen Charakter oder ein Produkt über verschiedene Szenen und Blickwinkel hinweg konsistent. Dies ist besonders nützlich für:

  • Marketing-Serien und Storyboards
  • Produktkataloge und Variationen
  • Markenmaskottchen und wiederkehrende Charaktere

Prompt-basierte Bearbeitung (lokal & global)

Verwandeln Sie Text in Bearbeitungen. Beispiele:

  • „Entferne den Hintergrund und behalte weiche Schatten bei“
  • „Ändere die Pose des Motivs in eine Dreiviertelansicht“
  • „Mache die Beleuchtung zu einem warmen Sonnenuntergangston“

Visuelles logisches Denken für komplexe Aufgaben

Kombinieren Sie Verständnis und Generierung:

  • Befolgen Sie mehrstufige Bearbeitungsanweisungen im Kontext
  • Verstehen Sie Objekte und Beziehungen in einer Szene
  • Erstellen Sie Kompositionen, die Ihre Vorgaben berücksichtigen

Vertrauen und Sicherheit mit SynthID

Alle Ausgaben enthalten ein unsichtbares SynthID-Wasserzeichen. Es wurde entwickelt, um KI-generierte Inhalte überprüfbar zu machen, während es für den Betrachter unauffällig bleibt.

Preise (Auf einen Blick)

Nano Banana ist in NextDocs über unsere fal.ai-Integration verfügbar. Die Preise werden im Seitenpanel angezeigt, bevor Sie einen Auftrag ausführen. Stand dieses Updates:

  • Generierung (1024×1024): normalerweise etwa 0,10 $ pro Bild
  • Bearbeitungen (1024×1024): normalerweise etwa 0,10 $ pro Bild

Die tatsächlichen Gebühren hängen von der Modellauswahl und der Größe ab; beziehen Sie sich immer auf die Schätzung, die neben der Aktion „Ausführen“ (Run) angezeigt wird.

Entwickler-Schnellstart

Unten finden Sie ein minimales Beispiel, das aus der Google-Dokumentation adaptiert wurde. Sie können das NextDocs Media-Panel (KI-Tab) verwenden, um Prompts interaktiv auszuprobieren, oder die API direkt in Ihren eigenen Skripten aufrufen.

import PIL.Image
from google import genai
from google.genai import types
from io import BytesIO

client = genai.Client()

prompt = """
Show me a picture of a nano banana dish in a fancy restaurant with a Gemini theme
"""

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt],
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = PIL.Image.open(BytesIO(part.inline_data.data))
    image.save("generated_image.png")

Probieren Sie es in NextDocs aus

Öffnen Sie das Media-Panel → KI → wählen Sie „Nano Banana“ (oder lassen Sie es auf Auto) → geben Sie Ihren Prompt ein → überprüfen Sie die geschätzten Kosten → Ausführen (Run). Für Bearbeitungen wählen Sie „Bearbeiten“ (Edit), schreiben Sie die Anweisung (z. B. „Hintergrund entfernen“) und schauen Sie sich das Ergebnis in der Vorschau an, bevor Sie es einfügen.

Fallstudien und Inspiration

  • Konsistente Markencharaktere über Kampagnen hinweg
  • Produkt-Hero-Bilder in verschiedenen Umgebungen
  • Visuelle A/B-Tests für Landingpages

Verwandte Themen

— Das NextDocs-Team