Gemini 2.5 Flash Image (Nano Banana): Spójne obiekty i edycja oparta na promptach

Google’s Gemini 2.5 Flash Image (kod‑nazwa „Nano Banana”) przyciąga wiele uwagi — i to nie bez powodu. Łączy szybkie generowanie obrazów z potężną edycją i rozumowaniem wizualnym, co czyni go idealnym narzędziem dla aplikacji, które potrzebują zarówno kreatywności, jak i kontroli.

W tym wpisie omówimy, co czyni Nano Banana wyjątkowym, pokażemy praktyczne zastosowania, przedstawimy oczekiwania dotyczące cen oraz zapewnimy szybki start, abyś mógł wypróbować go od razu w NextDocs.

Dlaczego Nano Banana

Tożsamość obiektu, zachowana: Generuj spójne postacie i produkty na wielu obrazach. Świetne do materiałów promocyjnych i zdjęć produktowych z różnych kątów.
Inteligentna, oparta na promptach edycja: Wprowadzaj celowane zmiany za pomocą prostego tekstu — usuń obiekty, zmień pozy, dostosuj oświetlenie — bez skomplikowanych zaznaczeń.
Rozumowanie wizualne: Wykracza poza generowanie. Model rozumie sceny, instrukcje i relacje, aby realizować złożone polecenia edycyjne.
Zaufanie i bezpieczeństwo (SynthID): Obrazy są niewidocznie oznaczone znakiem wodnym, co pozwala na audyt treści generowanych przez AI, jednocześnie pozostając dyskretnym dla widzów.

Kluczowe możliwości

Spójne postacie i obiekty

Utrzymuj spójność postaci lub produktu w różnych scenach i z różnych kątów. To szczególnie przydatne dla:

Serii marketingowych i storyboardów
Katalogów produktów i wariantów
Maskot marki i powracających postaci

Edycja oparta na promptach (lokalna i globalna)

Przekształcaj tekst w zmiany. Przykłady:

„Usuń tło i zachowaj miękkie cienie”
„Zmień pozycję obiektu na widok trzy‑czwarte”
„Ustaw oświetlenie na ciepły odcień zachodu słońca”

Rozumowanie wizualne dla złożonych zadań

Połączenie rozumienia i generowania:

Postępowanie zgodnie z wieloetapowymi instrukcjami edycyjnymi w kontekście
Rozpoznawanie obiektów i relacji w scenie
Tworzenie kompozycji zgodnych z Twoimi ograniczeniami

Zaufanie i bezpieczeństwo z SynthID

Wszystkie wyniki zawierają niewidoczny znak wodny SynthID. Zaprojektowano go tak, aby treści generowane przez AI były audytowalne, jednocześnie niezakłócające odbioru.

Wycena (Na pierwszy rzut oka)

Nano Banana jest dostępny w NextDocs poprzez integrację fal.ai. Wycena jest wyświetlana na panelu bocznym przed uruchomieniem zadania. Na dzień tego aktualizacji:

Generowanie (1024×1024): zazwyczaj około 0,10 USD za obraz
Edycje (1024×1024): zazwyczaj około 0,10 USD za obraz

Rzeczywiste opłaty zależą od wyboru modelu i rozmiaru; zawsze sprawdzaj szacunkową kwotę wyświetlaną obok przycisku Uruchom.

Szybki start dla deweloperów

Poniżej znajduje się minimalny przykład zaadaptowany z dokumentacji Google. Możesz użyć panelu Mediów NextDocs (zakładka AI), aby interaktywnie wypróbować prompt, lub wywołać API bezpośrednio w własnych skryptach.

import PIL.Image
from google import genai
from google.genai import types
from io import BytesIO

client = genai.Client()

prompt = """
Pokaż mi obraz nano banana w eleganckiej restauracji z motywem Gemini
"""

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt],
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = PIL.Image.open(BytesIO(part.inline_data.data))
    image.save("generated_image.png")

Wypróbuj w NextDocs

Otwórz panel Mediów → AI → wybierz "Nano Banana" (lub pozostaw na Auto) → wpisz swój prompt → sprawdź szacunkowy koszt → Uruchom. Dla edycji wybierz "Edycja", napisz instrukcję (np. "usuń tło"), i podglądaj wynik przed wstawieniem.

Studium przypadków i inspiracje

Spójne postacie marki w różnych kampaniach
Obrazy główne produktów w różnych ustawieniach
Wizualne testy A/B dla stron docelowych

Powiązane

Nowy panel medialny do generowania i edytowania z AI

— Zespół NextDocs