GoogleのGemini 2.5 Flash Image(コードネーム「Nano Banana」)が大きな注目を集めています。それには正当な理由があります。高速な画像生成と強力な編集機能、そして視覚的推論を組み合わせることで、創造性とコントロールの両方を必要とするアプリケーションに最適です。
この記事では、Nano Bananaの特長、具体的なユースケース、価格の目安、そしてNextDocsですぐに試せるクイックスタートについて解説します。
キャラクターや製品を、シーンや角度を問わず一貫して保つことができます。これは特に以下のような場合に役立ちます:
テキストを編集に変換します。例:
理解と生成を融合させます:
すべての出力には、目に見えないSynthIDウォーターマークが含まれています。これは、視聴者の邪魔をすることなく、AI生成コンテンツの監査を可能にするように設計されています。
Nano Bananaは、fal.aiとの統合によりNextDocsで利用可能です。価格はジョブを実行する前にサイドパネルに表示されます。今回のアップデート時点では以下の通りです:
実際の料金はモデルの選択とサイズによって異なります。常に「Run(実行)」アクションの横に表示される見積もりを確認してください。
以下は、Googleのドキュメントを参考にした最小限の例です。NextDocsのメディアパネル(AIタブ)を使用してインタラクティブにプロンプトを試すことも、独自のスクリプトで直接APIを呼び出すこともできます。
import PIL.Image
from google import genai
from google.genai import types
from io import BytesIO
client = genai.Client()
prompt = """
Show me a picture of a nano banana dish in a fancy restaurant with a Gemini theme
"""
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt],
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = PIL.Image.open(BytesIO(part.inline_data.data))
image.save("generated_image.png")
メディアパネルを開く → AI → 「Nano Banana」を選択(またはAutoのままにする) → プロンプトを入力 → 見積もり費用を確認 → Run(実行)。編集の場合は「Edit」を選択し、指示(例:「背景を削除」)を入力して、挿入前に結果をプレビューしてください。
— NextDocsチーム