Google 的 Gemini 2.5 Flash Image(代号 “Nano Banana”)正引起广泛关注——这并非没有原因。它将快速的图像生成与强大的编辑和视觉推理能力相结合,非常适合需要兼顾创意和控制力的应用。
在本文中,我们将介绍 Nano Banana 的特别之处,展示实际应用案例,概述定价预期,并提供快速入门指南,以便你立即在 NextDocs 中进行尝试。
保持角色或产品在不同场景和角度下的一致性。这对于以下场景特别有用:
将文本转化为编辑指令。例如:
融合理解与生成:
所有输出都包含不可见的 SynthID 水印。它旨在使 AI 生成的内容可审计,同时对观看者保持隐形。
Nano Banana 可通过我们的 fal.ai 集成在 NextDocs 中使用。在运行任务之前,定价会显示在侧边栏中。截至本次更新:
实际费用取决于模型选择和尺寸;请始终参考“运行”操作旁显示的预估值。
以下是改编自 Google 文档的一个最小示例。你可以使用 NextDocs 媒体面板(AI 选项卡)以交互方式尝试提示词,或者在自己的脚本中直接调用 API。
import PIL.Image
from google import genai
from google.genai import types
from io import BytesIO
client = genai.Client()
prompt = """
Show me a picture of a nano banana dish in a fancy restaurant with a Gemini theme
"""
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt],
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = PIL.Image.open(BytesIO(part.inline_data.data))
image.save("generated_image.png")
打开媒体面板 → AI → 选择 “Nano Banana”(或保持为 Auto)→ 输入提示词 → 查看预估成本 → 运行。对于编辑,选择 “编辑”,编写指令(例如 “删除背景”),并在插入前预览结果。
— NextDocs 团队