บล็อก
nano bananagemini 2.5image generationprompt editingsynthidvisual reasoning

ภาพเร่งด่วน Gemini 2.5 (Nano Banana): วัตถุที่สอดคล้องกันและการแก้ไขตามคำสั่ง

2 min
ภาพเร่งด่วน Gemini 2.5 (Nano Banana): วัตถุที่สอดคล้องกันและการแก้ไขตามคำสั่ง

ภาพเร่งด่วน Gemini 2.5 ของ Google (รหัสชื่อ "Nano Banana") กำลังดึงดูดความสนใจเป็นอย่างมาก — และเป็นเหตุผลที่ดี มันผสมผสานการสร้างภาพที่รวดเร็วเข้ากับการแก้ไขที่ทรงพลังและการวิเคราะห์ภาพ ทำให้เหมาะสำหรับแอปพลิเคชันที่ต้องการทั้งความคิดสร้างสรรค์และการควบคุม

ในโพสต์นี้ เราจะครอบคลุมสิ่งที่ทำให้ Nano Banana เป็นพิเศษ แสดงกรณีใช้งานจริง สรุปการคาดการณ์ราคา และให้คู่มือเริ่มต้นใช้งานเพื่อให้คุณสามารถทดลองใช้งานได้ทันทีใน NextDocs

ทำไมต้อง Nano Banana

  • ตัวตนของวัตถุที่สอดคล้องกัน: สร้างตัวละครและผลิตภัณฑ์ที่สอดคล้องกันในภาพหลายภาพ เหมาะสำหรับ:

    • ซีรีส์การตลาดและสตอรี่บอร์ด
    • แคตตาล็อกสินค้าและตัวเลือกต่าง ๆ
    • ตุ๊กตาแบรนด์และตัวละครที่ปรากฏซ้ำ ๆ
  • การแก้ไขตามคำสั่งที่ฉลาด: ใช้ข้อความง่าย ๆ เพื่อทำการแก้ไขเป้าหมาย — ลบวัตถุ เปลี่ยท่าทาง ปรับแสง — โดยไม่ต้องเลือกซับซ้อน

  • การวิเคราะห์ภาพ: ไปไกลกว่าการสร้างภาพ โมเดลเข้าใจฉาก คำสั่ง และความสัมพันธ์ เพื่อทำตามคำสั่งแก้ไขที่ซับซ้อน

  • ความน่าเชื่อถือและความปลอดภัย (SynthID): ภาพถูกลายน้ำในแบบมองไม่เห็นเพื่อแสดงให้ชัดเจนว่าเป็นการสร้างด้วย AI สนับสนุนการใช้งานอย่างรับผิดชอบ

ความสามารถหลัก

ตัวละครและวัตถุที่สอดคล้องกัน

รักษาความสอดคล้องของตัวละครหรือผลิตภัณฑ์ในฉากและมุมมองต่าง ๆ ซึ่งเป็นประโยชน์อย่างยิ่งสำหรับ:

  • ซีรีส์การตลาดและสตอรี่บอร์ด
  • แคตตาล็อกสินค้าและตัวเลือก
  • ตุ๊กตาแบรนด์และตัวละครที่ปรากฏซ้ำ ๆ

การแก้ไขตามคำสั่ง (ในระดับท้องถิ่นและระดับโลก)

เปลี่ยนข้อความเป็นการแก้ไข ตัวอย่าง:

  • "ลบพื้นหลังและเก็บเงาอ่อน ๆ"
  • "เปลี่ยนท่าทางของวัตถุเป็นมุมสามในสี่"
  • "ทำให้แสงเป็นโทนพระอาทิตย์ตกที่อบอุ่น"

การวิเคราะห์ภาพสำหรับงานที่ซับซ้อน

ผสมผสานความเข้าใจและการสร้างภาพ:

  • ทำตามคำสั่งแก้ไขหลายขั้นตอนในบริบท
  • เข้าใจวัตถุและความสัมพันธ์ในฉาก
  • สร้างองค์ประกอบที่เคารพต่อข้อจำกัดของคุณ

ความน่าเชื่อถือและความปลอดภัยด้วย SynthID

ผลลัพธ์ทั้งหมดรวมลายน้ำ SynthID ที่มองไม่เห็น ซึ่งออกแบบมาเพื่อให้เนื้อหาที่สร้างด้วย AI สามารถตรวจสอบได้โดยไม่รบกวนผู้ชม

การกำหนดราคา (โดยสรุป)

Nano Banana พร้อมให้ใช้งานใน NextDocs ผ่านการเชื่อมต่อ fal.ai ราคาจะแสดงในแผงด้านข้างก่อนที่คุณจะรันงาน ตามข้อมูล ณ ปัจจุบัน:

  • การสร้าง (1024×1024): โดยประมาณ $0.10 ต่อภาพ
  • การแก้ไข (1024×1024): โดยประมาณ $0.10 ต่อภาพ

ค่าบริการจริงขึ้นอยู่กับการเลือกโมเดลและขนาด; โปรดอ้างอิงการประมาณราคาที่แสดงข้างปุ่มรัน

คู่มือเริ่มต้นสำหรับนักพัฒนา

ด้านล่างเป็นตัวอย่างพื้นฐานที่ปรับจากเอกสารของ Google คุณสามารถใช้แผง Media ของ NextDocs (แท็บ AI) เพื่อทดลองคำสั่งแบบโต้ตอบ หรือเรียกใช้ API โดยตรงในสคริปต์ของคุณ

import PIL.Image
from google import genai
from google.genai import types
from io import BytesIO

client = genai.Client()

prompt = """
แสดงภาพจาน Nano Banana ในร้านอาหารหรูพร้อมธีม Gemini
"""

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt],
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = PIL.Image.open(BytesIO(part.inline_data.data))
    image.save("generated_image.png")

ทดลองใช้งานใน NextDocs

เปิดแผง Media → AI → เลือก "Nano Banana" (หรือปล่อยเป็นอัตโนมัติ) → ใส่คำสั่งของคุณ → ตรวจสอบประมาณค่าใช้จ่าย → รัน สำหรับการแก้ไข เลือก "แก้ไข" เขียนคำสั่ง (เช่น "ลบพื้นหลัง") และดูตัวอย่างผลลัพธ์ก่อนแทรก

กรณีศึกษาและแรงบันดาลใจ

  • ตัวละครแบรนด์ที่สอดคล้องกันในแคมเปญต่าง ๆ
  • ภาพไฮไลต์ของสินค้าในหลายสถานการณ์
  • การทดสอบ A/B เชิงภาพสำหรับหน้า Landing

ที่เกี่ยวข้อง

— ทีมงาน NextDocs