Imagen 4: AI สร้างภาพจากข้อความผ่าน Gemini API

Google เปิดตัว Imagen 4 โมเดลสร้างภาพ (text-to-image) รุ่นใหม่ล่าสุด ผ่าน Gemini API ที่ช่วยให้เราสามารถสร้างภาพคุณภาพสูงจากข้อความได้ง่ายและแม่นยำกว่าที่เคย ไม่ว่าจะเป็นงานออกแบบ คอนเทนต์ หรือการทดลองสร้างสรรค์ใหม่ ๆ

Imagen คืออะไร?

Imagen เป็นโมเดล AI จาก Google DeepMind ที่สามารถสร้างภาพจากคำอธิบายข้อความ โดยมีจุดเด่นด้านคุณภาพ ความสมจริง และมีการฝังลายน้ำ SynthID เพื่อระบุว่าเป็นผลงานจาก AI

รุ่นล่าสุด: Imagen 4 และ Imagen 4 Ultra

Imagen 4 – เหมาะสำหรับการใช้งานทั่วไป ค่าบริการประมาณ 0.04 ดอลลาร์ต่อภาพ
Imagen 4 Ultra – ความแม่นยำสูงกว่า ตีความข้อความได้ละเอียดกว่า ราคา 0.06 ดอลลาร์ต่อภาพ

ทั้งสองรุ่นเปิดให้ใช้งานในช่วง paid preview และสามารถทดลองฟรีผ่าน Google AI Studio ได้แบบจำกัด

ใช้งานผ่าน Gemini API

การใช้งาน Imagen ทำได้ผ่าน Gemini API โดย Google มี google-genai SDK สำหรับภาษา Python ที่ช่วยให้เริ่มต้นได้ง่าย:


from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="imagen-4",  # หรือ "imagen-4-ultra"
    contents="แมวใส่แว่นหมวกนักบินบนท้องฟ้ายามเย็น"
)
print(response)

ตัวอย่างโค้ดนี้จะเรียกใช้งานโมเดล Imagen 4 เพื่อสร้างภาพตามคำอธิบายข้อความ

ข้อดี

สร้างภาพคุณภาพสูงด้วยข้อความสั้น ๆ
มีลายน้ำ SynthID เพื่อแสดงที่มาของภาพจาก AI
เลือกใช้ได้ทั้งรุ่นมาตรฐานและรุ่น Ultra ตามความต้องการ
ใช้ง่ายผ่าน Python SDK หรือ Google AI Studio

สรุป

Imagen 4 ถือเป็นก้าวสำคัญของ AI ด้านการสร้างสรรค์ภาพ ไม่ว่าจะเป็นนักพัฒนา นักออกแบบ หรือคอนเทนต์ครีเอเตอร์ก็สามารถใช้เครื่องมือนี้เพื่อสร้างงานได้อย่างรวดเร็วและน่าทึ่ง

ค้นหาบล็อกนี้

A Lens P by SiRiCK