Imagen 4: AI สร้างภาพจากข้อความผ่าน Gemini API
Google เปิดตัว Imagen 4 โมเดลสร้างภาพ (text-to-image) รุ่นใหม่ล่าสุด ผ่าน Gemini API ที่ช่วยให้เราสามารถสร้างภาพคุณภาพสูงจากข้อความได้ง่ายและแม่นยำกว่าที่เคย ไม่ว่าจะเป็นงานออกแบบ คอนเทนต์ หรือการทดลองสร้างสรรค์ใหม่ ๆ
Imagen เป็นโมเดล AI จาก Google DeepMind ที่สามารถสร้างภาพจากคำอธิบายข้อความ โดยมีจุดเด่นด้านคุณภาพ ความสมจริง และมีการฝังลายน้ำ SynthID เพื่อระบุว่าเป็นผลงานจาก AI
รุ่นล่าสุด: Imagen 4 และ Imagen 4 Ultra
- Imagen 4 – เหมาะสำหรับการใช้งานทั่วไป ค่าบริการประมาณ 0.04 ดอลลาร์ต่อภาพ
- Imagen 4 Ultra – ความแม่นยำสูงกว่า ตีความข้อความได้ละเอียดกว่า ราคา 0.06 ดอลลาร์ต่อภาพ
ทั้งสองรุ่นเปิดให้ใช้งานในช่วง paid preview และสามารถทดลองฟรีผ่าน Google AI Studio ได้แบบจำกัด
ใช้งานผ่าน Gemini API
การใช้งาน Imagen ทำได้ผ่าน Gemini API โดย Google มี google-genai
SDK สำหรับภาษา Python ที่ช่วยให้เริ่มต้นได้ง่าย:
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="imagen-4", # หรือ "imagen-4-ultra"
contents="แมวใส่แว่นหมวกนักบินบนท้องฟ้ายามเย็น"
)
print(response)
ตัวอย่างโค้ดนี้จะเรียกใช้งานโมเดล Imagen 4 เพื่อสร้างภาพตามคำอธิบายข้อความ
ข้อดี
- สร้างภาพคุณภาพสูงด้วยข้อความสั้น ๆ
- มีลายน้ำ SynthID เพื่อแสดงที่มาของภาพจาก AI
- เลือกใช้ได้ทั้งรุ่นมาตรฐานและรุ่น Ultra ตามความต้องการ
- ใช้ง่ายผ่าน Python SDK หรือ Google AI Studio
สรุป
Imagen 4 ถือเป็นก้าวสำคัญของ AI ด้านการสร้างสรรค์ภาพ ไม่ว่าจะเป็นนักพัฒนา นักออกแบบ หรือคอนเทนต์ครีเอเตอร์ก็สามารถใช้เครื่องมือนี้เพื่อสร้างงานได้อย่างรวดเร็วและน่าทึ่ง