เช็กความล้ำ ChatGPT-4o สร้างสรรค์ภาพได้มากกว่าแค่คำว่า “สวย”

The Big Blue
18/04/2025
รับชมแล้วทั้งหมด 66 คน
เช็กความล้ำ ChatGPT-4o สร้างสรรค์ภาพได้มากกว่าแค่คำว่า “สวย”
banner

------------------------------------------

ภาพยุคนี้ต้องมีดีทั้ง “สวยและมีประโยชน์”

------------------------------------------

นับตั้งแต่ยุคของภาพวาดที่เกิดยุคแรก ๆ ที่ถูกสร้างอยู่ ในถ้ำ พัฒนามาจนกลายเป็นภาพอินโฟกราฟฟิกในยุคปัจจุบันที่เราเห็นกันทั่วไป เห็นได้ว่ามนุษย์เราใช้ “ภาพ” ในการสื่อสาร โน้มน้าวใจ และสามารถใช้มาช่วยในการวิเคราะห์ข้อมูลได้อีกด้วย

 

จะเห็นได้ว่าเมื่อการสร้างสรรค์ภาพที่เสริมด้วยสัญลักษณ์ต่าง ๆ ที่ใช้สื่อสารแทนภาษาได้ เราจะได้เห็นทั้งภาพที่ดีไซน์ออกมาสวยงาม พร้อมทั้งสามารถสื่อสารให้ทุกคนมองและเข้าใจความหมายออกมาตรงกันได้อย่างน่าทึ่ง!

.

ถามว่าโมเดล GPT-4o สามารถสร้างสรรค์ภาพออกมาตอบโจทย์ได้มากแค่ไหน??

  • ช่วยให้สามารถแสดงข้อความอย่างแม่นยำ

  • มีการปฏิบัติตามคำแนะนำได้อย่างแม่นยำ

  • การใช้ประโยชน์จากหลักฐานความรู้ และบริบทการสนทนาที่เคยมีอยู่ในโมเดล 4o

  • สามารถใช้ภาพ Reference จากที่เราอัพโหลดมาเป็น inspiration ในการสร้างสรรค์ภาพออกมาให้ใกล้เคียงความต้องการได้มากที่สุด

 

จากทั้ง 4 ความสามารถในการตอบโจทย์การสร้างสรรค์ภาพของโมเดล GPT-4o นับเป็นจุดที่สามารถเข้ามาเปลี่ยนให้ภาพในจินตนาการของเรา กลายมาเป็นภาพที่มองเห็นได้จริงอย่างง่ายดาย! เป็นอีกหนึ่งการพัฒนากระบวนการสร้างสรรค์ภาพให้กลายมาเป็นเครื่องมือที่ใช้งานได้ตอบโจทย์ แม่นยำ และทรงพลังมากกว่าเดิม!


จุดนี้นับว่า ChatGPT-4o ถูกเพิ่มความสามารถจากการฝึกอบรมโมเดล ให้สามารถทำงานออกมาได้ตอบโจทย์การสร้างสรรค์ภาพ ที่สอดคล้องกับความต้องการ และสร้างสรรค์ออกมาได้ในหลากหลายบริบทอีกด้วย


------------------------------------------

สรุป 6 การอัปเดตโมเดล GPT-4o ที่มาเพื่อตอบโจทย์การ Generate รูปภาพได้หลากหลายและเนียนกว่าเดิม

------------------------------------------

1. การอัปเดตความสามารถด้านการสร้างรูปภาพให้เก่งขึ้นไปอีกขั้น

โดยโมเดล GPT-4o ได้รับการฝึกจากข้อมูลที่รวมทั้งข้อความและภาพ มีการปรับแต่งหลังการฝึกโมเดลให้มีความสามารถด้านการสร้างรูปภาพที่ดีขึ้น ทำให้ GPT-4o สามารถสร้างรูปภาพที่ดูมีความสมเหตุสมผล และสอดคล้องกับบริบทได้อย่างตอบโจทย์

2. อัปเดตความสามารถในการเรนเดอร์ข้อความในภาพให้เนียนขึ้น

โดยโมเดล GPT-4o สามารถนำข้อความลงมาใส่ในภาพได้อย่างแม่นยำ ช่วยเสริมการสื่อสารด้วยภาพและข้อความที่ช่วยให้สามารถสื่อความหมายได้ดีมากขึ้น

3. อัปเดตความสามารถในการสร้างภาพได้หลายรอบ หรือพัฒนาจากภาพเดิมได้ (Multi-Turn Generation)

โดยการอัปเดตครั้งนี้ ทำมาเพื่อให้ ChatGPT สามารถรองรับการแก้ไข และพัฒนาภาพที่ generate ออกมาได้อย่างต่อเนื่องผ่านการสนทนา พร้อมทั้งยังสามารถรักษาความสอดคล้องของภาพตลอดกระบวนการแก้ไขได้อีกด้วย

4. อัปเดตโมเดลใหม่ให้สามารถทำตามคำสั่งที่ซับซ้อนได้

ซึ่งการสร้างสรรค์ภาพบน ChatGPT-4o สามารถรองรับภาพที่มีวัตถุ 10-20 ชิ้นในภาพเดียว และยังสามารถจัดการวัตถุและคุณสมบัติต่าง ๆ ได้ดีขึ้นอีกด้วย

5. อัปเดตโมเดลให้สามารถเรียนรู้จากภาพที่อัปโหลดได้

โดยเป็นโมเดลที่อัปเดต เพื่อให้สามารถวิเคราะห์ และนำรายละเอียดจากภาพที่ผู้ใช้ส่งเข้ามาในแชท ไปใช้ในการสร้างภาพใหม่เพื่อให้ตอบโจทย์ตามคำสั่งได้อย่างแม่นยำมากยิ่งขึ้น

6. อัปเดตการสร้างสรรค์รูปภาพให้มีความสมจริงและมีหลากหลายสไตล์

เป็นการที่ตัวโมเดลถูกฝึกฝนจากภาพที่มีหลากหลายสไตล์ ทำให้สามารถสร้างสรรค์ภาพได้ทั้งแบบสมจริงและแบบศิลป์ นอกจากนี้ยังสามารถเปลี่ยนหรือดัดแปลงภาพให้เข้ากับรูปแบบที่ต้องการได้ เป็นการเชื่อมโยงข้อมูลจากข้อความและภาพเข้าด้วยกัน ช่วยให้การสร้างสรรค์ภาพมีความสมจริงและฉลาดมากยิ่งขึ้น

------------------------------------------

นอกจากความสามารถสุดล้ำทั้ง 6 ข้อที่อัปเดตมานี้ ยังมีการตั้งมาตรการความปลอดภัย เพื่อป้องกันข้อผิดพลาดที่เกิดจาก AI และผู้ใช้งาน โดยมีการติดแท็ก C2PA metadata เพื่อระบุว่าเป็นภาพที่สร้างจาก AI, ป้องกันการสร้างภาพที่เป็นอันตราย เช่น deepfake หรือเนื้อหาที่ไม่เหมาะสม, ควบคุมการสร้างภาพที่เกี่ยวข้องกับบุคคลจริงอย่างเข้มงวด, และใช้ AI ที่สามารถให้เหตุผล (reasoning LLM) ในการตรวจสอบและกรองภาพที่สร้างขึ้น

.

ในส่วนของ ChatGPT-4o ที่ใช้ในการ Generate รูปภาพนี้ เปิดให้เข้าถึงได้ตั้งแต่กลุ่มผู้ใช้ฟรี ไปจนถึงผู้ใช้ระดับ Plus, Pro, และ Team พร้อมทั้งกำลังจะเปิดให้ใช้กับ Enterprise, Edu และ API และมีการตั้งเป้าจะผสานรวมเข้ากับ Sora และ DALL·E GPT เพื่อเพิ่มความสามารถให้ไปสุดกว่าเดิม!

#ChatGPT #GPT4o #AI #ArtificialIntelligence #สร้างภาพด้วยAI #BBO #thebigblueocean #digitaltransformation #transformationbuddy

ที่มา: www.openai.com


Bangkok Bank SMEเราเป็นเพื่อนคู่คิด มิตรคู่บ้าน ทุกช่วงการเติบโตของธุรกิจ
สนใจลงทุนธุรกิจสามารถปรึกษาธนาคารกรุงเทพคลิกหรือสายด่วน1333


Related Article

รู้จัก Visual Foundation Models เมื่อ AI ไม่ได้เข้าใจแค่ภาษา แต่ "มองเห็นภาพ" ได้อีกด้วย!

รู้จัก Visual Foundation Models เมื่อ AI ไม่ได้เข้าใจแค่ภาษา แต่ "มองเห็นภาพ" ได้อีกด้วย!

ในยุคที่ AI ไม่ได้แค่เข้าใจข้อความ แต่สามารถ "เข้าใจภาพ" ได้อย่างชาญฉลาด กับความสามารถที่เรียกว่า Visual Foundation Models (VFMs) ซึ่งกำลังกลายมาเป็นหัวใจสำคัญ…
pin
9 | 22/08/2025
“Prompt Engineering” คืออะไร? ทำไมใคร ๆ ก็พูดถึงกัน ในยุคที่ AI กำลังมาแรง !??

“Prompt Engineering” คืออะไร? ทำไมใคร ๆ ก็พูดถึงกัน ในยุคที่ AI กำลังมาแรง !??

ถ้าเปรียบการใช้งาน AI อย่าง ChatGPT, Gemini, หรือ Claude กับการขับรถยนต์ล้ำสมัย ในการ “ขับเคลื่อน” เหล่าโมเดลอัจฉริยะเหล่านี้ให้ไปถึงเป้าหมายได้อย่างแม่นยำ…
pin
21 | 18/07/2025
จับตา !! เมื่อ Agentic AI อาจกลายมาเป็นเครื่องมือ ที่หลายธุรกิจขาดไปไม่ได้ !??

จับตา !! เมื่อ Agentic AI อาจกลายมาเป็นเครื่องมือ ที่หลายธุรกิจขาดไปไม่ได้ !??

Gartner คาดการณ์ว่าภายในปี 2028 แอปพลิเคชันซอฟต์แวร์ขององค์กรกว่า 33% จะฝัง Agentic AI เข้ามาช่วยทำงาน จากในปี 2024 ที่ยังมีการนำมาใช้ไม่ถึง…
pin
35 | 20/06/2025
เช็กความล้ำ ChatGPT-4o สร้างสรรค์ภาพได้มากกว่าแค่คำว่า “สวย”