การสร้างวิดีโอด้วย AI ได้ก้าวไปสู่ระดับใหม่แล้วด้วย Veo 3.1, มอบชุดเครื่องมือที่ได้รับการปรับปรุงให้กับผู้สร้างเมื่อเทียบกับรุ่นก่อนหน้า Veo 3.
เมื่อทดสอบโมเดลด้วยตนเอง ผมพบว่า Veo 3.1 อนุญาตให้ผสานเสียงได้อย่างราบรื่น, คลิปที่ยาวขึ้นได้ถึง 148 วินาที, และการควบคุมฉากอย่างแม่นยำ, ทั้งหมดนี้ทำให้การเล่าเรื่องมีความสมจริงและน่าดึงดูดยิ่งขึ้น ใน Flow คุณสามารถสร้างวิดีโอที่ผสมผสานภาพอ้างอิงหลายภาพได้อย่างเป็นธรรมชาติ ขยายการกระทำให้เกินกว่าคลิปต้นฉบับ และควบคุมทั้งภาพและเสียงได้ในระดับที่เคยทำได้เฉพาะในขั้นตอนหลังการถ่ายทำเท่านั้น.
Global GPT ได้ผสานรวม Veo 3.1, นำเสนอรุ่นต่างๆ มากขึ้นในราคาที่ต่ำกว่า หากคุณต้องการ เข้าถึงโมเดลเพิ่มเติม เช่น Sora 2, คุณสามารถคลิกที่นี่.

คุณสมบัติใหม่ที่สำคัญใน Veo 3.1
| คุณสมบัติ | Veo 3 | Veo 3.1 |
|---|---|---|
| การผสานเสียง | การเพิ่มด้วยตนเองที่จำกัดและจำเป็น | การสร้างเสียงต้นฉบับในทุกฟีเจอร์ รวมถึงบทสนทนาและเสียงสภาพแวดล้อม |
| การควบคุมเรื่องเล่า | การจัดลำดับขั้นพื้นฐาน | การเล่าเรื่องหลายฉากที่พัฒนาขึ้น การควบคุมฉากและตัวละครอย่างละเอียด |
| ความสมจริงและพื้นผิว | ความเที่ยงตรงมาตรฐาน | พื้นผิวที่สมจริงพร้อมคุณภาพเสียงและภาพระดับสูง |
| การปฏิบัติตามคำแนะนำทันที | ปานกลาง | การปฏิบัติตามที่เข้มงวดมากขึ้น สะท้อนข้อความและคำแนะนำทางภาพได้อย่างถูกต้อง |
| ความสามารถในการแก้ไข | จำกัด | แทรกและนำวัตถุออก แก้ไขฉากภายในแอปได้อย่างแม่นยำ |
| ส่วนขยายวิดีโอ | คลิปสั้นเท่านั้น | ขยายอนุญาตให้วิดีโอมีความยาวสูงสุด 148 วินาที พร้อมการเชื่อมต่ออย่างราบรื่นจากคลิปก่อนหน้า |
| ประเภทของข้อมูลนำเข้า | ข้อความและรูปภาพ | ข้อความ, รูปภาพหลายภาพ, และคลิปวิดีโอ สำหรับการจัดฉากที่สมบูรณ์ยิ่งขึ้น |
| การเข้าถึง API และแพลตฟอร์ม | Gemini API (พื้นฐาน) | Gemini API 2, Vertex AI, Flow และการสนับสนุนแอป Gemini |
เสียงคุณภาพเยี่ยมในทุกฟีเจอร์

เสียงคุณภาพเยี่ยมในทุกฟีเจอร์
หนึ่งในอัปเดตที่น่าตื่นเต้นที่สุดใน Veo 3.1 คือ การสร้างเสียงต้นฉบับ. ก่อนหน้านี้ ผู้สร้างต้องเพิ่มเสียงเอฟเฟกต์หรือบทสนทนาด้วยตนเอง ตอนนี้ ฟีเจอร์ Flow เช่น ส่วนผสมสำหรับวิดีโอ, เฟรมเป็นวิดีโอ, และ ขยาย สามารถสร้างเสียงได้อัตโนมัติ ทำให้:
- ภาพนิ่งที่มีชีวิตชีวาด้วยเสียงที่ซิงโครไนซ์
- ภาพอ้างอิงหลายภาพเพื่อรวมตัวละคร วัตถุ และองค์ประกอบต่างๆ เข้าด้วยกันในฉากเดียวพร้อมเสียงที่เป็นธรรมชาติ
- คลิปวิดีโอที่ยาวขึ้น ซึ่งก่อนหน้านี้จำกัดไว้ที่ 8 วินาที ตอนนี้สามารถเล่นได้แล้ว สูงสุดถึง 30 วินาที หรือแม้กระทั่งหนึ่งนาทีเต็ม, พร้อมการเปลี่ยนผ่านที่ราบรื่นจากเฟรมสุดท้ายของคลิปก่อนหน้า
การปรับปรุงนี้ช่วยให้ผู้สร้างสามารถควบคุม อารมณ์, การเดินไปมา, และน้ำเสียงของเรื่องเล่า โดยตรงในระหว่างการสร้างวิดีโอ ซึ่งช่วยให้กระบวนการผลิตเนื้อหาง่ายขึ้นอย่างมาก ไม่ว่าจะเป็นเนื้อหาสำหรับการฝึกอบรม วิดีโอการตลาด หรือประสบการณ์ดิจิทัลที่สมจริง.
เครื่องมือแก้ไขขั้นสูง
ขณะนี้ Flow มีให้บริการ การแก้ไขในแอปที่แม่นยำยิ่งขึ้น ด้วย Veo 3.1:
- แทรกวัตถุ: เพิ่มองค์ประกอบที่สมจริงหรือเหนือจินตนาการให้กับฉากใดก็ได้ เงา แสง และความเป็นหนึ่งเดียวกันของพื้นที่จะถูกจัดการโดยอัตโนมัติ.
- นำวัตถุออก: สามารถลบตัวอักษรหรือวัตถุที่ไม่ต้องการออกได้อย่างราบรื่น; Flow จะสร้างพื้นหลังใหม่เพื่อรักษาความสมบูรณ์ของฉาก.
- การควบคุมสตอรี่บอร์ด: จัดเรียงฉากอย่างแม่นยำสำหรับเรื่องราวหลายขั้นตอน โดยรักษาความสอดคล้องของภาพและเสียงอย่างต่อเนื่อง.
ในทางปฏิบัติ ผมพบว่าเครื่องมือเหล่านี้ช่วยลดความจำเป็นในการแก้ไขภายนอกอย่างมาก ทำให้ผมสามารถปรับปรุงและขัดเกลาฉากต่าง ๆ ได้ทั้งหมดภายใน Flow.
การสร้างวิดีโอแบบขยาย
The ขยาย ฟีเจอร์นี้ช่วยให้ผู้สร้างสามารถผลิตได้ คลิปที่ยาวขึ้นและต่อเนื่อง:
- วิดีโอสามารถอยู่ได้ สูงสุด 148 วินาที, เชื่อมต่ออย่างเป็นธรรมชาติกับส่วนก่อนหน้า
- เหมาะสำหรับ ภาพตั้งต้น หรือลำดับที่ยาวกว่า
- แต่ละส่วนใหม่ใช้ เฟรมสุดท้ายของคลิปก่อนหน้า, รักษาความต่อเนื่องในการกระทำ, แสงสว่าง, และฉากหลัง
เมื่อเปรียบเทียบกับ Veo 3 ซึ่งเหมาะที่สุดสำหรับคลิปสั้น ๆ ที่แยกออกมา, นี่ทำให้ Veo 3.1 เหมาะสำหรับ โครงการเล่าเรื่องที่ยาวนานขึ้นหรือเนื้อหาการฝึกอบรมที่มีรายละเอียด.
การเข้าถึงหลายแพลตฟอร์ม
Veo 3.1 พร้อมใช้งานแล้วบนหลายแพลตฟอร์ม:
- โฟลว์: สำหรับผู้สร้างสรรค์ที่ผลิตวิดีโอ AI แบบภาพยนตร์โดยตรง
- Gemini API 2: นักพัฒนาที่ผสานการสร้างวิดีโอเข้ากับแอปพลิเคชัน
- Vertex AI: ลูกค้าองค์กรที่ต้องการวิดีโอที่ยาวนานขึ้น ความสม่ำเสมอของฉาก และการผลิตที่สามารถปรับขนาดได้
- โกลบอล จีพีที: แพลตฟอร์ม AI แบบครบวงจรได้ผสานรวม Veo 3.1 แล้ว ซึ่งให้การเข้าถึงวิดีโอที่ยาวขึ้น ความสม่ำเสมอของฉาก และการผลิตที่สามารถปรับขนาดได้.
สิ่งนี้ช่วยให้ผู้สร้างทุกระดับ—ตั้งแต่ผู้เริ่มต้นไปจนถึงทีมองค์กร—สามารถใช้ประโยชน์จาก ความสามารถเต็มรูปแบบของ Veo 3.1.
ราคาและข้อมูลจำเพาะทางเทคนิค
ปัจจุบัน Veo 3.1 อยู่ในช่วงพรีวิวและสามารถเข้าถึงได้เฉพาะผ่าน ระดับการชำระเงินของ Gemini API:
- มาตรฐานแบบจำลอง: 1.40 ต่อวินาทีของวิดีโอ
- แบบจำลองรวดเร็ว: 1.04 ต่อ 0.15 ต่อวินาทีของวิดีโอ
- ไม่มีแพ็กเกจฟรี; มีการเรียกเก็บเงิน เฉพาะหลังจากสร้างวิดีโอสำเร็จแล้วเท่านั้น
ข้อมูลทางเทคนิคประกอบด้วย:
- ความละเอียด: 720p หรือ 1080p
- อัตราเฟรม: 24 เฟรมต่อวินาที
- ความยาววิดีโอ: 4, 6, 8 วินาที (มาตรฐาน), สูงสุด 148 วินาทีโดยใช้ฟีเจอร์ขยาย
คุณสมบัติเหล่านี้ทำให้ Veo 3.1 มีประโยชน์อย่างยิ่งสำหรับองค์กรที่ต้องการ แบรนด์ที่สอดคล้องกัน, ภาพที่มีคุณภาพสูง, และเสียงที่ผสานรวม ในด้านการตลาด, การค้าปลีก, หรือการผลิตเนื้อหาเสมือน.
สรุป
Veo 3.1 เป็นการอัปเกรดครั้งใหญ่จาก Veo 3, เสนอ:
- เสียงต้นฉบับในหลายฟีเจอร์
- การควบคุมเรื่องราวและฉากที่ดียิ่งขึ้น
- เครื่องมือแก้ไขขั้นสูงสำหรับการแทรกหรือลบวัตถุ
- การสร้างวิดีโอที่ยาวขึ้นและไร้รอยต่อ
- การเข้าถึงหลายแพลตฟอร์มสำหรับผู้สร้างสรรค์และองค์กร
จากประสบการณ์ของฉัน การปรับปรุงเหล่านี้ทำให้ Flow ที่ขับเคลื่อนโดย Veo 3.1 เป็น ตัวเปลี่ยนเกมสำหรับการสร้างวิดีโอด้วย AI, ลดการทำงานหลังการผลิตด้วยมือ, เพิ่มอิสระในการสร้างสรรค์, และทำให้การเล่าเรื่องมีความสมบูรณ์มากกว่าที่เคย.

