Microsoft ได้ก้าวกระโดดครั้งสำคัญในด้านการสร้างสรรค์เนื้อหาที่ขับเคลื่อนด้วย AI โดยฝ่ายวิจัยของบริษัทที่นำโดย Satya Nadella ได้เปิดตัว VASA-1 ซึ่งเป็นเฟรมเวิร์ก AI ที่สามารถแปลงรูปถ่ายใบหน้าคนให้กลายเป็นวิดีโอที่พูดและร้องเพลงได้
โครงการนี้ถือเป็นการเปลี่ยนแปลงครั้งใหญ่ในสิ่งที่ประสบความสำเร็จในด้านเนื้อหาที่สร้างโดย AI เนื่องจากใช้ข้อมูลอินพุตเพียงเล็กน้อย ใช้แค่เพียงภาพถ่ายใบหน้าแบบคงที่เพียงภาพเดียวและไฟล์เสียงที่มีการพูด จากนั้นก็จะทำการซิงค์ปาก แสดงออกทางสีหน้า และการขยับศีรษะที่เกี่ยวข้อง
Microsoft ได้นำเสนอตัวอย่างผลงานมากมายเพื่อแสดงความสามารถของเฟรมเวิร์กนี้ รวมถึงตัวอย่างของโมนา ลิซ่าที่กำลังแร็ป อย่างไรก็ตาม ด้วยความเสี่ยงที่อาจจะก่อให้เกิด deepfake จากเทคโนโลยีดังกล่าว บริษัทฯ จึงเน้นย้ำว่านี่เป็นเพียงการสาธิตงานวิจัยเท่านั้น และยังไม่มีแผนที่จะนำเทคโนโลยีนี้ออกสู่ตลาด
อ่านเพิ่มเติมที่นี่ – VB