Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ล่าสุดในซีรีส์ “Qwen” เมื่อวันพฤหัสบดี ท่ามกลางการแข่งขันที่ร้อนแรงขึ้นของโมเดลภาษาขนาดใหญ่ (LLM) ในประเทศจีน หลังจากกระแส “DeepSeek moment”
โมเดลใหม่ที่มีชื่อว่า “Qwen2.5-Omni-7B” เป็นโมเดลแบบมัลติโมดอล ซึ่งสามารถประมวลผลข้อมูลนำเข้าได้หลายรูปแบบ เช่น ข้อความ รูปภาพ เสียง และวิดีโอ พร้อมทั้งสามารถสร้างข้อความและเสียงพูดที่เป็นธรรมชาติแบบเรียลไทม์ โดยทางบริษัทระบุว่า โมเดลนี้สามารถนำไปใช้งานบนอุปกรณ์ Edge เช่น โทรศัพท์มือถือ ทำให้มีประสิทธิภาพสูงโดยไม่ลดทอนสมรรถนะ
Alibaba Cloud กล่าวว่า Qwen2.5-Omni-7B เป็นรากฐานที่สมบูรณ์แบบสำหรับการพัฒนา AI Agent ที่มีความคล่องตัว คุ้มค่า และสามารถสร้างมูลค่าได้อย่างเป็นรูปธรรม โดยเฉพาะอย่างยิ่งในแอปพลิเคชันที่เกี่ยวข้องกับเสียงอัจฉริยะ เช่น การช่วยเหลือผู้พิการทางสายตาในการนำทางผ่านคำบรรยายเสียงแบบเรียลไทม์
นอกจากนี้ โมเดลใหม่นี้ยังเปิดเป็น โอเพ่นซอร์ส บนแพลตฟอร์ม Hugging Face และ Github ซึ่งเป็นแนวโน้มที่กำลังเติบโตในจีน หลังจากที่ DeepSeek ได้เปิดโอเพนซอร์ซโมเดล R1 ของตนเองก่อนหน้านี้
โดยทั่วไป คำว่า “โอเพ่นซอร์ส” หมายถึงซอฟต์แวร์ที่เปิดให้เข้าถึงซอร์สโค้ดได้ฟรีบนอินเทอร์เน็ต เพื่อให้สามารถแก้ไขและพัฒนาเพิ่มเติมได้ Alibaba Cloud เปิดเผยว่า ในช่วงไม่กี่ปีที่ผ่านมา บริษัทได้เปิดโอเพ่นซอร์สโมเดล Generative AI ไปแล้วมากกว่า 200 โมเดล ซึ่งสะท้อนถึงความมุ่งมั่นของบริษัทในการพัฒนาเทคโนโลยี AI ให้ก้าวหน้ายิ่งขึ้น
รายละเอียด CNBC