أخبار التقنية

نموذج MuseStreamer من Baidu يستعد لمنافسة Veo 3 من Google في مجال توليد الفيديو بواسطة الذكاء الاصطناعي

أعلنت شركة Baidu عن إطلاق نموذجها الجديد MuseStreamer لتوليد الفيديو بالذكاء الاصطناعي، ويتميز هذا النموذج بقدرته على دمج الصوت الصيني في مقاطع الفيديو المُولّدة، مما يجعله ثاني نموذج في العالم يقدم هذه الميزة بعد Veo 3 من Google. وتزعم Baidu أن MuseStreamer هو الأول من نوعه الذي يدعم توليد الصوت الصيني الأصلي، بالإضافة إلى هذه الإضافة، قامت الشركة أيضًا بإصدار منصة جديدة لإنشاء محتوى الفيديو تُعرف باسم HuiXiang، لكن من الملاحظ أنها لا تتوفر حاليًا خارج حدود الصين.

النموذج الميزات اللغة المدعومة
MuseStreamer توليد الفيديو بالصوت الصيني الصينية
Veo 3 توليد الفيديو باللغة الإنجليزية الإنجليزية

شهد مجال نماذج توليد الفيديو بالذكاء الاصطناعي تطورات ملحوظة في العامين الماضيين، حيث تطورت التقنيات من نموذج يواجه صعوبة في توليد الصور الدقيقة للأشخاص إلى نماذج يمكنها تصوير الحركة بدقة عالية. ومع ذلك، يتجنب العديد من شركات الذكاء الاصطناعي الغوص في إنتاج الفيديوهات التي تتضمن صوتًا أصليًا، وهو ما يجعل MuseStreamer علامة فارقة في هذا المجال.

خلال مؤتمر جوجل للمطورين (Google I/O 2025)، تفوقت Google على المنافسين بإطلاق Veo 3، الذي أصبح حديث وسائل الإعلام، حيث قامت بتوسيع نطاق توفره ليشمل 154 دولة. يعد ذلك تتويجًا لجهودها الحثيثة في تطوير التقنيات المرتبطة بهذا النوع من الأدوات، ويتفوق Veo 3 على منافسه Sora من OpenAI.

وفقًا لتقارير Tech in Asia، دخلت Baidu بالسوق بقوة مع نموذج MuseStreamer الذي يقدم خيار إنتاج مقاطع فيديو بالصوت الصيني، وهو المتميز في تقديم تلك الميزة إضافة إلى أن Veo 3 يقتصر على الصوت باللغة الإنجليزية فقط. تعكس هذه المنافسة المتزايدة في مجال الذكاء الاصطناعي تطلعات الشركات نحو تلبية احتياجات السوق المتنوعة.

من المثير للاهتمام أن MuseStreamer لا يقتصر على إنشاء الحوارات المتزامنة مع مقاطع الفيديو فحسب، بل يمكنه أيضًا إضافة مؤثرات صوتية وضوضاء محيطية. وقد زعمت Baidu أن النموذج حقق أداءً متميزًا بنسبة 89.38% في معيار VBench I2V، مما يعكس قوة الابتكار في التصميم والأداء.

علاوة على ذلك، تُعتبر منصة HuiXiang بمثابة واجهة المستخدم لنموذج MuseStreamer، حيث تتيح للمستخدمين إمكانية مشاركة الطلبات وإنشاء مقاطع فيديو بسهولة. وتدعم المنصة حاليًا إنشاء مقاطع فيديو مدتها 10 ثوانٍ بدقة تصل إلى 1080 بكسل، وهو ما يفوق قدرات Veo 3 التي لا تستطيع إنتاج مقاطع تتجاوز 8 ثوانٍ، ولكن لا يزال هناك غموض حول أبعاد الفيديو ومرونة المستخدمين في إنشاء مقاطع بأنماط مختلفة.

مقالات ذات صلة

زر الذهاب إلى الأعلى