طرحت شركة ميتا المالكة لفيسبوك، 3 نماذج ذكاء اصطناعي قادرة على جعل الصوت يبدو حقيقيا أكثر في العالم الافتراضي.
وقالت الشركة: ”تركز نماذج الذكاء الاصطناعي على الصوت البشري وصوت الفيديو في الواقع الافتراضي، وتدفعنا بمعدل أسرع نحو الواقع المعزز“.
وأشار باحثو الذكاء الاصطناعي في الشركة والمتخصصون في الصوتيات من فريق مختبر رياليتي لابز التابع لها، إلى أن الصوتيات تلعب دورا أساسيا في تجربة عالم ميتافيرس، معتبرين أن الذكاء الاصطناعي قادر على رفع دقة الصوت حتى يصبح حقيقيا أكثر، وفقا لموقع ”غادجتس ناو“.
وطور الباحثون النماذج الجديدة بالتعاون مع جامعة تكساس الأمريكية، في ظل خطط ترمي إلى توفيرها للمطورين.
ويعتمد نموذج الذكاء الاصطناعي الذاتي ”أفاتار“ على الربط بين الصوت والصورة، من خلال تعديل الصوت ليتناسب مع مساحة الصورة المستهدفة.
وذكرت الشركة أن النموذج الذاتي التعلم يستمد مهارة ربط الصوت والصورة من مقاطع البرية المصورة، رغم احتواء بعضها على سوء ترابط بين الصوت والصورة، وأخطاء في البيانات.
أما نموذج ”فيجوال فويس“، فيعتمد على آلية تعلم ذاتية مشابهة لطريقة تعلم البشر مهارات جديدة، عن طريق الربط بين أدلة الصوت والصورة في المقاطع المصورة.
ويهدف إلى الفصل بين الأصوات في المحادثة الافتراضية؛ مثل حضور اجتماع افتراضي في ميتافيرس مع أشخاص من جميع أنحاء العالم.
لكن بدلا من تراكب جميع الأصوات فوق بعضها، وحدوث محادثات قليلة، يعمل النموذج على ربط الصوت بالمكان خلال حركة الأشخاص لتوفير إمكانية إجراء محادثات صغيرة فيما بينهم.
وأوضح باحثو الذكاء الاصطناعي: ”يتميز نموذج فيجوال فويس بقدرته على التعامل مع سيناريوهات عديدة تشبه الواقع الحقيقي، ما يمثل تحديا كبيرا“.
وازداد في الآونة الأخيرة عدد الشركات المستخدمة لتقنيات الواقع المعزز المتاحة حاليا، وما يبدو مرجحا حاليا أن تقنيات الواقع المعزز ستظل تتطور في الأعوام المقبلة تطورا متسارعا يتعلق باستخدامها في مواقع العمل.