نموذج جديد لتحويل الصورة إلى فيديو حيث طرحت مايكروسوفت تطبيق الذكاء الأصطناعي VASA-1، وهو نموذج متقدم للذكاء الاصطناعي قادر على إنشاء وجوه ناطقة نابضة بالحياة مع حركات الشفاه المتزامنة وديناميكيات الوجه التعبيرية. يستخدم الذكاء الاصطناعي هذا نموذجًا قائمًا على الانتشار لإنشاء صور رمزية واقعية لتطبيقات الاتصالات الرقمية والألعاب والوسائط الاجتماعية. ومن خلال الاستفادة من هذه التكنولوجيا، تهدف مايكروسوفت إلى تحويل التفاعلات في مختلف القطاعات، بما في ذلك الرعاية الصحية والتعليم، وتعزيز الطبيعة والواقعية للصور الرمزية الرقمية.
على الرغم من تطوير شركة مايكروسوفت لنموذج VASA-1 الذي يمتلك قدرات استثنائية في توليد مقاطع الفيديو، إلا أنها لا تعتزم إطلاق منتج أو واجهة برمجة تطبيقات للاستفادة من هذه التكنولوجيا، نظرًا للخطر الكبير المتمثل في توليد التزييف العميق بهذه التقنية، وقد قدمت الشركة شرحاً مفصلاً لطريقة عمل نموذج الذكاء الاصطناعي VASA-1، مع التركيز على قدراته حيث يمكن للنموذج توليد مقاطع فيديو بدقة تصل إلى 512×512 بكسل، بمعدل يصل إلى 40 إطاراً في الثانية.تلك كانت فوائده .
أما بالنسبة لمخاطره .وماهو أختلافه عن التكنلوجيا السابقة الخاصة بالتزييف العميق. يعتبر نموذج VASA-1 الآن يسهل وبشكل كبير أستخدام هذه التقنية في مجال التزييف العميق , سابقاً نحتاج لعدة صور للشخص باتجاهات مختلفة وتسجيل صوتي وبعدها تتم فبركة الفيديو . أما الآن يتيح نموذج الذكاء الاصطناعي VASA-1 توليد مقاطع الفيديو عبر الإنترنت بزمن قصير مع توفير ما يصل إلى دقيقة واحدة من الفيديو بجودة عالية، وذلك باستخدام صورة ثابتة واحدة كمدخل ونبرة الصوت،ويوفر لك عدة حركات للراس و حركات العيون الشائعة .مما يعطي انطباع واقعي وحقيقي للفيديو و انسايبية و تناسق جميع الحركات معاً من حركة الشفاه و حركة الرأس و حركة العيون و تمايل الرأس وحتى الابتسامة. وكذلك أبرزت الشركة قدرة النموذج على توليد حركات الشفاه المتوافقة مع الملف الصوتي يطابقها بدرجة كاملة لا تجعل المتلقي يشك ل 1% أن الأمر فيه تزييف، وتقديم تعبيرات وجه متناسقة معه. ويمكن كتابة نص يمكن تحويله كسيناريو لفلم قصير من خلال تكنلوجيا هذا التطبيق.
بصفتي باحث متخصص في مجال الأمن السيبراني و التكنلوجيا الفائقة يؤسفني القول أن شركات تكنلوجيا المعلومات ماتعلنه عن برامجها و تطبيقاتها المثيرة لجدل هو فقط 5% من ما وصلت أليه. خوفاً من المنافسة الشرسة وسرقة الافكار من قبل الشركات الكبرى الأخرى المنافسة وكذلك لا يرغبون أن يسببون الهلع والرعب للمستخدمين العاديين قبل نزول هذه التطبيقات و البرامج ممايجعلهم يعادون هذه التكنلوجيا قبل أن تكون موجودة للأستخدام بسبب الخوف منها وذلك سيسبب هبوط أسهم تلك الشركات و خسائر بالملايين لاستثمارات شركات التكنلوجية . لنأخذ مثلا شركة الفيسبوك غيرت اسمها من فيسبوك الى أسم شركة ميتا وهو مختصر لمصطلح ميتافيرس. والسبب هو أنها صنعت عالم أفتراضي بكل تفاصيله تريد أن تكون الشركة الرائدة والمسيطره عليه في عالم الميتافيرس (Metaverse) و أستثمرت 17 مليار دولار لبناء هذا الواقع الافتراضي الذي سوف يكون جاهز بالمستقبل القريب. وهو أحد أخطر التطورات التي سوف تدمر الروابط الأجتماعية بين البشر . لمشاهدة تفاصيل أكثر عن عالم الميتافيرس كان لي مقال سابق سلطت الضوء على تفاصيله لقراءة المقال أضغط هنا.
الفلم القصير أدناه يشرح تفاصيل تطبيق الذكاء الأصطناعي VASA-1 الذي طرحته شركة مايكروسوفت