الذكاء الاصطناعي يمنح المشاهدين قدرة تغيير حبكات الأفلام بمشاعرهم
شركة ديزني للأبحاث تعاونت مع فريق من الباحثين بجامعة Simon Fraser لتطوير برنامج يعتمد على خوارزمية تُعرف باسم (FVAEs).
لن يمضي وقت طويل قبل أن يغير الذكاء الاصطناعي وجه صناعة الترفيه في السينما والتلفزيون بالكامل، إذ تتجه تجارب اليوم إلى منح المشاهد دفة قيادة المشهد السينمائي، عبر مشاعره وردود أفعاله تجاه ما يراه، بالاستفادة من التسارع الدراماتيكي للتطور التكنولوجي والتقني في العالم.
في أواخر العام الماضي، تحديداً ديسمير/كانون الأول 2018، كانت منصة خدمة بث الترفيه عبر الإنترنت الأمريكية "نيتفلكس" أنجزت أولى تجاربها العملية في تكريس سيادة المشاهد، حين منحته عبر حلقة خاصة من الموسم الجديد لمسلسل "Black Mirror" بعنوان "Black Mirror: Bandersnatch"، القدرة على توجيه أحداث هذه الحلقة والاختيار بالنيابة عن أبطالها، وبالتالي تغيير مسار حبكتها، على نحو صار المشاهد جزءاً فاعلاً فيها، بشكل مشابه لفاعلية مخرجها وكاتبها.
لكن ما اعتُبر خطوة رائدة من "نيتفلكس" في ذلك الوقت، من شأنها أن تحدث تحولاً في صناعة السينما والدراما التلفزيونية، سيصير تجربة قديمة ومتأخرة، بمجرد دخول تجارب "ديزني" التي بدأتها الشركة الأمريكية منذ 2017 حيز التطبيق العملي، ومن شأن تلك التجارب أن تمكّن صانعي الأفلام من تحديد ردود أفعال المشاهدين تجاه أفلامهم، من خلال مراقبة ملامح وجوههم باستخدام كاميرات الأشعة تحت الحمراء في قاعة السينما لمدة 10 دقائق، وبناء عليه يتم التنبؤ بردود أفعالهم تجاه بقية الوقت المتبقي من زمن الفيلم.
كانت شركة ديزني للأبحاث تعاونت مع فريق من الباحثين في جامعة Simon Fraser بتطوير برنامج يعتمد على خوارزمية تُعرف باسم وحدات التشفير التلقائي ذات العوامل (FVAEs)، تستخدم أدوات الترميز التلقائي المتغيرة التعلم العميق لترجمة صور الكائنات المعقدة تلقائياً، مثل الوجوه، إلى مجموعات من البيانات العددية، واستناداً إلى هذا البرنامج التقط فريق الباحثين ردود أفعال مشاهدي أفلام لديزني، من خلال مراقبة وجوه الجمهور عبر كاميرات عالية الوضوح تعمل بالأشعة تحت الحمراء، خلال 150 عرضا لـ9 أفلام، منها "Big Hero 6" و"The Jungle Book" و"Star Wars: The Force Awakens".
في مسرح يتسع لـ400 مقعد ومزود بـ4 كاميرات تعمل بالأشعة تحت الحمراء، سجلت ردود أفعال مختلفة لعدد من المشاهدين، مثل الابتسامات والضحك والعيون المتسعة، وكانت النتيجة عبارة عن مجموعة بيانات لـ3.179 من المشاهدين تضم 16 مليون من معالم الوجه التي قام الفريق بتغذيتها للبرنامج، الذي سيقوم بدوره بمعالجتها، بما يتيح القدرة على التنبؤ كيف سيكون رد فعل المشاهدين تجاه لقطات معينة في الفيلم، بعد 10 دقائق من مراقبتهم، وهو الأمر الذي يمنح صانعي الأفلام، على هذا النحو، وحدة تنبؤ جديدة، لكنها أكثر دقة وموضوعية من سواها، لاقتراح مشاريع سينمائية مستقبلية وسيناريوهات تلقي رواجاً عند الجمهور.
تطوير هذه التجارب بما يضمن فعالية أكثر مرونة لنظام الذكاء الاصطناعي في سرعة تحليل البيانات والاستجابة لنتائجها من شأنه أن ينقل "الدراما التفاعلية" من المرحلة التي بلغتها "نيتفلكس" في سرد القصص التفاعلية درامياً، عندما منحت المشاهد حرية التفاعل مع شخصيات الحكاية وتوجيهها على نحو مشابه تقريباً لآلية تحكم المستخدم بشخصيات ألعاب الفيديو التقليدية، إلى مرحلة جديدة يكفي خلالها أن يبدي المشاهد أثناء تفاعله مع مشاهد الفيلم أو المسلسل واحداً من العواطف السبعة الشهيرة (الغضب والاحتقار والاشمئزاز والخوف والسعادة والحزن والمفاجأة) أو ما يترتب عليها من مشاعر أخرى، حتى يستجيب الذكاء الاصطناعي لمشاعره، ويغير مسار أحداث الفيلم بما يناسب مشاعر المتلقي.
تلك التجربة التفاعلية مع مشاعر المشاهد، بلا شك تنتقل سريعاً لتستهدف الهواتف المحمولة بالتحديد، بالنظر إلى الدراسات التي أظهرت أن استخدام الهاتف المحمول في مشاهدة المحتوى الترفيهي أعلى بكثير بين أبناء جيل الألفية من الجيل الذي سبقهم، ما يجعل الهواتف الجوالة شاشة العالم الأكثر انتشاراً في الفترة المقبلة، وعليه لا نستبعد أن تصير واحدة من ميزات كاميرات هذه الهواتف، هي القدرة على التعامل مع هذه التجربة التفاعلية باستخدام تطبيق خاص بالذكاء الاصطناعي، بذلك سيكون بوسع هذه الهواتف تغيير مسار الفيلم ومشاهده ونهايته، اعتمادًا على التغذية الراجعة اللاإرادية المستمرة التي تقدمها الكاميرات لنظام الذكاء الاصطناعي التفاعلي المرتبط بالفيلم نفسه.
وحتى بلوغ هذه المرحلة من التجربة التفاعلية يمكن للتجارب المستمرة التي تجريها "ديزني"، والمزيد من العمل على نمذجة تعبيرات وجوه المشاهدين بدقة أكبر في مجموعة واسعة من التطبيقات، أن تحصد أولى نتائجها العملية من خلالها المقاطع الترويجية للأفلام (movie trailers)، ويمكن الاستعانة بالنظام المأمول اعتماداً على الذكاء الاصطناعي؛ لرصد ملامح الوجوه تجاه المقاطع الترويجية للأفلام، لفهم اتجاهات الجمهور بشكل أفضل، والتنبؤ لمستقبل الفيلم، وصولاً إلى امتلاك مرجعية قياس دقيقة، تستند إلى بيانات غير قابلة للتزييف، لتقييم الفيلم وعلاقته المحتملة مع الجمهور الحالي واللاحق، وأدائه المالي المحتمل.