Data Science

تحليل بيانات الأفلام

كتب بواسطة: 25/10/2020 لا يوجد تعليقات

عالم الأفلام وصناعته عالمٌ واسع، تُنتج العديد من الأفلام سنويًا وتتنوع في موضوعاتها ولغاتها والقضايا التي تطرحها، وتتنوع أيضًا عوائدها وإيراداتها ومدى نجاحها، في هذه المقالة سنقوم باستعراض تحليل يشمل بيانات أكثر من ٤٥ ألف فيلم تم انتاجهم في عام ٢٠١٧ وما قبله، وسنسلط الضوء على بعض الجوانب لتحليلها واستنتاج بعض الدلالات من خلالها.

 

أكثر الكلمات تكرارًا في عناوين الأفلام

في الغالب، تدل عناوين الأفلام بشكلٍ مباشر على قصة الفيلم، أو تصنيفه، وتتكرر بعض الكلمات بكثرة في عناوين الأفلام، دالةً على أحداث وقصص يكثر ورودها في الأفلام، وقد نكون لاحظنا ذلك مسبقًا، مثل الكلمات الدالة على القصص الرومانسية، أو الكلمات الدالة على المغامرات، وغيرها.

سنقوم ببعض التحليلات بالاعتماد على عنوان الفيلم المترجم، بحيث تكون كل العناوين بالانجليزية، من خلال هذه التحليلات يمكن تأكيد أو نفي مثل هذه الظاهرة، وإن وُجد ذلك، فما هي الكلمات التي قد تكررت في عناوين الأفلام؟

الكلمات الأكثر تكرارًا في عناوين الأفلام التي تم تحليلها

 

تمثل الصورة في الأعلى الكلمات الأكثر تكرارًا في عناوين الأفلام، بحيث أن حجم الكلمة يمثل معدل تكرارها، أي أن الكلمات ذات الحجم الكبير هي كلمات متكررة كثيرًا، بينما الكلمات ذات الحجم الصغير كلمات متكررة ولكن بشكل قليل.

نجد أن كلمة Love (حُب) هي أكثر كلمة تكرر استعمالها في عناوين الأفلام، تليها كلمات مثل Girl (فتاة)، Day (يوم)، Man (رجل) تكرر أيضًا استعمالهن كثيرًا، وقد يكون سبب تكرار كلمة حُب في عناوين الأفلام يرجع إلى أن العديد من الأفلام تضيف شيئًا من الطابع الرومانسي للقصة، والذي يرجح أنه لقصد التأثير في شريحة كبيرة من الجمهور، هنا بعض الاجابات لسؤالٍ شبيهٍ بما نتطرق له على منصة كورا.



أكثر سلاسل الأفلام نجاحًا بحسب معدل الإيرادات

إيرادات الأفلام أو ما يسمى بالانجليزية Revenu بحسب تعريف موقع ويكيبيديا هي:

“الدخل الذي تحققه الشركة أو المصنع أو المؤسسة التجارية من نشاط أعمالها التجاري، وهو في العادة إيراد بيع سلع أو خدمات إلى مشترين.”

إذًا الإيرادات بالنسبة للأفلام، هي الدخل الذي حققته الشركة المنتجة من خلال الفيلم، عن طريق دُور السينما ومنصات العرض وغيرها.

يعرض الجدول أعلى ١٠ سلاسل أفلام مرتبة من حيث متوسط الإيرادات، ويقصد بمتوسط الإيرادات:

قسمة إجمالي الإيرادات (sum) / عدد أفلام السلسلة (count)

وهذا لمحاولة خلق مقياس عام لمقارنة سلاسل الأفلام ببعضها، حيث أنه من غير المنطقي اعتبار سلسلة أفلام مكونة من ٨ أفلام مثلًا والتي حققت إيرادات عالية أنها الأكثر نجاحًا من سلسلة أفلام أخرى مكونة من فيلمين فقط.

تعد سلسلة أڤاتار Avatar والتي تتكون من فيلم واحد فقط في ذلك الوقت، هي أكثر سلسلة ناجحة من حيث معدل الإيرادات بما يقارب ٣ مليار دولار، تليها سلسلة هاري پوتر Harry Potter المكونة من خمسة أفلام في ذلك الوقت.

ملصقات فيلم Avatar وفيلم Harry Potter

 

أكثر شركات الإنتاج نجاحًا حسب متوسط الإيرادات

سنقوم بمقارنة أداء شركات إنتاج الأفلام، من خلال إيجاد إجمالي الإيرادات للشركة من كل الأفلام التي قامت بإنتاجها، ومن ثم سنوجد متوسط هذه الإيرادات، أي أننا سنأخذ بالاعتبار عدد الأفلام المُنتجَة.

نلاحظ من خلال الجدول والرسم البياني أعلاه:

  • شركة پكسار Pixar Animation Studios، التي أنتجت أفلام أنميشن مشهورة مثل Monsters, Inc. و Toy Story و Finding Nemo وغيرها، تعد أعلى شركة من خلال متوسط الإيرادات من أفلامها.
  • تليها مارڤل Marvel Studios التي أنتجت أفلامًا ناجحة مثل Iron Man و The Avengers، بمتوسط إيرادات بحوالي ٦٠٠ مليون دولار.
    
ملصقات فيلم Finding Nemo وفيلم Iron Man

 

العلاقة بين إيرادات الفيلم وتاريخ الاصدار، هل هناك أشهر معينة تزيد فيها إيرادات الأفلام؟

لنفترض أن إيرادات الفيلم تتأثر بموعد صدوره، هل سيكون لموعد ما تأثيرٌ مختلفٌ عن موعدٍ آخر؟

ومالذي قد يجعل موعدًا أفضل من موعدٍ آخر؟

في الرسم أعلاه، قمنا بتمثيل بيانات الأفلام ذات متوسط إيرادات أعلى من مئة مليون دولار، حتى نركز على الأفلام التي جلبت إيراداتٍ عالية. بالنظر للرسم نجد أن هناك أشهرًا خلال العام، مثل شهر أبريل، ومايو، ويونيو، حققت فيها معظم الأفلام نجاحًا أكثر من الأشهر الأخرى، ثم عادت أشهرٌ أخرى من العام مثل شهر نوفمبر بتحقيق أرقامٍ جيدة.

يعزى ذلك لكون الثلاثة المذكورة هي أشهر الربيع وبداية الصيف في معظم الدول، والتي قد يخصص فيها الناس مبالغ جيدة للترفيه، كزيارة دور السينما، وهي فترة عطلة.

 

أخيرًا، لا يزال هناك العديد من المعلومات والاستنتاجات حول الأفلام، والتي يمكن الاستدلال عليها من خلال تحليل البيانات الموجودة، اخترنا بعضًا منها مما استعرضناه أعلاه، ولمعرفة تفاصيل أكثر حول البيانات المستخدمة، أو الأكواد البرمجية، أو جوانب أخرى لم نتطرق لها، كل هذا وأكثر يمكن الوصول له من خلال المراجع في الأسفل.

 

هنا نهاية المقالة، تحياتنا.

 

المصادر:

شفاء سعد

كاتب شفاء سعد

مدربة معسكر علم البيانات، مهتمة بعلم البيانات والذكاء الاصطناعي

المزيد من المقالات من شفاء سعد

اترك تعليق