وجهة النظر الأكاديمية في التحديات التي تواجه عملية تحليل البيانات الضخمة

 

 

تشكل بيانات وسائل التواصل الاجتماعي أحد أهم أشكال الإيرادات لشركات التواصل الاجتماعي، وذلك من خلال الاستفادة من بيع هذه البيانات، وهو ما يعتبر عملية مربحة لهذه الشركات، لذلك فإن الشركات المالكة لوسائل التواصل الاجتماعي تقيد الوصول إلى جميع البيانات الخاصة بها، فشركات التواصل الاجتماعي في كثير من الأحيان تعتبر الخوارزميات الخاصة بها سر عمل تنافسي في الأسواق، وبالتالي فإن هذه الشركات لن تتيح للوصول للبيانات الخام «Pure Data» بشكل مجاني، وهذه ما يجعل تكلفة هذه البيانات باهظة الثمن.

فالبيانات الصادرة من خلال واجهة التطبيق البرمجية «API» تشكل ملف ذو كمية بيانات صغيرة جداً من إجمالي البيانات الكاملة لدى هذه الشركات، فعلى سبيل المثال يصدر موقع تويتر ١٪ فقط من إجمالي البيانات من خلال «API»، ولا يمكن للباحثين الاعتماد على هذا النوع المتاح من البيانات بشكل مجاني من تويتر، وذلك لأن هذه البيانات لا تصنف، على أنها بيانات خام خلال الخوارزمية الآلية المستخدمة، مما يلزم الدفع للوصول إلى محتوى البيانات الخام المتبقي.

وعليه يمكن القول إن شركات شبكات الوسائل التواصل الاجتماعي هي من تمتلك البيانات الضخمة وتحميها، والمنظمات التي يمكنها استخدام بيانات وسائل التواصل الاجتماعي في مجملها هي الشركات العملاقة والمؤسسات الحكومية التي يمكنها دفع الرسوم المرتفعة للوصول إلى البيانات الخام الضخمة، في حين يجب على محللي البيانات من المؤسسات الأكاديمية والمؤسسات ذات الحجم المتوسط القيام بجمع المواد التي يريدونها من البيانات المنشورة على منصات شبكات التواصل الاجتماعي، أو توظيف شركات التنقيب عن البيانات لتوفير المواد لهم.

إن التحدي الآخر الذي يواجه تحليل وسائل التواصل الاجتماعي هو سلامة البيانات الخام، فعندما يتم جمع البيانات من قبل طرف ثالث «وسيط» فغالباً ما ترتبط سلامة البيانات بالقدرات التقنية المتاحة لذلك الوسيط، على سبيل المثال، تتكون شبكات وسائل التواصل الاجتماعي من العديد من المنصات وبالتالي تتنوع مصادر البيانات، وعليه يصعب الترجيح بين البيانات الخام أ وتلك التي تم جمعها من «API»، وإلى جانب تحدي تكامل وسلامة البيانات الخام ؛ فإن البعد الآخر الجدير بالملاحظة هو شفافية البيانات في كونها ممثلة للعينة بشكل جيد، حيث أن هذه أحد معايير جودة البحث العلمي.

في الاتجاه المعاصر الحالي تقوم منصات وسائل التواصل الاجتماعي باستخدام خوارزميات ذكية لتحجيم «Limted» البيانات وإصدارها، ولهذا السبب فإن موردي البيانات «جامعي البيانات الخارجيين» غير قادرين على معرفة المحتوى الحسابي لمنصات شبكات التواصل الاجتماعي من خلال الوصول إلى البيانات الخاصة بهم، أو من خلال شراء البيانات من منصات التواصل الاجتماعي.

للأسباب المذكورة أعلاه فإن المتطلبات التحليلية لجمع بيانات وسائل التواصل العربية مرتفعة التكلفة، لذلك يوجد ندرة في الدراسات والأبحاث القائمة على البيانات التجريبية، وغالباً ما يتم تقديم أبحاث نوعية في مجال تحليل بيانات شبكات التواصل الاجتماعي من قبل العديد من المساهمين مما يعكس الحالة الوليدة في هذا المجال، وهذا يبرز ضرورة العمل الجماعي «البحوث البينية» نظراً لطبيعة هذا المجال متعددة التخصصات.

 

د. الجوهرة المطيري 

أستاذ مساعد في قسم الإعلام  

خبير في تحليل بيانات شبكات التواصل الاجتماعي

0
قم بتقييم هذا المحتوى

إضافة تعليق جديد

التحقق البصري
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA