معايير جودة البيانات
يمكن تعريف جودة البيانات بصورة عامة بأنها «ملاءمة البيانات للغرض الذي وجدت من أجله»؛ وهناك رؤى مختلفة حول الأبعاد المتعددة لجودة البيانات، فهي يمكن أن تشمل عوامل مثل الاكتمال والتغطية والمطابقة والاتساق والدقة وعدم الازدواجية والتحديث.
ويتم تقييم جودة البيانات بناءً على وجهات نظر المستخدمين لها واحتياجاتهم وأولوياتهم، والتي تختلف باختلافهم، ويصف الخبراء جودة البيانات بقائمة من المعايير التي قد تنجح في تلبية بعضها في حين تفشل في تلبية البعض الآخر.
تعتبر الدقة هي أهم هذه المعايير، والدقة ببساطة، هي مدى الحقيقة التي تعكسها البيانات المعطاة؛ فقد تحتوي على مشكلات مخفية من منظور الدقة يصعب اكتشافها، وقد تحتوي على مشكلات واضحة لأي شخص يحاول استخدامها.
على سبيل المثال، يمكن أن تشير جداول البيانات التي لا تعطي رقمًا صحيحًا لمجموع العناصر الموجودة على طول الصفوف أو الأعمدة إلى وجود مشكلات في دقتها. كما يعد وجود البيانات والمعلومات الواصفة أحد المعايير الضرورية لجودة البيانات.
البيانات الواصفة هي تلك التي تقدم للمستخدمين معلومات سياقية حول أصول البيانات ومحدداتها والقيود القانونية على استخدامها وغير ذلك. كما أنه يمكن بواسطتها العثور على البيانات ذات الصلة بها.
وقد فرض العصر الرقمي معيارًا جديدًا لجودة البيانات، وهو وجودها في صورة رقمية، حيث يكون استخدامها محدودًا للغاية إذا لم تتوفر في تلك الصورة، بينما بمجرد وضعها في صورة رقمية، في أحد أنظمة إدارة قواعد البيانات، فإنها تساعد حينئذ في سرعة أداء العمليات، وفي الربط بأنظمة أخرى تتطلب نفس البيانات، كما يمكن أن تيسر سبل الإفصاح عنها.
يعتبر تحديث البيانات عاملاً جوهريًا في جودتها، ويجب أن يتم ذلك بصورة مستمرة بحيث تظل ملائمة لمستخدمي البيانات كونها عاكسة للواقع، وخصوصًا إذا كانت من النوع الذي يتغير بسرعة، فالتوقيت حينئذ في غاية الأهمية، فالبيانات عن المستفيدين بمعاشات تصرف في أول الشهر- على سبيل المثال- يلزم تحديثها قبل صرف المعاشات، ولا يكون هناك قيمة لتحديثها بعد أول الشهر أي بعد صرف المعاشات.
كما تعد درجة تفصيل البيانات من معايير جودتها، وذلك حسب استخداماتها، فأحيانًا تكون التفاصيل مهمة عند التعامل المباشر مع المواطنين، أو عند العرض الإحصائي للبيانات، بينما قد تكون البيانات المختصرة هي المطلوبة عند المستوى الأعلى الذي يتخذ القرار.
فالإدارة التي تتعامل مع المواطنين- على سبيل المثال- تقوم باستقبال طلبات أو أذون دفع أو طلبات تسجيل أو غير ذلك، وكلها تتطلب وجود بيانات تفصيلية عن طالب الخدمة، أما المستويات الأعلى فتحتاج فقط إلى عدد الطلبات وأصنافها والإجماليات المالية ومثل ذلك.
تلعب التعريفات والمسميات المعيارية دوراً هاماً في ضمان جودة البيانات وجعلها أكثر قابلية للتشغيل البيني، بحيث يسهل تبادلها واستخدامها مع الجهات التي تستخدم أنظمة أو تطبيقات برمجية تختلف عن تلك التي تم إنشاء البيانات فيها. كما يسهل مقارنة قواعد البيانات ودمجها إذا كانت تستخدم تعريفات معيارية موحدة.
إن جودة المعلومات تؤدي إلى اتخاذ قرارات سليمة، وكثيرة هي الأحداث الكارثية على مستوى العالم التي ما كانت لتحدث لو توفرت معلومات كافية ودقيقة في الوقت المناسب بما يساعد على اتخاذ قرارات تحول دون حدوثها.
أ. د. جبريل بن حسن العريشي
أستاذ علم المعلومات