ثورة البيانات

هناك تعريفات عدة لثورة البيانات. يتحدث التقرير الذي أعدته مجموعة الخبراء الاستشارية المستقلة للأمين العام للأمم المتحدة (IEAG) عن "انفجار" في حجم وإنتاج البيانات مقابل "الطلب المتزايد على البيانات من جميع شرائح المجتمع" (IEAG، 2014). تتخذ الشراكة في الإحصاء من أجل التنمية في القرن الـ 21 (PARIS21) نهجاً مكمّلة وتشير إلى "تقديم البيانات الصحيحة للأشخاص المناسبين بالشكل الصحيح في الوقت المناسب (PARIS21، 2015). يسلط هذا التعريف الضوء على حقيقة أن على ثورة البيانات أن تزيد استخدام وتأثير البيانات على النتائج.

ولتمكين هذه الزيادة في استخدام وتأثير البيانات، يجب أن تشمل استراتيجيات الأنظمة الإحصائية الوطنية حيثما كان ذلك ممكناً، مصادر جديدة للبيانات ومشاركة زائدة مع الجهات الفاعلة الجديدة، مثل القطاع الخاص والمؤسسات غير الربحية والأوساط الأكاديمية. وتكتب هذه المبادئ التوجيهية مع التركيز على هذا الجانب المهم بالذات من ثورة البيانات. فالوصول إلى واستخدام هذه المصادر الجديدة للبيانات في نظام بيانات إيكولوجي جديد من قبل مستخدمي وأصحاب ومنتجي البيانات والمشرعين، من شأنهما تمكين واضعي السياسات ومنظمات المجتمع المدني والمواطنين من "مراقبة التقدم في عملية التنمية ومساءلة الحكومات وتعزيز التنمية المستدامة (IEAG، 2014).

تحمل ثورة البيانات معانٍ مختلفة وفق موضعك في نظام البيانات الإيكولوجي. وستواجه الإحصاءات الرسمية والأنظمة الإحصائية الوطنية تحديات في التكيف مع بيئة البيانات الجديدة. فقد تتجاوز وكالات إنتاج البيانات الجديدة نماذج التنمية الإحصائية التي تم تطبيقها خلال السنوات الـ15 - 20 الماضية وتقلل من أهميتها في حال عدم تكيف البلدان. ستؤثر ثورة البيانات على كل مجالات المنظومة الاحصائية الوطني. وهذا يحدث بالفعل في بعض البلدان مثل السنغال، حيث تستفيد النهج المبتكرة لتخطيط وتكييف العمليات الإحصائية بناءً على سجلات مكالمات مفصلة من مشغلي شبكات الهواتف النقالة بالفعل من منهج التفكير الجديد في العمل بالفعل. في بلدان أخرى أيضًا، سيتوجب على المنظمات الإحصائية الوطنية التكيف من أجل الحفاظ على دورها في النظام الإيكولوجي الجديد.

تدعم المبادئ الأساسية للإحصاءات الرسمية صراحةً استخدام هذه المصادر الجديدة للبيانات (كما هو موضح لاحقاً في هذا القسم). على وجه التحديد، وبغية تكريم استحقاق المواطنين للمعلومات العامة (على أساس الجودة والتوقيت والتكلفة)، تستطيع المنظمات الإحصائية الوطنية الاعتماد على "جميع أنواع المصادر" (الأمم المتحدة، 2014). وتقوم السمة المميزة للإحصاءات الرسمية على أن تقدمها الهيئات الإحصائية الرسمية وفقاً للمعايير المهنية وتلك المنصوص عليها في المبادئ الأساسية.

“"المبدأ 5: الفعالية من حيث التكلفة: يمكن استخلاص بيانات الغايات الإحصائية من جميع أنواع المصادر [...]. فتختار الوكالات الإحصائية المصدر بالنظر إلى الجودة والتوقيت والتكاليف والعبء على المشاركين". -- الأمم المتحدة (2014)، المبادئ الأساسية للإحصاءات الرسمية.

يجب أن تستجيب كل مراحل الـNSDS لهذه المطالب الجديدة من خلال اعتبار ما يلي:

  • مواصلة تطوير نظم البيانات الإدارية لإعداد تقديرات متينة وموثوق بها للسكان بغية وضع أسس جديدة للبيانات السكانية وترسيخ مصادر البيانات الجديدة..
  • استكمال جمع البيانات التقليدية من مصادر البيانات الجديدة بالاستناد إلى مراجعات التكلفة وسهولة جمع البيانات وجودة البيانات التي تم الحصول عليها من خلال عمليات جديدة واستمرارية العمليات.
  • اتباع الإجراء المناسب لتقييم استبدال مصادر البيانات القائمة بتكلفة فعالة.
  • وضع خطة بيانات شاملة ونهج منسق لاحتساب جمع البيانات بغية تحقيق تردد أكبر في التقارير التي جمعت حتى الآن بيانات أكثر تفصيلا وذات أهمية جغرافية أكبر (راجع خرائط طريق ثورة البيانات التي وضعتها الشراكة العالمية لبيانات التنمية المستدامة).
  • إعداد الميزانية للموظفين / الموارد البشرية في مجال علم البيانات الناشئ، ولكن أيضاً في القدرة القانونية والتنظيمية.
  • وضع خطة لبناء شراكات جديدة، إما عن طريق بناء علاقات مع جهات فاعلة مختلفة في القطاع الخاص أو الاستفادة من شبكة استشارات بيانات موثوق به أو الاستفادة من الوكالات الإحصائية الإقليمية لتسهيل الوصول إلى عدة اطراف كبيرة.
  • إقامة روابط قوية مع الاستراتيجيات الإقليمية للتنمية الإحصائية (RSDS) للجمع بين الموارد الإقليمية في مراكز المعرفة والتميز في االمجالات التي لا يكون للوكالات الإحصائية الوطنية فيها القدرات والموارد اللازمة للتكيف.
     
  •  مراجعة عمليات الأعمال الإحصائية الحالية، ودراسة المراجعة في حال الضرورة

تحسين عمليات البيانات القائمة

لا شك في أن التعداد الإحصائي و بيانات المسوح ستبقى مصدر البيانات الرئيسي للرصد الدولي وصنع القرار الوطني وأنه سيلزم تطوير أنظمة جمع البيانات الإدارية أكثر. وسوف يستمر هذا الإرث وسيكون في الواقع مهماً دائماً لإعادة وضع أسس البيانات القائمة على السكان. وستثبت التقديرات السكانية المتينة والموثوق بها مصادر جديدة للبيانات وتجعلها أكثر فائدة. فتقدم لنا ثورة البيانات والتكنولوجيات التمكينية الأدوات اللازمة لتحسين آليات إدارة البيانات الحالية في العديد من المجالات، مثل:

  1. منهجية المسح. التحسينات في منهجية المسوح
  2. جمع بيانات الموبايل. إدخال البيانات عن بعد باستخدام الهواتف والألواح النقالة
  3. البيانات الإدارية: التطورات الحالية في توفر البيانات الإدارية واستخدامها (انظر بشكل خاص إلى الفصل حول البيانات المفتوحة)
  4. نشر البيانات. نشر متماسك باستخدام التقنيات الجديدة والأدوات المبتكرة التي تتكيف مع متطلبات المستخدم.

فقد يساعد تطبيق الابتكارات على تسهيل العمليات القائمة وضمان موثوقية أكبر لبيانات المسوح. كما يتوجب على المنظمات الإحصائية الوطنية أن تعمل مع القطاعات والتوفيق والتعزيز والدعوة إلى تطوير نظم إدارية قوية. في الكثير من الحالات هذه البيانات أرخص نسبياً للاستخدام، ورغم أنها ليست قائمة على السكان، يجب بذل المزيد من الجهود للتوفيق بين هذه البيانات. وبغية تحقيق ذلك، يتوجب على المنظمة الإحصائية الوطنية جمع وتركيز قوائم المنشأة الرئيسية من أجل المساعدة في دمج عملية التخطيط. كما يجب أن تسعى المنظمات الإحصائية الوطنية لتطوير منطقة مرجعية جغرافية مكانية مركزية حيث يتم رسم حدود التعداد ونقاط الخدمات الصحية (المستشفيات والمستوصفات) وخدمات المدارس (الابتدائية والثانوية) ونقاط خدمة التمديد الزراعي معاً. يمكن أن يكون ذلك بمثابة قاعدة بيانات مرجعية قوية لتخطيط ومطابقة المسح ولكن أيضاً لخدمة المجتمع المدني.


مصادر البيانات الجديدة والأنظمة الإحصائية الوطنية

تتطلب تعبئة ثورة البيانات من أجل التنمية المستدامة من الأنظمة الإحصائية الوطنية الاستفادة باطراد من كميات البيانات المتزايدة، التي يحتفظ القطاع الخاص بالكثير منها. وقد تساهم شراكات البيانات الجديدة مع القطاع الخاص الربحي وغير الربحي في ذلك عن طريق مساعدة الأنظمة الإحصائية الوطنية في توفير التكاليف وتقديم بيانات أكثر تفصيلاً وتبصر بطريقة مؤقتة أكثر، غير أنها تترافق أيضاً مع العديد من المخاطر والتحديات (راجع PARIS21، 2015). يجب إدارة ما يعرف بـ"البيانات الكبيرة" - "آثار الأنشطة البشرية المسجلة من قبل الأجهزة الرقمية" (Letouzé وآخرون، 2013) -- وإنشاء الشراكات اللازمة بين الأوساط الأكاديمية والمحللين السياسيين و الأنظمة الإحصائية الوطنية. ولكن يجب الانتباه لأن استخدام هذه البيانات لا يزال يتطلب تقنيات تحليلية متطورة نسبياً.

ولكن يمكن تعريف البيانات الجديدة، فبدلاً من محاولة تعريف ما يشكل مصدر بيانات جديدة، يأخذ هذا الفصل طريقاً أكثر واقعية ونضيق النطاق لاعتبار مصادر البيانات الخمسة التالية التي تعتبرغالبًا "جديدة" للإحصاءات الرسمية، المدرجة في ترتيب يجدي التنفيذ في إطار البلدان النامية.

  1. البيانات الاستشعارية والجغرافية المكانية. مثل: استخدام صور الأقمار الصناعية لتقدير مستويات الفقر (انظر هنا).
  2. بيانات الاتصالات. مثل: استخدام سجلات المكالمات المفصلة لتقدير الفقر والغنى (راجع هنا). 
  3. المعاملات التجارية، بما في ذلك بيانات الماسح الضوئي وبيانات بطاقات الائتمان وغيرها. مثل: استخدام بيانات الماسح الضوئي لمؤشر أسعار المستهلك (راجع هنا).
  4. زحف وتقشير الويب والبحث والتحليل. مثل: استخدام إعلانات الوظائف على الانترنت لتقدير البطالة أو بيانات LinkedIn لتقدير التغييرات في فئات الوظائف (راجع هنا).
  5. وسائل التواصل الاجتماعي. مثل: استخدام مؤشرات غوغل وتحليل المشاعر لقياسو (سائل التو)

مصادر البيانات هذه مفيدة بشكل خاص للإبلاغ عن المؤشرات خلال السنوات بين المسوح ولالتقاط التغيرات في المؤشرات سريعة التغير. وتشكل دراسات الحالة من بلدان معينة المصدر الرئيسي للمعلومات، إذ أن استخدام هذه البيانات لا يزال بدائياً للغاية. على الأنظمة الإحصائية الوطنية أن تلعب دوراً في تطوير فهم أكبر لطلبات البلدان. لكن يبدو أن على المؤسسات الإقليمية أن تشارك بفعالية في إدارة الموارد النادرة والاستفادة من وفورات الحجم.

يختلف الوصول إلى البيانات الكبيرة (التي يحتفظ بها القطاع الخاص) ومسائل الخصوصية ذات الصلة عن استخدام البيانات الإدارية (التي يشار إليها أحياناً أيضاً بالبيانات الكبيرة). وللوصول إلى البيانات الإدارية، يمكن أن تعتمد المنظمات الإحصائية الوطنية غالباً على الأطر القانونية القائمة. غير أن بيانات الشركة تشكل مجالاً جديداً وسيلزم تطوير طرق الوصول إليها مع المجالس الوطنية الخاصة بحماية الخصوصية وكل أصحاب المصلحة المعنيين. أما على المستوى الدولي، فيعمل فريق العمل العالمي للأمم المتحدة الذي يعنى بالبيانات الكبيرة للإحصاءات الرسمية، حالياً على "مبادئ الوصول إلى البيانات" التي يمكن أن تستكمل بشكل مفيد المبادئ الأساسية للإحصاءات الرسمية (الأمم المتحدة، 2014).

يقدم روبن وكلاين وجوتنغ(2016) لمحة مفصلة عن فوائد وأوجه التكامل فضلا عن المخاطر والتحديات المرتبطة باستخدام مصادر البيانات الجديدة للإحصاءات الرسمية. تلخص النقاط التالية الدروس الرئيسية للأنظمة الإحصائية الوطنية.

الفوائد وأوجه التكامل 

  • الفعالية من حيث التكلفة. يمكن للشراكات بين القطاعين العام والخاص - المعرفة كاتفاقات طوعية وتعاونية تهدف إلى رفع قدرة NSS على توفير إحصاءات جديدة أفضل - أن تساعد NSS على توفير الموارد من خلال تبادل البيانات وتفادي التكاليف الأولية المرتفعة في البنى التحتية لإدارة البيانات. أولاً، فإن التكاليف الهامشية لنقل البيانات التي تم جمعها بالفعل من قبل القطاع الخاص لصاحب المصلحة في NSS منخفضة للغاية. فمثلاً، في حين أن دراسة في الولايات المتحدة يمكن أن تكلف أكثر من 20 مليون دولار أميركي، قد تكلف في المقابل بيانات جزئية خاصة مطابقة مع بيانات مجمعة قائمة (مثل ربط البيانات على مستوى المصنع بالبيانات على مستوى الشركة) أقل من خِمس هذا المبلغ (Landfeld، 2014). ثانياً، من خلال الاستعانة بمصادر خارجية لمعالجة البيانات، يمكن لصاحب المصلحة في NSS مقيدة رأس المال الاستفادة من البرمجيات والخبرات في القطاع الخاص، وبالتالي تجنب التكاليف الأولية المرتفعة.
  • الوقتية. أمام توفر بيانات تعريف الجوال غير المعالجة بصورة شبه فوري، يمكن أن تسفر سجلات المكالمات المفصلة (CDR) من مشغلي خدمات الجوال، على سبيل المثال، عن إحصاءات شبه فورية.
  • التقسيمات. يمكن أن تعرض بيانات القطاع الخاص – بيانات سجلات المكالمات المفصلة والبيانات الجغرافية المكانية على وجه الخصوص – تقسيمات كبيرة على مستوى الوقت والمكان والموضوع والوحدة. وهذا مفيد لتقييم السياسات قصيرة المدى وإنتاج إحصاءات مفصلة على المستويين الإقليمي ودون الإقليمي، على سبيل المثال. 

كما تمكّن مصادر البيانات الجديدة الوكالات الإحصائية من قياس التوجهات التي كان يعتقد سابقاً أنها غير قابلة للقياس وأكثر استجابة للمتطلبات السياسة سريعة التغير.

  • البيانات في مجالات جديدة. للبيانات الكبيرة على وجه الخصوص القدرة على دعم توليد مؤشرات جديدة، غير المجموعة سابقاً من قبل المنظمات الإحصائية الوطنية، مثل قياس عدم المساواة ذات الصلة لا سيما في إطار الـSDG.
  • القدرة الزائدة على الاستجابة. تزود مصادر البيانات الجديدة المنظمات الإحصائية الوطنية بالقدرة على معالجة الموضوعات الجديدة بسرعة ومساعدة الأكاديميين على الرد على أسئلة ماذا لو.

 

المخاطر والتحديات

هناك أربعة تحديات مرتبطة بخصائص معينة من البيانات تميز معظم الشراكات للاحصاءات عن الشراكات في قطاعات أخرى مثل الصحة أو البنى التحتية: ضمان أمن البيانات الشخصية وخلق نموذج عمل لتبادل البيانات وحفاظ الخصوصية والتعامل مع الصعوبات التقنية المرتبطة بالبيانات الكبيرة.

  • إمكانية الوصول. يعتبر تسرب المعلومات الشخصية تهديداً كبيراً للمنظمات الربحية وغير الربحية. ومن المرجح أن تكون البيانات التي تعطي معلومات عملية عن زبائن وعملاء أو استراتيجيات المؤسسة، خاضعة لسرية البيانات. على سبيل المثال، تعتبر سجلات المكالمات المفصلة التي تستخدم من قبل الشركات لأغراض التسويق الجغرافي أكثر حساسية من التغريدات العامة التي يمكن الوصول إليها نسبياً. هناك أيضا مخاوف من أن تستخدم الحكومات البيانات لأغراض تنظيمية أو أن يضر صدور بيانات بشأن عملاء مؤسسة معينة، صورتهم العامة.
  • الحوافز والاستدامة. يمكن أن تقلل بعض العوامل من جاذبية شراكات البيانات كنموذج للأعمال. أولاً، الشك في الطلب على البيانات الكبيرة يمكن أن تثير الشكوك حول مدى السوق. ثانياً، فوائد شراكات البيانات ليست دائماً مباشرة. ثالثاً، هناك مخاوف بشأن استمرارية مصادر البيانات الجديدة. ففي الواقع، نظراً لأنه يتم جمع البيانات الخاصة في الأصل لأغراض غير إحصائية، قد يصبح الحفاظ على عملية الاستخراج عبئاً إذا فقد مجال التطبيق الأولي أهميته.
  • الخصوصية والأخلاقيات. قد يعرض بعد التبادل في شراكات البيانات الخصوصية الفردية أو الجماعية للخطر. وبالتالي، يشكل أمن المعلومات الشخصية والجماعية شرطا لتنفيذ شراكات البيانات وهدفاً بحد ذاته في آن. أولاً، تفرض تشريعات الخصوصية غالباً قيوداً تنظيمية. وفيما معظم تشريعات الخصوصية الحالية والبيانات لا تغطي على وجه التحديد البيانات الكبيرة، تكون القوانين القائمة قابلة للتأويل. وبالتالي، لا تتمتع المنظمات الإحصائية الوطنية بصلاحية واضحة لاستغلال البيانات الجزئية الحساسة مثل سجلات المكالمات المفصلة. ثانياً، تواجه الجهات المعنية من القطاعين العام والخاص مسائل متعلقة بالسمعة والأخلاقيات: يمكن لواقع أن الشركات تحتفظ ببيانات عملائها حث هؤلاء على تغيير مقدمي الخدمات. وبالتالي فإن نقل البيانات يشكل خطراً كبيراً على المنظمات.
  • التحديات التقنية والإحصائية. تتعلق هذه التحديات بطبيعة معظم البيانات الخاصة والبيانات الكبيرة على وجه الخصوص، التي غالباً ما تتطلب بنى تحتية متخصصة والتي قد تكون غير مركزية وغير معيارية وغير هيكلية وغير تمثيلية. فتفرض خصائص مجموعات البيانات الكبيرة بالتالي أيضاً فرض قيود على الخصائص الهيكلية لشراكات البيانات، ولكن أيضاً على نوع الإحصاءات التي يمكن أن تنتجها.


إدراج مصادر بيانات جديدة في NSDS

تقرير الـIAEG بشأن ثورة البيانات يدعو بصورة خاصة إلى تعديل نهج الـNSDS لحساب ثورة البيانات من قبل

[…] تحديث "الاستراتيجيات الوطنية لتطوير الإحصاءات" (NSDS) للقيام بعمل أفضل في التخطيط المنسق وطويل المدى وتحديد الاستثمارات السليمة وإشراك منتجي البيانات غير الرسمية في جهد تعاوني لتسريع إنتاج ونشر واستخدام البيانات، وتعزيز قدرات وموارد المجتمع المدني في إنتاج واستخدام ونشر البيانات. – IEAG (2014، ص. )

ستغير ثورة البيانات طريقة عمل المنظمات والأنظمة الإحصائية الوطنية وتتطلب الحصول على جهات فاعلة جديدة لتشارك في عملية الـNSDS.

  • تغيير دور المنظمات الإحصائية الوطنية: سيؤدي نظام البيانات الإيكولوجي المتغير الخاص بمقدمي ومستخدمي البيانات الجديدة إلى نماذج أعمال غير متغيرة للمنظمات الإحصائية الوطنية وغيرها من الوكالات المنتجة للبيانات. فستكون المنظمات الإحصائية الوطنية بشكل خاص أقل تكامل عمودياً وستستعين بمصادر خارجية أكثر لعملياتها الإحصائية. ويترافق ذلك مع تغيير في أدوار المنظمات الإحصائية الوطنية من ملكية على الإنتاج الإحصائي إلى ملكية التحديات الإدارية لتقييم المخاطر والتكاليف.
     
  • ملامح تغيير المهارات. يطرح تغير دور المنظمات الإحصائية الوطنية أيضاً متطلبات مختلفة على مجموعة مهارات المنظمات الإحصائية الوطنية. فيجب أن يتمتع موظفوا هذه المنظمات بقيادة سليمة للمنهجيات جديدة لتحديد وتقييم والوصول إلى مصادر البيانات الجديدة. وهذا يتطلب مهارات وتدريب على مجال علم البيانات الناشئ، بلإضافة إلى قدرة قانونية وتنظيمية..
     
  • بناء مراكز دعم إقليمية: حيث لا تتمتع الوكالات الإحصائية الوطنية بالقدرات والموارد اللازمة للتكيف، يجب أن توضح الـ RSDS نهجها المنسق في تحقيق ثورة البيانات للإحصاءات الوطنية. وقد تقوم المجالات التي يمكن الاستفادة فيها من ثورة البيانات لدفع التغيير على الصعيد الإقليمي على ما يلي: (i) توفير مراكز تميز والمعرفة، (ii) توفير آليات تحديد الوصول إلى البيانات الكبيرة: منصات قابلة للتطوير والتنمية مثل منصة اللجنة الاقتصادية لأوروبا التي تستخدم لاستكشاف مجموعات المعلومات الخاصة بمنظمة معينة من خلال التفاعل والتعاون، (iii) تركيز الموارد لإقامة شراكات أكاديمية رئيسية وتعزيز الشراكات بين القطاعين العام والخاص والمساهمة في مجموعة من الخبرات الإقليمية.
     
  • نهج مدمج لجمع الإحصاءات الرسمية: إن درجة التعميم الإحصائي للعديد من مصادر البيانات غير التقليدية غير مفهومة جيداً في الوقت الحاضر. لذلك، يجب أن تستخدم بحذر وينبغي استخدام المصادر التقليدية للتحقق من صحة ومعايرة هذه التقديرات، وبخاصة على المدى القصير. وهذا النهج المدمج والتكميلي يعني أن المنظمات الإحصائية الوطنية ستستمر في الاعتماد على الأساليب الإحصائية التقليديةmethods.
     
  • أشكال شراكات جديدة: يتطلب الوصول إلى مصادر البيانات الجديدة أشكالاً جديدة من الشراكات. في السنوات الأخيرة، شهدنا ظهور العديد من الهياكل التعاونية الناجحة، والتي غالباً ما تربط بين مختلف الجهات الفاعلة في القطاع الخاص. ويمكن لبناء هذه الشراكات أن يستغرق وقتاً طويلاً. وبالتالي، يتوجب على المنظمات الإحصائية الوطنية الاستفادة بأقصى حد من الهياكل القائمة بالفعل. ويمكن أن يتم ذلك من خلال الاستفادة من شبكة "طرف ثالث" أو من خلال استكشاف مصادر أقل حساسية للبيانات. كما هناك أيضاً دور هام يجب لعبه لتوثيق التعاون بين المنظمات الإحصائية الوطنية والوكالات الإحصائية الإقليمية. ويمكن لهذه الأخيرة غالباً أن تسهل الوصول إلى تعاونات كبيرة متعددة الأطراف وأن تقلل من تكاليف التنسيق. وهناك أيضاً مجال لتوثيق التعاون بين المنظمات الإحصائية الوطنية التابعة للبلدان النامية والمتقدمة، من خلال تبادل بيانات الأقمار الصناعية على سبيل المثال.
     
  • الإطار القانوني والبروتوكولات. يعتمد نجاح شراكات البيانات على اعتماد النهج القائمة على البروتوكولات المنتظمة والشفافة لتبادل البيانات، التي تحد من مخاطر إعادة تعريف الأفراد. وهذه البروتوكولات موجودة بالفعل للبيانات الطبية الحساسة وهي ضرورية من أجل خلق الثقة في موثوقية وسلامة الأنظمة الإحصائية الوطنية عند التعامل مع البيانات غير الطوعية.
     
  • مثال يحتذى به. تتولى الجهات الفاعلة المختلفة في الأنظمة الإحصائية الوطنية مصادر مختلفة بسرعة مختلفة. وستكون المنظمات الإحصائية الوطنية غالباً الوكالة الرائدة المسؤولة عن صياغة وتنفيذ الـNSDS القطرية. فقد تلعب المنظمات الإحصائية الوطنية دوراً هاماً في أن تكون مثالاً يحتذى به حول كيف يمكن تنفيذ سياسة البيانات الحكومية المفتوحة من خلال السعي لجعل أكبر قدر من البيانات الخاصة بها مفتوحة مع مراعاة اعتبارات الخصوصية والجودة.

الأشكال الجديدة من الشراكات

يتطلب الوصول إلى مصادر بيانات جديدة أشكالاً جديدةً من الشراكات. وفي السنوات الماضية شهدنا صعود العديد من الهيئات التعاونية الناجحة التي غالبًا ما تربط بين لاعبين مختلفين ضمن القطاع الخاص. وتتمتع هذه الشراكات ما بين القطاع الخاص والعام في ما يتعلق بالإحصاءات ثلاثة مواصفات تميزها عن الشراكات بين القطاعين العام والخاص في المجالات الأخرى:

  1. يجب أن تصاغ على شكل اتفاقات على المدى الطويل، وثمة حاجة دائمًا لبيانات طولية، وفي الوقت عينه يتواجد عدد قليل من الموردين البدائل- مثلاً سجلات الاتصالات الهاتفية يملكها فقط عدد محدود من مشغلي شبكات الهاتف الجوال.
  2. تلعب مخاطر الملكية والخصوصية دورًا أساسيًا في الشراكة بين القطاعين العام والخاص في مجال الإحصاءات، فيما في المجالات الأخرى كالبنية التحتية مثلاً، تتصل المخاطر بشكل أساسي بالقيمة مقابل المال والعائد على الاستثمار.
  3. يمكن للشراكات بين القطاعين العام والخاص أن تغطي أي مرحلة من مراحل سلسلة قيمة البيانات، بما فيها جمع البيانات ومعالجتها والتحليل والتوزيع.

Tولتكون هذه الشراكات متينة، قد يستغرق بناؤها بعض الوقت. بالتالي، على الـ NSOsأن تستفيد لأقصى درجة من الهيئات القائمة حاليًا، حيث يمكن تحقيق ذلك من خلال الاستفادة من شبكة "طرف ثالث" أو استكشاف مصادر بيانات أقل حساسيةً. كذلك يوجد دور مهم يجب لعبه في ما خصّ التعاون عن كثب أكثر بين الـ NSOsوالوكالات الإحصائية الإقليمية إذ يمكن للأخيرة إلى مؤسسات تعاونية أكبر متعددة الأطراف، والحدّ من تكاليف التنسيق. كذلك يوجد نطاق للتعاون عن قرب أكثر بين الـ NSOsمن الدول النامية أو الدول في طور النموّ، مثلاً من خلال تشارك بيانات الأقمار الصناعية.

الأطر القانونية

من العوائق التي قد تحول دون استخدام مصادر جديدة للبيانات هي الحاجة إلى تعريف الوسائل والإجراءات القانونية لتقييم هذه البيانات والحفاظ على خصوصية المستخدم. ويعتبر هؤلاء المستخدمون ضمن المجال الخاص ويشكلون مصدرًا غنيًا لبيانات العملاء التي تحرسها المصلحة الخاصة التي تملك البيانات. في العديد من الدول، القانون غير واضح في ما خصّ الإجراءات القانونية للحصول على هذه البيانات ووضعها في المجال العام. وقد تمّ نشر الكثير من الوعي في خلال مرحلة MDG لتوفير البيانات الجزئية الخاصة بالاستطلاعات على الانترنت للباحثين. وتخلل ذلك إعداد بروتوكول لتوثيق البيانات وتحديد المعايير، وأدى إلى ثورة تحديد البيانات الوصفية مثل مبادرة توثيق البيانات DDI وتبادل البيانات الإحصائية والوصفية SDMX. إلى ذلك، تم القيام بالكثير من أعمال حشد الدعم لتغيير البنيات القانونية وإعادة تعريف حقوق المستخدم بالأخذ في عين الاعتبار إجراءات إبقاء الهوية مجهولة. وقد أسهمت الاتفاقات مثل الميثاق الأفريقي للإحصاءات في توفير أرضية قانونية للدول تقود إجراءاتها القانونية الخاصة. وبالفعل، يوفر الميثاق إرشادات للمساعدة في تعديل القوانين، بالأخذ في عين الاعتبار التطورات المتعلقة بالبيانات الجديدة مثل استخدام البيانات الكبيرة.

 

الأدوات: 
في ما يلي قائمة بحالات استخدام ملموسة للأدوات الجديدة الخاصة بإدارة البيانات ومصادر البيانات الجديدة:

 جردة البيانات الكبيرة GWG هي كتيب إرشادي عن مشاريع البيانات الكبيرة المتصلة بالإحصاءات الرسمية ومؤشرات أهداف التنمية المستدامة وغيرها من الإحصاءات اللازمة لصنع القرارات حول السياسات العامة، إلى جانب إدارة ومراقبة برامج/مشاريع القطاع العام.
 

أداة تخطيط البيانات المتقدمة (ADAPT) : وهو أداة تخطيط مبتكرة تساعد المنظمات الإحصائية على التكيف مع المطالب الجديدة وممارسات البيانات المتغيرة. وتساعد ADAPT منتجي البيانات في المنظومة الإحصائية الوطنيةفي التشاور والتكلفة ورسم مؤشراتهم على النحو المحدد في خطة التنمية الوطنية. وتوجه هذه الأداة إلى البلدان المستهدفة في محاولة لتلبية مطالب وكالات العالمية التي ترصد الـSDG وتضع هذه الأهداف في سياق الأولويات الوطنية الخاصة بها.
 
منصة الابتكارات في الإحصاءات (PISTA)عبارة عن مجموعة من الابتكارات في مجال البيانات والإحصاءات الرسمية في البلدان النامية. وهو يوفر المعلومات الأساسية مثل المراجعات وتفاصيل الاتصال والتقييمات الموجزة ودراسات الحالة بشأن الابتكارات المؤسسية والتنظيمية والتكنولوجية من القطاعين العام والخاص.

تبادل الابتكارات العالمي من يو أس إيد هو عبارة عن سوق الكتروني عالمي للابتكارات والتمويل والموارد في مجال التنمية. وهو يهدف للربط بين المبتكرين والموارد ونقاط الاتصال والمعلومات التي يحتجونها لتطوير ابتكارهم.صندوق أدوات GPSDD مجموعة من الأدوات والوسائل والموارد التي يطورها اختصاصيون من كافة أرجاء العالم في مجال تطوير البيانات.
 

الممارسات الفضلى: 
وقد ظهر بالفعل عدد من مشاريع تبادل البيانات التعاونية بين القطاعين العام والخاص.وبحسب روبن وكلاين وجوتنغ (2016)، يمكن تصنيف هذه المشاريع ضمن أنواع عامة :
 
إنتاج الاحصاءات الداخلي: استخدم مشغل شبكة الجوال تليفونيكا سجلات الهاتف الخاصة به لتطوير العديد من التطبيقات داخلياً، وذلك باستخدام القدرات الداخلية. وتثبت هذه المشاريع أن منتجي البيانات الخاصين مستعدون للمساعدة في ملء الفجوات الإحصائية وقادرون أيضاً على الاستفادة من استخدام بياناتهم ومواردهم من أجل المصلحة العامة.
 
نقل مجموعات البيانات إلى المستخدمين النهائيين: يقوم نموذج نقل مجموعات البيانات إلى المستخدم النهائي على نقل مجموعات البيانات مباشرةً من مالك البيانات إلى المستخدم النهائي. ويعطي هذا النموذج المستخدم النهائي مرونةً أفضل حيال ما يجب أن يفعله بالبيانات. في هذا النموذج، يتم تحديد البيانات الأولية وأخذ عينات عنها وتجميعها لتفادي إعادة تحديدها من جديد.

الوصول عن بعد: في نموذج الوصول عن بعد، يتيح مالكو البيانات الوصول الكامل لبياناتهم إلى المستخدمين النهائيين، فيما يحافظون على التحكم الصارم بالمعلومات التي يتم استخراجها من قاعدة البيانات ومجموعات البيانات. وتوجد حاليًا العديد من الأمثلة حول الوصول عن بعد، مثل مبادرة البيانات من أجل الخير التي أطلقتها Real Impact Analytics. في هذا المشروع، تصل الشركة إلى بيانات الاتصال ضمن البيئة الآمنة للمشغليند.
 

نقل مجموعات البيانات إلى طرف ثالث موثوق به: في نموذج الطرف الثالث الموثوق به، لا يحمل لا مالك البيانات ولا مستخدم البيانات العبء الأمني لاستضافة البيانات بأنفسهم. في النموذج T3P، يعتمد الطرفان على طرف ثالث موثوق فيه لاستضافة البيانات وتأمين الخدمات اللازمة لتأمين الوصول الآمن إلى مصدر البيانات.
 
تحريك اللوغاريتم بدل البيانات: يتيح نموذج تشارك اللوغاريتم إعادة استخدام البرنامج الالكتروني من قبل العديد من أصحاب البيانات الخاصين الذين يرغبون في القيام بوظائف تحليلية مماثلة على مجموعة أو عدةّ مجموعات من البيانات. ويهدف مشروع اللوغاريتم المفتوح OPAL للاستفادة من قوة البيانات الخاصة عبر توفير منصة مفتوحة ولوغاريتم جاهزة تتيح للشركات الخاصة استخدام لوغاريتم ما قبل تعريف بشكل مستقل ضمن بيئتها المؤمنة وعدم نشر إلى النتائج المجمعة.
 
المراجع: 
IEAG (2014).عالم يهم: تعبئة ثورة البيانات من أجل التنمية المستدامة, مجموعة الخبراء الاستشارية المستقلة المعنية
 
Landfeld, S. (2014). استخدامات البيانات الكبيرة للإحصاءات الرسمية: الخصوصية والحوافز والتحديات الإحصائية. وقضايا أخرى. في: شعبة الإحصاءات في الأمم المتحدة (UNSD) والمكتب الوطني للإحصاءات في الصين، المؤتمر الدولي بشأن البيانات الكبيرة للإحصاءات الرسمية، بكين، الصين: 8-30 أكتوبر/تشرين الأول 2014
 
Letouzé وآخرون. (2013), البيانات الكبيرة لمنع النزاعات: النفط الجديد والحرائق القديمة. في: فرانشيسكو مانشيني، عدد التكنولوجيا الجديدة ومنع العنف والنزاعات، نيويورك: معهد السلام الدولي، أبريل/نيسان 2013.
 
وقد ظهر بالفعل عدد من مشاريع تبادل البيانات التعاونية بين القطاعين العام والخاص. روبن، ن.، ت. كلاين وج. جوتنغ (2016). Public-Private Partnershipsشراكات الاحصاءات بين القطاعين الخاص والعام، الدروس المكتسبة، الخطوات المستقبلية: التركيز على استخدام مصادر البيانات غير الرسمية للإحصاءات الوطنية والسياسة العامة, أوراق عمل منظمة التعاون والتنمية الاقتصادية (OECD)، رقم 27، (OECD) للنشر، باريس, Paris.http://dx.doi.org/10.1787/5jm3nqp1g8wf-en
 
الأمم المتحدة (2014), المبادئ الأساسية للإحصاءات الرسمية, قرار الجمعية العمومية للأمم المتحدة رقم 68/261، الأمم المتحدة http://unstats.un.org/unsd/dnss/gp/FP-New-E.pdf.