La révolution des données et les nouvelles sources de données

Les ODD ont souligné la nécessité d'une révolution des données   pour faire face à la diversité, à la complexité et à la qualité accrues des données nécessaires pour obtenir des résultats. Le concept de révolution des données s'accompagne d'un accent renouvelé et d'un plaidoyer plus fort en faveur de la transparence et de la responsabilité dans la production, l'accès et l'utilisation des données. 

La révolution des données a considérablement suscité l'intérêt pour les nouvelles sources de données, principalement les mégadonnées  , de la reconnaissance de leur existence à leur reconnaissance en tant qu'univers parallèle et plus large de données pouvant soutenir les ODD. L'utilisation de nouvelles sources de données est explicitement encouragée dans les PFSO (Principes fondamentaux de la statistique officielle) « Principe 5 : Rentabilité : Les données à des fins statistiques peuvent provenir de tous types de sources [...]. Les agences statistiques doivent choisir la source en tenant compte de la qualité, de la rapidité, des coûts et de la charge pesant sur les répondants. (PFSO, ONU, 2014)

Les mégadonnées existent depuis aussi longtemps que les systèmes statistiques nationaux (SSN) servent de principale source de statistiques pour la gouvernance et le développement Maintenant, les mégadonnées et d'autres nouvelles sources de données telles queles données générées par les citoyens   sont devenues extrêmement pertinentes et importantes à mesure qu'elles continuent de se développer et offrent des possibilités infinies pour créer et améliorer des statistiques au sein et au-delà du SSN et grâce à l'évolution écosystèmes de données    .

Les écosystèmes de données représentent un véritable défi pour les SSN, mais présentent également d'énormes possibilités d'amélioration des méthodes et d'adaptation de l'innovation et de la technologie pour améliorer la qualité des données actuelles et produire de nouvelles statistiques. Le manque de ressources gouvernementales restant un goulot d'étranglement important dans de nombreux pays, les SSN doivent non seulement améliorer la qualité des données existantes, mais aussi commencer à développer et à produire des statistiques intelligentes   basées sur des données conventionnelles existantes améliorées et de nouvelles statistiques créées par les écosystèmes de données. 

Le développement de statistiques intelligentes nécessitera plus qu'une simple amélioration des systèmes et des capacités. La production de statistiques intelligentes nécessitera la transformation du SSN en un SNDS moderne   guidé et soutenu par une SNDS moderne  . Des réformes appropriées seront nécessaires sur plusieurs fronts tels que la base juridique, les politiques de statistiques officielles et de données ouvertes, l'assurance qualité des données, la protection des données, les processus de production des statistiques, les compétences et aptitudes, l'innovation et la technologie, et le financement. Plus que jamais, les ONS devront renforcer les partenariats public-privé avec de nouvelles sources de données, des organisations privées et de la société civile traditionnelles aux institutions de science et technologie des données et aux citoyens privés.

Actions concrètes

  • Inclure les concepts et principes de la révolution des données dans la phase d'évaluation de la SNDS
    • Identifier les parties prenantes de l'écosystème de données et évaluer leurs besoins en données. Pas 1.1 | Pas 3.3
      • Analyser les besoins en statistiques intelligentes, y compris les mégadonnées, les données générées par les citoyens et d'autres données provenant de sources non traditionnelles.
    • Évaluer la production statistique actuelle par rapport aux statistiques intelligentes et à l'écosystème de données. Pas 3.2
      • Comparer les produits statistiques actuelles et les statistiques intelligentes souhaitées.
      • ⁻ Évaluer la viabilité de nouvelles sources de données potentielles, y compris les mégadonnées, les données générées par les citoyens et d'autres données provenant de sources non traditionnelles.
    • Évaluer le SSN en termes de 
      • readiness (institutional resources and capacities/competencies and skills) and 
      • ouverture (cadre juridique, politiques, normes, systèmes et technologies) pour aborder l'écosystème des données. Pas 3.1
        • ⁻ donner la priorité à l’ONS et aux producteurs de données dans les secteurs prioritaires tels que l'éducation, la santé, l'agriculture, la macroéconomie et les finances, le travail et l'emploi, les prix, les revenus et la pauvreté, l'environnement, entre autres, dans l'évaluation organisationnelle.
  • Considérer les caractéristiques d'un SSN moderne dans l'exercice de visualisation, en tenant compte de l'état de préparation et de l'ouverture du SSN. Pas 4.1
  • Identifier les objectifs stratégiques appropriés et les produits clés pour aborder les statistiques intelligentes, y compris l'utilisation des mégadonnées, des données générées par les citoyens et d'autres données provenant de sources non traditionnelles, dans des secteurs ou des domaines clés ou prioritaires. Pas 4.2
  • Identifier des actions concrètes pour aborder les statistiques intelligentes dans les secteurs ou domaines clés ou prioritaires, et les coûts correspondants ainsi que les principaux facteurs de risque et les mesures d'atténuation aux niveaux national, sectoriel/des domaines et de l'agence. Pas 5.1 | Pas 5.2 | Pas 5.3  
    • Considérations clés
      • Rapide et facile
      • Large éventail de partenariats (par exemple, travailler avec des scientifiques des données et des développeurs d'applications logicielles sur l'utilisation de différents ensembles de données, l'analyse de données, la cartographie et l'infographie, etc.)
      • Réformes bien gérées.
  • Établir des mécanismes de partenariat institutionnel (politiques, normes et dispositions) entre le SSN et les parties prenantes de l'écosystème des données, initialement dans les secteurs prioritaires et/ou les domaines d’activité. Pas 6.3
    • Coordonner avec l'autorité de l'État compétente la politique et les plans globaux de données ouvertes (ou de gouvernement ouvert) qui peuvent avoir un impact sur les sources de données existantes et nouvelles.
    • Envisager des partenariats avec des sources de mégadonnées (par exemple, des entreprises de science des données, des entreprises de télécommunications et d'autres fournisseurs de services) pour le partage de données et de technologies. 
    • Étudier et considérer les systèmes existants des sociétés civiles, y compris les données générées par les citoyens.
  • Assurer le suivi et évaluer les jalons et les résultats des initiatives de développement et d'intégration de nouvelles sources de données et de nouvelles parties prenantes. Pas 6.4 | Pas 7.2 | Pas 7.3
    • Identifier les apprentissages et les domaines à améliorer.