A Revolução de Dados

Existem várias definições de revolução de dados. O relatório do Grupo Consultivo de Peritos Independentes do Secretário Geral das Nações Unidas (IEAG) fala de uma “explosão” no volume e produção de dados acompanhado por uma “crescente procura por dados de todas as partes da sociedade” (IEAG), 2014). PARIS21 leva uma abordagem complementar e refere-se a “fornecer os dados certos às pessoas certas no formato certo no momento certo” (PARIS21, 2015). Esta definição dá ênfase no facto de que a revolução de dados deve aumentar o uso e impacto dos dados nos resultados. 

Para permitir que haja este aumento no uso e impacto dos dados, as estratégias dos Sistemas Estatísticos Nacionais, sempre que possível, devem incluir novas fontes de dados e aumentar o envolvimento com novos actores, tais como o sector privado, organizações sem fins lucrativos e academia. Estas directrizes foram desenhadas com um foco neste aspecto particular e importanteda Revolução de Dados. É o acesso e uso destas novas fontes de dados num novo ecosistema de dados dos usuários de dados, proprietários, produtores e legisladores que permitirão os fazedores de políticas, organizações da sociedade civil e cidadãos “monitorar o progresso do desenvolvimento, responsabilizar os governos e promover o desenvolvimento sustentável” (IEAG), 2014.

A Revolução de Dados significa coisas diferentes dependente onde se está no ecosistema de dados. Estatísticas Oficiais e os Sistemas Estatísticos Nacionais enfrentarão desafios na adaptação ao novo ambiente de dados. Modelos para o desenvolvimento estatístico que foram implementados nos últimos 15-20 anos poderão ser ultrapassados pelas novas agências de produção de dados e considerados irrelevantes se os países não se adaptarem. A Revolução de Dados afectará todas áreas do Sistema Estatístico Nacional. Esta situação já está a acontecer em países como Senegal, em que abordagens inovadoras de planificação e adaptação às operações estatísticas baseados em registos de chamadas das redes dos operadores de telefonia móvel já puseram o novo pensamento em acção. Em outros países também, os Institutos Nacionais de Estatísticas (INEs) precisarão de adaptar-se de modo a manter relevância no novo ecosistema.

O uso dessas novas fontes de dados (segundo o definido mais adiante nesta Secção) é explicitamente encorajado nos Princípios Fundamentais das Estatísticas Oficiais. Sobretudo, para honrar o direito dos cidadãos à informação (baseado na qualidade, pontualidade, custo), os INEs podem basearem-se em “todos os tipos de fontes” (Nações Unidas, 2014). A característica determinante das estatísticas oficiais é que elas sejam disponibilizadas pelos órgãos de estatísticas oficiais de acordo com os padrões e normas profissionais estabelecidos nos princípios fundamentais.

“Princípio 5: Custo-Eficácia: Dados para todos os fins estatísticos podem ser obtidos de todos os tipos de fontes [...]. As agências estatísticas têm de escolher a fonte no tocante a qualidade, pontualidade, custos e encargos sobre os inquiridos.” – Nações Unidas (2014), Princípios Fundamentais das Estatísticas Oficiais.

Todas as fases da ENDE devem satisfazer estas novas demandas considerando o seguinte:

  • Desenvolver ainda mais os sistemas de dados administrativos para produzir estimativas populacionais fiáveis e robustas para actualizar dados baseados na população e ancorar novas fontes de dados.
  • Complementar a recolha tradicional de dados com novas fontes de dados baseadas em revisão dos custos, facilidade de recolha, qualidade de dados obtidos através de novos processos e sustentabilidade dos processos.
  • Levar a cabo o devido processo de avaliação da susbstituição de custo eficácia das fontes de dados.
  • Elaborar um plano de dados detalhado e abordagem coordenada a recolha de dados que tenha em consideração uma maior frequência na elaboração de relatórios até agora forjando, maior disagregação, maior relevância geográfica (vide Roteiros da Revolução de Dados elaborados pela Parceria Global para Dados de Desenvolvimento Sustentável).
  • Orçamentar para o pessoal/recursos humanos na área emergente da ciência de dados, mas também na capacidade legal e reguladora.
  • Elaborar um plano para criar novas parcerias, seja através de estabelecimento de ligações com diferentes actores dentro do sector privado, explorar a rede de consultorias de dados fiáveis ou alavancando agências estatísticas regionais para facilitar o acesso a grandes organizações multilaterais.
  • Criar grandes ligações com Estratégias Regionais para o Desenvolvimento de Estatísticas (ERDEs/RSDSs) de modo a agregar os recursos regionais em centros de conhecimento e excelência em que as agências estatísticas não têm capacidade e recursos para adaptarem-se.
     
  • Revisão de processos estatísticos existentes e, se for necessário, analisar a revisão de

 

Melhoria dos Processos de Dados Existentes

Não há dúvida que dados de censo e de inquéritoThere is no doubt that census and survey data continuarão a ser fontes importantes para a monitoria internacional e tomada de decisão nacional e que os sistemas para a recolha de dados administrativos precisará de serem amis desenvolvidos. Este legado prevalecerá e com certeza, sempre será relevante para a actualização dos dados baseados na população. Estimativas populacionais robustas e fiáveis irão ancorar novas fontes de dados e torna-los mais úteis. A revolução de dados e as suas tecnologias impulsionadoras dão-nos as ferramentas para melhorar os mecanismos actuais de gestão de dados em várias áreas, tais como:

  1. Metodologia de pesquisa. Melhorias na metodologia de pesquisa
  2. Recolha de dados móveis. Intodução remota de dados com recurso a telemóveis e tablets
  3. Dados administrativos. Desenvolvimentos actuais em dados administrativos disponíveis e uso (vide em particular o capítulo sobre Dados Abertos)
  4. Disseminação de Dados. Disseminação coerente usando novas tecnologias e ferramentas inovadoras que se adaptam às exigencies do usuário

6. A aplicação de inovações pode ajudar a integrar processos existentes e assegurar maior fiabilidade de dados de pesquisa. Os INEs devem trabalhar com os sectores e reconciliarem, promoverem e defenderem o desenvolvimento de sistemas administrativos fortes. Estes dados são, em muitos casos,comparativamente mais baratos para usar apesar de não serem baseados na população, deve fazer-se maior esforço para reconciliar-se estes dados. Para isto acontecer, o INE devia recolher e centralizar listas de infraestruturas chave de modo a ajudar integrar o processo de planificação. Um objectvo claro que devia estar a ser adoptado pelos INEs é elaborar uma área central de referência geoespacial em que limites dos censos, pontos de serviço em saúde (clínicas e dispensários), escolas (primárias, secundárias) e pontos dos serviços de extensão agrícola são todos demarcados juntos. Isto pode servir de uma forte base de dados de referência para a planificação e estratificação da pesquisa mas também fornecer um serviço à sociedade civil.


Novas Fontes de Dados e Sistemas Estatísticos Nacionais

Mobilização da revolução de dados para o desenvolvimento sustentável requer SENs para aproveitar o crescimento cada vez mais exponencial dos valores dos dados, maioria dos quais é detida pelo sector privado. Novas parcerias de dados com o sector privado com fins lucrativos e sem fins lucrativos pode contribuir contribuir ajudando os SENs a poupar custos e prover dados mais detalhados e que contrivuem de uma forma mais oportuna, mas os mesmos vem com muitos riscos e desafios (cf. PARIS21, 2015). O que é popularmente chamada “Big Data” –“traços das acções humanas registadas por dispositivos digitais” (Letouzé et al., 2013) – terá de ser gerido e provávelmente criar as parcerias necessárias entre a academia, analistas políticos e o SEN. Contudo, há que se ter cuidado pois o uso destes dados requer técnicas analíticas relativamente sofisticadas.

No entanto novos dados podem ser definidos, ao invés de tentar uma definição do que constitui uma nova fonte de dados, este capítulo toma rota mais pragmatic e reduz o âmbito para tomar em consideração as seguintes fontes de dados largamente consideradas como sendo “novas” às estatísticas oficiais, alistadas pela ordem de viabilidade para implementação num contexto de um país em desenvolvimento.

  1. Dados de sensor e geoespaciais. usando imagens de satellite para estimar níveis de pobreza (vide here).
  2. Dados Telecom. Exemplo: Usando registos dos detalhes de chamada para estimar a pobreza e riqueza (vide here).
  3. Transações Comerciais, incuindo dados dos scanners, dados do cartão de crédito, etc. Exemplo:usando dados do scanner para o Índice do Preço ao Consumidor (vide here).
  4. Recuperação de informação (Web crawling), destruição de informaçao (scraping), pesquisa e análise. Exemplo: Usando a oferta de emprego online para estimar o desemprego ou dados do LinkedIn para estimar mudanças nas categorias do emprego (vide here).
  5. Redes sociais. Exemplo: Usando tweets geo-codificados e análise de sentiment para medir bem-estar subjective ( veja-se aqui).

Estas fontes de dados são particularmente úteis para fazer relatórios sobre os indicadores dos anos inter-inquéritos e captar mudanças em indicadores rápidos. Os Estudos de Caso dos países serão uma fonte primária de informação pois o uso destes dados está numa fase bastante embrionária. O SEN deve jogar um papel importante na criação de uma maior percepção das aplicações do país. Contudo, as instituições regionais terão provavelmente de estar activamente envolvidas para gerir os parcos recursos e aproveitar as economias de escala.

Acesso a Big Data (nas mãos do sector privado) e os problemas relacionados com a privacidade são diferentes dos do uso de dados administrativos (que também são algumas vezes referidos como sendo Big Data). Para ter acesso aos dados administrativos, os INEs podem muitas vezes basearem-se nos quadros legais existentes. Contudo, os dados de empresas constituem uma nova área e as modalidades de acesso terão de ser elaboradas juntamente com os conselhos nacionais sobre a protecção à privacidade e com todos os actores intervenientes. No plano internacional, o Grupo de Trabalho das Nações Unidas sobre o Big Data para Estatísticas Oficiais está actualmente a trabalhar sobre os “Princípios de Acesso a Dados” que podem ser úteis na extensão dos Princípios Fundamentais das Estatísticas Oficiais (Nações Unidas, 2014).

Robin, Klein and Jütting (2016) fazem uma análise detalhada dos benefícios e complementaridades bem como os riscos e desafios associados ao uso das novas fontes de dados para estatísticas oficiais. Os pontos a seguir resumem as principais lições para os SEN.

Benefícios e Complementaridades 

  • Custo eficácia. Parcerias público-privadasdefinidos como sendo voluntaries, acordos de colaboração com voltados ao aumento da capacidade de um SEN de modo a dar estatísticas novas ou melhorespodem ajudar os SENs a poupar recursos tanto partilhando dados e assim como a evitar custos iniciais em infraestruturas para a gestão de dados. Primeiro, os custos marginais de transferências de dados já recolhidos pelo sector privado para um actor interveniente de SEN são extremamente baixos. Por exemplo, enquanto uma pesquisa nos Estados Unidos da América podia custar mais de USD 20 milhões, juntar os micro-dados privados com os dados agregados existentes (por exemplo, dados ao nível da fábrica para os dados de nível da empresa) poderia custar menos do que um quinto deste valor (Landfeld, 2014). Segundo, subcontratando o processamento dos dados, um actor interveniente do SEN com problemas de capital pode fazer uso do conhecimento e software do sector privado, e daí evitar altos custos iniciais.
     
  • Pontualidade. Dado que metadata móvel não processada está disponível quase instantâneamente, os Registos dos Detalhes de Chamada (CDR) das operadoras de telefonia móvel, por exemplo, podem produzir estatísticas em quase tempo real.
     
  • Granularidade. Dados do sector privado – CDRs e dados geo-espaciais em particular – podem apresentar grandes unidades temporais, especiais, temáticas e de granulidade. Isto é útil para a avaliação de políticas de curto prazo e a produção de estatísticas desagregadas nos planos regional e sub-regional, por exemplo. 

Novas fontes de dados também permitem às agências estatísticas medirem as tendências que foram previamente tidas como sendo imensuráveis e de serem mais responsivas aos requisitos de políticas rapidamente mutáveis.

  • Dados em novas áreas. Big Data tem, em particular, o potencial de ajudar a produzir novos indicadores, anteriormente não compilados pelos INEs, tais como as medidas das desigualidades que são especialmente relevantes no âmbito dos ODSs.
  • Aumentar a capacidade de resposta. As novas fontes de dados providenciam aos INEs a capacidade de abordar novas temáticas rapidamente e ajuda aos académicos a responder a perguntas do tipo “que tal se”.

 

Riscos & Desafios

Quatro desafios que se relacionam às propriedades particulares dos dados distinguem a maioria das estatísticas das parcerias em outros sectores tais como saúde ou infraestruturas: garantindo a segurança de dados de propriedade, criando um modelo de negócio para a partilha de dados, preservando a privacidade e ultrapassando as dificuldades associadas com o Big Data.

  • Acesso. A fuga de informação de propriedade é tida como uma ameaça séria para as organizações com ou sem fins lucrativos. Dados que fornecem informação accionável sobre clientes, fregueses ou estratégia de uma organização é mais provável que seja sujeita à critérios de confidencialidade. Por exemplo, CDRs, que são usados por empresas para fins de geo-marketização são muito mais sensíveis do que tweets públicos, que são relativamente acessíveis. Há preocupações também, segundo as quais, os governos podem usar os dados para fins de regulação ou que a publicação de dados sobre os clientes de uma organização pode ser prejudicial à sua imagem.
  • Incentivos e sustentabilidade. Certos factores podem reduzir a atracção da parceria de dados como um modelo de negócio. Primeiro, a incerteza sobre a procura por Big Data pode levantar dúvidas sobre a extensão do mercado. Segundo, os benefícios da parceria de dados não são sempre imediatos ou automáticos. Em terceiro lugar, há preocupações sobre a durabilidade das novas fontes de dados. Certamente, dado que os dados privados são originalmente recolhidos para fins não-estatísticos, manter o processo de extracção pode tornar-se um fardose o campo inicial de aplicação perde relevância.
  • Privacidade e ética .A dimensão de partilha das parcerias de dados pode pôr em risco a privacidade individual ou do grupo. Daí que a segurança da informação pessoal e do grupo é tanto uma condição para a implementação da parceria de dados assim como um objectivo por si. Primeiro, a legislação atual sobre privacidade muitas vezes traz constrangimentos regulatórios. Como maioria das legislações sobre dados não cobrem especificamente Big Data, as leis actuais estão abertas a interpretações. Posto isto, os INEs não têm mandato claro para explorar micro-dados sensíveis tais como os registos de detalhes de chamadas. Em segundo lugar, tanto os actores intervenientes público e privados enfrentam problemas de reputação e ética: o simples facto de que as empresas detêm os dados dos seus clientes pode originar a mudança de provedores. Assim sendo a transferência de dados impõe riscos significativos às organizações.
  • Desafios técnicos e estatísticos. Isto relaciona-se com a natureza da maioria dos dados privados, o Big Data em particular, que muitas vezes pode requerer infraestruturas especializadas e pode ser descentralizado, despadronizado, desestruturado e não representativo. Daí que as propriedades de grandes conjuntos de dados também impõem restrições sobre as características estruturais das parcerias de dados, mas também sobre o tipo de estatísticas que podem produzir.


Integrando as Novas Fontes de Dados dentro da ENDE - NSDS

O relatório do IEAG sobre a Revolução de Dados necessário especificamente para modificar a abordagem da ENDE – NSDS para ser responsável pela Revolução de Dados por

[…] modernizar as “Estratégias Nacionais para o Desenvolvimento das Estatísticas” (ENDE - NSDS) para melhorar a planificação coordenada e de longo prazo e na identificação de melhores investimentos e envlover os produtores de dados não-oficiais num esforço cooperativo para acelerar a produção, disseminação e uso de dados, reforçando a capacidade da sociedade civil e recursos para produzir, usar e disseminar dados. IEAG (2014, página 25)

A revolução de dados mudará a forma como os INEs e SENs operam e requer que se encontre novos actores envolvidos no processo da ENDE – NSDS.

  • A Evolução do Papel dos INEs: o ecosistema de dados em evolução dos novos provedores e usuários de dados resultará na mudança dos modelos de negócio para os INEs e outras agências de produção de dados. Particularmente, os INEs serão menos verticalmente integrados e subcontratar mais dos seus processos estatísticos. Isto vem com uma evolução nos papeis dos INEs desde a pertença da produção estatística até à pertença dos desafios de gestão para avaliar riscos .
     
  • Evolução dos perfis de competências. A evolução do papel dos INEs também impõe diferentes requisitos sobre o conjunto de competências. Os funcionários do INE precisam de ter um comando adequado das novas metodologias para identificar, avaliar e acessar as novas fontes de dados. Esta tarefa requer competências e capacitação no campo emergente da ciência de dados, mas também a capacidade legal e reguladora.
     
  • Construção de centros regionais de apoio: onde as agências estatísticas regionais não têm a capacidade e recursos para adaptarem-se, as ERDEs deviam ser responsáveis pela sua abordagem coordenada trazendo a revolução de dados para as estatísticas nacionais. Áreas em que a revolução de dados podia ser alavancada para avançar a mudança no plano regional seria: (i) criar centros de excelência e de conhecimento; (ii) criar sandboxes do Big Data: escalonáveis e evolucionárias tais como as do UNECE usadas para explorar os ricos conjuntos de informação de organização através de interacção e colaboração, (iii) Concentrando recursos para parcerias académicas chave e promovendo Parcerias Público-Privadas para contribuir para o conjunto do conhecimento regional.
     
  • Abordagem mista para a compilação de estatísticas oficiais: o grau da generalização estatísticade muitas das fontes de dados não tradicionais não é presentemente bem percebido. Por isso devem ser empregues com cautela e as fontes tradicionais devem ser usadas para validar e calibrar estas estimativas, sobretudo a breve prazo. Essa abordagem mista e complementar implica que os INEs continuarão a usar os métodos de estatísticas tradicionais.
     
  • Protocolos. O sucesso das parcerias de dados depende da adopção de abordagens baseadas em protocolos sistemáticos e transparentes, que limitam os riscos de re-identificação de pessoas. Esses protocolos já existem para dados médicos sensíveis e essenciais de modo a criar confiança na fiabilidade e integridade dos sistemas estatísticos nacionais quando se lida com dados não voluntários.
     
  • Liderança pelo exemplo. Diferentes actores no SEN usam diferentes fontes em ritmos diferentes. Os INEs são muitas vezes a agência de liderança responsável da formulação e implementação da ENDE (NSDS) do país. INEs podem desempenhar um papel importante dando um bom exemplo sobre como novas fontes de dados para estatísticas oficiais podem ser usadas tentando experimentar as novas fontes com a devida consideração das preocupações sobre privacidade e qualidade.

Novas formas de parcerias

Acesso a novas fontes de dados requer novas formas de parcerias. Nos últimos anos, temos assistido a emergência de várias estruturas cooperativas bem sucedidas, que muitas vezes ligam diferentes actores dentro do sector privado. Estas parcerias público-privadas (PPPs) para estatísticas têm três características que as distinguem em outros sectores:

  1. Devem ser formuladas como acordos de longo prazo, dado que muitas vezes existe a necessidade de dados longitudinais e, ao mesmo tempo, existem poucos fornecedores alternativos – por exemplo, logs de telefones são detidos por um número limitado de Operadores de Rede Móvel.
  2. Riscos de propriedade e privacidade jogam um papel central nas PPPs para estatísticas, enquanto que em outros sectores, por exemplo, em infraestruturas, os riscos estão principalmente ligados à relação Custo-Benefício e Retorno no Investimento.
  3. PPPs para estatísticas podem cobrir qualquer estágio da cadeia de valor dos dados, incluíndo a recolha de dados, processamento, análise, disseminação.

Para estas parcerias tornarem-se sólidas, pode levar tempo a serem formadas. Por isso os INEs devem aproveitar o máximo das estruturas existentes. Isto pode ser feito entrando na rede de “terceiros” ou explorando as fontes de dados menos sensíveis. Existe também um papel importante a ser desempenhado para uma cooperação mais estreita entre os INEs e as agências estatísticas regionais. O segundo pode facilitar acesso a cooperação multi-lateral maior e reduzir custos de coordenação. Existe também espaço para uma cooperação estreita entre INEs de países em desenvolvimento e de países desenvolvidos, por exemplo, através da partilha de dados de satélite.

Quadros Jurícos

Um obstáculo na obtenção e uso das novas fontes de dados tem haver com a necessidade de definir instrumentos legais e processos para acessar estes dados e preservar a confidencialidade do usuário. Estes usuários são o domínio privado e constituem uma fonte rica de dados do cliente que são guardados pelo interesse privado que pode ser detentor dos dados. Em muitos países, a lei não é clara sobre os processos legais para a obtenção destes dados e como coloca-los no domínio público. Muita consciencilização foi feita durante a era dos ODMs colocando-se inquérito de microdata on-line para pesquisadores. Isto implicava definir um protocolo para a documentação de dados e definição de padrões. O resultado foi a evolução das definições de metadata tais como a Iniciativa de Documentação de Dados (DDI) e os Dados Estatísticos e Metada eXchange (SDMX). Para além disso, um grande trabalho de advocacia foi empreendido para mudar estruturas legais e redefinir os direitos dos usuários que têm haver com o processo de anonimização. Instrumentos como a Carta Africana para Estatísticas criaram um quadro jurídico para os países orientarem os seus processos lesgilativos; A Carta claramente cria um impulso e directrizes que ajudam na modificação da lei atinente aos novos desenvolvimentos de dados, tais como o uso doBig Data.

Ferramentas: 
A lista que se segue é de casos concretos de uso das novas ferramentas para a gestão de dados e novas fontes:
 
O Inventário GWG de Big Data é um catálogo de projectos de Grandes Dados que são relevantes para estatísticas oficiais, indicadores dos ODS e outras estatísticas necessárias para a tomada de decisão sobre políticas públicas, bem como para a gestão e monitoria de programas/projectos do sector público.
 
A Ferramenta Avançada da Planificação de Dados (ADAPT) é uma ferramenta de planificação inovadora para os institutos de estatísticas adaptarem-se às novas demandas e práticas de dados em evolução. A ADAPT ajuda os produtores de dados no sistema estatístico nacional a consultar, calcular custos e representar os seus indicadores em gráficos nos termos do definido pelo plano de desenvolvimento nacional. A ferramenta foi concebidapara os países alvo tentando responder à procura das agências globais que monitoram os ODS traze-los ao contexto das suas prioridades nacionais.
 
O Plataforma para inovações em Estatísticas (PISTA) é uma colecção de inovações na área de dados e estatísticas oficiais em países em desenvolvimento. Dá informação básica tal como análises, detalhes de contacto, avaliações breves e estudos de caso sobre inovações institucionais, organizacionais e tecnológicas tanto do sector público quanto do privado.
 
A USAID Global Innovations Exchange é uma praça global online para inovações, financiamento e recursos no domínio do desenvolvimento. Tem em vista ligar inovadores com recursos, contactos e informação que eles precisam para desenvolverem a sua inovação. A Caixa de Ferramenta GPSDD Toolbox é um conjunto de ferramentas, métodos e recursos desenvolvidos por praticantes de todas as regiões do mundo no campo de dados de desenvolvimento.
 
Boas Práticas: 
Vários projectos de partilha de dados colaborativos entre o sector privado e público já emergiram. De acordo com Robin, Klein e Jütting (2016 ), estes podem ser classificados em tipos genéricos:
 
In-house production of statistics : A operadora da rede Móvel Telefónica usou os seus logs do telefone para desenvolver vários aplicativos internos, usando a sua capacidade interna. Estes projectos demonstram que produtores privados de dados não apenas estão com vontade de ajudar a fechar as lacunas estatísticas mas também podem criar benefícios do uso dos seus dados e recursos para o bem público.
 
Transferência do conjunto de dados para os usuários finais : O modelo de transferência do conjunto de dados aos usuários finais é constituído por datasets que são tranferidos directamente dos donos dos dados ao usuário final. Este modelo concede ao usuário final mais flexibilidade sobre o que fazer com os dados. Neste modelo, dados primários são descaracterizados, tirados em amostras e agregados de modo a evitar possível re-identificação. Entre 2012 3 2015, a Operadora de Rede Móvel Orange organizou dois desafios de inovação em que pôs os seus CDRs anonimizados a disposição para equipas de pesquisa em todo mundo, apesar dos riscos envolvidos em termos de privacidade e informações proprietárias.
 
Acesso remoto: no modelo de acesso remoto, os donos de dados dão acesso completo dos seus dados aos usuários finais ao mesmo tempo que exercem um control rigoroso sobre que informação é extraída das suas bases de dados e conjuntos de dados. Vários exemplos de acesso remoto já existem, tais como iniciativa Data for Good da Real Impact Analytics. Neste projecto, a empresa acessa dados das telecomunicações dentro de um ambiente seguro de operadores.
 
Transferência de conjuntos de dadospara um terceiro de confiança : No modelo do Terceiro Confiável, tanto o dono dos dados assim como o usuário de dados não suporta o encargo da segurança de acolher os dados. No modelo T3P, ambas as partes dependem do terceiro confiável para acolher os dados e dar os serviços necessaries para permitir acesso seguro à fonte de dados.Desde 2009, estatísticas de viagem para determinar a balança da conta dos pagamentos de viagens são calculadas com base em detalhes de registo graças a uma parceria público-privada entre a empresa analítica Positium e o Banco Central da Estónia, Eesti Pank.
 
Transferindo algorítmos e não os dados: o modelo de algorítmos partilhados permite a reutilização do software por muitos proprietários privados de dados que pretendam levar a cabo funções analíticas semelhantes em um ou vários conjuntos de dados. O projecto The The Open Algorithms (OPAL) tem em vista impulsionar o poder de dados privados providenciando uma plataforma aberta e algorítmos pré-elaborados que permitem que empresas privadas possam gerir algorítmos pré-definidos de forma autónoma em seus próprios ambientes seguros e apenas tira resultados agregados.
 
Referências: 
IEAG (2014).Um Mundo que Conta: Mobilizando a Revolução de Dados para o desenvolvimento sustentável, Grupo Consultivo de Peritos Independentes sobre uma Revolução de Dados por um Desenvolvimento Sustentável
 
Landfeld, S. (2014). Usos do Big Data para Estatísticas Oficiais: Privacidade, Incentivos, Desafios Estatísticos e Outros Assuntos. In: Divisão de Estatísticas das Nações Unidas (UNSD) e Bureau de Estatísticas da China, Conferência Internacional sobre o Big Data para Estatísticas Oficiais, Beijing, China: 8-30 Outubro de 2014
 
Letouzé et al. (2013), Big Data para a Prevenção de Conflitos: New Oil and Old Fires. In: Francesco Mancini, ed., Nova Tecnologia e a Prevenção de Violência e Conflito, New York: Instituto Internacional da Paz, Abril 2013.
 
PARIS21 (2015). Um Roteiro para uma Revolução Liderada pelo País, Secretariado do PARIS21.
 
Robin, N., T. Klein and J. Jutting (2016). Parceria Público-Privada para Estatísticas. Lições Aprendidas, Passos Futuros: Um foco no uso de fonte de dados não-oficiais para estatísticas nacionais e política pública, OECD Documentos sobre Trabalho de Cooperação de Desenvolvimento, No. 27, OECD Publishing, Paris. http://dx.doi.org/10.1787/5jm3nqp1g8wf-en
 
United Nations (2014), Fundamental Principles of Official Statistics, Resolução da Assembleia Geral das Nações Unidas 68/261, Nações Unidas, http://unstats.un.org/unsd/dnss/gp/FP-New-E.pdf.