N°4 / Méthodes et stratégies de gestion de l'information par les organisations : des big data aux thick data

Les Nations Unies face au big data : comment utiliser les nouvelles sources de données pour optimiser les programmes de développement des organisations internationales

Christelle Cazabat

Résumé

Cet article vise à analyser le potentiel des big data pour l’élaboration, la mise en œuvre et le suivi de programmes de développement par les organisations internationales comme les Nations Unies. Son objectif est d’estimer, à partir d’études de cas, le potentiel des nouvelles sources de données à contribuer aux Objectifs de Développement Durable. A ce jour, seules quelques initiatives pilotes ont été mises en œuvre. La plupart d’entre elles ont été réalisées en partenariat avec le secteur privé, dans le cadre de stratégies de responsabilité sociale des entreprises. Elles semblent prometteuses, avec des impacts plus importants que des initiatives similaires utilisant des méthodes traditionnelles et des coûts moins élevés. Mais des questions sur la sécurité des données, l’éthique, la règlementation, les problèmes techniques, la représentativité des données et leurs avantages réels pour le développement doivent être étudiées avant d’étendre davantage ces nouvelles méthodes.

Mots-clés

Plan de l'article

Télécharger l'article

INTRODUCTION

Le secteur privé exploite depuis plus d’une décennie les données massives ou big data pour mieux connaitre ses marchés et maximiser ses profits. Dans le secteur du développement, leur utilisation en est encore au stade expérimental, mais soulève un enthousiasme grandissant et l’espoir d’augmenter l’efficacité des programmes d’aide international à faible coût.

L’enjeu est de taille : en septembre 2015, l’ensemble des gouvernements du monde se sont engagés à atteindre d’ici 2030 les Objectifs de Développement Durable, un programme d’une ambition sans précédent qui devra, entre autres, éliminer l’extrême pauvreté et la faim, assurer la santé, le bien-être et une éducation de qualité à tous, l’égalité des sexes, la réduction des inégalités et une exploitation durable des ressources naturelles (Nations Unies, 2015).

Atteindre ces objectifs nécessitera des investissements estimés à plusieurs milliers de milliards de dollars américains, alors que l’aide publique au développement se chiffre aujourd’hui en milliards de dollars (Banque Mondiale, 2015). Il est donc indispensable d’innover pour réduire le coût des initiatives de développement et accélérer leur impact sur les populations.

contexte

Dans le seul domaine de l’information, les besoins se sont démultipliés. De 2000 à 2015, l’initiative mondiale précédente des Objectifs du Millénaire pour le Développement concentrait la plupart des efforts gouvernementaux sur 8 objectifs identifiés par les Nations Unies (Nations Unies, 2001). Les Objectifs de Développement Durable sont désormais au nombre de 17, dont beaucoup d’objectifs « absolus ». Ainsi pour le premier objectif de réduction de la pauvreté, alors que les Objectifs du Millénaire pour le Développement appelaient à « réduire de moitié, entre 1990 et 2015, la proportion de la population dont le revenu est inférieur à 1,25 dollar par jour », les Objectifs de Développement Durable ambitionnent d’ « éliminer complètement l’extrême pauvreté dans le monde entier ».

D’un point de vue statistique, cela signifie que les moyennes nationales ne suffiront plus à suivre les résultats obtenus : des données ventilées par âge, sexe, catégorie socio-économique et lieu de résidence seront nécessaires pour s’assurer que tous les groupes de population, en particulier les plus vulnérables, ont atteint l’objectif fixé. Les statistiques doivent être disponibles à l’échelle locale et non plus seulement à l’échelle nationale, doivent couvrir davantage de domaines et être mises à jour plus régulièrement.

Ce besoin d’informations dans le domaine du développement est inédit, et ne peut pas être rempli avec les sources traditionnelles de données. A ce jour, seulement un tiers des indicateurs prévus pour suivre les progrès sur les Objectifs de Développement Durable sont disponibles dans au moins la moitié des pays (IAEG-SDGs, 2017). Figure 1 compare les deux programmes mondiaux de développement pour illustrer la croissance exponentielle des nombres d’objectifs, de cibles ou sous-objectifs et d’indicateurs entre les Objectifs du Millénaire pour le Développement et les Objectifs de Développement Durable. Pour répondre à ces besoins, on estime le coût de la mise à jour des systèmes statistiques des 77 pays à plus faibles revenus à un total d’un milliard de dollars américains par an (SDSN, 2015).

2018 notes cazabat 

Figure 1 : Comparaison du nombre d’objectifs, de cibles et d’indicateurs compris dans les deux programmes mondiaux de développement, les Objectifs du Millénaire pour le Développement (2000-2015) et les Objectifs de Développement Durable (2015-2030)

 

problème et causes

Jusqu’à présent, les informations utilisées dans le domaine du développement viennent principalement des sources suivantes : les recensements de population réalisés environ tous les dix ans, les enquêtes auprès des ménages, les sondages auprès d’échantillons de la population, les registres administratifs et quelques enquêtes qualitatives ciblées. La collecte de ces données nécessite la mise en place d’équipes spécialisées qui peuvent s’avérer très couteuses pour un gouvernement, limitant notamment la fréquence et l’étendue de ces relevés dans les pays à faibles revenus. La collecte, l’analyse et la publication des données demandent du temps, ce qui limite également les mises à jour.

De plus, ces enquêtes excluent certains groupes de population et ne fournissent donc pas une image complète ou précise de la situation. Les recensements et les enquêtes auprès des ménages sont organisés à partir des registres administratifs d’adresses déclarées. Les sans-abri ou les personnes vivant dans des refuges, par exemple, qui n’ont pas d’adresse propre, ne sont donc pas comptabilisés dans ces statistiques (Carr-Hill, 2013). Les femmes et les enfants sont souvent ignorés par les enquêtes qui interrogent uniquement le « chef de famille », le plus souvent un homme adulte. Les nomades, les personnes vivant dans des bidons-villes, les domestiques ou les esclaves vivant chez leurs employeurs ou chez leurs maitres, les réfugiés, les personnes déplacées internes ou les migrants saisonniers sont tous sous-représentés dans les statistiques officielles. Ce sont pourtant souvent ces groupes de population qui sont les plus vulnérables et ont le plus besoin de l’aide au développement.

Les données disponibles dans le domaine du développement sont donc actuellement incomplètes et souvent obsolètes, limitant la capacité des gouvernements, organisations internationales et organisations de la société civile qui les utilisent pour adapter leurs interventions au plus près des besoins des populations bénéficiaires.

objectifs

Dès 2013, alors que les Objectifs de Développement Durable étaient encore en pleine élaboration, les Nations Unies ont appelé à une « révolution des données » (United Nations, 2013). Cette révolution consistait à obtenir davantage d’informations, de meilleure qualité, et à les diffuser plus largement. L’utilisation des technologies de l’information et de la communication pour obtenir ces données était d’ores et déjà recommandée.

En 2014, le Secrétaire General des Nations Unies a commandité un rapport contenant des recommandations pour que cette « révolution des données » soit effective. Le rapport reconnaissait le potentiel des big data pour suivre les progrès en matière de développement et recommandait que les données soient accessibles à tous gratuitement (United Nations, 2014).

Les big data peuvent sensiblement améliorer la quantité, la précision et la mise à jour des informations utilisées par les acteurs du développement pour élaborer, mettre en œuvre et évaluer leurs projets. Le résultat attendu est une meilleure compréhension des problèmes à résoudre et des moyens à disposition pour des interventions mieux ciblées, moins couteuses, plus rapides et plus étendues (voir Figure 2). Les informations plus rapides et plus précises obtenues sur les résultats du projet permettent ensuite de le réajuster, si besoin, pour en maximiser l’impact.

 

2018 notes cabazat2

Figure 2. Le potentiel des big data pour améliorer l’efficacité des projets de développement

 

Tout projet de développement, qu’il s’agisse d’un projet d’électrification d’un village ou d’une campagne d’information sur la prévention du VIH/Sida, peut se décomposer de manière schématique en ces trois phases d’élaboration, de mise en œuvre et de suivi-évaluation. Les big data peuvent apporter une forte valeur ajoutée à chacune de ces phases. Au-delà de leur apport dans le domaine des statistiques, en augmentant le retour sur investissement des projets de développement, les big data doivent également permettre de dégager des ressources pour financer d’autres projets de développement et améliorer les conditions de vie de davantage de bénéficiaires.

mise en œuvre

Plusieurs organisations internationales, dont certaines agences des Nations Unies, la Banque Mondiale ou l’Union Européenne, misent donc depuis quelques années sur les big data pour répondre aux besoins du programme des Objectifs de Développement Durable. Certaines initiatives pilotes ont été menées sur le suivi des indicateurs de développement. Trois projets portant sur les Objectifs de Développement Durable 1 (« Éliminer la pauvreté sous toutes ses formes et partout dans le monde »), 3 (« Permettre à tous de vivre en bonne santé et promouvoir le bien-être de tous à tout âge ») et 6 (« Garantir l’accès de tous à l’eau et à l’assainissement et assurer une gestion durable des ressources en eau ») servent ici d’exemples de mise en œuvre.

Estimer le taux de pauvreté grâce aux images satellites de nuit

En 2015, le bureau du Programme des Nations Unies pour le Developpement au Soudan visait à exploiter les images satellites de nuit pour combler les lacunes des statistiques officielles soudanaises en matière de suivi du taux de pauvreté de la population (PNUD, 2016). Le pays, affecté par des années de conflit et des faibles revenus, ne pouvait en effet mener des recensements de populations aussi régulièrement que l’exigerait un suivi efficace de l’Objectif de Developpement Durable 1 de lutte contre la pauvreté.

Les images satellites de nuit permettent d’analyser la luminosité résultant des éclairages électriques, supposés plus nombreux dans les zones plus aisées et moins nombreux dans les zones plus pauvres. Théoriquement, le degré de luminosité devrait donc être corrélé au degré de pauvreté d’une région. Les images prises régulièrement par les satellites pourraient ainsi permettre d’estimer les taux de pauvreté en temps réel et à l’échelle locale, a très faible coût. La Banque Mondiale a mené à la même période des projets similaires au Kenya et au Rwanda (Sanghi, Bundervoet et Maiyo, 2015).

Les rapports de la Banque Mondiale sur l’utilisation d’images satellites de nuit pour estimer le degré de pauvreté des pays d’Afrique se veulent encourageant, concluant sur une forte corrélation entre la luminosité nocturne et le Produit Intérieur Brut à l’échelle nationale. Le bureau du PNUD au Soudan a cependant mis un terme à son initiative. En raison de zones non électrifiées, les lumières de nuit ne pouvaient pas servir d’indicateur fiable du taux de pauvreté à travers l’ensemble du pays. A l’heure actuelle, le bureau du PNUD au Soudan se tourne vers les taux d’utilisation des téléphones portables pour estimer la pauvreté : avec près de 70 téléphones portables pour 100 habitants (UIT, 2017), le taux de couverture pourrait être suffisant pour produire des données fiables à l’échelle locale.

Mieux cibler et étendre les campagnes de communications grâce aux réseaux sociaux

Ce deuxième projet a été mis en œuvre par le bureau du Fonds des Nations Unies pour l’Enfance (UNICEF) au Brésil. En 2015, au plus fort de l’épidémie du virus Zika en Amérique latine, l’UNICEF au Brésil a lancé une campagne de communication pour informer la population des moyens d’éviter la maladie. La première phase de cette campagne, traditionnelle, s’est faite par radio, par la presse et par du porte-à-porte. L’UNICEF a ainsi touché 60 000 personnes en quelques semaines. Dans un deuxième temps, l’UNICEF a collaboré avec Facebook pour lancer une campagne de communication sur le réseau social. En seulement quelques heures, plus de 4 millions de personnes ont été informées des moyens d’éviter la maladie (Nations Unies, 2017).

Par ailleurs, l’analyse des messages anonymisés d’utilisateurs de Facebook au Brésil comportant le mot clef « Zika » a permis de réaliser que la plupart des messages étaient publiés par des hommes. L’UNICEF a donc ajusté sa campagne de communication initialement ciblée sur les femmes pour toucher davantage d’hommes, notamment par le biais d’une photo d’un jeune père et de sa fille atteint par la maladie (UNICEF, 2016). Le réseau social a par la suite proposé un sondage pour vérifier l’efficacité de la campagne de communication : 82% des utilisateurs ayant vu les messages de prévention ont indiqué avoir pris des mesures contre Zika.

L’épidémie du virus Zika est l’un des premiers cas où les réseaux sociaux ont pu jouer un rôle significatif dans l’information de la population et la prévention de la transmission. La quasi-totalité de la population brésilienne utilise Facebook régulièrement, ce qui en fait un mode de communication pratiquement universel, gratuit et instantané. Cet exemple montre comment les technologies de l’information et de la communication peuvent non seulement accroitre de manière exponentielle la portée des projets de communication et en réduire le coût, mais aussi fournir des informations en temps réel sur leur efficacité afin de permettre des réajustements tout au long de la mise en œuvre.

Suivre l’avancée des objectifs environnementaux grâce aux données géospatiales

Ce dernier exemple de projet porte sur l’objectif 6 d’accès universel à l’eau et à l’assainissement et de gestion durable des ressources en eau. Les Objectifs du Développement Durable, en comparaison avec leurs prédécesseurs les Objectifs du Millénaire pour le Développement, accordent une place beaucoup plus centrale à l’environnement. Quatre objectifs sont désormais entièrement consacrés à l’environnement, contre seulement un dans le programme précédent, et plusieurs autres comptent des cibles, ou sous-objectifs, concernant la gestion durable des ressources naturelles.

Le suivi des objectifs environnementaux est problématique car les informations pertinentes sont rarement collectées par les gouvernements, dont les efforts statistiques se concentrent davantage sur les indicateurs socio-économiques. L’utilisation des images satellites et autres sources de données géospatiales est donc particulièrement indiqué dans ce domaine.

Le Programme des Nations Unies pour l’Environnement publie sur le site Internet Environment Live des cartes détaillées représentant différents indicateurs relatifs à la protection de l’environnement. Des données météorologiques et géographiques sont combinées d’une manière accessible à tous, comme le montre la figure 3 présentant les sources d’eau souterraines en Afrique. Ces cartes peuvent permettre aux décideurs nationaux de prendre des décisions appropriées pour gérer durablement les ressources en eau de leur pays et limiter l’impact des sècheresses. Leur publication en libre accès permet quant à elle aux citoyens de s’engager dans le suivi et la mise en œuvre des objectifs de développement, en faisant pression sur les gouvernements ou en lançant des initiatives citoyennes de développement, comme des projets communautaires de gestion de l’eau.

 2018 notes cabazat3

Figure 3 : Sources d’eau souterraines en Afrique publiées en libre accès
sur le site Internet Environment Live du Programme des Nations Unies pour l’Environnement

 

Il existe ainsi de nombreux projets pilotes, pour la plupart à l’échelle nationale ou locale, utilisant les big data dans le domaine du développement. Le répertoire Big Data Project Inventory, géré par la Commission Statistique des Nations Unies, en recense plus de 200 à ce jour (Commission Statistique des Nations Unies, 2017). Les big data sont pourtant encore loin d’être intégrés systématiquement dans les programmes de développement, du fait de plusieurs obstacles qui s’opposent encore à une utilisation plus générale.

résultats

Les agences statistiques gouvernementales ou bureaux nationaux de la statistique du monde entier ont adopté en 1994, lors de la Commission Statistique annuelle des Nations Unies, les principes fondamentaux des statistiques officielles, mis à jour en 2014 (Commission Statistique des Nations Unies, 2014). Cet ensemble de bonnes pratiques doit être respecté par les agences nationales produisant la plupart des indicateurs de suivi des objectifs de développement. En accord avec ces principes, les statistiques officielles acceptent l’utilisation de données de toute origine, choisies pour leur qualité, mises à jour, coût et charge pour les répondants.

D’après ces critères, les big data sont toutes indiquées : elles fournissent des informations potentiellement en temps réel et à une échelle de précision inédite, pour un très faible coût et sans aucune gêne pour les populations, qui ne sont la plupart du temps pas conscientes que ces informations sont collectées automatiquement par satellite ou à travers leur utilisation des téléphones portables et des réseaux sociaux. Le recours des gouvernements aux big data est donc en accord avec les principes fondamentaux des statistiques officielles.

D’autres obstacles ont cependant fait jour lors des projets pilotes dont quelques exemples ont été présentés ci-dessus. D’un point de vue pratique tout d’abord, l’exploitation des big data nécessite du matériel informatique et des ressources humaines spécialisés, souvent chers et rarement disponibles dans les pays en développement. Les ensembles de données tirés par exemple des registres d’appels anonymisés doivent être analysés par des logiciels avancés et généralement élaborés sur mesure pour un projet spécifique, sans possibilité de les réutiliser pour un autre projet similaire. La standardisation et le passage à plus grande échelle des tentatives d’exploitation des big data pose donc encore un problème.

Par ailleurs, dans le domaine du développement, il est important de garder à l’esprit le fait que les big data ne représentent pas l’ensemble de la population, et notamment les plus vulnérables. Tout comme les recensements et les enquêtes gouvernementales excluent certains groupes, les big data ont leurs propres limites en termes de représentativité. Les inégalités d’accès aux technologies de l’information et de la communication, comme Internet ou les téléphones portables, en sont la principale raison. Les personnes vivant dans les pays en développement, les pauvres, les femmes, les personnes âgées ou vivant en milieu rural sont moins connectées, et donc moins bien représentées dans les données produites par ces technologies. Figure 4 illustre la différence des taux d’accès entre les pays développés et les pays en développement.

 2018 notes cabazat4

Figure 4 : Taux d’accès à Internet et à la téléphonie mobile dans les pays développés et en développement
(données provenant de l’Union Internationale des Télécommunications pour 2017)

 

Enfin, le fait que les big data sont principalement produites par des entreprises privées dans un but lucratif peut limiter leur accès pour les acteurs du développement et pour le grand public. Pour des raisons de confidentialité, de protection de la vie privée ou de protection des retours sur investissements, leur publication et leur utilisation doivent être contrôlées. L’accès libre aux données sur le développement est pourtant une des recommandations des Nations Unies, pour encourager la participation des citoyens et le suivi public des progrès sur les objectifs de développement.

conclusion

Les quelques centaines de projets pilotes qui ont été mis en œuvre depuis 2015 ont laissé entrevoir un potentiel indéniable des big data pour améliorer les informations disponibles sur le développement et l’efficacité des projets mis en œuvre. On recense aujourd’hui plusieurs centaines d’initiatives prometteuses dans tous les domaines du développement.

Un engagement politique a été pris au plus haut niveau pour intégrer les big data aux statistiques officielles et faire en sorte qu’elles soutiennent la réalisation des objectifs de développement, mais des obstacles significatifs limitent encore l’ampleur de leur utilisation et de leur impact sur l’amélioration sur l’efficacité des projets de développement.

bibliographie

Banque Mondiale. 2015. Joint Statement from MDBs and IMF Head on Financing for Development. Repéré à http://www.worldbank.org/en/news/press-release/2015/04/16/joint-statementmdbs-imf-head-financing-for-development

Carr-Hill, Roy. 2013. “Missing Millions and Measuring Development Progress”. World Development.

Commission Statistique des Nations Unies. 2014. Principes fondamentaux des statistiques officielles. Repéré à https://unstats.un.org/unsd/dnss/gp/FP-New-E.pdf

Commission Statistique des Nations Unies. 2017. Big Data Project Inventory. Repéré à https://unstats.un.org/bigdata/inventory.cshtml

IAEG-SDGs. 2017. Tier Classification for Global SDG Indicators. Repéré à https://unstats.un.org/sdgs/files/Tier%20Classification%20of%20SDG%20Indicators_20%20April%202017_web.pdf

Nations Unies. 2001. Plan de campagne pour la mise en œuvre de la Déclaration du Millénaire (A/56/326). Repéré à http://www.un.org/documents/ga/docs/56/a56326.pdf

Nations Unies. 2013. A new global partnership : Eradicate poverty and transform economies through sustainable development. The Report of the High-Level Panel of Eminent Persons on the Post-2015 Development Agenda. Repéré à http://www.post2015hlp.org/wp-content/uploads/2013/05/UN-Report.pdf

Nations Unies. 2014. A World That Counts: Mobilizing The Data Revolution for Sustainable Development. Repéré à http://www.undatarevolution.org/wp-content/uploads/2014/12/A-World-That-Counts2.pdf

Nations Unies. 2015a. Transformer notre monde : le Programme de développement durable à l’horizon 2030 (A/RES/70/1). Repéré à http://www.un.org/ga/search/view_doc.asp?symbol=A/RES/70/1&referer=/english/&Lang=F

Nations Unies. 2015b. Rapport sur les objectifs du Millénaire pour le développement. Repéré à http://www.un.org/fr/millenniumgoals/reports/2015/pdf/rapport_2015.pdf

Nations Unies. 2017. The Future of Data Production. Session TA2.01 of the United Nations Statistical Commission’s World Data Forum. Repéré à https://www.youtube.com/watch?v=Hw_n6h481Oo

PNUD (Programme des Nations Unies pour le Développement). 2016. A BIG DEAL: How can we use big data to measure poverty in Sudan? Repéré à http://www.sd.undp.org/content/sudan/en/home/blog/2016/1/12/A-BIG-DEAL-How-can-we-use-big-data-to-measure-poverty-in-Sudan-.html

Sanghi, A., Bundervoet, T. et Maiyo, L. 2015. Night lights and the pursuit of subnational GDP: Application to Kenya & Rwanda. Banque Mondiale. Repéré à http://blogs.worldbank.org/developmenttalk/night-lights-and-pursuit-subnational-gdp-application-kenya-rwanda

SDSN (Sustainable Development Solutions Network). 2015. Data for Development: A Needs Assessment for SDG Monitoring and Statistical Capacity Development. Repéré à http://unsdsn.org/wp-content/uploads/2015/04/Data-for-Development-Full-Report.pdf

UIT (Union Internationale des Télécommunications). 2017. Mobile-cellular subscriptions. Repéré à http://www.itu.int/en/ITU-D/Statistics/Documents/statistics/2017/Mobile_cellular_2000-2016.xls

UNICEF (Fonds des Nations Unies pour l’Enfance). 2016. How Facebook statuses informed the Zika response in Brazil. Repéré à http://unicefstories.org/2016/12/17/how-facebook-statuses-informed-the-zika-response-in-brazil/.


Du même auteur

Tous les articles

Aucune autre publication à afficher.