Atelier sous rgional sur lintgration des donnes administratives

  • Slides: 15
Download presentation
Atelier sous régional sur l'intégration des données administratives, des données de masse et des

Atelier sous régional sur l'intégration des données administratives, des données de masse et des informations géospatiales pour la compilation des indicateurs des ODD pour les pays africains francophones 9 au 11 mai 2018 - Hôtel Saint Manick - Lomé, Togo Analyse des réponses des pays au questionnaire d'auto-évaluation: Sources données de masse (Big Data) Oumar Sarr, CEA

Données de masse (Big Data) • Les données de masse sont des données non

Données de masse (Big Data) • Les données de masse sont des données non échantillonnées, caractérisées par la création de bases de données à partir de sources électroniques dont le but principal est autre chose que l'inférence statistique (W. Horrigan, 2013) • L'analyse des données de masse repose souvent sur des techniques telles que l'apprentissage automatique et l'exploration de données • Les données de masse sont caractérisées non seulement par leur grand volume, mais aussi par leur variété et la vitesse à laquelles sont générées

Sources des Données de masse • En général, les grandes sources de données peuvent

Sources des Données de masse • En général, les grandes sources de données peuvent être classées comme suit: • Sources découlant de l'administration d'un programme: • Par exemple, les dossiers médicaux électroniques, les visites à l'hôpital, les fichiers d'assurance, les fichiers bancaires et les banques alimentaires. • Sources commerciales ou transactionnelles découlant de la transaction entre deux entités: • Par exemple, les transactions par carte de crédit et les transactions en ligne (y compris les transactions à partir d'appareils mobiles).

Sources des Données de masse • Réseau de capteurs: • Par exemple, l'imagerie par

Sources des Données de masse • Réseau de capteurs: • Par exemple, l'imagerie par satellite, les capteurs routiers et les capteurs climatiques. • Périphériques de suivi: • Par exemple, données de suivi à partir de téléphones mobiles et le système de positionnement global (GPS). • Données comportementales: • Par exemple, les recherches en ligne (sur un produit, un service ou tout autre type d'information) et les pages consultées en ligne. • Données d'opinion: • Par exemple, des commentaires à travers les médias sociaux.

RESULTATS

RESULTATS

Principaux résultats attendus des projets de données de masse en cours (Q 4. 4)

Principaux résultats attendus des projets de données de masse en cours (Q 4. 4) • Amélioration de la qualité des données • Estimer différemment certains indicateurs habituellement produits (pauvreté, transfert de fonds, indicateurs de mobilité, etc. ) • Production des indicateurs spécifiques des ODD

Procédures permettant d'étudier le potentiel des sources de données de masse à des fins

Procédures permettant d'étudier le potentiel des sources de données de masse à des fins statistiques (Q 4. 1) • Seuls 3 pays sur 18 ont répondu que certaines procédures étaient en place pour étudier le potentiel des sources de données de masse à des fins statistiques, y compris pour l'élaboration d'indicateurs ODD.

Principales sources données de masse (Q 4. 2) Dossiers de santé 3 Images satellites

Principales sources données de masse (Q 4. 2) Dossiers de santé 3 Images satellites ou données d'imagerie aérienne 3 Données des téléphones portables 3 Autre 2 Données issues des extractions du contenu de sites. . . 2 Données des compteurs d'électriques intelligents 2 Données scannées 1 Données d'identification automatique des navires 1 Données d'utilisation des transports publiques 1 Données des capteurs routiers 1 Données des cartes de crédit 1 Données des médias sociaux 1

Implication des ONS dans un projet de Big Data pertinent pour compiler et /

Implication des ONS dans un projet de Big Data pertinent pour compiler et / ou renforcer la mesure des indicateurs ODD (Q 4. 3) • 6 ONS sur 16 ont participé à des projets de Données de masse pertinents pour compiler et / ou soutenir la mesure des indicateurs ODD

Partenariats établis ou planifiés pour les projets de données de masse (Q 4. 5)

Partenariats établis ou planifiés pour les projets de données de masse (Q 4. 5) 7 4 4 2 2 1 Organisations internationals Institut de recherche ou Instituts académiques Instituts gouvernementaux Partenariats non établis ou prévus pour des projets de Big Data Autre Partenaires technologiques

Méthodes d’estimation ou cadre méthodologique pour l’utilisation des sources données de masse (Q 4.

Méthodes d’estimation ou cadre méthodologique pour l’utilisation des sources données de masse (Q 4. 6) • Tous les pays qui ont répondu à cette question (15) n’ont pas développé de nouvelles méthodes d'estimation ou un cadre méthodologique spécifiquement lié à l'utilisation des sources de données de masse • 3 ONS utilisent des méthodes statistiques traditionnelles tandis que 1 ONS utilise des méthodes de visualisation des données

Technologies et outils utilisés dans la mise en oeuvre des projets des données de

Technologies et outils utilisés dans la mise en oeuvre des projets des données de masse (Q 4. 7) Apprentissage automatique (machine learning) Apprentissage supervisé (Supervised learning) Techniques Ba. Ouiian Réseaux de neurones Arbres de décision Méthodes de visualisation des données Méthodes statistiques traditionnelles Autres méthodes (veuillez préciser) Pas de projet sur les données de masse Nbre de pays 1 1 1 2 2 1 3 1 8

Défis nationaux dans l'utilisation des sources de données de masse dans la production de

Défis nationaux dans l'utilisation des sources de données de masse dans la production de statistiques officielles, y compris pour l'élaboration des indicateurs des ODD (Q 4. 8) Services cloud (nuage) Base de données No. SQL SAS Visual Analytics Moteur de traitement des données de masse (big. . . R-Hadoop Autre (veuillez préciser) Enter text. Outils de visualisation des données SIG Tableurs Base de données relationnelles Base de données orientées colonnes Clusters Hadoop Outils d'exploration des données (Data mining tools) Pas de projet sur les données de masse 0 0 0 1 1 1 1 2 11

Défis et obstacles nationaux dans l'utilisation des sources de données de masse dans la

Défis et obstacles nationaux dans l'utilisation des sources de données de masse dans la production des statistiques officielles (Q 4. 10) 11 4 10 10 9 5 Cadre juridique Capacité humaine Défis Manque d'outils et Coûts d'accès aux inapproprié ou (compétences non méthodologiques absence de données limité Enter text. appropriées pour méthodologies accéder et gérer les données de masse (big data)) 4 Accès limité aux Perceptions des données de masse (big data) par les statisticiens

Merci Pour des questions et des commentaires : Oumar Sarr Centre Africain pour la

Merci Pour des questions et des commentaires : Oumar Sarr Centre Africain pour la Statistique Commission Economique pour l’Afrique sarro@un. org