Statistique Canada lre des donnes Claude Turmelle Statistique

  • Slides: 28
Download presentation
Statistique Canada à l’ère des données Claude Turmelle Statistique Canada Mai 2018

Statistique Canada à l’ère des données Claude Turmelle Statistique Canada Mai 2018

PLAN DE LA PRÉSENTATION • Contexte actuel • Un Statistique Canada moderne • Quelques

PLAN DE LA PRÉSENTATION • Contexte actuel • Un Statistique Canada moderne • Quelques initiatives en cours • Conclusion

CONTEXTE ACTUEL Une économie et une société de plus en plus complexes Une prolifération

CONTEXTE ACTUEL Une économie et une société de plus en plus complexes Une prolifération de nouvelles données Une révolution de la science des données Une hausse fulgurante des demandes en information

LA VISION Un organisme statistique moderne et souple, en voie de devenir pleinement numérique

LA VISION Un organisme statistique moderne et souple, en voie de devenir pleinement numérique Aller au-delà de l’approche fondée sur les données d’enquêtes pour adopter de nouvelles méthodes et l’intégration de données provenant de diverses sources Faciliter l’accès à nos données et leur utilisation en adoptant de nouveaux outils et en renforçant notre capacité aux fins de l’analyse et de la visualisation des données Aider davantage les Canadiens à utiliser les données en vue de prendre des décisions axées sur des données probantes Permettre une gestion efficace des données dans la fonction publique

Moderniser chaque étape du cycle Génération et collecte Maximiser l’utilisation des données administratives/mégadonnées plutôt

Moderniser chaque étape du cycle Génération et collecte Maximiser l’utilisation des données administratives/mégadonnées plutôt qu’une collecte isolée et axée sur les enquêtes Consommation Intégration et traitement Appuyer des décisions éclairées de la part des citoyens, des gouvernements et des entreprises, à la lumière de données probantes Moderniser nos méthodologies pour mieux intégrer et traiter les données provenant de diverses sources Analyse et visualisation Diffusion Passer de l’analyse et des tableaux de données statiques à la création d’outils d’évaluation des données et d’utilisation responsable des données Améliorer grandement l’accès et offrir des produits et des services souples et de qualité élevée Les piliers d’un organisme statistique moderne Prestation de services axée sur l’utilisateur Accroissement des capacités statistiques et leadership Partage et collaboration Méthodes d’avantgarde et outils à la fine pointe de la technologie Main-d’oeuvre flexible et moderne 5

DONNÉES SOURCES q q q q q Canadiens Ministères fédéraux Provinces/Territoires Villes Entreprises Internet

DONNÉES SOURCES q q q q q Canadiens Ministères fédéraux Provinces/Territoires Villes Entreprises Internet Médias sociaux Satellites Capteurs CARACTÉRISTIQUES q Microdonnées q Données agrégées q Avec / sans identification q Information transactionnelle q Numériques / Texte q Images CYCLE DE VIE DES DONNÉES PROCURER • Exploration • Découvertes • Besoins (données) • Négociations • Fichiers provisoires • Réception PROTÉGER PRÉPARER • Stockage temporaire • Pré traitement • Dépersonnalisation • Dépôt ministériel • Gestion (registres) • Intégration • Mise à jour des registres • Programme • Analyse • Mise en tableaux directe PARTAGER • Diffusion • Microdonnées • Centres de recherche • Gouvernement ouvert Supporter par des métadonnées Règles de sécurité et de gestion de I’information Renseigneme nts

REGISTRES PRÉPARER STATISTIQUES P R O C U R E R P R O

REGISTRES PRÉPARER STATISTIQUES P R O C U R E R P R O T É G E R Système des registres statistiques infrastructure géospatiale Registre des personnes Registre des activités Registre des immeubles Registre des entreprises • Base de sondage • Collecte de données • Intégration • Traitement • Estimation et tabulation • Analyse P A R T A G E R

PROJETS EXPLORATOIRES Ø Statistiques sur le cannabis Ø Programme de la statistique du logement

PROJETS EXPLORATOIRES Ø Statistiques sur le cannabis Ø Programme de la statistique du logement canadien Ø Mesure de la croissance du tourisme international Ø Stratégie de mesure des émissions de carbone Ainsi que plusieurs autres initiatives de modernisation reliées à nos programmes existants (quelques exemples plus loin)

Statistiques sur le cannabis – moderne de par sa nature • Nous devons mesurer

Statistiques sur le cannabis – moderne de par sa nature • Nous devons mesurer quelque chose à partir de rien : X Nous ne pouvons pas consulter de classification industrielle ou de produits X Nous ne pouvons pas nous inspirer d’un univers d’enquête ou d’une base de sondage X Il n’y a aucune boutique sur laquelle se fonder pour établir des prix X Il n’existe aucune association industrielle avec laquelle collaborer X Nous ne pouvons pas mettre sur pied un groupe de discussion afin de tester des questions X Nous ne pouvons pas acquérir de données de lecteurs optiques ou avoir accès à des dossiers fiscaux X Peu de répondants souhaiteront fournir des renseignements ØPourtant, les Canadiens ont beaucoup de questions, et ils s’attendent à ce que Statistique Canada fournisse des réponses. 9 STATISTIQUE CANADA • STATISTICS CANADA 2021 -10 -20

Plus de 18, 000 réponses depuis janvier 2018, provenant des 13 provinces et territoires

Plus de 18, 000 réponses depuis janvier 2018, provenant des 13 provinces et territoires et de près de 800 villes différentes

Programme de la statistique du logement canadien Le prix des maisons a crû de

Programme de la statistique du logement canadien Le prix des maisons a crû de plus de 50% à Vancouver et Toronto en 3 ans!

Programme de la statistique du logement canadien Statistique Canada a reçu le mandat de

Programme de la statistique du logement canadien Statistique Canada a reçu le mandat de créer une base de données sur les propriétés résidentielles. Un dépôt complet de statistiques sur de nombreux aspects du secteur de l'habitation dont les caractéristiques des propriétés et des propriétaires, le statut de résidence, et le financement. La base de données comprendra des renseignements sur toutes les propriétés résidentielles au Canada.

Programme de la statistique du logement canadien • Avril – Novembre 2016: projet pilote

Programme de la statistique du logement canadien • Avril – Novembre 2016: projet pilote • Avril 2017: Lancement officiel du programme • Décembre 2017: première diffusion de données pour Toronto et Vancouver

Couverture Médiatique

Couverture Médiatique

Médias Sociaux • 11 messages Twitter, 9 messages Facebook, vus 113, 325 fois •

Médias Sociaux • 11 messages Twitter, 9 messages Facebook, vus 113, 325 fois • 2833 utilisateurs par message • Plus du double de l’intérêt comparé aux autres messages de Statcan de décembre 2017

Approche moderne • Emphase sur l’actualité • Se permettre de publier rapidement des résultats

Approche moderne • Emphase sur l’actualité • Se permettre de publier rapidement des résultats préliminaires et partiels (zones prioritaires – TO et VAN – contenu limité) • Emphase sur géographies détaillées (45 municipalités) • À partir de données existantes; pas d’enquête • Plusieurs produits; plusieurs modes • Mesure, analyse la pertinence et l’intérêt (centré sur l’utilisateur) • Collaboration étroite avec partenaires Mais, qu’en est-il de la précision? 22

PSLC - Métadonnées Le PSLC regroupe des données provenant de sources multiples : rôles

PSLC - Métadonnées Le PSLC regroupe des données provenant de sources multiples : rôles d'évaluation foncière, titres fonciers, financement hypothécaire, fichiers de données fiscales, recensement de la population et autres. Des méthodes de couplage déterministes et probabilistes d'enregistrements sont appliquées. De multiples vérifications des couplages sont ensuite effectuées à des fins d'assurance de la qualité, et les couplages définitifs font l'objet d'un examen manuel pour estimer les taux d'erreurs.

PSLC - Métadonnées Mais… Exactitude des données Des mesures directes du degré d'erreur dans

PSLC - Métadonnées Mais… Exactitude des données Des mesures directes du degré d'erreur dans les estimations ne peuvent être calculées. La qualité des estimations peut être jugée à partir d'une analyse comparative et au moyen d'une évaluation subjective des sources de données et méthodes employées dans la préparation des estimations.

Mesurer et communiquer la précision • Comment mesure-t-on la précision d’estimations produites à partir

Mesurer et communiquer la précision • Comment mesure-t-on la précision d’estimations produites à partir d’intégration de plusieurs sources de données, elles-mêmes parfois de qualité inconnue ou résultant de processus complexes? • Dans ce contexte, quels genres d’indicateurs de qualité les utilisateurs ont-ils de besoin? • CV et IC? Taux d’appariement? Taux d’imputation? • Quel est leur appétit pour apprendre à utiliser des données qui sont, oui plus détaillé, mais de moins bonne qualité? Ou de qualité moins bien comprise et non quantifiée? • Quelles autres dimensions de la qualité devrait-on mesurer et rapporter?

CONCLUSION § La modernisation est déjà bien enclenchée à l'agence. § Au cours de

CONCLUSION § La modernisation est déjà bien enclenchée à l'agence. § Au cours de la dernière année, nous avons élargi nos partenariats dans le but d’obtenir des données alternatives sur de nombreux sujets, notamment le logement, les déplacements et les dépenses et revenus des ménages. § Nous développons l’infrastructure TI et statistique, comme le système de registres, pour faciliter la production de statistiques modernes. § Nous développons également de nouvelles méthodes de collecte et de production de statistiques, telles que la surveillance des médias sociaux pour obtenir des informations sur le tourisme.

CONCLUSION § Nous continuons à faire des percées dans le développement de nouveaux moyens

CONCLUSION § Nous continuons à faire des percées dans le développement de nouveaux moyens novateurs de collecte de données. Par exemple, nous utilisons des données satellitaires pour suivre l'état des cultures agricoles. Grâce à cette méthode, nous pouvons continuer à fournir des données de haute qualité de manière rentable, tout en réduisant le fardeau de réponse imposé à la communauté agricole. § Nous explorons de plus en plus les méthodes et outils d’intelligence artificielle et d’apprentissage automatique (voir annexe) § Mais nous faisons aussi face à plusieurs défis…

DÉFIS § Puissance/infrastructure de traitement § Disponibilité/acquisition/qualité des nouvelles données § Connaissances et expertises

DÉFIS § Puissance/infrastructure de traitement § Disponibilité/acquisition/qualité des nouvelles données § Connaissances et expertises des méthodes et outils non traditionnels (ex. : IA, AA, etc. ) § Continuité des séries chronologiques § Confidentialité/vie privée § Évaluation et communication de la qualité des produits résultants