La Lecture Automatique de Documents LAD L exprience

  • Slides: 13
Download presentation
La Lecture Automatique de Documents (LAD) L’ expérience de l’ONS

La Lecture Automatique de Documents (LAD) L’ expérience de l’ONS

Sommaire 1. Qu’est-ce-que la Lecture Automatique de Documents ? 2. L’Expérience de l’ONS 2

Sommaire 1. Qu’est-ce-que la Lecture Automatique de Documents ? 2. L’Expérience de l’ONS 2

1. Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? La lecture Automatique de Documents

1. Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? La lecture Automatique de Documents (LAD) ou «Lecture optique» est un ensemble de technologies ayant pour but de : • Reconnaitre et extraire automatiquement des informations contenues dans un document numérisé, • Contrôler et traiter les données extraites, • Introduire automatiquement ces données dans des systèmes d’information. On peut résumer le processus de la (LAD) ou lecture optique par : • Numérisation, • Identification des documents, • Lecture et extraction des données, • Traitement et contrôle, • Export. 3

Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? a) Numérisation La numérisation est une

Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? a) Numérisation La numérisation est une « photographie » des documents, les images obtenues sont traitées pour l’extraction des données. b) Identification des documents Le premier traitement, après numérisation, appelé RAD (Reconnaissance Automatique de Documents), consiste à identifier le type «modèle» du document à traiter. « Exemple : Q 1, Q 2, Q 3 » 4

Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? c) Lecture et extraction Ensuite c’est

Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? c) Lecture et extraction Ensuite c’est au tour des traitements de reconnaissance de caractères, qui consiste à lire, détecter les formes, puis les comparer à des bibliothèques de formes pour en faire correspondre un caractère. OCR - Reconnaissance Optique de Caractères L’OCR désigne les procédés informatiques permettant la traduction de textes écrits, en format électronique. Exemple : B B, H H OMR – Reconnaissance Optique de Marques L’OMR est employée pour extraire des données de type marque telles que les cases à cocher, les cases à noircir. X 5

Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? d) Traitement et contrôle On applique

Qu’est-ce-que la Lecture Automatique de Documents (LAD) ? d) Traitement et contrôle On applique sur les données extraites par la reconnaissance de caractères les règles dites «règles de cohérence» qui vont permettre de contrôler les valeurs lues. e) Export Après ce contrôle, l’ensemble des valeurs lues par le système ainsi que les fichiers images sont exportés vers le système d’information cible (base de données, GED …). 6

1. 1. Les avantages de la lecture optique • Efficacité La lecture optique permet

1. 1. Les avantages de la lecture optique • Efficacité La lecture optique permet un traitement des questionnaires automatisé en masse et de ce fait, des gains de productivité par rapport à un traitement manuel. • Sécurisation des traitements La lecture optique permet une sécurisation maximale des données. Les questionnaires sont sécurisés grâce à un identificateur unique et techniques diverses notamment le traitement des redondance des données. 7

1. 2. Les exigences de la lecture optique Les formulaires d’enquête doivent être adaptés

1. 2. Les exigences de la lecture optique Les formulaires d’enquête doivent être adaptés en vue de leur traitement par la lecture optique, et ce afin de garantir une bonne lecture du formulaire, une optimisation des traitements et une bonne qualité de données en sortie. 8

2. Expérience de l’ONS Dans le cadre du Recensement Economique de 2011, pour son

2. Expérience de l’ONS Dans le cadre du Recensement Economique de 2011, pour son exploitation des questionnaires, l’Office National des Statistiques a opté pour l’utilisation de la lecture optique. A cet effet, l’ONS a mis en place une solution matérielle et logicielle complète pour la capture de données et le traitement des questionnaires. Un système répartie sur trois sites de production identiques et un site central a été réalisé au niveau du siège et des annexes régionales de l’ONS. 9

Expérience de l’ONS 10

Expérience de l’ONS 10

Expérience de l’ONS : Chaine de production du RE 2011 11

Expérience de l’ONS : Chaine de production du RE 2011 11

Merci de votre attentio n 12

Merci de votre attentio n 12

17

17