Reconnaissance de symboles partir de schmas lectriques Soutenance
Reconnaissance de symboles à partir de schémas électriques Soutenance de Stage Master GI Romain Raveaux ( Double cursus Master GI et Master GEII ) 07/2006 Maître de stage : Mlle Elise GABARRA Tuteur : M. Sébastien ADAM 1
Le déroulement de la soutenance 1. Problématique : reconnaissance de symboles 2. Etat de l’art 3. Réalisations a. Approche statistique et combinaison de classifieurs b. Approche structurelle, classification de graphes 4. Analyse de résultats 5. Conclusions et perspectives Présentation 2
Problématiquede : reconnaissance de symboles Le déroulement la soutenance Ø Le traitement automatique du document Ø Analyse de document graphique 1. Introduction Ø Structure générale des systèmes d’analyse 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Rétro conversion Ø Bilan des savoir-faire et des verrous technologiques 3
Les différents points de vue Le déroulement de ladesoutenance des processus reconnaissances Ø Les systèmes de recherche dans une base de documents 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats Ø Les systèmes de détection/reconnaissance des symboles dans un document complet. Ø Les systèmes de « simple » reconnaissance 5. Conclusion Modèles Inconnu Rétro conversion Processus de RDF Classe du symbole identifiée 4
électrique Le déroulement Schéma de la soutenance Ø Le traitement automatique du document Ø Analyse de document graphique 1. Introduction Ø Structure générale des systèmes d’analyse 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Rétro conversion Ø Bilan des savoir-faire et des verrous technologiques 5
Le déroulement Contexte de la soutenance Industriel Développement de logiciel de schématique électrique (CAO/DAO) 1. Introduction 2. Etat de l’art Projet européen EPEIRES (Évaluation des PErformances de l'Interprétation et de la REconnaissance de Symboles) 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Rétro conversion 6
Le déroulement de la soutenance 1. Problématique : reconnaissance de symboles 2. Etat de l’art 3. Réalisations a. Approche statistique et combinaison de classifieurs b. Approche structurelle, classification de graphes 4. Analyse de résultats 5. Conclusions et perspectives Présentation 7
Etat de l’art de la de symboles Le déroulement dereconnaissance la soutenance [RAM 05] « De l’appariement de graphes symboliques à l’appariement de graphes numériques : Application à la reconnaissance de symboles » , Rashid Jalal Qureshi, Jean-Yves Ramel, Hubert Cardot. 1. Introduction [FIL 92] Filipski A. J. , Flandrena R. , « Automated Conversion of Engineering Drawings to CAD form » , Proc. IEEE, vol. 80, n° 7, p. 1195 -1209, 1992. 2. Etat de l’art [Jean-Marc Ogier et Sébastien Adam 06] Chapitre 7 : « Documents graphiques : de la rétro conversion à la recherche d’information » 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion [DOR 95] DORI D. , « Vector-Based Arc Segmentation in the Machine Drawing Understanding System Environment » , IEEE PAMI, vol. 17, n° 11, p. 1057 -1068, 1995. BELAID A. , TOMBRE K. (1992) "Analyse de documents : de l'image à la sémantique", Actes de CNED'92, Bigre No 80, pp. 3 -29. Trois types d’approches Ø Approches statistiques Ø Approches structurelles Bibliographie Ø Approches syntaxiques 8
Approches statistiques Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats Ø Le Symbole image est projeté sous forme de vecteur de caractéristiques numériques. Ø L’image est donc ramenée à un espace à N dimensions. 5. Conclusion Approche statistique 9
Approches statistiques Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes Ø Exemple de caractéristiques : 1. Les moments invariants de Zernike 2. Les descripteurs de Fourier – Melin 3. Les moments de Legendre 4. Analyse de résultats 5. Conclusion Approche statistique Signature Radon Pattern Recognition, Vol. 29, No. 4, pp. 641 -662, 1996, “FEATURE EXTRACTION METHODS FOR CHARACTER RECOGNITION--A SURVEY” 10
Approches Le déroulement de la structurelles soutenance 1. Introduction 2. Etat de l’art Un symbole peut être décrit à partir des primitives le constituant (composantes connexes, occlusions, segments, arcs…) et des relations entre ces primitives (voisinage, connexions, parallélisme). 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Approche structurelle Contextual System of Symbol Structural Recognition based on an Object-Process Methodology. Mathieu Delalandre and Eric Trupin and Jean-Marc Ogier and Jacques Labiche 11
Approches syntaxiques Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats Ø Modélisation par un ensemble de règles. Ø Phase de reconnaissance : - Vérification des grammaires de production [CHA 01] Chang M. T. and Chen S. Y. , « Deformed trademark retrieval based on 2 D pseudo-hiddem Markov model » , PR, vol. 34, p. 953– 967, 2001. 5. Conclusion MMC Approche syntaxique MEM CRF 12
solutions Le déroulement. Etude de ladesoutenance Ø Il n’existe pas de solution générique • Dépendance au contexte d’acquisition de l’image. 1. Introduction 2. Etat de l’art 3. Réalisations • Dépendance au type de symbole à traiter. • Nombre de classes du problème. • L’objectif à atteindre. a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Ø Confronter des approches bien différentes • Obtenir des erreurs non corrélées. • Comparatif Analyse 13
Le déroulement de la soutenance 1. Problématique : reconnaissance de symboles 2. Etat de l’art 3. Réalisations a. Approche statistique et combinaison de classifieurs b. Approche structurelle, classification de graphes 4. Analyse de résultats 5. Conclusions et perspectives Présentation 14
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats Ø Principe : Ø Extraction de caractéristiques Ø Classification Ø Combinaison parallèle 5. Conclusion Approche statistique 15
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance ØExtraction de caractéristiques : 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Approche statistique 16
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance Ø Classification de caractéristiques 1. Introduction • Classifieur 1 Plus Proche Voisin 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Approche statistique Classifieur : Classification basée sur les moments de Zernike d’ordre 6 17
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance Ø Classification de caractéristiques 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Approche statistique § Deux cas de figures : • Distance entre deux vecteurs : q Distance euclidienne. • Distance entre deux matrices : q Chaque ligne représente un vecteur de caractéristiques d’une composante connexe. 18
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance Ø Classification de caractéristiques 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes Matrice M 1 : Vecteur A 1 [ 13. 545152 ; 0. 788149 ; 2. 686930 ] Vecteur A 2 [ 13. 562704 ; 0. 780961 ; 2. 679942 ] Vecteur A 3 [13. 545152 ; 0. 788149 ; 2. 686930 ] 4. Analyse de résultats 5. Conclusion Matrice M 2 : Vecteur B 1 [ 6. 216766 ; 0. 416909 ; 4. 637786 ] Classification 19
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance Matrice M 1 : Matrice M 2 : Vecteur A 1 [ 13. 545152 ; 0. 788149 ; 2. 686930 ] Vecteur A 2 [ 13. 562704 ; 0. 780961 ; 2. 679942 ] Vecteur A 3 [13. 545152 ; 0. 788149 ; 2. 686930 ] Vecteur B 1 [ 6. 216766 ; 0. 416909 ; 4. 637786 ] 1. Introduction 2. Etat de l’art 3. Réalisations B 1 Dummy (fictif) A 1 D(A 1, B 1) |A 1| A 2 D(A 2, B 1) |A 2| A 3 D(A 3, B 1) |A 3| Matrice de pondération a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion B 1 Dummy (fictif) A 1 0 A 2 0 0 1 A 3 1 0 0 Matrice d’assignement D(M 1, M 2) = D(A 3, B 1) + D(A 2) • Recherche de la matrice d’assignement par la méthode hongroise. • SCHÖNAUERS [SHO 03] Recherche opérationnelle • “Distances and expression measures”, Sandrine Dudoit and Robert Gentleman, Bioconductor short course Summer 2002 20
Approche statistique de classifieurs Le déroulement de etlacombinaison soutenance Ø Combinaison parallèle 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Combinaison 21
Le déroulement de la soutenance 1. Problématique : reconnaissance de symboles 2. Etat de l’art 3. Réalisations a. Approche statistique et combinaison de classifieurs b. Approche structurelle, classification de graphes 4. Analyse de résultats 5. Conclusions et perspectives Présentation 22
Approche structurelle classification de graphes Le déroulement de laet soutenance Du symbole au graphe : 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats - Construction à partir des éléments vectorisés. - Graphe de jonctions 5. Conclusion Représentation 23
Approche structurelle classification de graphes Le déroulement de laet soutenance Attributs nominaux : 1. Introduction Etiquetage des nœuds : 2. Etat de l’art - Le degré du nœud 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Etiquetage des arêtes : - L’alignement entre deux points. Représentation - Le type de liaison : Arc ou Vecteur v 1 J 1 v 2 J 3 v 3 J 1 v 4 J 1 v 5 J 2 v 6 J 3 v 7 J 2 v 8 J 1 u 1 2 vec_qqc_g u 2 3 vec_qqc_g u 2 6 vec_h_g u 4 5 vec_h_p u 5 6 vec_v_g u 6 7 vec_v_g u 7 8 vec_h_p - La taille de liaison : Discrétisation en Grand ou Petit. Clustering 24
Approche structurelle classification de graphes Le déroulement de laet soutenance Ø Description structurelle du symbole. 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes Ø Le problème tourne en une classification de graphes. Ø Comment comparer des graphes ? - Difficulté : établir une distance entre graphes. 4. Analyse de résultats 5. Conclusion Classification de graphes 25
Distance graphe Le déroulement de laentre soutenance • Notion de distance : 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Distance 26
Distance graphe Le déroulement de laentre soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Distance d’édition • Représente la séquence d'édition visant à minimiser la somme des coûts des opérations élémentaires permettant de transformer un graphe en un autre. - Opération d’insertion - Opération de substitution -… • Une complexité algorithmique exponentielle dans le pire des cas. Problème NP complet. • Si les coûts des opérations élémentaires sont symétriques, il s'agit d'une métrique. • Les coûts des opérations doivent être déterminés en fonction de l'application. • Cette distance n'est pas normalisée 27
Mesure de dissimilarité Le déroulement de la soutenance Pour pallier ce handicap, l’explosion combinatoire, nous optons pour une approximation : 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Mesure Graph Probing [D. P. Lopresti and G. T. . Wilfong, “A fast technique for comparing graph representations with applications to performance evaluation” ] Le Graph Probing s'applique aux graphes non orientés ● La structure d'arcs d'un noeud donné – Considérant ‘a’ étiquettes d'arcs : – La structure d'arcs d'un noeud est un ‘ 2 a’-tuple d'entiers non négatifs – Le noeud a exactement xi arcs entrants étiquetés li, et yj noeuds sortant étiquetés lj ● Probe 1 : Combien de noeuds étiquetés « J 2 » sont présents dans le graphes ? ● Probe 2 : Combien de noeuds disposant d’une structure d'arcs donnée sont présents dans le graphe ? 28
Mesure de dissimilarité Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes ● Graph probing distance respecte les conditions 1, 3 et 4 de la définition d'une métrique, mais pas la propriété 2. ● Graph probing peut être calculé en temps linéaire ● Relation entre graph probing et distance d'édition : 4. Analyse de résultats 5. Conclusion Dissimilarité entre objets 29
Mesure de dissimilarité Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes G 1 4. Analyse de résultats 5. Conclusion G 2 Graphes 30
Mesure de dissimilarité Le déroulement de la soutenance 1. Introduction Probe 1 = 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats N G 1 G 2 3 5 5. Conclusion Probe 1 31
Mesure de dissimilarité Le déroulement de la soutenance S 1. Introduction 2. Etat de l’art G 1 G 2 1 1 2 0 0 2 0 1 Probe 2 = 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Probe 2 32
Appariement de soutenance graphes : Corrélation Le déroulement de la Mesure de dissimilarité : Graph Probing 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes Taux de corrélation 4. Analyse de résultats Graph Probing 5. Conclusion Kendall 0. 6824176 Ø Etude du comportement du Graph Probing : Evaluation E. Barbu, R. Raveaux, H. Locteau, S. Adam, P. Héroux, E. Trupin, "Graph Classification Using Genetic Algorithm and Graph Probing Application to Symbol Recognition“ 33 Lecture Notes in Computer Science, 2006.
résultats Le déroulement. Analyse de ladesoutenance Ø Problèmes : Approche statistique • Sensible aux caractéristiques d’acquisition de l’image. • Coûteuse en temps: Extraction + combinaison de classifieurs 1. Introduction 2. Etat de l’art ØProblèmes : Approche structurelle • Vectorisation imprécise Solution possible: LOCTEAU H. , RAVEAUX R. , ADAM S. , LECOURTIER Y. , HEROUX P. , TRUPIN E. « Approximation of Digital Curves Using a Multi-Objective Genetic Algorithm » ; Lecture Notes in Computer Science 3926, 2006. 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats Base GREC 5. Conclusion Comparaison Base Electrique Approche statistique Approche structurelle Top 1 0. 8734 0, 7325 0. 2142 0, 5654 Top 5 0. 9216 0, 8855 0. 7678 0, 7486 Top 10 1 1 0. 875 0, 8928 Top 15 0. 9464 1 Top 20 0. 9642 1 34
Le déroulement de. Conclusion la soutenance • Bilan : - Méthode statistique associée à une combinaison de 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Bilan classifieurs. - Méthode structurelle: 2 types de graphe Comparaison de mesures de dissimilarité entre graphes. - Réseau de symboles [MES 93] • Prospection : - Combinaison statistico/strcuturelle - Tester et valider l’approche en réseau de symboles. - Etudier des méthodes d’appariements de graphes. « A Comparative Study of Ant Colony Optimization and Reactive Search for Graph Matching Problems. » Sébastien Sorlin - Tenir compte d’éléments externes à l’imagette. - Information spécifique au domaine. http: //algoreco. free. fr 35
Le déroulement de la. Fin soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes • Merci de votre attention 4. Analyse de résultats 5. Conclusion Des questions ? 36
Représentation structurelle Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Probe 2 37
Réseau Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Probe 2 38
Documents graphiques Le déroulement de la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Rétro conversion 39
Pluralitéde des la données graphiques Le déroulement soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats 5. Conclusion Rétro conversion 40
Faible de pixels Le déroulement dedensité la soutenance 1. Introduction 2. Etat de l’art 3. Réalisations a. Approche statistique b. Classification de graphes 4. Analyse de résultats Symbole GREC 250 000 pixels Symbole base Elec 1600 pixels 5. Conclusion Rétro conversion 41
- Slides: 41