Introduction lutilisation des corpus Introduction aux expressions rgulires

  • Slides: 14
Download presentation
Introduction à l’utilisation des corpus Introduction aux expressions régulières

Introduction à l’utilisation des corpus Introduction aux expressions régulières

Questions abordées Ø Aujourd’hui (18 Octobre 2006) Ø Qu’est-ce qu’une expression régulière ? Ø

Questions abordées Ø Aujourd’hui (18 Octobre 2006) Ø Qu’est-ce qu’une expression régulière ? Ø A quoi peut servir une expression régulière ? Ø Comment construire des patrons ? Ø Comment faire des requêtes avec Text. Stat/Wall en utilisant les expressions régulières.

Qu’est-ce qu’une expression régulière ? Ø Qu’ont en commun les expressions suivantes ? Ø

Qu’est-ce qu’une expression régulière ? Ø Qu’ont en commun les expressions suivantes ? Ø Enlarge Image (125 K) Ø Enlarge Image (273 K) Ø Enlarge Image (159 K) Ø Ou alors Ø volatile, volatile-rich, volatilization, volatility, volatilize ? Ø écrire, écrirais, écrivons, écrirons …. Ø Comment pourrait-on décrire une url ? Ø Ou une date ?

Qu’est-ce qu’une expression régulière ? Ø formule écrite dans un langage* crée dans le

Qu’est-ce qu’une expression régulière ? Ø formule écrite dans un langage* crée dans le but de pouvoir décrire d’une façon concise des classes de chaînes de caractères Ø repérage de ‘patrons’ ou ‘motifs’ Ø chaîne de caractères = suite de symboles Ø caractère = lettres, nombres, ponctuation, espaces, tabs

A quoi sert une expression régulière ? Ø Les applications sont immenses et vous

A quoi sert une expression régulière ? Ø Les applications sont immenses et vous en aurez certainement besoin un jour !!! Ø Recher/remplacer des séquences spécifiques dans les corpus. (en formulant un patron qu’on recherche) Ø Les outils de traitement de texte, concordanciers permettent en général des requêtes pas expressions régulières Ø La syntaxe des expressions régulières peut varier mais les utilités sont les mêmes.

Comment construire des patrons ? (Syntaxe des expressions régulières)

Comment construire des patrons ? (Syntaxe des expressions régulières)

Comment construire des patrons ? 1. Chaînes de caractères Ø les plus simples expressions

Comment construire des patrons ? 1. Chaînes de caractères Ø les plus simples expressions : chaînes de caractères : Ø « house » Ø « House » Ø « out of » Ø Exceptions : les caractères spéciaux Ø . ^ $ | [] () Ø Ils doivent être ‘protégés’ par le symbole

Comment construire des patrons ? 2. La disjonction (alternatives) Ø caractères alternatifs Ø [Hh.

Comment construire des patrons ? 2. La disjonction (alternatives) Ø caractères alternatifs Ø [Hh. Mm]ouse Ø r[iau]ng Ø i[sz]e Ø [0123456789] Ø [aeiou] Ø chaîne de caractères alternatives Øin (any|every) Ø volcano|lava

Comment construire des patrons ? 3. Intervalles Ø [0 -9] Ø [a-z] Ø [A-Z]

Comment construire des patrons ? 3. Intervalles Ø [0 -9] Ø [a-z] Ø [A-Z] Ø [a-c] Ø Autres exemples d’ensembles(alternatives) : Ø [0 -9 a-z. A-Z] Ø [a-zàèêëéïüùç]

Comment construire des patrons ? 4. La négation Ø [^A-Z] Ø [^aeoiuy] Ø [^Dd]

Comment construire des patrons ? 4. La négation Ø [^A-Z] Ø [^aeoiuy] Ø [^Dd] ni D ni d

Comment construire des patrons ? 5. Quantificateurs Ø ? représente 0 ou 1 occurrence

Comment construire des patrons ? 5. Quantificateurs Ø ? représente 0 ou 1 occurrence de l‘expression qui précède Ø Ex : arbres? arbre | arbres Ø colou? r color | colour Ø interest(s|(ed|ing)(ly)? )? Ø (school)? Bus(es)? Ø * 0 ou plus occurrences de l’expression qui le précède Ø lo*ng lng, loong, loooong Ø + au moins une occurrence Ø as [a-z]+ as Ø volatil[a-z]+

Comment construire des patrons ? 5. Autres quantificateurs Ø lo{1, 3}ng long, looong Ø

Comment construire des patrons ? 5. Autres quantificateurs Ø lo{1, 3}ng long, looong Ø as ([a-z]+ ){1, 3}as

Comment construire des patrons ? 6. Un dernier point Ø le symbole. remplace n’importe

Comment construire des patrons ? 6. Un dernier point Ø le symbole. remplace n’importe quel caractère (caractère joker) Ø r. ng ring, rang, rbng, r 4 ng, r ng Ø r. *ng -> rng, rdshfksdhng, riiing, etc. Ø wait. {0, 14} for Ø the more. {0, 30} the more Ø the (more|less). {0, 30} the (more|less)

Comment construire des patrons ? Exercices Ø Écrire les expressions régulières correspondant aux Ø

Comment construire des patrons ? Exercices Ø Écrire les expressions régulières correspondant aux Ø les mots commençant par over– Ø les mots finissant par –ion Ø formes du verbe ask Ø formes des verbes finissant par –ise/–ize Ø adresses émail Øsites web Ødates.