Valorisation des corpus oraux dveloppements rcents de PFCEF

  • Slides: 36
Download presentation
Valorisation des corpus oraux: développements récents de PFC-EF (PFC-Enseignement du français) Sylvain DETEY, David

Valorisation des corpus oraux: développements récents de PFC-EF (PFC-Enseignement du français) Sylvain DETEY, David LE GAC, Lucie FLOCH Université de Rouen Annelise COQUILLON, Sylvain NAVARRO Université de Toulouse II Dominique NOUVEAU Université Radboud de Nimègue Atanas TCHOBANOV CNRS UMR 7114 Modyco 11/12/08 – MSH Paris – Colloque Phonologie du Français Contemporain : variation, interfaces, cognition

PLAN 1) S. Detey: chantiers (volume Ophrys, sous-corpus DGLFLF) 2) A. Coquillon & S.

PLAN 1) S. Detey: chantiers (volume Ophrys, sous-corpus DGLFLF) 2) A. Coquillon & S. Navarro: transcription et anonymisation 3) L. Floch: étiquetage thématique et fiches pédagogiques 4) D. Le Gac: espace Présentation du français oral 5) D. Nouveau: espace Schwa 6) A. Tchobanov: le site PFC-EF

Chantiers PFC-EF (S. Detey) (pour rappel : PFC-EF lancé en décembre 2006, cf. Bulletin

Chantiers PFC-EF (S. Detey) (pour rappel : PFC-EF lancé en décembre 2006, cf. Bulletin PFC n° 7 en ligne sur le site PFC) 1) Un volume-ressource: Le français parlé contemporain dans ses variétés: ressources pour l’étude du français (Eds. S. Detey, J. Durand, B. Laks, C. Lyche) A paraître en 2009 chez Ophrys (coll. L’Essentiel français) Volume de référence sur le français parlé contemporain dans l’espace francophone, illustré de manière systématique par des extraits sonores transcrits accompagnés de commentaires descriptifs, qui constituent des ressources linguistiques pour l’étude et l’enseignement/apprentissage du français, abordé selon plusieurs axes : culturel & lexical, syntaxique & discursif, phonétique & phonologique.

36 contributeurs, 21 universités • ANDREASSEN, Helene Nordgard (Université de Tromsø (Norvège)) • BORDAL,

36 contributeurs, 21 universités • ANDREASSEN, Helene Nordgard (Université de Tromsø (Norvège)) • BORDAL, Guri (Université d’Oslo (Norvège)) • BOUTIN, Akissi Béatrice (Université de Toulouse II (France) et Université d’Abidjan (Côte d’Ivoire)) • COQUILLON, Annelise (Université de Toulouse II (France)) • DETEY, Sylvain (Université de Rouen (France)) • DURAND, Jacques (Université de Toulouse II (France)) • EYCHENNE, Julien (Université Simon Fraser (Canada)) • HALL, Damien (Université de Pennsylvanie (Etats-Unis)) • HAMBYE, Philippe (Université catholique de Louvain (Belgique)) • HANSEN, Anita Berit (Université de Copenhague (Danemark)) • KELLY, Stéphanie (Université de Western Ontario (Canada)) • KLINGLER, Thomas (Université de Tulane (Etats-Unis)) • LAFLEUR, Amanda (Université de Louisiane (Etats-Unis)) • LAKS, Bernard (Université de Paris X (France)) • LE GAC, David (Université de Rouen (France)) • LEDEGEN, Gudrun (Université de la Réunion (France)) • LEROY, Sarah (CNRS, Modyco (France)) • LONNEMMANN, Birgit (Université de Düsseldorf (Allemagne)) • LYCHE, Chantal (Université d’Oslo et de Tromsø (Norvège)) • MAITRE, Raphaël (Université de Neufchâtel (Suisse)) • MALLET, Géraldine-Mary (Université de Paris X (France)) • MEISENBURG, Trudel (Université de Osnabrück (Allemagne)) • NOUVEAU, Dominique (Université de Radboud de Nimègue (Pays-Bas)) • ØSTBY, Kathrine (Université d’Oslo (Norvège)) • PAGLIANO, Claudine (Université de Nice (France)) • POIRE, François (Université de Western Ontario (Canada)) • PRIGNITZ, Gisèle (Université de Pau (France) et Université de Ouagadougou (Burkina Faso)) • PUTSKA, Elissa (Ludwig-Maximilians-Universität (Allemagne)) • RACINE, Isabelle (Université de Genève (Suisse)) • ROSSI-GENSANE, Nathalie (Université de Toulouse II (France)) • SIMON, Anne-Catherine (Université catholique de Louvain (Belgique)) • TARRIER, Jean-Michel (Université de Toulouse II (France)) • TCHOBANOV, Atanas (CNRS, Modyco (France)) • VORDERMAYER, Martin (Ludwig-Maximilians-Universität (Allemagne)) • WALKER, Douglas (Université de Calgary (Canada)) • WILMET, Régine (Université catholique de Louvain (Belgique))

Sommaire Introduction à l’ouvrage Carte du monde avec points d’enquête Carte de France, Suisse

Sommaire Introduction à l’ouvrage Carte du monde avec points d’enquête Carte de France, Suisse et Belgique avec points d’enquête Liste des symboles et abréviations Tableau de l’Alphabet Phonétique International Partie I. Le français parlé : arrière-plan descriptif et théorique Ch. 1. Les variétés du français parlé contemporain : approche, méthodologie et données (Detey, Durand, Laks, Lyche) Ch. 2. Eléments de description de l’oral (Durand) Ch. 3. La variation socio-phonologique illustrée (Tarrier) Ch. 4. Oralité, syntaxe et discours (Rossi-Gensane)

Partie II. La France hexagonale septentrionale Ch. 1. Le français de référence : éléments

Partie II. La France hexagonale septentrionale Ch. 1. Le français de référence : éléments de synthèse (Lyche) Ch. 2. Le français de référence : quels locuteurs ? (Detey & Le Gac) Ch. 3. Conversation à Paris dans la haute bourgeoisie : l’enseignement secondaire (Østby) Ch. 4. Conversation à Paris avec un étudiant : un parcours scolaire difficile (Hansen) Ch. 5. Conversation à Darnétal (Seine-Maritime) : la télévision dans les loisirs (Hall & Lyche) Ch. 6. Conversation à Roanne (Loire) : voyage de la classe 54 dans le Sud marocain (Nouveau) Ch. 7. Conversation à Treize Vents (Vendée) : le réseau social des jeunes dans un petit village (Mallet) Ch. 8. Conversation à Ogéviller (Meurthe-et-Moselle ) : les enfants d’hier et d’aujourd’hui, l’éducation se perd (Pagliano & Le Gac) Ch. 9. Conversation à Magland (Haute-Savoie) : regard sur la vie d’autrefois (Pustka & Vordermayer) Partie. III. La France hexagonale méridionale Ch. 1. Le français méridional : éléments de synthèse (Coquillon & Durand) Ch. 2. Conversation à Douzens (Aude) : retour sur les deux guerres mondiales (Durand & Rossi-Gensane) Ch. 3. Conversation à Lacaune (Tarn) : une leçon d’école buissonnière (Lonnemann & Meisenburg) Ch. 4. Conversation à Marseille (Bouches-du-Rhône) : un cuisinier dans la marine (Coquillon) Ch. 5. Conversation à Bayonne (Pyrénées-Atlantiques) : langue et identité au Pays basque (Eychenne) Ch. 6. Conversation avec une Aveyronnaise. . . à Paris : les Parisiens vus par une Provinciale (Pustka)

Partie IV. La Belgique (Hambye, Simon & Wilmet) Ch. 1. Le français de Belgique

Partie IV. La Belgique (Hambye, Simon & Wilmet) Ch. 1. Le français de Belgique : éléments de synthèse Ch. 2. Conversation à Gembloux (province de Namur) : deux enfants bien différents Ch. 3. Brève conversation à Ivoz-Ramet (province de Liège) : vivre au quotidien après la maladie Ch. 4. Brève conversation à Tournai (Hainaut) : la vie estudiantine Ch. 5. Brève conversation à Zellik (Brabant flamand) : les tensions entre communautés linguistiques Ch. 6. Brève conversation à Molenbeek-Saint-Jean (Région de Bruxelles-Capitale) : l’argent de poche des enfants Partie V. La Suisse (Andreassen, Maître et Racine) Ch. 1. Le français de Suisse romande : éléments de synthèse Ch. 2. Conversation à Gland (canton de Vaud) : la culture suisse Ch. 3. Brève conversation à Veyras (canton du Valais) : la menuiserie Ch. 4. Brève conversation à Meinier (canton de Genève) : la fête de l’Escalade Ch. 5. Brève conversation à Bévilard (canton de Berne) : l’enjeu du bilinguisme dans un canton franco-allemand

Partie VI. L’Afrique et les DROM Ch. 1. Le français d’Afrique et des DROM:

Partie VI. L’Afrique et les DROM Ch. 1. Le français d’Afrique et des DROM: éléments de synthèse (Boutin) Ch. 2. Conversation à Bejaia (Algérie) : les femmes et le mariage (Leroy) Ch. 3. Conversation à Abidjan (Côte d’Ivoire) : des études mouvementées dans les années soixante (Boutin) Ch. 4. Conversation à Ouagadougou (Burkina Faso) : parenté à plaisanterie entre Gurma et Yatenga (Prignitz & Boutin) Ch. 5. Conversation à Ilet à Cordes (Ile de la Réunion) : arrivée du téléphone et de la route (Bordal & Ledegen) Ch. 6. Conversation à Petit-Canal (Guadeloupe) : la fête de Noël (Pustka) Partie VII. L’Amérique du Nord Ch. 1. Le français d’Amérique du Nord: éléments de synthèse (Eychenne & Walker) Ch. 2. Conversation à Québec ville (Québec, Canada) : la religion pour un jeune Québécois (Kelly) Ch. 3. Conversation à Belle-Rivière (Ontario, Canada) : la transmission du français en milieu minoritaire (Poiré) Ch. 4. Conversation à Rivière-la-Paix (Alberta, Canada) : la francophonie rurale dans l’Ouest canadien (Walker) Ch. 5. Conversation à la Ville Platte (Louisiane, Etats-Unis) : langue et musique en Louisiane (Lyche, Klingler & La. Fleur) Références

Sommaire du CD-ROM (responsable : A. Tchobanov) Annexe 1. Exploitation pédagogique des données PFC

Sommaire du CD-ROM (responsable : A. Tchobanov) Annexe 1. Exploitation pédagogique des données PFC (Detey, Nouveau & Floch) Annexe 2. Navigation en ligne dans la base PFC (Tchobanov) Annexe 3. Glossaire Annexe 4. Références bibliographiques complètes Annexe 5. Transcriptions (version imprimable) Annexe 6. Enregistrements

Structure: • • • Cadrage théorique: éléments de description de l’oral (phonologie, variation, syntaxe)

Structure: • • • Cadrage théorique: éléments de description de l’oral (phonologie, variation, syntaxe) Chapitres de synthèse: FR, FM, FB, FS, FA, FC. . . Chapitres-commentaires: – – Introduction Aspects culturels & lexicaux Aspects discursifs & syntaxiques Aspects phonétiques et phonologiques Spécificité: • Volume multi-public: – – – • Volume multi-usage: – – • Enseignants de français (ressources pré-didactiques) Etudiants de linguistique française et apprenants avancés de français Enseignants-chercheurs en linguistique française Enregistrements et transcriptions, pour du FLE et/ou de l’analyse Commentaires à trois niveaux Lecture aisée: peu de références, de métalangage technique, style épuré, commentaires axés sur l’extrait, transcriptions normalisées. . . • Introduction à la base PFC: vers davantage de données accessibles gratuitement. . . Utilité: réaction de Mlle Floch (enseignante FLE) au sujet des variétés: « Je n’ai pas assez d’information pour faire travailler mes étudiants sur les variétés de français » précisément la fonction du volume !

2ème chantier PFC-EF: le sous-corpus DGLFLF • Marché Numérisation ILF-TUL-DGLFLF (partie « Valorisation des

2ème chantier PFC-EF: le sous-corpus DGLFLF • Marché Numérisation ILF-TUL-DGLFLF (partie « Valorisation des usages » ) Financement 2008 de PFC-EF: 4 KE. Vacations: – Sylvain Navarro (Doctorant, Toulouse II) pour vérification de transcription et anonymisation de sous-corpus, supervisé par A. Coquillon. – Lucie Floch (M 2 pro. , Rouen) pour réalisation de fiches pédagogiques et étiquetage thématique du sous-corpus, supervisée par S. Detey & D. Le Gac. Sous-corpus DGLFLF (Abidjan, Aix-Marseille, Biarritz, Gembloux, Genève, Paris, Vendée. . . ) Merci à: H. Andreassen, B. Boutin, A. Coquillon, J. Durand, J. Eychenne, P. Hambye, C. Lyche, G. Mallet, K. Østby, A. -C. Simon. . . • Appel à proposition Valorisation et usages de corpus oraux DGLFLF. Financement 2009 de PFC-EF: 16 KE. Poursuite du travail. • Intégration au site PFC-EF et au site corpusdelaparole. fr

Du sous-corpus DGLFLF à la base PFC: questions d’anonymisation et de transcription (A. Coquillon

Du sous-corpus DGLFLF à la base PFC: questions d’anonymisation et de transcription (A. Coquillon et S. Navarro) • Questions d’anonymisation des données: – Qu’est-ce qu’anonymiser? – Qu’anonymiser? – comment? – Problèmes

Qu’est-ce qu’anonymiser? • Anonymisation : Opération par laquelle se trouve supprimé d’un ensemble de

Qu’est-ce qu’anonymiser? • Anonymisation : Opération par laquelle se trouve supprimé d’un ensemble de données recueillies auprès d’un individu ou d’un groupe tout lien permettant l’identification de ces derniers (Corpus Oraux, guide des bonnes pratiques 2006, DGLFLF, O. Baude) Þ Si l’on respecte ces consignes à la lettre, toutes les conversations guidées posent problème Þ Question des fiches de consentement. . . Þ contradiction éventuelle entre anonymisation et disponibilité des détails pour l’analyse

Qu’anonymiser? • Questions desde données: – Donnéesd’anonymisation personnelles (numéros téléphone, – Qu’est-ce qu’anonymiser? adresse,

Qu’anonymiser? • Questions desde données: – Donnéesd’anonymisation personnelles (numéros téléphone, – Qu’est-ce qu’anonymiser? adresse, etc. ) –– Qu’anonymiser? Noms propres – comment? • sauf noms de personnes publiques (propos non diffamatoires) – Problèmes – Sigles d’entreprises • notamment si citées dans des propos diffamatoires ÞLes décisions restent subjectives

Comment anonymiser? • Texte: • Questions d’anonymisation des données: – Pas d’hyperonymes du type

Comment anonymiser? • Texte: • Questions d’anonymisation des données: – Pas d’hyperonymes du type : « nom propre » ; entreprise qu’anonymiser? » , etc. => lisibilité du texte (notamment en – «Qu’est-ce didactique) –– Qu’anonymiser? Utilisation de pseudonymes trop lourde Comment anonymiser? –– Initiales: peuvent être confondues avec les initiales des ou de réelles initiales – locuteurs Problèmes Þ Opter pour les deux 1ères lettres des noms • Problème: lorsque 2 noms différents sont confondus Ex: Monsieur Durand et Monsieur Dusse => Du. • Sigles (S. N. C. M. => So. ? )

Comment anonymiser? • Le son: – Pas d’insertion de silence: peut être confondu avec

Comment anonymiser? • Le son: – Pas d’insertion de silence: peut être confondu avec des pauses silencieuses – Pas de « réversion » du signal: peut induire en erreur sur ce qui est dit, l’anonymisation n’est pas claire et est réversible! Þ Opter pour un bip dans le signal • Problème: ne se fait pas sous Praat (essai de filtrage avec un script de Cyril Auran) • Chevauchements : on perd l’information donnée par l’autre locuteur

Problèmes Autres problèmes: • Questions d’anonymisation des données: – Cette anonymisation prend du temps,

Problèmes Autres problèmes: • Questions d’anonymisation des données: – Cette anonymisation prend du temps, et ne peut Qu’est-ce qu’anonymiser? l’instant porter que sur les portions déjà – pour Qu’anonymiser? transcrites des fichiers de conversation – Comment anonymiser? –– Qui doit s’en occuper? Problèmes • Le responsable d’enquête, avant la mise en ligne • Que faire des enquêtes déjà en ligne?

Questions de transcription • Transcriptions réalisées par des non-natifs Ex: « j’arrive pas à

Questions de transcription • Transcriptions réalisées par des non-natifs Ex: « j’arrive pas à les énuer » (sgacm 1 g) => « j’arrive pas à les énumérer » « Je récupère plus grand bonheur » (sgacm 1 g) => « Avec le, plus grand bonheur » • Non-natifs de la variété transcrite: expressions et prononciations spécifiques. Ex: (Sylvain) => Fouilla, cette affaire de pitanche, beauseigne, il me fout le babeau, il est a cacasson dans la gandouse.

Questions de transcription • Question des onomatopées Bulletin PFC n° 1: (onomatopées chchch) ex:

Questions de transcription • Question des onomatopées Bulletin PFC n° 1: (onomatopées chchch) ex: -n’t (13 baa 1 l) -p’t (85 agm 1 g) -rha (bgacg 1 l) -f injectif (svaab 1 l) • Discours rapporté imbriqué RB 1: Puis il me dit 'oui, puis peut-être d'un côté ça sera bien, les gens, ils diront ah zut, il est vendu'. (svajb 1 l)

Etiquetage thématique et fiches pédagogiques (L. Floch) • Pour l’enseignement/apprentissage du FLE : intérêt

Etiquetage thématique et fiches pédagogiques (L. Floch) • Pour l’enseignement/apprentissage du FLE : intérêt des contenus thématiques, nécessité de séquences courtes (30 sec – 2 min). • Récupération des extraits thématisés dans les ressources didactiques (par thème, titre, lieu, durée). • Chaque fiche fait appel à un ou plusieurs extraits sonores d’un ou plusieurs enregistrements d’un ou plusieurs locuteurs…

Ajout d’une tire « thématique » sous Praat :

Ajout d’une tire « thématique » sous Praat :

Exploitation pédagogique du sous-corpus DGLFLF (et de la base PFC dans son ensemble) :

Exploitation pédagogique du sous-corpus DGLFLF (et de la base PFC dans son ensemble) : des fiches « prêtes-à-l’emploi » pour les enseignants de français Types d’activités : • • Compréhension Prononciation Lecture/écriture Grammaire Variation Discours oral Rapport écrit/oral • • • Questions ouvertes ou fermées QCM, grilles d’écoute Exercices de repérage Exercices de discrimination Exercices de reconstruction Exercices de réécriture

Ressources didactiques :

Ressources didactiques :

du niveau A 1 au niveau universitaire quelques exemples : Parcours de compréhension :

du niveau A 1 au niveau universitaire quelques exemples : Parcours de compréhension : réenregistrement d’un dialogue de type méthodes (simplifications, réductions, choix du lexique, choix des expressions utilisées) à l’enregistrement authentique Niveaux avancés : • écrit oralisé/oral spontané • aspect interactionnel (type d’interactions, déroulement conversationnel, alternance des tours de parole, etc. ) • étude des marqueurs discursifs Phonologie : intonation, rythme, schwa, liaison, rapport graphie/phonie, registres, etc. Locuteurs A B C Les difficultés rencontrées… Caractéristiques phonologiques x x

Espace Présentation du français oral (D. Le Gac) • L’espace « Présentation du français

Espace Présentation du français oral (D. Le Gac) • L’espace « Présentation du français oral » : – Les caractéristiques du français oral – Une vitrine pour le volume Ophrys: extraits, références systématiques aux chapitres du volume d’Ophrys • PLAN: – Situation, registres et styles de paroles – Aspects morphosyntaxiques, lexicaux; les alternances codiques, la prosodie – Variation phonétique: • • • Français septentrionales (Paris, Dijon, Roanne, Vendée) Français du midi (Biarritz, Lacaune, Douzens, Marseille) Nyon & la Haute-savoie La Guadeloupe & la Réunion Côte d’Ivoire Etc.

Espace Présentation du français oral

Espace Présentation du français oral

Espace Présentation du français oral

Espace Présentation du français oral

Espace Présentation du français oral

Espace Présentation du français oral

Espace schwa (D. Nouveau)

Espace schwa (D. Nouveau)

Espace schwa (D. Nouveau) Espace généraliste situé dans la rubrique Le français expliqué •

Espace schwa (D. Nouveau) Espace généraliste situé dans la rubrique Le français expliqué • architecture harmonisée avec l’espace liaison • accent sur la perception et la conscientisation aux réalités diverses du phénomène en faisant appel à illustrations sonores de la base • créer aussi des renvois (liens) vers des pages spécifiques de "commentaires sur enquêtes" ou des résultats de recherche qui nous semblent pertinents.

Harmonisation des vitrines schwa et liaison Qu’est-ce que X ? • Définition et principes

Harmonisation des vitrines schwa et liaison Qu’est-ce que X ? • Définition et principes généraux • Complexité ayant trait à la variation du phénomène, avec idée d’ alternance (caractéristiques, par ex. géographique, stylistique) • Petit aperçu de la diversité des usages illustrée par exemples sonores de PFC • Les rapports à la graphie Caractéristiques de X dans les variétés septentrionales e muet : différents contextes (en position finale, interne, etc). liaison : longueur, cohésion syntaxique, métrique, etc. La variation en francophonie Traiter la variation géographique du sud de la France et des autres pays francophones (Europe, Afrique, Canada) en nous basant sur les sous-corpus de PFC Les autres variations Traiter la variation stylistique

Espace schwa (D. Nouveau)

Espace schwa (D. Nouveau)

Espace schwa (D. Nouveau)

Espace schwa (D. Nouveau)

Espace schwa (D. Nouveau) http: //www. projet-pfc. net/? pfc-ef: frexplique: schwa A court terme

Espace schwa (D. Nouveau) http: //www. projet-pfc. net/? pfc-ef: frexplique: schwa A court terme : • poursuivre le remplissage des rubriques • illustrer à partir des enregistrements de la base • développer en parallèle des ressources didactiques pour la perception et rapport graphie/phonie (pour CD ROM Ophrys) A moyen terme : • La variation en francophonie : sous-espace collaboratif à étoffer/enrichir par les participants (façon wikipédia).

Site PFC-EF (A. Tchobanov)

Site PFC-EF (A. Tchobanov)

Merci de votre attention !

Merci de votre attention !