Valorisation des corpus oraux dveloppements rcents de PFCEF
- Slides: 36
Valorisation des corpus oraux: développements récents de PFC-EF (PFC-Enseignement du français) Sylvain DETEY, David LE GAC, Lucie FLOCH Université de Rouen Annelise COQUILLON, Sylvain NAVARRO Université de Toulouse II Dominique NOUVEAU Université Radboud de Nimègue Atanas TCHOBANOV CNRS UMR 7114 Modyco 11/12/08 – MSH Paris – Colloque Phonologie du Français Contemporain : variation, interfaces, cognition
PLAN 1) S. Detey: chantiers (volume Ophrys, sous-corpus DGLFLF) 2) A. Coquillon & S. Navarro: transcription et anonymisation 3) L. Floch: étiquetage thématique et fiches pédagogiques 4) D. Le Gac: espace Présentation du français oral 5) D. Nouveau: espace Schwa 6) A. Tchobanov: le site PFC-EF
Chantiers PFC-EF (S. Detey) (pour rappel : PFC-EF lancé en décembre 2006, cf. Bulletin PFC n° 7 en ligne sur le site PFC) 1) Un volume-ressource: Le français parlé contemporain dans ses variétés: ressources pour l’étude du français (Eds. S. Detey, J. Durand, B. Laks, C. Lyche) A paraître en 2009 chez Ophrys (coll. L’Essentiel français) Volume de référence sur le français parlé contemporain dans l’espace francophone, illustré de manière systématique par des extraits sonores transcrits accompagnés de commentaires descriptifs, qui constituent des ressources linguistiques pour l’étude et l’enseignement/apprentissage du français, abordé selon plusieurs axes : culturel & lexical, syntaxique & discursif, phonétique & phonologique.
36 contributeurs, 21 universités • ANDREASSEN, Helene Nordgard (Université de Tromsø (Norvège)) • BORDAL, Guri (Université d’Oslo (Norvège)) • BOUTIN, Akissi Béatrice (Université de Toulouse II (France) et Université d’Abidjan (Côte d’Ivoire)) • COQUILLON, Annelise (Université de Toulouse II (France)) • DETEY, Sylvain (Université de Rouen (France)) • DURAND, Jacques (Université de Toulouse II (France)) • EYCHENNE, Julien (Université Simon Fraser (Canada)) • HALL, Damien (Université de Pennsylvanie (Etats-Unis)) • HAMBYE, Philippe (Université catholique de Louvain (Belgique)) • HANSEN, Anita Berit (Université de Copenhague (Danemark)) • KELLY, Stéphanie (Université de Western Ontario (Canada)) • KLINGLER, Thomas (Université de Tulane (Etats-Unis)) • LAFLEUR, Amanda (Université de Louisiane (Etats-Unis)) • LAKS, Bernard (Université de Paris X (France)) • LE GAC, David (Université de Rouen (France)) • LEDEGEN, Gudrun (Université de la Réunion (France)) • LEROY, Sarah (CNRS, Modyco (France)) • LONNEMMANN, Birgit (Université de Düsseldorf (Allemagne)) • LYCHE, Chantal (Université d’Oslo et de Tromsø (Norvège)) • MAITRE, Raphaël (Université de Neufchâtel (Suisse)) • MALLET, Géraldine-Mary (Université de Paris X (France)) • MEISENBURG, Trudel (Université de Osnabrück (Allemagne)) • NOUVEAU, Dominique (Université de Radboud de Nimègue (Pays-Bas)) • ØSTBY, Kathrine (Université d’Oslo (Norvège)) • PAGLIANO, Claudine (Université de Nice (France)) • POIRE, François (Université de Western Ontario (Canada)) • PRIGNITZ, Gisèle (Université de Pau (France) et Université de Ouagadougou (Burkina Faso)) • PUTSKA, Elissa (Ludwig-Maximilians-Universität (Allemagne)) • RACINE, Isabelle (Université de Genève (Suisse)) • ROSSI-GENSANE, Nathalie (Université de Toulouse II (France)) • SIMON, Anne-Catherine (Université catholique de Louvain (Belgique)) • TARRIER, Jean-Michel (Université de Toulouse II (France)) • TCHOBANOV, Atanas (CNRS, Modyco (France)) • VORDERMAYER, Martin (Ludwig-Maximilians-Universität (Allemagne)) • WALKER, Douglas (Université de Calgary (Canada)) • WILMET, Régine (Université catholique de Louvain (Belgique))
Sommaire Introduction à l’ouvrage Carte du monde avec points d’enquête Carte de France, Suisse et Belgique avec points d’enquête Liste des symboles et abréviations Tableau de l’Alphabet Phonétique International Partie I. Le français parlé : arrière-plan descriptif et théorique Ch. 1. Les variétés du français parlé contemporain : approche, méthodologie et données (Detey, Durand, Laks, Lyche) Ch. 2. Eléments de description de l’oral (Durand) Ch. 3. La variation socio-phonologique illustrée (Tarrier) Ch. 4. Oralité, syntaxe et discours (Rossi-Gensane)
Partie II. La France hexagonale septentrionale Ch. 1. Le français de référence : éléments de synthèse (Lyche) Ch. 2. Le français de référence : quels locuteurs ? (Detey & Le Gac) Ch. 3. Conversation à Paris dans la haute bourgeoisie : l’enseignement secondaire (Østby) Ch. 4. Conversation à Paris avec un étudiant : un parcours scolaire difficile (Hansen) Ch. 5. Conversation à Darnétal (Seine-Maritime) : la télévision dans les loisirs (Hall & Lyche) Ch. 6. Conversation à Roanne (Loire) : voyage de la classe 54 dans le Sud marocain (Nouveau) Ch. 7. Conversation à Treize Vents (Vendée) : le réseau social des jeunes dans un petit village (Mallet) Ch. 8. Conversation à Ogéviller (Meurthe-et-Moselle ) : les enfants d’hier et d’aujourd’hui, l’éducation se perd (Pagliano & Le Gac) Ch. 9. Conversation à Magland (Haute-Savoie) : regard sur la vie d’autrefois (Pustka & Vordermayer) Partie. III. La France hexagonale méridionale Ch. 1. Le français méridional : éléments de synthèse (Coquillon & Durand) Ch. 2. Conversation à Douzens (Aude) : retour sur les deux guerres mondiales (Durand & Rossi-Gensane) Ch. 3. Conversation à Lacaune (Tarn) : une leçon d’école buissonnière (Lonnemann & Meisenburg) Ch. 4. Conversation à Marseille (Bouches-du-Rhône) : un cuisinier dans la marine (Coquillon) Ch. 5. Conversation à Bayonne (Pyrénées-Atlantiques) : langue et identité au Pays basque (Eychenne) Ch. 6. Conversation avec une Aveyronnaise. . . à Paris : les Parisiens vus par une Provinciale (Pustka)
Partie IV. La Belgique (Hambye, Simon & Wilmet) Ch. 1. Le français de Belgique : éléments de synthèse Ch. 2. Conversation à Gembloux (province de Namur) : deux enfants bien différents Ch. 3. Brève conversation à Ivoz-Ramet (province de Liège) : vivre au quotidien après la maladie Ch. 4. Brève conversation à Tournai (Hainaut) : la vie estudiantine Ch. 5. Brève conversation à Zellik (Brabant flamand) : les tensions entre communautés linguistiques Ch. 6. Brève conversation à Molenbeek-Saint-Jean (Région de Bruxelles-Capitale) : l’argent de poche des enfants Partie V. La Suisse (Andreassen, Maître et Racine) Ch. 1. Le français de Suisse romande : éléments de synthèse Ch. 2. Conversation à Gland (canton de Vaud) : la culture suisse Ch. 3. Brève conversation à Veyras (canton du Valais) : la menuiserie Ch. 4. Brève conversation à Meinier (canton de Genève) : la fête de l’Escalade Ch. 5. Brève conversation à Bévilard (canton de Berne) : l’enjeu du bilinguisme dans un canton franco-allemand
Partie VI. L’Afrique et les DROM Ch. 1. Le français d’Afrique et des DROM: éléments de synthèse (Boutin) Ch. 2. Conversation à Bejaia (Algérie) : les femmes et le mariage (Leroy) Ch. 3. Conversation à Abidjan (Côte d’Ivoire) : des études mouvementées dans les années soixante (Boutin) Ch. 4. Conversation à Ouagadougou (Burkina Faso) : parenté à plaisanterie entre Gurma et Yatenga (Prignitz & Boutin) Ch. 5. Conversation à Ilet à Cordes (Ile de la Réunion) : arrivée du téléphone et de la route (Bordal & Ledegen) Ch. 6. Conversation à Petit-Canal (Guadeloupe) : la fête de Noël (Pustka) Partie VII. L’Amérique du Nord Ch. 1. Le français d’Amérique du Nord: éléments de synthèse (Eychenne & Walker) Ch. 2. Conversation à Québec ville (Québec, Canada) : la religion pour un jeune Québécois (Kelly) Ch. 3. Conversation à Belle-Rivière (Ontario, Canada) : la transmission du français en milieu minoritaire (Poiré) Ch. 4. Conversation à Rivière-la-Paix (Alberta, Canada) : la francophonie rurale dans l’Ouest canadien (Walker) Ch. 5. Conversation à la Ville Platte (Louisiane, Etats-Unis) : langue et musique en Louisiane (Lyche, Klingler & La. Fleur) Références
Sommaire du CD-ROM (responsable : A. Tchobanov) Annexe 1. Exploitation pédagogique des données PFC (Detey, Nouveau & Floch) Annexe 2. Navigation en ligne dans la base PFC (Tchobanov) Annexe 3. Glossaire Annexe 4. Références bibliographiques complètes Annexe 5. Transcriptions (version imprimable) Annexe 6. Enregistrements
Structure: • • • Cadrage théorique: éléments de description de l’oral (phonologie, variation, syntaxe) Chapitres de synthèse: FR, FM, FB, FS, FA, FC. . . Chapitres-commentaires: – – Introduction Aspects culturels & lexicaux Aspects discursifs & syntaxiques Aspects phonétiques et phonologiques Spécificité: • Volume multi-public: – – – • Volume multi-usage: – – • Enseignants de français (ressources pré-didactiques) Etudiants de linguistique française et apprenants avancés de français Enseignants-chercheurs en linguistique française Enregistrements et transcriptions, pour du FLE et/ou de l’analyse Commentaires à trois niveaux Lecture aisée: peu de références, de métalangage technique, style épuré, commentaires axés sur l’extrait, transcriptions normalisées. . . • Introduction à la base PFC: vers davantage de données accessibles gratuitement. . . Utilité: réaction de Mlle Floch (enseignante FLE) au sujet des variétés: « Je n’ai pas assez d’information pour faire travailler mes étudiants sur les variétés de français » précisément la fonction du volume !
2ème chantier PFC-EF: le sous-corpus DGLFLF • Marché Numérisation ILF-TUL-DGLFLF (partie « Valorisation des usages » ) Financement 2008 de PFC-EF: 4 KE. Vacations: – Sylvain Navarro (Doctorant, Toulouse II) pour vérification de transcription et anonymisation de sous-corpus, supervisé par A. Coquillon. – Lucie Floch (M 2 pro. , Rouen) pour réalisation de fiches pédagogiques et étiquetage thématique du sous-corpus, supervisée par S. Detey & D. Le Gac. Sous-corpus DGLFLF (Abidjan, Aix-Marseille, Biarritz, Gembloux, Genève, Paris, Vendée. . . ) Merci à: H. Andreassen, B. Boutin, A. Coquillon, J. Durand, J. Eychenne, P. Hambye, C. Lyche, G. Mallet, K. Østby, A. -C. Simon. . . • Appel à proposition Valorisation et usages de corpus oraux DGLFLF. Financement 2009 de PFC-EF: 16 KE. Poursuite du travail. • Intégration au site PFC-EF et au site corpusdelaparole. fr
Du sous-corpus DGLFLF à la base PFC: questions d’anonymisation et de transcription (A. Coquillon et S. Navarro) • Questions d’anonymisation des données: – Qu’est-ce qu’anonymiser? – Qu’anonymiser? – comment? – Problèmes
Qu’est-ce qu’anonymiser? • Anonymisation : Opération par laquelle se trouve supprimé d’un ensemble de données recueillies auprès d’un individu ou d’un groupe tout lien permettant l’identification de ces derniers (Corpus Oraux, guide des bonnes pratiques 2006, DGLFLF, O. Baude) Þ Si l’on respecte ces consignes à la lettre, toutes les conversations guidées posent problème Þ Question des fiches de consentement. . . Þ contradiction éventuelle entre anonymisation et disponibilité des détails pour l’analyse
Qu’anonymiser? • Questions desde données: – Donnéesd’anonymisation personnelles (numéros téléphone, – Qu’est-ce qu’anonymiser? adresse, etc. ) –– Qu’anonymiser? Noms propres – comment? • sauf noms de personnes publiques (propos non diffamatoires) – Problèmes – Sigles d’entreprises • notamment si citées dans des propos diffamatoires ÞLes décisions restent subjectives
Comment anonymiser? • Texte: • Questions d’anonymisation des données: – Pas d’hyperonymes du type : « nom propre » ; entreprise qu’anonymiser? » , etc. => lisibilité du texte (notamment en – «Qu’est-ce didactique) –– Qu’anonymiser? Utilisation de pseudonymes trop lourde Comment anonymiser? –– Initiales: peuvent être confondues avec les initiales des ou de réelles initiales – locuteurs Problèmes Þ Opter pour les deux 1ères lettres des noms • Problème: lorsque 2 noms différents sont confondus Ex: Monsieur Durand et Monsieur Dusse => Du. • Sigles (S. N. C. M. => So. ? )
Comment anonymiser? • Le son: – Pas d’insertion de silence: peut être confondu avec des pauses silencieuses – Pas de « réversion » du signal: peut induire en erreur sur ce qui est dit, l’anonymisation n’est pas claire et est réversible! Þ Opter pour un bip dans le signal • Problème: ne se fait pas sous Praat (essai de filtrage avec un script de Cyril Auran) • Chevauchements : on perd l’information donnée par l’autre locuteur
Problèmes Autres problèmes: • Questions d’anonymisation des données: – Cette anonymisation prend du temps, et ne peut Qu’est-ce qu’anonymiser? l’instant porter que sur les portions déjà – pour Qu’anonymiser? transcrites des fichiers de conversation – Comment anonymiser? –– Qui doit s’en occuper? Problèmes • Le responsable d’enquête, avant la mise en ligne • Que faire des enquêtes déjà en ligne?
Questions de transcription • Transcriptions réalisées par des non-natifs Ex: « j’arrive pas à les énuer » (sgacm 1 g) => « j’arrive pas à les énumérer » « Je récupère plus grand bonheur » (sgacm 1 g) => « Avec le, plus grand bonheur » • Non-natifs de la variété transcrite: expressions et prononciations spécifiques. Ex: (Sylvain) => Fouilla, cette affaire de pitanche, beauseigne, il me fout le babeau, il est a cacasson dans la gandouse.
Questions de transcription • Question des onomatopées Bulletin PFC n° 1: (onomatopées chchch) ex: -n’t (13 baa 1 l) -p’t (85 agm 1 g) -rha (bgacg 1 l) -f injectif (svaab 1 l) • Discours rapporté imbriqué RB 1: Puis il me dit 'oui, puis peut-être d'un côté ça sera bien, les gens, ils diront ah zut, il est vendu'. (svajb 1 l)
Etiquetage thématique et fiches pédagogiques (L. Floch) • Pour l’enseignement/apprentissage du FLE : intérêt des contenus thématiques, nécessité de séquences courtes (30 sec – 2 min). • Récupération des extraits thématisés dans les ressources didactiques (par thème, titre, lieu, durée). • Chaque fiche fait appel à un ou plusieurs extraits sonores d’un ou plusieurs enregistrements d’un ou plusieurs locuteurs…
Ajout d’une tire « thématique » sous Praat :
Exploitation pédagogique du sous-corpus DGLFLF (et de la base PFC dans son ensemble) : des fiches « prêtes-à-l’emploi » pour les enseignants de français Types d’activités : • • Compréhension Prononciation Lecture/écriture Grammaire Variation Discours oral Rapport écrit/oral • • • Questions ouvertes ou fermées QCM, grilles d’écoute Exercices de repérage Exercices de discrimination Exercices de reconstruction Exercices de réécriture
Ressources didactiques :
du niveau A 1 au niveau universitaire quelques exemples : Parcours de compréhension : réenregistrement d’un dialogue de type méthodes (simplifications, réductions, choix du lexique, choix des expressions utilisées) à l’enregistrement authentique Niveaux avancés : • écrit oralisé/oral spontané • aspect interactionnel (type d’interactions, déroulement conversationnel, alternance des tours de parole, etc. ) • étude des marqueurs discursifs Phonologie : intonation, rythme, schwa, liaison, rapport graphie/phonie, registres, etc. Locuteurs A B C Les difficultés rencontrées… Caractéristiques phonologiques x x
Espace Présentation du français oral (D. Le Gac) • L’espace « Présentation du français oral » : – Les caractéristiques du français oral – Une vitrine pour le volume Ophrys: extraits, références systématiques aux chapitres du volume d’Ophrys • PLAN: – Situation, registres et styles de paroles – Aspects morphosyntaxiques, lexicaux; les alternances codiques, la prosodie – Variation phonétique: • • • Français septentrionales (Paris, Dijon, Roanne, Vendée) Français du midi (Biarritz, Lacaune, Douzens, Marseille) Nyon & la Haute-savoie La Guadeloupe & la Réunion Côte d’Ivoire Etc.
Espace Présentation du français oral
Espace Présentation du français oral
Espace Présentation du français oral
Espace schwa (D. Nouveau)
Espace schwa (D. Nouveau) Espace généraliste situé dans la rubrique Le français expliqué • architecture harmonisée avec l’espace liaison • accent sur la perception et la conscientisation aux réalités diverses du phénomène en faisant appel à illustrations sonores de la base • créer aussi des renvois (liens) vers des pages spécifiques de "commentaires sur enquêtes" ou des résultats de recherche qui nous semblent pertinents.
Harmonisation des vitrines schwa et liaison Qu’est-ce que X ? • Définition et principes généraux • Complexité ayant trait à la variation du phénomène, avec idée d’ alternance (caractéristiques, par ex. géographique, stylistique) • Petit aperçu de la diversité des usages illustrée par exemples sonores de PFC • Les rapports à la graphie Caractéristiques de X dans les variétés septentrionales e muet : différents contextes (en position finale, interne, etc). liaison : longueur, cohésion syntaxique, métrique, etc. La variation en francophonie Traiter la variation géographique du sud de la France et des autres pays francophones (Europe, Afrique, Canada) en nous basant sur les sous-corpus de PFC Les autres variations Traiter la variation stylistique
Espace schwa (D. Nouveau)
Espace schwa (D. Nouveau)
Espace schwa (D. Nouveau) http: //www. projet-pfc. net/? pfc-ef: frexplique: schwa A court terme : • poursuivre le remplissage des rubriques • illustrer à partir des enregistrements de la base • développer en parallèle des ressources didactiques pour la perception et rapport graphie/phonie (pour CD ROM Ophrys) A moyen terme : • La variation en francophonie : sous-espace collaboratif à étoffer/enrichir par les participants (façon wikipédia).
Site PFC-EF (A. Tchobanov)
Merci de votre attention !
- Triafeni
- Methode de valorisation des stock
- Valorisation des terres
- Calcul du cmpc
- Bouchon nomacorc
- Dénutrition
- Compléments nutritionnels oraux
- Petek korkusuz
- Oogenesis process
- Volarisation
- Slag valorisation symposium 2021
- Des des des
- Budget des ventes
- Diversification des espaces et des acteurs de la production
- Je t'offrirai des fleurs et des nappes en couleurs
- La diffusion des idées des lumières
- Le volume d'un corps
- Robin des bois des alpes
- Il existe des personnes qui sont des lumières pour tous
- Volume des liquides et des solides
- Triple des attack
- Affiche de propagande plan marshall
- Présent d'actualité
- Cartographie des flux de valeur
- Hiatushernie
- Pyelon
- Corpus callosum definition and function
- Corpus striatum function
- Clapi corpus
- Parvozelluläre kerne
- Tinia corpus
- Metathalamus
- Missions and presidios in texas
- La ley es dura pero es la ley
- Corpus construction
- Crime scence investigator
- Corpus ventriculi