TOILE CONTRE DICTIONNAIRES ANALYSE MORPHOLOGIQUE EN CORPUS DE

  • Slides: 3
Download presentation
TOILE CONTRE DICTIONNAIRES : ANALYSE MORPHOLOGIQUE EN CORPUS DE NOMS DÉVERBAUX CONCURRENTS Wes. Con.

TOILE CONTRE DICTIONNAIRES : ANALYSE MORPHOLOGIQUE EN CORPUS DE NOMS DÉVERBAUX CONCURRENTS Wes. Con. Va (Web, Suffixation, Concurrence de déVerbaux d’Action) Projet soutenu par l’Institut de Linguistique Française Georgette DAL (SILEX - Université Lille 3) Stéphanie LIGNON (ERSS - Université de Haute-Alsace) Objectifs : q Étude des phénomènes constructionnels concurrents susceptibles de former des déverbaux d’action (conversion, -age, -ment, -tion, -ure, Méthode : etc. ) avec une approche quantitative et contextuelle des données. q Comparaison entre lexique attesté dans corpus de référence (nomenclatures du TLFi et du Robert Électronique) et sur le Web. Fiammetta NAMER (ATILF CNRS-Université Nancy 2) Ludovic TANGUY (ERSS - Université Toulouse-Le Mirail) TLFi + Robert Électronique (Nomenclatures) 400 000 formes fléchies q Comprendre les raisons motivant une nouvelle création de déverbal. q Déterminer les paramètres qui conditionnent le choix de la (des) forme(s) du (des) déverbal(aux), notamment en ce qui concerne la concurrence -age/-ment qui constitue la concurrence la plus fréquente et, de ce fait, la plus étudiée en testant diverses hypothèses : Extractage des verbes Þ Existence d'une distinction sémantique entre –age et –ment ; . . . encuistrer encuver encyclopédier. . . Liste des verbes 10 200 verbes Þ Influence du domaine et du type d'emploi ; Þ Impact de la structure argumentale de la base verbale et proto-rôle de ces mêmes arguments. Données Le premier chiffre correspond au nombre de déverbaux attestés dans le corpus dictionnairique et dans le Web, le deuxième chiffre au nombre de déverbaux attestés dans le corpus dictionnairique • Classes de Verbes : … encuirasser encuistrer encuver endauber endenter … 00 10 21 11 11 encuvade encuvage encuvance encuvement encuvation Liste de déverbaux-candidats 64 000 candidats Répartition des différentes classes de verbes Deux déverbaux attestés dans dico+Web Un seul déverbal dans dico encuirassement encuvage endaubage endentement encuvement WALIM/Webaffix/ Cherchage sur Web + filtrement Liste des déverbaux récupérés dans le TLFi + RE NOM encuvage encuvement Suffixe age ment encuvage Attesté TLF+RE OUI NON Statut Lexical correct Statut Morphologique déverbal Verbe encuver Type d'emploi technique Domaines viticulture maçonnerie Champs remplis manuellement. Permettent vérifier la validité des occurrences trouvées : -Statut lexical = correct, faute d'orthographe, autre catégorie, autre langue, archaïsme, etc. -Statut morphologique = déverbal ou non Autres déverbaux repérés 198 243 Pages Analysées 32 27 Occurrences Analysées 47 61 Champs remplis manuellement. Permettent d'évaluer la sélection affixale en fonction de la répartition en domaines et en types d'utilisation des différents déverbaux Cherchage sur TLFi/RE Données : Liste de déverbaux attestés 9 939 déverbaux dont 5 023 non-attestés dans TLF/RE Pages Web (contexte) 166 000 pages Web analysées Liste des déverbaux récupérés sur le Web § Fiches générées automatiquement : Pages Référencées Déri. F Suffixement à base de règles : -ade, -age, -ance, -ence, -ment, -tion 198 Documents référencés sur Google SUFFIXE : -age 32 Pages analysées … http: //perso. wanadoo. fr/domainedeleyre-loup/La. Vinification. htm : grappes, complété par un tri systématique lors de l’ encuvage (le remplissage des cuves), afin de garantir la http: //www. ampelidae. com/les_savoirs. htm : est nécessaire ils peuvent être refroidis avant encuvage. Une partie des raisins rouges sont coupés en http: //www. charlesjoguet. com/fr/les-vins/accueil. php 3 : La vendange est égrappée au dernier moment avant l' encuvage , pour limiter le plus possible l'oxydation des http: //www. beaujolais. net/pages/vins. Du. B/sav_faire/FR/vinification. asp : L'intégrité des grappes est maintenue grâce à un encuvage par gravité ou par tapis roulant. … 47 Occurrences au total --- VOISINS: Mot Fréquence Macération 8 Raisins 7 Vinification 6 Grappes 5 Vendange 5 Chai 5 Fermentation 5 Deg 5 Afin 4 Lors 4 Froid 4 encuvement Encuver : encuvage (dico) encuvement (nouveau) « La vinification en rouge est très classique, avec un encuvage de raisins foulés. » http: //www. vinsdubugey. net/vinifications. htm 243 Documents référencés sur Google SUFFIXE : -ment 27 Pages analysées … http: //6 juin. omaha. free. fr/allem/al-def. htm : batteries d'artillerie dont les canons, seront en " encuvement " ou à l'abri dans des "casemates" en béton. Les http: //monsite. wanadoo. fr/batteries_cotentin/page 5. html : Voici le canon de 155 mm dans un encuvement à Gatteville en 1944 (USIS) ses canons furent sortis des casemates et mis en encuvement au moment des combats. http: //perso. club-internet. fr/guijp/loire. htm : de l'Atlantique. On y trouve un 8, 8 cm Flak 18 en encuvement , une casemate H 611 en défense de plage, un très http: //musee-batiment. pays-allier. com/glossaire%20 detaille. htm : Pièce horizontale qui, dans une ferme à encuvement , relie la sablière à la jambe de force. portant le faux entrait dans le cas d'un comble à encuvement. … 61 Occurrences au total --- VOISINS: Mot Fréquence 1 17 Pièce 12 2 10 Canon 9 Tobrouk 9 Batterie 8 Flak 7 Wn 7 Char 7 Assemblage 6

Résultats Répartition quantitative –age/-ment Ø A partir de données brutes (tableaux 1 et 2)

Résultats Répartition quantitative –age/-ment Ø A partir de données brutes (tableaux 1 et 2) Statistiques établies sur des données massives mais brutes (Tableaux 1 et 2) : Tableau 2 : Répartition des couples -age/-ment Ø -ment et –age sont les deux suffixes qui entrent le plus souvent en concurrence puisqu'il s'agit du couple d'opposition affixale le plus représenté ; Tableau 1 : Nombre de déverbaux obtenus Ø quantitativement, ils sont représentés de façon équivalente au sein des déverbaux (Tableau 1); Ø Ils sont tout autant disponibles dans la formation de néologismes (Tableau 2). Il semble donc qu'il n'y ait pas de dominance nette de l'un ou l'autre de ces deux affixes dans la formation de déverbaux. Domaines d'emploi Pour près d'un tiers des néologismes, le domaine d'emploi ne recouvre pas le domaine d'emploi du dérivé attesté dans notre référentiel dictionnairique (Tableaux 3 et 4). Ø Sur un échantillon de données : 80 verbes examinés manuellement (tableaux 3 et 4) Tableau 3 : Répartition des domaines d'emploi des nouveaux déverbaux en -age DOMAINES Pourcentage Domaines identiques Restriction de domaines 25, 86 24, 14 Amincir : amincissage/amincissement Tableau 4 : Répartition des domaines d'emploi des nouveaux déverbaux en -ment DOMAINES Domaines identiques Restriction de domaines Pourcentage 36, 36 27, 27 Domaines disjoints 22, 41 Domaines disjoints 18, 18 Domaines en recouvrement partiel 15, 52 Domaines en recouvrement partiel 13, 64 Extension de domaines 12, 07 Extension de domaines 4, 55 NOM amincissage amincissement Suffixe age ment Attesté TLF+RE Non Oui Amincissage : "Gamme abrasifs pour le cuir : travail à sec ou travail, nettoyage chair, amincissage, veloutage, finitions, gamme complète en stock. " Statut Lexical correct Statut Morphologique déverbal Verbe amincir http: //www. azemar. fr/htfr/0002. htm Type d'emploi technique général Domaine tannerie, textile médecine, santé, météorologie, zoologie, philatélie. . . Pages Référencées 10 17410 Pages Analysées 8 27 Occurrences Analysées 9 150 RELATIONS DOMAINES Disjoints Contextes Aminicissage des coutures centre d'aminicissement techniques d'aminicissage cure d'aminicissement système d'aminicissage des coutures amincissement de la couche d'ozone Amincissement : "Dîtes adieu aux kilos qui vous obsèdent et gâchent votre quotidien. Cathy, spécialiste de l'amincissement vous proposera des programmes de soins sur mesure après un bilan personnalisé complet (alimentaire, corporel, mode de vie, impédance métrie). Cliquez pour agrandir. " http: //www. azemar. fr/htfr/0002. htm aminicissement de la lithosphère institut de beauté et d'amincissement produit d'amincissement Jeux de langage Poésie : "[. . . ] tout enfui enfoui recouvert scellé, oh toi, saleté, contre l'angoisse de la page blanche idéale panacée, fauve enragé radical épitomé, massacrage, capitulation désespérée, bousillage, épilogue goguenard (épinard!), anéantissage saboté. . . , bah. . . sabotage!" (http: //home. inter. net/berlol/feu. htm) Rafales : "Thomas DANZEISEN: saxophones, objets divers, Christophe RYSER: contrebasse, objets divers. Duo né de l'envie de sortir de leurs contextes musicaux individuels et à la recherche du terrain propice à l'expérimentation. Trifouillage, grinçage, soufflage, pinçage, grattage, . . et ceterage. " (http: //www. amr-geneve. ch/prog 2000/aout/overground%20 detail. htm) Blagues et calembours divers "On a passé la nuit sous tente, et le lendemain à 7 h, autrement dit aux aurores, on s'est tiré du sac d'accouchage (HAHA) tant bien que mal ! Le week-end à pris fin après un bon petit déjeuner. Un très chouette WE malheureusement "entaché" par le mauvais temps. " (http: //www. membres. lycos. fr/flambls/chron/3_00/chronique 2 eme 2000. htm) Dans les "jeux de langage", le suffixe –age est presque exclusivement le seul suffixe utilisé pour former des déverbaux d'action ludiques (ce qui tendrait à corroborer l'hypothèse que le suffixe –age est le suffixe par défaut) Rissoler : rissolement/rissolage Rissolement : "Faites les fondre lentement dans le beurre jusqu'à ce que, l'eau des champignons totalement évaporée, le rissolement s'amorce. " http: //www. sucrezsalez. com/r/m 4/11/php Rissolage : "En fin de rissolage, augmenter le feu et ajouter les petits lardons et les laisser grésiller quelques instants. Ajouter les moules. " http: //www. cadour. net/cuisine/moules. htm NOM rissolage rissolement Suffixe age ment Attesté TLF+RE Non Oui Statut Lexical correct Statut Morphologique déverbal Verbe rissoler Type d'emploi technique Domaine culinaire Pages Référencées 256 33 Pages Analysées 32 4 Occurrences Analysées 45 4 RELATIONS DOMAINES Identité Contextes Phase de rissolage rissolement du lard Début de rissolage rissolement des oignons rissolage des lardons rissolement dans la poêle poêlage et rissolage le rissolement s'amorce concentration par rissolage huile de rissolage

Calcul des N en position de complément du nom Proto-rôles Méthode : ü Recherche

Calcul des N en position de complément du nom Proto-rôles Méthode : ü Recherche systématique des occurrences sur le web ü Analyse syntaxique automatique des contextes ü Calcul des N apparaissant en position" Xage de N"/"Xment de N" De façon à observer la distribution des N en position de complément du nom par rapport à la forme du dérivé. Un de nos objectifs de départ était de valider l'hypothèse de C. Kelling (2001) selon laquelle la répartition -age/-ment serait motivée par les proto-rôles des arguments des verbes servant de base aux dérivés : Exemples : Encuver Encuvement de N centre (3) béton (2) flak (2) transformateur (2) canon (2) pièce (1) tir (1) marine (1) station (1) Débroussailler Encuvage de N raisin (9) grappe (4) vendange (3) baie (2) cépage (2) moût (2) carignan (1) pinot (1) sauvignon (1) Débroussaillement de N bande (4) totalité (3) arrêté (2) maintien (2) propriété (2) reste (2) sol (2) fossé (1) portage (1) Débroussaillage de N coteau (3) sentier (3) taillis (3) marais (2) motte (2) piste (2) question (2) sommet (2) secteur (2) C. Kelling (2001) Ø -ment premier argument de la base verbale = proto-agent Ø -age premier argument de la base verbale = proto-patient Nos résultats % de déverbaux agentifs -ment -age Total TLFi+RE 41, 25 42, 50 83, 75 WEB 18, 18 31, 03 27, 50 TOTAL 46, 25 65, 00 55, 62 La répartition observée est beaucoup moins systématique celle proposée par Kelling. On n'observe, pour l'instant, que des tendances. CONCLUSIONS PROVISOIRES Cette étude à large spectre est toujours en cours, mais elle donne accès à un très grand nombre de données sur les déverbaux en –age et –ment Encuvage/encuvement Ø Répartition des verbes en fonction des compléments de leurs déverbaux Débroussaillage / débroussaillement de N terrain (18) zone (14) site (11) abord (10) chemin (10) habitation (8) forêt (5) parcelle (5) partie (5) Les hypothèses classiques sur les distinctions ne sont pas vérifiées de façon significative sur les plans de : - la fréquence d'apparition : les déverbaux attestés dans les dictionnaires, ainsi que ceux nouvellement créés le sont dans les mêmes proportions ; - la thématique : plus de la moitié des déverbaux concurrents apparaissent dans les mêmes domaines ; - la complémentation du nom (et donc, pour une part, la signification) : plus d'un quart des couples de déverbaux présentent un recouvrement des compléments ; - le statut des proto-rôles : l'hypothèse de C. Kelling n'est pas vérifiée. Un quart des couples de déverbaux ont des compléments en commun, ce qui semble indiquer que les deux déverbaux ont les mêmes emplois et le même sens. La méthode ayant permis d'effectuer ces calculs est très restrictive. Les tests effectués manuellement ont montré que les cas de synonymie sont plus nombreux que ceux obtenus automatiquement. Le taux de synonymie réel doit être supérieur à 25%. Une étude basée sur les attestations du Web est bien entendu à prendre avec précaution, les données étant parfois peu fiables (locuteurs non natifs, erreurs typographiques, etc. ). Toutefois, la variété et la spontanéité des productions permet une approche nouvelle, notamment sur les jeux de langage, pour lesquels une distinction se fait nettement avec l'emploi quasi-exclusif de –age pour atteindre des effets comiques. BIBLIOGRAPHIE Dowty D. R. (1991), “Thematic Proto-Roles and Argument Selection”, Language 67, pp. 547– 619. Grimshaw J. (1990), Argument Structure, Cambridge, Mass. , MIT Press. Kelling C. (2001), “Agentivity and Suffix Selection”, in Proceedings of the LFG ’ 01 Conference, Stanford, CA, CSLI, pp. 147– 162. Kelling C. (2003), “The Role of Agentivity for Suffix Selection”, in G. Booij, J. De Cesaris, A. Ralli & S. Scalise eds, Acts of the Third Mediterranean Meeting on Morphology. Namer F. (2003), “Valider les unités morphologiques par le Web”, in B. Fradin, G. Dal, N. Hathout, F. Kerleroux, M. Plénat & M. Roché éds, Les unités morphologiques, Silexicales 3, Un. de Lille 3, pp. 142 -150. Plag I. (1999), Morphological productivity. Structural constraints in English derivation, Berlin/New York, Mouton de Gruyter. Tanguy L. & Hathout N. (2002), “Webaffix : un outil d'acquisition morphologique dérivationnelle à partir du Web”, in Actes de la 9 e conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN’ 02), Nancy, 24 -27 juin 2002, pp. 245 -254. Tasmowski-de Ryck L. (1977), « Tours ‑ment/‑age et génération morphologique » , SCL XXVIII-4, pp. 405 -416.