Valenn slovnk eskch sloves Zdenk abokrtsk FAL 23
Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23. 5. 2005
Jak zmenšit VALLEX? • Osnova: 1) Stručně o VALLEX 1. 0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí
VALLEX • Valence – „the range of syntactic elements either required or specifically permitted by a verb or other lexical unit“ – stát – někde, o někoho, za něco, za něčím, při někom… – odpovídat – někomu na něco, za někoho, něčemu – brát – něco někomu, za něco, roha, zasvé, … • Teorie valence ve Funkčním generativním popisu – aktanty-volná doplnění, posouvání, obligatornost… • VALLEX – valenční slovník českých sloves budovaný na základě FGP od jara 2001 – verze 1. 0 zveřejněná na podzim 2003 (cca 1400 sloves) – http: //ckl. mff. cuni. cz/zabokrtsky/vallex/1. 0
Volba termínů pro popis slovníku • Filipec, 1994 – lexém trojí úrovně: • 1. odpovídat, 2. odpovídat 2 (čemu), 3. „ Neodpovídá požadavkům“ • Mel’čuk, Žolkovskij, 1984 • vocabel (odpovídat) vs. lexeme (odpovídat 2) • Filipec, Čermák, 1985 • lexém vs. lexie • Cruse, 1986 • lexém vs. lexikální jednotka
Jak snížit počet hesel ve VALLEXu • tradiční pohled: – 1 slovníkové heslo ~ 1 lexém ~ 1 lemma • řešení: – více slovesných lemmat v jednom lexému
Sloučení vidových „dvojic“ do jediného lexému dát dávat dávávat + přiblížení k FGP (na tg. rovině je rozdíl ve vidu považován za rozdíl v morfologickém, nikoli lexikálním významu - gramatémy aspect a iterativeness) + snížení redundance slovníku (předpoklad: vidové protějšky se víc podobají než liší, rozdíly jsou výjimky) – vidové protějšky nesdílí všechny významy/rámce – problematické vymezení vidové dvojice – ztráta stromové struktury slovníku – nestandardní makrostruktura slovníku – jak má vypadat tektogramatické lemma (t-lemma v PDT 2. 0)?
Vidové dvojice • způsoby tvoření vidových dvojic: (a) – sufixace (vypsat-vypisovat) (b) – prefixace (psát-napsat) (c) – supletivní dvojice (vzít-brát) • problematické (b) – nejednoznačný dok. protějšek (zblednout/vyblednout) – hypotéza čistě vidové předpony – kritérium sekundární imperfektivizace (napisovat? ) • závěr: – ve VALLEXu do jednoho lexému raději jen (a) a (c)
Změna datové struktury • VALLEX 1. 0 lemma-pf -attr 1 -attr 2 lemma-impf -attr 1 -attr 2 • VALLEX 2. 0 lemma-pf -attr 1 -attr 2 lemma-impf -attr 1 -attr 2
Kvantitativní důsledky sloučení vidových dvojic ve VALLEX 1. 5 • před sloučením vid. dvojic: – 2451 lexémů (1338 impf, 1075 perf, 38 biasp) – 6411 lexikálních jednotek • po sloučení vidových dvojic – 1585 lexémů (866 perf+impf, 472 impf, 209 perf, 38 biasp) – 4303 lexikálních jednotek, • z toho 2623 u sloučených lexémů • z toho jen 515 lex. jednotek platilo jen pro jedno sloveso z dvojice • závěr: – sloučením vidových dvojic lze slovník zmenšit zhruba o třetinu (co do počtu lexémů i lexikálních jednotek) při zachování stejné informace
Další kandidáti na sloučení • determinovaná / nedeterminovaná slovesa – jít-chodit, jet-jezdit, běžet-běhat. . . • pro: – posun v (základním) lexikálním významu je srovnatelný s posunem u vidových dvojic • proti: – jen malá uzavřená skupina – další zkomplikování datové struktury
Jak snížit počet rámců? • tradiční pohled: – 1 podheslo (LU) ~ 1 rámec ~ 1 význam • řešení – více rámců/významů v jedné LU
Kandidáti na sloučení • • • odevzdat nález policii – na policii ukradl bance peníze – peníze z banky vyčistit šaty od bláta – bláto z šatů naložit vůz cementem – cement na vůz osázet park stromy – stromy do parku prorazit hřebík plechem – plech hřebíkem vyjít na kopec – vyjít kopec oloupat slupku z jablka – jablko umístit nábytek do bytu – nábytek v bytě slunce vyzařuje světlo – světlo vyzařuje ze slunce tričko pouští barvu – barva pouští z trička
Alternace • Volba termínu – diateze - Mel’čuk, Cholodovič, 1970 – hierarchizace – Daneš, 1985 – alternace – Levinová, 1993 • Trojí projev alternace (1) změna (povrchové) formy predikátoru (2) změna valenčního rámce (3) změna lexikálního významu Pozn. : model alternace je účelné zavádět jen tam, kde jde o pravidelné změny, které se týkají celé skupiny lexikálních jednotek
(1) Změna formy predikátoru • alternace v širokém pojetí: – pasivizace (být vybrán) – reflexivizace (mýt se) – složený tvar s pomocným slovesem (dostat slíbeno) – dispoziční modalita (Knížka se mi čte dobře. ) – ? prefixace (nachodit se - alternace přes hranice lexému!)
(2) Změna valenčního rámce • Změny ve valenčních rámcích: – přibyde aktant (Vyběhl kopec. ) – ubyde aktant (Pepík už čte. ) – záměna dvou valenčních členů s různým funktorem – např. ADDR-DIR 3 (možný souvýskyt: Poslal jeden dopis babičce a dva domů. ) – náhrada jednoho funktoru skupinou: • DIFF – DIR 1+DIR 3 , DIFF – ORIG+EFF (klesl o 10 cm/ze 150 na 140 cm), LOC – DIR 1+DIR 3
(3) Změna lexikálního významu • ne nutně zcela totožná situace, ale změna významu po provedení alternace je (pro třídu sloves, která se této alternace může účastnit) predikovatelná • různý (ontologický, pragmatický? ) vztah argumentů a predikátu –. . . hřebík. PAT plechem – plech. PAT hřebíkem
Příklad 1: „odstraňování z kontejneru“ • vybalit (dárky, kufr), vykácet (stromy, zahradu), vyklidit (pokoj, nábytek), vyložit (zboží, vagón), vysypat (popel, popelník). . . (Daneš, 1985) • změna formy predikátoru: žádná • změna valenčního rámce: ubude obl. DIR 1 (ale: vysypat popelník z okna(? )) • změna významu: – před alternací je kontejner na tg. rovině obsažen v DIR 1, po alternaci je PAT – po alternaci: předpokládáme úplnější dokončení děje (vykácel zahradu ~ vykácel ze zahrady všechny stromy)
Příklad 2: dispoziční modalita • dobře se mi čte (ta kniha) (ale: *zná se mi dobře, *umí se mi dobře, *cítí se mi dobře) • změna formy predikátu: reflex. • změna valence: přibude hodnotící obl. MANN, ACT(3) a non-obl PAT(1) • změna významu: modální příznak
Příklad 3: „ztranzitivnění“ sloves pohybu • vyjít/vyběhnout/vyjet/vylézt na kopec/kopec • změna formy predikátu: žádná • změna valence: ubude obl. DIR 3, přibude obl. PAT • změna významu: před alternací jde jen o dosažení cíle, po alternaci jde o zdolání úseku
ČNK: plavat + ak.
Alternační model valenčního slovníku LEXÉM LEX. FORMY lemma 1 lemma 2 LEX. JEDNOTKA RÁMEC . . LEX. FORMY lemma 1 lemma 2 LEX. JEDNOTKA ZÁKL. RÁMEC ODV. RÁMCE . .
Další výhody alternačního modelu – valence komparativů a superlativů • tatáž lexikální jednotka, ale jiná valence – valence substantiv („přetížený“ genitiv) • Karlův dluh dvou miliónů / dluh Karla – valence anglických sloves • He gave Mary a book / He a book to Mary. – „nadfunktory“ • DIR 1 -TFRWH: pochází z osmého století / ze střední Asie – krok k vyšší (sémanticko-logické? ) rovině popisu jazyka • napustil vanu vodou napustil vodu do vany
Závěr • sloučení vidových dvojic – významné snížení redundance slovníku – přiblížení FGP – komplikovanější datová struktura slovníku • alternační model valenčního slovníku – snížení redundance slovníku – jednotný mechanismus pro popis řady dosud (v rámci VALLEXu) nezachytitelných situací – zásah do valenční teorie FGP – komplikovanější datová struktura slovníku • otevřené otázky. . .
„Lituji, slečno, manžel dnes nepřijde, je upoután na lůžko. “
- Slides: 24