BLARKi levaade Krista Liin 18 juuni 2009 Mis

  • Slides: 11
Download presentation
BLARKi ülevaade Krista Liin 18. juuni 2009

BLARKi ülevaade Krista Liin 18. juuni 2009

Mis on BLARK? § BLARK = Basic Language Resource Kit Väikseim hulk keeleressursse, mis

Mis on BLARK? § BLARK = Basic Language Resource Kit Väikseim hulk keeleressursse, mis on teadus- ja arendustöös ning õpetamisel – etapil enne äriliste lahenduste loomist - vajalikud. Avalikult kättesaadav standarditele vastav baasressursside kogum. § Keeleressursid ja –tööriistad, nende kvaliteet (nt. standardid) ja kvantiteet (nt. sõnade arv). § Infrastruktuur nende ressursside haldamiseks ja levitamiseks. § Ühine definitsioon kõigile keeltele, mida võib vastavalt vajadusele kohandada. § BLARK on ajas muutuv – uute tehnoloogiate ja rakendusvaldkondade areng toob kaasa uuenenud vajadused.

Millest BLARK koosneb? § Keeleressursid § Ühe- ja mitmekeelsed korpused (nii kirjalikud, suulised kui

Millest BLARK koosneb? § Keeleressursid § Ühe- ja mitmekeelsed korpused (nii kirjalikud, suulised kui multimodaalsed) § Ühe- ja mitmekeelsed leksikonid § Terminipangad § Grammatikad § Hindamisalused, kuldstandardid § Tööriistad § Rakendused (nt. morfoloogiline, süntaktiline ja semantiline, NER, kõnetuvastus) § Märgendamisstandardid ja –tööriistad § Korpuseotsingu tööriistad

Mis aspekte ressursside juures vaadata? § Kättesaadavus § § Firmasisene kasutus, teadustöö, ärikasutus Hind

Mis aspekte ressursside juures vaadata? § Kättesaadavus § § Firmasisene kasutus, teadustöö, ärikasutus Hind Lähtekoodi nähtavus ja muudetavus Programmeerimiskeel ja kasutuskeskkond § Kvaliteet § § § Vastavus standarditele Kas ressursile on koostatud spetsifikatsioon, kas ta vastab sellele Sobivus ülesandele (kas on piisavalt suur, sisaldab piisavalt infot) Ühilduvus teiste ressursside ja keskkondadega Andmed ressursside efektiivsuse hindamise kohta § Kvantiteet § Sõnade arv korpuses jms – milline peaks olema BLARKI ressursside vähim maht?

BLARKi osad § Definitsioon Keelest sõltumatu minimaalne ressursside nimistu § Spetsifikatsioon Konkreetse keele jaoks

BLARKi osad § Definitsioon Keelest sõltumatu minimaalne ressursside nimistu § Spetsifikatsioon Konkreetse keele jaoks loodud täpsem spetsifikatsioon. § Sisu Olemasolevate ressursside nimekiri koos nende kirjeldustega

Milleks BLARKi vaja on? § Avalikult kättesaadav standarditele vastav baasressursside kogum, mida saab kasutada

Milleks BLARKi vaja on? § Avalikult kättesaadav standarditele vastav baasressursside kogum, mida saab kasutada nii õpetamisel kui teadus- ja äritegevuses alusressurssidena. § Ühine BLARKi definitsioon kõigile keeltele § Aitab vältida liigset tööd § Aitab hinnata vajaminevat töömahtu § Aitab kaasa ressurssidevahelisele ühilduvusele

Kuidas BLARKi tehakse? § 3 põhilist etappi: § BLARKi defineerimine (spetsifikatsioon) § Olemasolevate ja

Kuidas BLARKi tehakse? § 3 põhilist etappi: § BLARKi defineerimine (spetsifikatsioon) § Olemasolevate ja vajaminevate ressursside kirjeldamine § Vajaminevate ressursside tähtsuse järjekorda panek (priority list, koos kuluhinnanguga) § Erinevate keelte puhul on etappide tehniline lahendus ja järjekord erinevad § Reeglina hõlmab ressursside nimekirjade koostamine kõigi keeltehnoloogia valdkonnas tegevate isikute ja asutuste koostööd (küsitlus, komitee).

Kellel juba on BLARK? § Holland ~2002 -2004 § Araabia ~2004 -2009 § Rootsi

Kellel juba on BLARK? § Holland ~2002 -2004 § Araabia ~2004 -2009 § Rootsi ~2006 -… § BLARKi koostamine on küllaltki töömahukas ja vajab kõigi keeletehnoloogia valdkondade koostööd.

Näide: Hollandi BLARK

Näide: Hollandi BLARK

Näide: Araabia BLARK

Näide: Araabia BLARK

Tänan kuulamast

Tänan kuulamast