Obrada kontroliranog hrvatskog jezika u inteligentnom tutorskom sustavu
Obrada kontroliranog hrvatskog jezika u inteligentnom tutorskom sustavu Branko Žitko Prirodoslovno matematički fakultet Sveučilište u Splitu branko. zitko@pmfst. hr Dan jezičnih tehnologija Zagreb, 30. 11. 2012
Sadržaj 1. 2. 3. 4. 5. 6. Inteligentni tutorski sustav (ITS) Problem Rješenje Prepoznavanje kontroliranog jezika Generiranje kontroliranog jezika Tutorski dijalog 2
Inteligentni tutorski sustav • Inteligentni tutorski sustavi (ITS) su računalni sustavi zasnovani na tehnikama umjetne inteligencije kako bi simulirali ljudske tutore koji znaju • što poučavaju, • koga poučavaju i • kako poučavaju Što Kako Koga 3
Inteligentni tutorski sustav • Učenik se uči i testira nad područnim znanjem • Komunikacijski modul – prikazuje područno znanje – prikazuje test nad područnim znanjem i prima učenikove odgovore • Prikaz područnog znanja i testa u ITS-u Tutor-Expert System (TEx-Sys) TEx-Sys – Stankov 1997 2008 4
Problem • Ne postoji pravilo za imenovanje elemenata područnog znanja – imenovanje koncepata – imenovanje relacija • Rezultira generiranjem gramatički nepravilnih rečenica kod – prikaza područnog znanja i – testa nad područnim znanjem Miš i Tipkovnica vrsta Ulazna jedinica. Miš i Tipkovnica je vrsta Ulazne jedinice. Tko je povezan vezom vrsta s ulazna jedinica? Tko je povezan vezom je vrsta s ulazne jedinice? Je li Miš vrsta Ulazna jedinica? Je li Miš je vrsta Ulazne jedinice? 5
Rješenje • Uvedeno – ontologija kao područno znanje – kontrolirani jezik kao sredstvo komunikacije • Struktura kontroliranog jezika i jezične tehnologije primijenjene rečenica gramatika kontroliranog jezika kontekstno neovisna gramatika fraza pravila za imenovanje fraza parametrizirani regularni izrazi riječ morfološki oblik riječi morfosintaktički opis • Obrada kontroliranog jezika – generiranje rečenica (iz područnog znanja) – prepoznavanje fraza (frazama se imenuje koncept i relacija) 6
Rješenje • Controlled Language Service (Co. La. S) – generiranje rečenica i prepoznavanje fraza kontroliranog jezika • Hrvatski morfološki leksikon (HML) – generiranje i prepoznavanje oblika riječi • Hrvatski valencijski leksikon glagola (CROVALLEX) – određivanje oblika riječi priloženog uz glagol Co. La. S – Žitko 2010 HML – Tadić 2003 CROVALLEX – Mikelić Preradović 2008 7
Ontologija kao područno znanje <owl: Class rdf: about="#Arithmetic_logic_unit"> <rdfs: label xml: lang="hr">aritmetičko logička jedinica</rdfs: label> <rdfs: label xml: lang="en">arithmetic logic unit</rdfs: label> <rdfs: sub. Class. Of> <owl: Class> <owl: intersection. Of rdf: parse. Type="Collection"> <owl: Restriction> <owl: on. Property rdf: resource="#is_part_of"/> <owl: some. Values. From rdf: resource="#Central_processing_unit"/> </owl: Restriction> <owl: on. Property rdf: resource="#execute"/> <owl: all. Values. From> <owl: Class> <owl: union. Of rdf: parse. Type="Collection"> <rdf: Description rdf: about="#Aritmetic_operation"/> <rdf: Description rdf: about="#Logical_operation"/> </owl: union. Of> </owl: Class> </owl: all. Values. From> </owl: Restriction> </owl: intersection. Of> </owl: Class> </rdfs: sub. Class. Of> </owl: Class> #Arithmetic_logic_unit identifikator koncepta aritmetičko logička jedinica naziv koncepta (na hrvatskom) intersection. Of oznaka veznika (i) #is_part_of identifikator relacije some. Values. From oznaka broja (1 = jednina) 8
Prepoznavanje kontroliranog jezika RBP Parametri (Rod Broj Padež) oblik riječi lema morfosintaktički opis (MSD) aritmetičko aritmetički Afpnsay Afpnsny Afpnsvy logička logički Afpfsny Afpfsvy Afpnpay Afpnpny Afpnpvy jedinica Ncfpg Ncfsn KRBP = A--nsn A--RBP N—RBP R = f – ženski B = s – jednina P = n – nominativ (aritmetički, A--nsn) (logički, A--RBP)(jedinica, N-RBP) MULTEXT East specifikacija N – imenica f – ženski rod s – jednina n - nominativ Parametrizirana fraza 9
Generiranje kontroliranog jezika (1) 10
Generiranje kontroliranog jezika (2) B=s P=n B=s P=g B=s za glagol "biti" trpitelj radnje je u genitivu identifikator #Arithmetic_logic_unit #is_part_of #Central_processing_unit #execute #Arithmetic_operation #Logic_operation parametrizirana fraza (aritmetički, A--nsn) (logički, A--RBP) (jedinica, N-RBP) (biti, V----n) (dio, N-BPn) (centralan, A--RBP) (procesorski, A--RBP) (jedinica, N-RBP) (izvršavati, V----n) (aritmetički, A--RBP) (operacija, A--RBP) (logički, A--RBP) (operacija, A--RBP) B=s P=a za glagol "izvršavati" trpitelj radnje je u genitivu parametri B=s P=n B=s P=g B=s B=p P=a fraza (HML) (aritmetičko, aritmetički, Afpnsny) (logička, logički, Afpfsny) (jedinica, Ncfsn) (je, biti, Vcip 3 s) (dio, Ncmsn) (centralne, centralan, Afpfsg) (procesorske, procesorski, Afpfsg) (jedinice, jedinica, Ncfsg) (izvršava, izvršavati, Vmip 3 s) (aritmetičke, aritmetički, Afpmpa) (operacije, operacija, Ncmpa) (logičke, logički, Afpmpa) (operacije, operacija, Ncmpa) Aritmetičko logička jedinica je dio centralne procesorske jedinice i izvršava aritmetičke operacije i logičke operacije 11
Tutorski dijalog • Tutorski dijalog kombinira – generiranje kontroliranog jezika – prepoznavanje kontroliranog jezika • Dijalog jednostrane inicijative ostvaren preko dijaloškog okvira 12
Tutorski dijalog 4 1 6 2 5 # 1 Stanje S 1 Sudjelovatelj Tutor 2 3 S 2 S 3 Učenik Tutor 4 5 S 4 S 2 Tutor Učenik 6 7 S 3 S 4 Tutor 8 9 S 2 S 3 Učenik Tutor Tekst Aritmetičko logička jedinica je dio koga ili čega? Računala Aritmetičko logička jedinica je dio računala, ali ovo nije potpuni odgovor Koji su djelovi računala? Centralna procesorska jedinica i radna memorija Točno. Je li aritmetičko logička jedinica dio centralne procesorske jedinice? Da Točno. 13
Co. La. B Tutor • Controlled Language Tutor (Co. La. B Tutor) – inteligentni tutorski sustav zasnovan na obradi kontroliranog jezika nad ontologijom http: //nasti. pmfst. hr > Co. La. B Tutor Co. La. B – Žitko 2010 14
Obrada kontroliranog hrvatskog jezika u inteligentnom tutorskom sustavu Branko Žitko Prirodoslovno matematički fakultet Sveučilište u Splitu branko. zitko@pmfst. hr Dan jezičnih tehnologija Zagreb, 30. 11. 2012
- Slides: 15