Ljudska snaga Google prevoditelja Napravili Josip P Tena

  • Slides: 20
Download presentation
Ljudska snaga Google prevoditelja Napravili: Josip P. Tena R. Sofija M. Adel S. Adrian

Ljudska snaga Google prevoditelja Napravili: Josip P. Tena R. Sofija M. Adel S. Adrian B. Mentorica: Kristina Mijandrušić-Ladavac

Tijek rada �Provjeravali smo Google-ove prijevode �Tražili smo od izvornih govornika subjektivnu ocjenu prijevoda

Tijek rada �Provjeravali smo Google-ove prijevode �Tražili smo od izvornih govornika subjektivnu ocjenu prijevoda �Proveli smo “japanski i španjolski test”

Jezične pogreške SKUPINA POGREŠAKA PRAĆENE POGREŠKE Fonetske Pisanje riječi i slova Morfološke Jd. /mn.

Jezične pogreške SKUPINA POGREŠAKA PRAĆENE POGREŠKE Fonetske Pisanje riječi i slova Morfološke Jd. /mn. , m. /ž. rod, nastavak Leksikološke Vrsta, nedostatak i višak riječi Sintaktičke Red riječi, gl. vrijeme/oblik Semantičke Doslovno značenje, pogrešan izbor riječi

Primjeri Bili pak unuci sad već poodrasli momci, It was a little dude now,

Primjeri Bili pak unuci sad već poodrasli momci, It was a little dude now, already poodrasli guys, djedu do ramena i poviše ramena. grandfather to shoulder and above shoulders. The cheetah’s excellent eyesight helps it Dobar vid geparda pomaže u pronalaženju plijena find prey during the day. tijekom dana. Zaigraše kolo čobani i čobanice. The balls and the balls are played. Uživam u gledanju utakmica Hrvatske I enjoy watching the Croatian national team reprezentacije. match.

Harry Potter 1 – 2. poglavlje Ten years ago, there had been lots of

Harry Potter 1 – 2. poglavlje Ten years ago, there had been lots of pictures of what looked like a large pink beach ball wearing different-colored bonnets - but Dudley Dursley was no longer a baby, and now the photographs showed a large blond boy riding his first bicycle, on a carousel at the fair, playing a computer game with his father, being hugged and kissed by his mother. The room held no sign at all that another boy lived in the house, too.

Harry Potter 1 – 2. poglavlje (Google prijevod) Prije deset godina bilo je mnogo

Harry Potter 1 – 2. poglavlje (Google prijevod) Prije deset godina bilo je mnogo slika onoga što je izgledalo kao velika ružičasta plaža s kuglicama s različitim bojama - ali Dudley Dursley više nije beba, a sada su fotografije pokazale velikog plavokosog dječaka koji je vozio svoj prvi bicikl, na carousel na sajmu, igrajući kompjutersku igru s ocem, zagrlila ga i poljubila majka. Soba nije imala nikakve znakove da je još jedan dječak živio u kući.

Pogreške u prijevodu rečenica 16 14 12 10 BROJ POGREŠAKA 8 6 4 2

Pogreške u prijevodu rečenica 16 14 12 10 BROJ POGREŠAKA 8 6 4 2 0 FONETSKE MORFEOLOŠKE LEKSIKOLOŠKE SINTAKTIČNE SEMANTIČKE

Pogreške u prijevodu teksta 80 70 60 50 40 BROJ POGREŠAKA 30 20 10

Pogreške u prijevodu teksta 80 70 60 50 40 BROJ POGREŠAKA 30 20 10 0 FONETSKE MORFOLOŠKE LEKSIKOLOŠKE SINTAKTIČKE SEMANTIČKE

BROJ POGREŠAKA VRSTA POGREŠKE REČENICE TEKST FONETSKE 2 0 MORFOLOŠKE 5 7 LEKSIKOLOŠKE 15

BROJ POGREŠAKA VRSTA POGREŠKE REČENICE TEKST FONETSKE 2 0 MORFOLOŠKE 5 7 LEKSIKOLOŠKE 15 71 SINTAKTIČKE 2 5 SEMANTIČKE 12 30 UKUPNO 36 POGREŠAKA/600 RIJEČI 113 POGREŠAKA/600 RIJEČI TOČNOST 94% 81%

Subjektivna ocjena � 7 ocjena sudionika kampa + 2 ocjene govornika makedonskog i njemačkog

Subjektivna ocjena � 7 ocjena sudionika kampa + 2 ocjene govornika makedonskog i njemačkog = 3. 1 (ej hrv. , mak. , njem. ) �Potvrđuje naša mjerenja – semantičkih pogrešaka ima jako puno

Vremenski test Uređivanje google prijevoda Samostalni prijevod 45’ 40’

Vremenski test Uređivanje google prijevoda Samostalni prijevod 45’ 40’

Krivulja učenja broj zapamćenih j. riječi 600 500 400 300 200 100 0 1.

Krivulja učenja broj zapamćenih j. riječi 600 500 400 300 200 100 0 1. mjerenje 2. mjerenje 3. mjerenje 4. mjerenje Naša krivulja učenja Slika krivulje učenja s interneta

Serijalni efekt broj zapamćenih j. riječi 700 600 500 400 300 200 100 0

Serijalni efekt broj zapamćenih j. riječi 700 600 500 400 300 200 100 0 POČETAK SREDINA KRAJ ekta Naša krivulja serijalnog ef Slika krivulje serijalnog efekta s interneta

Najviše ponavljane riječi Japanske riječi Španjolske riječi �choko �ventana/Cierra la ventana! �konichiwa �Buenas noches!

Najviše ponavljane riječi Japanske riječi Španjolske riječi �choko �ventana/Cierra la ventana! �konichiwa �Buenas noches! �chizu �cama �sensei �cocina �heya �sala de mentores

Najmanje ponavljane riječi Japanske riječi Španjolske riječi �o-isashiburidana � 7 riječi nije bilo ni

Najmanje ponavljane riječi Japanske riječi Španjolske riječi �o-isashiburidana � 7 riječi nije bilo ni izgovoreno �hajimemashite �gracias �arigato gozaimashita �bien �itadakimasu �silencio �iyada �comida

χ2 TEST - napredak po danima χ2 =1599. 8 dƒ=3 ƒo ƒt ƒo-ƒt (ƒo-ƒt)2/ƒt

χ2 TEST - napredak po danima χ2 =1599. 8 dƒ=3 ƒo ƒt ƒo-ƒt (ƒo-ƒt)2/ƒt 140 0 0 0 306 140 166 27 556 196. 8 404 140 264 69696 497. 8 496 140 356 126736 905. 2 Zaključak: 99% smo sigurni da će svakog sljedećeg dana sve veći broj riječi biti zapamćen.

χ2 TEST – uloga redoslijeda χ2 =73. 6 dƒ=2 ƒo ƒt ƒo-ƒt (ƒo-ƒt)2/ƒt 1.

χ2 TEST – uloga redoslijeda χ2 =73. 6 dƒ=2 ƒo ƒt ƒo-ƒt (ƒo-ƒt)2/ƒt 1. trećina riječi na popisu 604 431 173 29929 69. 4 2. trećina riječi na popisu 431 0 0 0 3. trećina riječi na popisu 388 431 -43 1849 4. 2 Zaključak: 99% smo sigurni da će broj zapamćenih riječi imati veze s redoslijedom riječi na popisu.

Usporedba japanskog i španjolskog jezika 70. 00% 60. 00% 50. 00% 40. 00% prepoznavanje

Usporedba japanskog i španjolskog jezika 70. 00% 60. 00% 50. 00% 40. 00% prepoznavanje 30. 00% reproduciranje 20. 00% 10. 00% japanski jezik španjolski jezik

Naši zaključci �Google prevoditelj ima najviše leksikoloških i semantičkih pogrešaka �točnije prevodi na razini

Naši zaključci �Google prevoditelj ima najviše leksikoloških i semantičkih pogrešaka �točnije prevodi na razini rečenica �nužno je da stručna osoba provjeri Google prijevod �“ciljano” učenje je kvalitetnije od “usputnog”

HVALA NA POZORNOSTI!

HVALA NA POZORNOSTI!