Bemutatkozik a Vilghall Aki mg nem hallott mestersgesen
Bemutatkozik a Világhalló • • • Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor? Hasonlat: A beszédszintetizátor a motor, a Világhalló a karosszéria. • • • Aki már hallott beszédszintetizátort beszélni azt kérdezi, hogy: Miben különbözik a Világhalló és egy képernyőolvasó? Hasonlat: A képernyőolvasás az otthon főzés, a Világhalló az étteremben evés.
A Világhalló bemutatkozik annak, aki még nem hallott mesterségesen generált beszédet A beszédszintetizátor motor nem a kliens gépében működik, hanem központi hangszerveren, és a szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy „szövegrádió”) egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. .
A Világhalló architektúrája
INTEGRÁLT SZOLGÁLTATÁS A szolgáltató végzi Motor cseréjét, pl. , fejlettebb verzióra (több hangszín, állítható sebesség, jobb beszédminőség) és több motorra, pl. idegen nyelvűre A számítógépes nyelvi elemzés új eredményeinek felhasználását A felolvasás szempontjából informatív, strukturális és nyelvi annotációk, (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az – akár ragozott - idegenszó illetve név helyes kiejtése). Ez tesz lehetővé a nyelvtanilag helyes, központi kivételszókezelést. Pl. V. Hugoval A felolvasásra legalkalmasabb formátumra hozza függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) Egy egységes közeget, vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható. A felhasználói beállítások közül az egyik legfontosabb a „KÖNYVJELZŐ” funkció. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart).
A Világhalló rendszer komponensei VH SZERVER NYELVI ELEMZŐ PROFIVOX KLIENS
A Világ. Halló kliens A kliens program fő feladata könyvek ill. hosszabb szövegek felolvasása. Kétféle módon használható 1. Indítható a program egy web oldalon elhelyezett link segítségével, mely a Világ. Halló szerver által már feldolgozott könyvre való hivatkozást tartalmaz. Ekkor a Világ. Halló kliens automatikusan elindul a felhasználó számítógépén és elkezdi felolvasni a linkben hivatkozott szöveget. 2. Elindítható a kliens számítógépen. Ekkor a felhasználói felület kereső és tallózó funkcióival választható ki a felolvasni kívánt könyv, ill. ennek valamely részlete, vagy folytatható a felolvasás a felhasználó által korábban letett könyvjelzők valamelyikétől. Verziók követésére a Java Web. Start alkalmazás-menedzser rendszert használja A Világ. Halló kliens felhasználói felülete konfigurálható a felhasználók igényeinek megfelelően. A konfigurálással a megjelenés (színek, betűméret, stb. ), a felolvasás módja (részletesség, sebesség, szintetizátor) és a vezérlés (billentyűkombinációk) állítható be
A Világ. Halló szerver Komponesek Web szerver JNLPServlet Apache, Tomcat web és alkalmazás szerverek gondoskodnak a Világ. Halló szerver oldali komponenseinek futtatásáról és weben keresztüli elérhetőségéről. A kliens alkalmazás letöltését és frissítését végzi, valamint a gondoskodik az alkalmazásnak a hívási paraméterekkel történő indításáról. Content. Servlet TTS szerver A kliens programokat kiszolgáló egység. A felhasználók nyilvántartását, beléptetését, a könyvjelzők kezelését, a könyvek adatbázisában való keresést végzi és közvetít a hangszerver és a kliens között. Egyszerű TCP protokollon keresztül teszi elérhetővé a MS Speech API-n keresztül illesztett text-to-speech motort a Content. Servlet számára
Nyelvi Elemző A felolvasható szövegek gyűjteménye A Világ. Halló rendszernek „saját gyűjteménye” van a felolvasható szövegekből. Az ide bekerülő szövegeket, könyveket egy előkészítő program dolgozza fel. Ez az előkészítés teszi lehetővé a felhasználók számára a könyvek keresését és a szövegben való navigálást, valamint az értelmezett felolvasást. Előkészítő rendszer A könyv meta-adatainak és a szöveg forrásának a megadása és tárolása: A könyvet leíró XML állomány megadásával vagy az adatok közvetlen bevitelével. Ez biztosítja a felhasználók számára a keresés lehetőségét. A különböző típusú szövegek azonos alakra való konvertálása. (A szövegek lehetnek TXT, HTML, tömörített (zip-elt) TXT vagy HTML és XML formátumúak. ) A szövegek strukturális feldolgozása Könyvek esetében ez a nyitólap, tartalom, fejezetek, stb. felismerését és a szerkezet adatbázisban való rögzítését jelenti. Ez teszi lehetővé a könyv szerkezeti elemein való navigálást. A szövegek nyelvtani feldolgozása Ez szótövelést, szófelismerést és mondatokra bontást jelent. Ez teszi lehetővé a szintetizátor meghajtását értelmes szintaktikus egységekkel, mely alapfeltétele a helyes intonációnak, a kivételszavak felismerését és helyes kiejtésük megállapítását, valamint a mondat-szintű navigálást a felolvasott szövegben.
- Slides: 8