SGN4010 PUHEENKSITTELYN MENETELMT Luento 4 TTYSignaalinksittelyn laitos Hanna
- Slides: 39
SGN-4010 PUHEENKÄSITTELYN MENETELMÄT Luento 4 TTY/Signaalinkäsittelyn laitos Hanna Silen
2 Lineaarisen ennustuksen sovelluksia Luennon aiheena lineaarisen ennustuksen sovellukset: – Formanttien etsiminen – Perustaajuuden määrittäminen
3 Kertausta viimekertaisesta: lähde-suodin –malli • Puhekehys voidaan kuvata lähde-suodin –mallin avulla • Järjestelmän syötteenä x(n) on kurkunpää-ääni ja ulostulona y(n) mitattu puhesignaali X(z) H(z) Y(z)
4 Kertausta viimekertaisesta: lineaarinen ennustus • Lineaarinen ennustus on yksi tärkeimmistä puheenkäsittelyn työkaluista • Lyhenne LP (linear prediction) tai LPC (linear predictive coding) • Puheenkäsittelyn kannalta LP: n tärkein ominaisuus on sen kyky mallintaa ääntöväylää • Ideana ennustaa puhesignaalin seuraavaa näytettä edellisten näytteiden ja lineaarisen suotimen avulla (edellisten näytteiden lineaarikombinaationa) • Aiemmin käsitelty ristikkorakenteinen malli ääntöväylälle on all-pole – suodin – Lineaarinen ennustus on hyvä menetelmä suotimen parametrien estimointiin
5 Kertausta viimekertaisesta: lineaarinen ennustus Ääntöväyläsuotimelle voidaan käyttää mallia (all-pole –suodin) eli All-pole –järjestelmän ulostulo voidaan ennustaa täydellisesti mikäli sisäänmeno ja ulostulon aiemmat arvot tunnetaan. Jätetään riippuvuus sisäänmenosta pois ja tehdään ennustus pelkän ulostulon perusteella. – Ulostulon estimaatti aikatasossa:
6 Kertausta viimekertaisesta: lineaarinen ennustus Tehtävänä on määrittää suotimen parametrit a(1), a(2), . . . , a(p) – Tämä tehdään yleensä niin, että ulostulon ja ennustuksen neliövirheiden summa minimoituu autokorrelaatioyhtälöiden avulla johdetuista normaaliyhtälöistä voidaan ratkaista ennustuskertoimet (LP-suotimen kertoimet)
7 Kertausta viimekertaisesta: Levinson-Durbin –rekursio • Levinson-Durbin –rekursio: tehokkaampi tapa ennustuskertoimien a(1), a(2), . . . , a(p) ratkaisemiseen • Ideana on ratkaista symmetrinen Toeplitz-matriisiyhtälö lohkoittain kasvattamalla vektorin x pituutta ja laskemalla uusi ratkaisu edellisten avulla
8 Kertausta viimekertaisesta: Levinson-Durbin –rekursio • Yhtälöryhmän ratkaisu: vektori, joka on summa alempiasteisesta ratkaisusta ja sen vakiolla painotetusta käännöksestä • Esim. kun aste on 3: missä k 3 on heijastuskerroin ja Jotta tämä olisi normaaliyhtälöiden ratkaisu, vaaditaan ainoastaan että oikean puolen vektorin alkiot ensimmäistä lukuunottamatta ovat nollia, eli
9 Kertausta viimekertaisesta: Levinson-Durbin –rekursio Ratkaistaan termi k 3 ja tämän jälkeen termi E 3
10 Kertausta viimekertaisesta: Levinson-Durbin –rekursio Vastaavasti, kun kasvatetaan lohkon koko n – 1: stä n: ään: Aloitus ehdosta:
11 Formanttien estimointi • Formantti on spektrissä havaittava vahvistunut osavärähtelyalue tai taustalla oleva siirtofunktio-ominaisuus (napa)
12 Napaparin amplitudivaste: formantin taajuus • Napaparilla on siirtofunktio • Kompleksitason yksikköympyrällä, , siirtofunktio saa (tai tämän vakiolla kerrottu versio): kun muodon: • Siirtofunktion kertoimet ovat siis: • Järjestelmän amplitudivaste - eli siirtofunktion itseisarvo - saa maksimiarvonsa, kun saa minimiarvonsa, eli kun => eli taajuudella:
13 Napaparin amplitudivaste: formantin taajuus • Napapari taajuudella 1600 Hz (Fs = 16000 Hz), eli kulmataajuudella
14 Napaparin amplitudivaste: formantin taajuus • Vastaavasti, napapari taajuudella 3200 Hz (Fs = 16000 Hz), eli kulmataajuudella
15 Napaparin amplitudivaste: formantin kaistanleveys • Formantin kaistanleveys ilmaisee, kuinka leveä formantti on – Mikäli formantti on jyrkkä, sen kaistanleveys on pieni (ja päinvastoin) • Kaistanleveys on sen taajuuskaistan leveyden puolikas hertseinä, jolla amplitudivasteen arvo on laskenut 3 d. B maksimiarvosta • Napaparin kaistanleveys riippuu navan etäisyydestä origosta:
16 Napaparin amplitudivaste: formantin kaistanleveys • Napapari etäisyydellä 0. 9 origosta (näytteenottotaajuus 16 k. Hz) kaistanleveys:
17 Napaparin amplitudivaste: formantin kaistanleveys • Vastaavasti, kun r = 0. 7 ja r = 0. 99
18 Napaparin amplitudivaste: napojen yhteisvaikutus • Tarkastellaan vielä kahden napaparin (0. 9 e j 1 ja 0. 9 e j 2 ) yhdistettyä amplitudivastetta
19 Napaparin amplitudivaste: napojen yhteisvaikutus • Napojen taajuuksien lähestyessä toisiaan amplitudivasteen huiput sulautuvat yhteen
20 Formanttien estimointi: tekijöihin jako • Suoraviivainen tapa estimoida formantteja on jakaa LP-polynomi tekijöihin missä ovat LP-polynomin nollakohdat
21 Formanttien estimointi: tekijöihin jako • LP-polynomin nollakohta zi voidaan kirjoittaa muodossa Mikä tarkoittaa, että suotimella 1/A(z) on formantti taajuudella ωi
22 Formanttien estimointi: tekijöihin jako • MATLABissa polynomin nollakohdat voi laskea komennolla roots • Juurtaminen on laskennallisesti raskas operaatio, käytännössä käytetään jotakin iteratiivista menetelmää • Newton-Raphson-algoritmi toimii hyvin jos juurten alkuarvaukset ovat hyvät • Ääntöväylä ja LP-polynomin nollat muuttuvat suhteellisen hitaasti Käytetään alkuarvoina edellisen puhekehyksen LP-polynomin nollakohtia
23 Formanttien estimointi: tekijöihin jako Tekijöihin jakamiseen perustuva formanttien estimointi: 1. Ikkunoidaan signaali 2. Lasketaan kullekin puhekehykselle LP-polynomi A(z) (aste näytteenotto-taajuuden mukaan) 3. Juurretaan suotimen 1/A(z) nimittäjä (siis etsitään A(z): n nollakohdat) 4. Formanttien taajuudet saadaan LP-polynomin nollakohtien (1/A(z): n napojen) kulmista (muuntamalla kulmataajuudet hertseiksi)
24 Formanttien estimointi: tekijöihin jako Fs: 8 k. Hz LP-mallin aste: 8 Kehyksen pituus: 30 ms
25 Formanttien estimointi: tekijöihin jako Siistitään edellisen kalvon kuviota LP-mallin aste: 12 Huomioidaan vain navat, joiden: 1) säde on vähintään 0. 9 2) kulma vähintään 200 Hz
26 Formanttien estimointi: amplitudivasteen maksimien etsintä • Toinen tapa formanttien estimointiin LP-polynomin A(z) avulla on laskea siirtofunktion 1/A(z) amplitudivaste • Formanttien pitäisi olla suotimen 1/A(z) amplitudivasteen maksimien kohdalla • Nopeampi tapa: formanttien pitäisi olla LP-polynomin A(z) amplitudivasteen minimien kohdalla
27 Formanttien estimointi: amplitudivasteen maksimien etsintä • Formanttien estimointi etsimällä amplitudivasteen maksimit toimii pääsääntöisesti hyvin • Ongelmia syntyy, kun formantit ovat niin lähellä toisiaan, että ne sulautuvat yhteen – Tällöin amplitudivasteessa on vain yksi maksimi • Muokataan LP-mallia ongelman ratkaisemiseksi
28 Mc. Candlessin menetelmä • Lasketaan järjestelmän amplitudivaste ympyrän muotoisella kehällä yksikköympyrän sisällä pisteissä missä 0 < r < 1 ja 0 ≤ ω < 2π • Amplitudivasteen piikeistä tulee terävämpiä ja helpommin eroteltavia
29 Mc. Candlessin menetelmä • Laskennallisesti: Tämä on jonon DTFT, joka voidaan laskea nopeasti nollilla jatketun jonon FFT: nä
30 Mc. Candlessin menetelmä Tarkastellaan napapareja 0. 9 e 0. 3 jπ ja 0. 85 e 0. 4 jπ • Lasketaan amplitudivasteen arvo yksikköympyrällä: formantit sulautuvat • Formantit saadaan erotettua, kun lasketaan amplitudivaste yksikköympyrän sisällä
31 Kangin ja Coulterin menetelmä • Siirretään LP-polynomin nollat yksikköympyrälle – Tämän jälkeen amplitudivasteen minimit on helppo erottaa • Nollien siirtäminen asettamalla viimeinen heijastuskerroin ykköseksi: Viimeinen heijastuskerroin = LP-polynomin viimeisen termin kerroin = LP-polynomin nollakohtien tulo • Nollat eivät kuitenkaan siirry säteittäisesti yksikköympyrälle => Formanttitaajuuksiin tulee pieni vääristymä
32 Christensenin menetelmä • Etsitään amplitudivasteen minimien sijaan sen toisen derivaatan maksimi • Toinen derivaatta mittaa funktion kuperuutta tai koveruutta – Funktion kuvaajassa jyrkkä käännös toisen derivaatan maksimikohdassa • Menetelmällä voidaan arvioida myös formantin kaistanleveyttä
33 LP-mallin käyttö perustaajuuden estimoinnissa • Puheen perustaajuutta f 0 voidaan estimoida laskemalla kehyksen autokorrelaatiofunktio (korrelaatio itsensä kanssa) ja etsimällä autokorrelaation maksimi sopivalla viivealueella Fs = 8 k. Hz Perusjakson pituus: n. 70 näytettä eli 70 / 8000 Hz = 8. 75 ms Perustaajuus: 8000 Hz / 70 = 114 Hz
34 LP-mallin käyttö perustaajuuden estimoinnissa • Perustaajuus f 0 saadaan laskettua perusjaksonajasta T 0 (l. lyhimmästä jaksonajasta, jolla signaali toistaa itseään) • Perusjaksonaika taas saadaan jakamalla jakson pituus näytteinä perustaajuudella Fs • Esim. taajuusalue 50… 500 Hz vastaa autokorrelaation viiveitä Fs/500…Fs/50 • Autokorrelaatiofunktion maksimin etsintään perustuva menetelmä toimii pääsääntöisesti hyvin, mutta formanttien aiheuttamat huiput tuottavat joskus virheellisen perustaajuusarvon • Formantit voidaan poistaa signaalista LP-mallin avulla
35 LP-mallin käyttö perustaajuuden estimoinnissa • Puhekehys Y(z) muodostuu ääntöväylämallilla 1/A(z) suodatetusta glottisherätteestä X(z) Y(z) 1/A(z) Eli
36 LP-mallin käyttö perustaajuuden estimoinnissa • Vastaavasti formantit voidaan poistaa (ratkaista glottisheräte) suodattamalla puhekehys LP-parametreista saadulla käänteissuotimella A(z) Y(z) X(z) A(z) • Glottisheräte X(z) saadaan siis suodattamalla puhekehys Y(z) käänteissuotimella A(z)
37 LP-mallin käyttö perustaajuuden estimoinnissa • Koska all-pole –suodin 1/A(z) aiheuttaa signaaliin formantit, voidaan ne siis poistaa FIR-käänteissuotimella A(z) • Kun LP-mallin aste on riittävän matala, se mallintaa vain formantteja (ääntöväylää) ei perustaajuutta (glottista) • Autokorrelaatio voidaan nyt laskea glottisherätteestä X(z) puhekehyksen Y(z) sijaan Formanttien vaikutus pienenee • Menetelmästä käytetään nimitystä SIFT (simple inverse filter tracking)
38 LP-mallin käyttö perustaajuuden estimoinnissa • SIFT-esisuodatettu autokorrelaatio:
39 Yhteenveto • Lineaarinen ennustus ehkä tärkein yksittäinen puheenkäsittelyn menetelmä • LP: n sovellukset perustuvat puheen esittämiseen heräte-suodin –mallin avulla – Lineaarisen ennustuksen avulla voidaan estimoida ääntöväyläsuodatinta • Puhekehyksestä estimoidun ääntöväyläsuotimen 1/A(z) navoista/amplitudivasteen huipuista voidaan päätellä puhekehyksen formanttitaajuudet • Perustaajuuden estimointia voidaan parantaa poistamalla formanttien vaikutus puhekehyksestä suodattamalla se suotimella A(z) • Edelleen tärkeä muistaa, että puhetta käsitellään muutamien kymmenien millisekuntien kehyksissä
- Hannu lauerma luento
- Kvanttielektrodynamiikka
- Coatesville area school district
- Aiman habib
- Hanna raatikainen
- Hanna pölönen
- Hannah’s prayer
- Hanna nyfors
- Hanna pulkkinen
- Hanna kryszewska
- Ce hanna
- Hanna hartleb
- Hanna pihkola
- Gammapatia monoklonalna
- Jennifer hanna md
- Aiman hanna
- Hanna hakko
- Hannah hernan cortes actress
- Hanna gabriels biografia
- Hanna vock
- Hanna sorsa
- Wielka środa obrazki
- Hanna wilson
- Orleans hanna algebra prognosis test
- Hanna torp
- Mercurys composition
- Hanna kuvaja
- Hanna hyttinen
- "rob hanna"
- Aiman hanna
- Hanna sikora
- Integracion vertical hacia atras
- Hanna f. pitkin
- Hanna aardal
- Hanna rothkaehl
- Kristine hanna
- Egyptian flood story
- Hanna simple
- Alimentation hanna raby
- Naarajärven vankila myymälä