5 ANALIZA SPECTRAL A SEMNALULUI VOCAL urechea realizeaz

  • Slides: 20
Download presentation
5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL • urechea realizează o analiză spectrală a undei

5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL • urechea realizează o analiză spectrală a undei acustice recepţionate

Metodele de analiză spectrală au ca obiective: • analiza spectrală continuă a semnalului vocal

Metodele de analiză spectrală au ca obiective: • analiza spectrală continuă a semnalului vocal (necesară în procesul recunoaşterii vorbirii sau a vorbitorului); • utilizarea rezultatelor analizei spectrale în tehnicile de sinteză a semnalului vocal (bazate pe prelucrarea în domeniul frecvenţă). Principalele metode de analiză spectrală: • analiza cu ajutorul densităţii spectrale pe termen scurt, pornind de la definirea transformatei Fourier pe termen scurt; • analiza spectrală cu ajutorul bancului de filtre; • analiza parametrică – parametrizarea semnalului vocal pe baza modelării autoregresive (codarea prin predicţie liniară) si a analizei cepstrale (homomorfice).

Analiza homomorfică (cepstrală) a semnalului vocal • semnalul x analizat provine din convoluţia a

Analiza homomorfică (cepstrală) a semnalului vocal • semnalul x analizat provine din convoluţia a două semnale. • semnalului vocal x[n] se obţine ca o convoluţie între excitaţia la nivel glotal, e[n] şi funcţia pondere a tractului vocal, h[n]. • separarea celor două semnale nu este posibilă prin filtrare deoarece ele ocupă în general aceeaşi bandă de frecvenţă. • analiza homomorfică, ce are la bază noţiunea de cepstru, permite în anumite condiţii separarea celor două semnale. • se realizează deconvoluţia semnalului x[n]. • cepstrum (engleză), reprezintă anagrama cuvântului spectrum.

Transformare homomorfică

Transformare homomorfică

x[n] * Z-1{} X(z) Z{} ln{} Bloc de prelucrare liniară (“lifter”-engl. ) {} *

x[n] * Z-1{} X(z) Z{} ln{} Bloc de prelucrare liniară (“lifter”-engl. ) {} * Z{} h[n] H(z) exp{} Z-1{} Schema bloc de realizare a unei prelucrări homomorfice • în cazul în care prelucrarea liniară este realizată în domeniul frecvenţă, blocurile marcate cu `*` lipsesc.

Proprietăţile cepstrului complex 1. 2.

Proprietăţile cepstrului complex 1. 2.

3. Dacă funcţia X(z) este stabilă şi de fază minimă atunci cepstrul va fi

3. Dacă funcţia X(z) este stabilă şi de fază minimă atunci cepstrul va fi cauzal

4. Cepstrul unei succesiuni de impulsuri Dirac periodice (de perioadă N şi amplitudine C):

4. Cepstrul unei succesiuni de impulsuri Dirac periodice (de perioadă N şi amplitudine C):

Exemplu:

Exemplu:

pt. x 2[n] pt. x 1[n] Cepstrele corespunzătoare celor două secvenţe din exemplu

pt. x 2[n] pt. x 1[n] Cepstrele corespunzătoare celor două secvenţe din exemplu

Cepstrul real x[n] DFT X[k] ln{|●|} ln|X[k]| DFT-1 Evaluarea cepstrului real cu ajutorul DFT

Cepstrul real x[n] DFT X[k] ln{|●|} ln|X[k]| DFT-1 Evaluarea cepstrului real cu ajutorul DFT

Utilizarea analizei cepstrale în prelucrarea semnalului vocal - pentru o transa sonora de semnal

Utilizarea analizei cepstrale în prelucrarea semnalului vocal - pentru o transa sonora de semnal vocal: - e[n] = excitaţia idealizată formată din impulsuri unitate cu perioada P; - g[n] = funcţia pondere a filtrului trece jos (FTJ) ce simulează forma impulsurilor glotale; - ht[n] = funcţia pondere a tractului vocal; - r[n] = răspunsul la impuls al filtrului ce modelează regiunea buzelor; - w[n] = fereastră de ponderare.

Estimarea frecvenţei fundamentale • estimarea frecvenţei fundamentale este legată de tranşele sonore. • perioada

Estimarea frecvenţei fundamentale • estimarea frecvenţei fundamentale este legată de tranşele sonore. • perioada T 0 este în general cuprinsă între limitele 2 ms – 17 ms; • frecvenţa fundamentală F 0 variază între: - 60 Hz – 250 Hz pentru voci masculine; - 150 Hz – 500 Hz pentru voci feminine. • atunci când o metodă de determinare nu furnizează o valoare plauzibilă pentru perioada fundamentală P se decide că tranşa respectivă este nesonoră.

1. Metoda autocorelaţiei - evaluarea funcţiei de autocorelaţie pentru tranşa de N eşantioane ce

1. Metoda autocorelaţiei - evaluarea funcţiei de autocorelaţie pentru tranşa de N eşantioane ce acoperă mai multe perioade ale fundamentalei: - nu este necesară evaluarea funcţiei de autocorelaţie pentru toate valorile lui k, ci doar pentru un interval: - se caută maximul cel mai pronunţat al funcţiei de autocorelaţie cuprins în acest interval.

Exemplu: - o reducere a timpului de calcul se poate realiza dacă reţinem din

Exemplu: - o reducere a timpului de calcul se poate realiza dacă reţinem din fiecare eşantion x[n] doar partea care depăşeşte un anumit prag L:

- o altă posibilitate constă în a substitui toate eşantioanele ce depăşesc pragul L

- o altă posibilitate constă în a substitui toate eşantioanele ce depăşesc pragul L prin eşantioane de valoare fixă (de exemplu egale cu +/-1)

2. Metoda AMDF Average Magnitude Difference Function = metoda funcţiei medie a diferenţei modulelor

2. Metoda AMDF Average Magnitude Difference Function = metoda funcţiei medie a diferenţei modulelor - estimarea frecvenţei fundamentale se face prin găsirea indicelui k = P din intervalul menţionat, pentru care D[k] este minim posibil.

3. Metoda filtrului invers x[n] H(z) = Ap(z) Semnalul original Eroarea de predicţie Filtrul

3. Metoda filtrului invers x[n] H(z) = Ap(z) Semnalul original Eroarea de predicţie Filtrul invers - pentru o tranşă sonoră, acest filtru produce eroarea de predicţie, ce reprezintă excitaţia cvasiperiodică aplicată tractului vocal (multiplicată cu o constantă). - “perioada” P a poate fi determinată direct în domeniul timp. - rezultatele se îmbunătăţesc dacă se aplică metoda autocorelaţiei, considerând în locul semnalului x[n] secvenţa de eroare de la ieşirea filtrului invers.

4. Metoda cepstrală pentru care = max.

4. Metoda cepstrală pentru care = max.