D wik w multimediach Ryszard Gubrynowicz Ryszard Gubrynowiczpjwstk
D� wiĘk w multimediach Ryszard Gubrynowicz Ryszard. Gubrynowicz@pjwstk. edu. pl Wykład 2 1
Dźwięki mowy • Badanie dźwięków mowy określonego języka: • • Jak powstają ? Czym się charakteryzują ? Jakie są między nimi współzależności ? Jakie spełniają funkcje ? 2
Dziedziny wiedzy obejmujące dwustronną komunikację werbalną Fonetyka artykulacyjna Fonetyka percepcyjna Fonetyka akustyczna 3
Podstawy opisu i klasyfikacji dźwięków mowy Opis artykulacyjny Opis akustyczny Opis percepcyjny 4
Fonetyka artykulacyjna Przedmiotem fonetyki artykulacyjnej jest opisanie mechanizmu powstawania dźwięków mowy w narządzie artykulacyjnym człowieka. 5
Fonetyka akustyczna • Koncentruje się na analizie fizycznych własności dźwięków mowy promieniowanych wokół osoby mówiącej. • Badanie dźwięków mowy odbywa się przy zastosowaniu fizycznych metod analizy sygnałów akustycznych. • Jednocześnie poszukuje powiązań istniejących między czynnością artykulacyjną i wytworzonym sygnałem mowy 6
Fonetyka percepcyjna • Bada percepcję dźwięków mowy, na poziomie układu centralnego. • W badaniach stosowane są metody analizy subiektywnej oceny własności sygnałów akustycznych, zrozumiałości mowy itp. 7
Układ akustyczny źródło –ośrodek-odbiornik 8
Anatomia i akustyka narządu artykulacyjnego 9
Narząd artykulacyjny człowieka 10
Narząd artykulacyjny w akcji „Le boulanger dit onze bieres” 11
Elementy narządu artykulacyjnego uczestniczące w formowaniu sygnału mowy Fałdy głosowe Podniebienie miękkie Podniebienie twarde Język Zęby Wargi 12
Źródłem energii promieniowanej podczas mówienia są płuca. Podobnie jak ma to miejsce w instrumentach muzycznych dętych – źródłem energii niesionej przez dźwięk są płuca osoby grającej 13
Funkcjonalny schemat organu mowy 14
Układ oddechowy- płuca 15
Układ oddechowy - tchawica 16
Cykle oddechowe: proporcje czasowe Max pojemność płuc – ok. 7 litrów Pojemność minimalna – 2 litry stale w płucach. Objętość powietrza wymieniana podczas każdego cyklu oddechowego – 0. 5 l Częst. oddychania w stanie spoczynku – 12 -20 cykli na minutę 17
Przebieg zmian objętości powietrza w płucach VC – pojemność spoczynkowa 18
Źródłem pobudzającym tor głosowy mogą być: a) fałdy głosowe – modulują w sposób regularny przepływ powietrza wychodzącego z płuc, b) szczelina utworzona w torze głosowym powoduje powstanie zawirowań, c) przeszkoda (zęby) – j. w. d) krótkotrwały impuls powietrza – powstaje w wyniku nagłego otwarcia toru głosowego, po chwilowym zwarciu w określonym miejscu toru głosowego. 19
Głośnia+fałdy głosowe+tchawica Przekrój pionowy 20
Fałdy głosowe – widok z góry 21
Fałdy głosowe w akcji Faza oddechu Faza fonacji 22
Rozkład ciśnień powietrza w torze głosowym 23
Aerodynamika fałdów głosowych 24
Instrumenty muzyczne stroikowe Działają na podobnej zasadzie jak fałdy głosowe Harmonijka ustna 25
Przebieg zmian prędkości objętościowej strugi powietrza u wylotu głośni T 0=1/F 0 26
Mechaniczny model źródła pobudzenia krtaniowego Model 1 -masowy Model 3 -masowy m – masa fałdów głosowych k – sprężystość fałdów b – stratność w ruchu fałdów 27
Funkcjonalny model źródła krtaniowego 28
Wzór na częstotliwość drgań fałdów głosowych m – masa fałdów K – sztywność (napięcie) fałdów K* - sztywność aerodynamiczna 29
Widmo przebiegu piłokształtnego Aproksymacja przebiegu zmian prędkości objętościowej strugi powietrza płynącego przez głośnię 30
Widmo pobudzenia krtaniowego Obwiednia widma opada z częstotliwością – 12 d. B/okt 31
Zmiana średniej częstotliwości tonu krtaniowego w funkcji wieku wie Skąd się biorą różnice? Średnia długość fałdów: noworodki – 5 mm dzieci – 10 -13 mm kobiety – 11 -15 mm mężczyźni – ok. 20 mm Masa drgających fałdów jest proporcjonalna do ich długości 32
Przebieg zmian częstotliwości F 0 w zdaniu „Czy mógłby pan. . . ” 33
Przebieg F 0 z opisem fonetycznym 34
Narząd artykulacyjny jako układ akustyczny Jest on swoistego rodzaju układem akustycznym, w którym można wyróżnić dwa podstawowe elementy: a) źródło pobudzające b) tor głosowy stanowiący w swej istocie rurę o zmiennym przekroju wypełnioną powietrzem – w torze tym rozchodzi się fala płaska 35
Formowanie sygnału mowy 36
Akustyczny model toru głosowego 37
Rezonanse stratnej rury cylindrycznej o długości 17. 5 cm formanty 38
Tor głosowy jako rura akustyczna o zmiennej konfiguracji 39
Dlaczego rezonanse w modelu 2 - rurowym są inne niż w 1 segmentowym (sumaryczna długość w obu przypadkach jest taka sama)? 40
Co się dzieje na granicy 2 segmentów cylindrycznych? (Ak Ak+1) 41
Jak wygląda przybliżony kształt toru głosowego dla /a/ ? Funkcja powierzchni przekroju toru głosowego An 42
Stosunek powierzchni Ak/Ak+1 a charakterystyka częstotliwościowa Nakładanie się fal padających i odbitych o różnym przesunięciu czasowym powoduje ich wielokrotne sumowanie (lub/i odejmowanie). Wielkość (amplituda) fal przenikających i odbitych zależy od stosunku powierzchni Ak/Ak+1. Stosunek tych powierzchni decyduje o charakterystyce częstotliwościowej układu cylindrów 43
Przekroje samogłoskowe Samogłoska i Samogłoska I Samogłoska a Samogłoska o Samogłoska e 44 Samogłoska u
Miejsce i wysokość artykulacji długość toru głosowego - 17 cm długość odcinka cylindrycznego - 1 cm Miejsce artykulacji Wysokość artykulacji 45
Wpływ położenia zwężenia na F 1, F 2, F 3 dla konfiguracji /u/ 46
Charakterystyka rezonansów modelu samogłoski /a/ 47
Porównanie widm modelu i naturalnej samogłoski /a/ F 1 F 2 F 4 F 3 Częstotliwość [k. Hz] Liczba rezonansów w torze głosowym istotnych dla percepcji dźwięku samogłoskowego jest ograniczona 48 i nie przekracza zazwyczaj 5 -7
Modelowanie toru głosowego za pomocą filtrów formantowych źródło Pojedyncze rezonatory F 1 F 2 Funkcja promieniowania F 3 49
Definicja formantu Maksima w charakterystyce częstotliwościowej toru głosowego wpływające na różnicowanie dźwięków mowy danego języka nazywamy formantami. Oznacza to, że nie każde maksimum w widmie danego dźwięku mowy musi być formantem. 50
Trudności w określaniu formantów w sygnałach naturalnych Dwie kolejne samogłoski /a/ w wyrazie „waga” (głos męski, F 0=148 Hz) Częstotliwość [Hz] 51
Wpływ częstotliwości F 0 na widmo dźwięku mowy widmo głosu niskiego widmo głosu 52 wysokiego
Zasadnicze tematy 1) Jakie elementy narządu artykulacyjnego uczestniczą w formowaniu sygnału mowy ? 2) Jaki jest mechanizm działania fałdów głosowych ? 3) Jakie czynniki wpływają na częstotliwość drgań fałdów głosowych ? 4) Jaki jest model formowania dźwięków mowy ? 5) Miejsce i wysokość artykulacji 53
Terminy angielskie Tchawica - trachea Krtań – larynx Fałdy głosowe – vocal folds Głośnia - glottis Podniebienie miękkie – soft palate Podniebienie twarde – hard palate Wargi – lips Źródło pobudzenia – excitation source Częstotliwość podstawowa (F 0) – fundamental frequency Tor głosowy – vocal tract 54
Terminy angielskie • Widmo – spectrum • Obwiednia widma – spectrum envelope • Miejsce i wysokość artykulacji – place of articulation, height of articulation • Formant - formant 55
- Slides: 55