amp d B 1 0 5 0 0
amp. (d. B) 狭帯域包絡線間相関を用いた話者識別 1 0. 5 0 -0. 5 -1 200 400 600 800 1000 1200 1400 1600 1800 2000 time (ms)
処理の流れ amplitude 1/4 Oct. 分割した音声時間波形 0. 04 0. 02 0 -0. 02 -0. 04 b : 39バンド 28. 9 Hz~ 20749 Hz 0. 04 0. 02 0 -0. 02 -0. 04 0 0. 2 0. 4 0. 6 time (s ) 0. 8 1 amplitude ヒルベルト変換して求めた包絡線 0. 04 0. 02 0 -0. 02 -0. 04 0 0. 2 0. 4 0. 6 time (s ) 0. 8 1 0 0. 2 0. 4 0. 6 0. 8 1 time (s ) amplitude(d. B) d. B変換(-30 d. Bで打ち切り) 0 0 -10 -20 -30 0 0. 2 0. 4 0. 6 time (s ) 0. 8 1 -30 0 0. 2 time (s ) 狭帯域包絡線間相関係数
登録語と識別語の音素分布 Vowel a i u e o 33 68 11 0 11 11 0 0 22 11 0 1 10 8 8 3 10 5 77 0 0 11 8 22 10 12 22 31 11 11 0 27 0 11 0 0 8 0 9 9 22 0 0 19 35 2 11 8 11 0 0 11 11 11 0 19 21 0 0 9 0 11 14 26 0 11 15 10 0 3 22 0 1 17 11 0 0 11 11 11 20 0 11 27 11 11 0 3 0 8 0 9 0 2 V N’n nymmys sh h hy f z j k ky t ts p pych g gy d dyb byry y r w Q- N Fl Fv Sl Sv Consonant +:登録語(個数は上段の数) ×:識別語(個数は下段の数) Ca V:Vowel 母音 N:Nasal 鼻音 Fl:Fricative voiceless 摩擦音(無声) Fv:Fricative voiced 摩擦音(有声) Sl:Stop voiceless 閉鎖音(無声) Sv:Stop voiced 閉鎖音(有声) Ca:Central approximant 中央近接音 Q:Geminate consonant 促音 -:Long vowel 長音 分布に偏りがない
帯域減少と平均正解率 1 0. 9 0. 8 0. 7 C 0. 6 0. 5 6 0. 4 14 22 0. 3 31 0. 2 0. 1 0 1 5 10 15 20 25 Starting band number 30 35 38 重要帯域:帯域番号6~14,22~
The second formant F 2 (k. Hz) 結果の検討(高い周波数範囲の検討) 帯域番号 22~ 31(1091 Hz~ 5187 Hz) 4. 0 3. 8 3. 4 3. 0 /i/ 2. 5 2. 2 2. 0 1. 8 1. 5 1. 4 /e/ /a/ 第 2フォルマント 周波数の 1091 Hz~ 4000 Hz (帯域番号 22~ 30) /u/ 1. 0 0. 8 0. 6 0. 2 /o/ 0. 5 1. 0 The first formant F 1 (k. Hz) 1. 4
データによるばらつきの検討 1 0. 95 Band No. CA 88% 0. 9 86% 0. 85 83% + 1 -39 0. 8 × 6 -31 0. 75 □ 6 -14 22 -31 0. 7 0. 65 0. 6 0. 55 0. 5 All A E K M N SA SB SC TA TB Y Talker 識別語に共通性
90% 85% 80% 75% 70% C 90% 85% 80% 75% 70% V-31 4 5 6 7 V(Band Number) 8 6-V,22-31 C C C 重要帯域近傍での平均正解率の変化 10 11 12 13 14 15 16 V(Band Number) 90% 85% 80% 75% 70% 6-V 29 30 31 32 V(Band Number) 33 6-14, V-31 18 19 20 21 22 23 V(Band Number) 24 重要帯域を 7-11,22-31に絞り込める
帯域制限(6~ 14,22~ 31)時の識別語の正解率 corrective judgement ratio 100% netto sa-fi n' nosutora damusu 90% mekara uroko neko fu n'jatta nakayama kin'niku n' ueda shi n'ya neko shi n'jatta matsuzaka daisuke 80% 70% 60% mito koumo n' no n'biriya 50% 40% 30% mo-ni n'gu musume niho n' chi n'botsu 1 2 3 4 5 6 7 8 number of subjective word 9 10 11
- Slides: 31