Codificacin bidimensional de patrones vocales mediante un esquema
Codificación bidimensional de patrones vocales mediante un esquema de reducción dimensional basado en redes neuronales Alejandro Bassi A. Universidad de Chile Departamento de Ciencias de la Computación abassi@dcc. uchile. cl
Caracterización fonética del timbre n n n oído interno descompone en frecuencias escala no lineal lo importante es la envolvente del espectro
Caracterización articulatoria del habla n bastan dos dimensiones
Relación articulación/timbre n posición de "formantes"
Codificación de la envolvente del espectro n n cepstrum reducción dimensional: q lineal (componentes principales) q no lineal (redes neuronales) q calidad de la reconstrucción
Reconstrucción lineal (2 D)
Reconstrucción lineal (3 D)
Reconstrucción lineal (4 D)
Reducción dimensional con redes neuronales n n n estructura codificador/decodificador entrenamiento autoasociativo decodificador basado en composición gausiana
Codificación inicial
Codificación final
Reconstrucción (diptongos)
Posición de formantes
Reconstrucción (palabra: "cuatro")
Reconstrucción (otra palabra: "nueve")
Reconstrucción (diptongos, otro hablante)
Comparación entre hablantes
Conclusiones n n buena reconstrucción (visualización) reducción dimensional / seguimiento formantes contexto general / contexto local Reconocimiento de patrones (TDW, HMM) ¿varios hablantes? q normalización del "triángulo"
- Slides: 18