PRAAT DE ENGENHEIROS PARA NOENGENHEIROS Para entusiastas do

  • Slides: 78
Download presentation
PRAAT: DE ENGENHEIROS PARA NÃO-ENGENHEIROS Para entusiastas do som/voz/fala

PRAAT: DE ENGENHEIROS PARA NÃO-ENGENHEIROS Para entusiastas do som/voz/fala

Praat: De. . . Para. . . Prof. Marcelo de Oliveira Rosa � Depto.

Praat: De. . . Para. . . Prof. Marcelo de Oliveira Rosa � Depto. Acad. de Eletrotécnica (DAELT) Profa Maria Lúcia de Castro Gomes � Depto. Acad. de Línguas Estrangeiras Modernas (DALEM) Universidade Tecnológica Federal do Paraná � UTFPR � Campus Curitiba

Ementa O que veremos: � Praat Objetos Operações sobre objetos Visualização de informação �

Ementa O que veremos: � Praat Objetos Operações sobre objetos Visualização de informação � Som (conceito físico) � Sinais Analógicos vs Digitais Propriedades (amplitude, frequência, fase) Conversões analógico-digitais (AD) e vice-versa (DA)

Ementa O que veremos: � Sinais de Voz F 0 vs Pitch vs Perceptual

Ementa O que veremos: � Sinais de Voz F 0 vs Pitch vs Perceptual Pitch Harmônicos Formantes (frequência e largura de banda) � Sistemas Sinal de produção de fala glotal e laringe Modulação e supra-glotais Vocálicos e não-vocálicos

Ementa O que veremos: � Análise espectral Transformada de Fourier FFT e sinais não-estacionários

Ementa O que veremos: � Análise espectral Transformada de Fourier FFT e sinais não-estacionários (com a fala) Spectrum vs Power. Spectrum Espectrograma � Filtros Passa-baixa, � Retorno passa-alta, passa-banda rejeita-banda) rejeita-banda ao Praat

Som Conceito � Onda longitudinal

Som Conceito � Onda longitudinal

Praat Ferramenta para análise de som/voz/fala

Praat Ferramenta para análise de som/voz/fala

Praat Objetos

Praat Objetos

Praat Operações sobre objetos

Praat Operações sobre objetos

Praat Visualização “estática” de objetos

Praat Visualização “estática” de objetos

Praat Visualização “interativa” de objetos

Praat Visualização “interativa” de objetos

Praat De “engenheiros” Para “estudantes de som/voz/fala” Exigências: � Fortemente baseado em matemática e

Praat De “engenheiros” Para “estudantes de som/voz/fala” Exigências: � Fortemente baseado em matemática e física Processamento � Suporte a programação Linguagem � Exige digital de sinais similar ao BASIC conhecimentos de fonética/linguística

Praat Nossa área � Matemática, física, engenharia, linguística, fonética, produção de fala. . .

Praat Nossa área � Matemática, física, engenharia, linguística, fonética, produção de fala. . . � Pontos positivos Multidisciplinaridade � Pontos negativos Multidisciplinaridade

Sinais Analógico vs Digital � Sinais analógicos = sinais contínuos “Zoom � Sinais Para

Sinais Analógico vs Digital � Sinais analógicos = sinais contínuos “Zoom � Sinais Para infinito” para qualquer intervalo de tempo discretos uso em computador Não consegue processar TANTAS informações Apenas “amostras” igualmente espaçadas são “lidas” Período de amostragem = 1/(frequência de amostragem) Intervalo entre coletas de amostras do sinal contínuo

Sinais Analógico vs Digital � Posso escolher qualquer frequência de amostragem?

Sinais Analógico vs Digital � Posso escolher qualquer frequência de amostragem?

Sinais Periodicidade � Padrão Pegue de repetição de um sinal um trecho Copie e

Sinais Periodicidade � Padrão Pegue de repetição de um sinal um trecho Copie e cole um atrás do outro!

Sinais Propriedades � Focadas em sinais periódicos � Amplitude Quão “alto” é um sinal

Sinais Propriedades � Focadas em sinais periódicos � Amplitude Quão “alto” é um sinal � Frequência fundamental F 0 Nível de vibração do sinal � Fase Deslocamento lateral

Sinais Propriedades � Focadas em sinais periódicos � Amplitude Adimensional ou em d. B

Sinais Propriedades � Focadas em sinais periódicos � Amplitude Adimensional ou em d. B � Frequência Hertz (Hz) Radiano/segundo (rad/s) � Fase Graus ou radianos

Sinais Propriedades � Focadas em sinais periódicos � Amplitude Adimensional ou em d. B

Sinais Propriedades � Focadas em sinais periódicos � Amplitude Adimensional ou em d. B � Frequência Hertz (Hz) Radiano/segundo (rad/s) � Fase Graus ou radianos

Sinais Cálculo/Estimação da F 0 � Autocorrelação Encontrar Sinal e sua versão atrasada/adiantada �

Sinais Cálculo/Estimação da F 0 � Autocorrelação Encontrar Sinal e sua versão atrasada/adiantada � Correlação Encontrar � Com similaridades/repetições dentro do sinal Cruzada similaridades entre dois sinais qual frequência um trecho do sinal se repete!

Sinais Cálculo/Estimação da F 0 � Autocorrelação Sinal “infinitamente” periódico Apenas teórico (na prática,

Sinais Cálculo/Estimação da F 0 � Autocorrelação Sinal “infinitamente” periódico Apenas teórico (na prática, um sinal tem início e fim)

Sinais Cálculo/Estimação da F 0 � Autocorrelação Sinal de curta duração (“enjanelado”)

Sinais Cálculo/Estimação da F 0 � Autocorrelação Sinal de curta duração (“enjanelado”)

Sinais Cálculo/Estimação da F 0 � Correlação Sinal cruzada de curta duração vs Sinal

Sinais Cálculo/Estimação da F 0 � Correlação Sinal cruzada de curta duração vs Sinal de “longa” duração

Sinais Conversão analógico-digital � Já sabemos que perderemos informações � Algo mais? Escala em

Sinais Conversão analógico-digital � Já sabemos que perderemos informações � Algo mais? Escala em amplitude Conversão digital-analógico � Quando reproduzimos o sinal digital � Influências Caixa acústica, amplificadores, circuitos eletrônicos

Sinal de Fala Sinal produzido pela ação “coordenada” de pulmão, laringe e sistema supra-glotal

Sinal de Fala Sinal produzido pela ação “coordenada” de pulmão, laringe e sistema supra-glotal

Sinal de Fala F 0, Pitch e harmônicos � Sinal A periódico = soma

Sinal de Fala F 0, Pitch e harmônicos � Sinal A periódico = soma de vários sen()/cos() frequência de cada sen/cos = múltiplo da F 0 Harmônicos

Sinal de Fala F 0, Pitch e harmônicos � Sinal A periódico = soma

Sinal de Fala F 0, Pitch e harmônicos � Sinal A periódico = soma de vários sen()/cos() frequência de cada sen/cos = múltiplo da F 0 Harmônicos

Sinal de Fala Pitch “real” vs Pitch “perceptual” �O que é medido � O

Sinal de Fala Pitch “real” vs Pitch “perceptual” �O que é medido � O que é percebido/sentido

Sinal de Fala Formantes � Frequências Como de ressonância da cavidade supraglotal calculá-las modelo

Sinal de Fala Formantes � Frequências Como de ressonância da cavidade supraglotal calculá-las modelo de tubos conectados Modelo de predição linear (LPC)

Sinal de Fala Formantes � Frequências de ressonância da cavidade supraglotal dos pontos de

Sinal de Fala Formantes � Frequências de ressonância da cavidade supraglotal dos pontos de máximo na curva LPC Largura de banda: quão largo são esses picos!

Sinal de Fala Formantes � Frequências Como de ressonância da cavidade supraglotal calculá-las modelo

Sinal de Fala Formantes � Frequências Como de ressonância da cavidade supraglotal calculá-las modelo de tubos conectados Modelo de predição linear (LPC)

Sinal de Fala Formantes � Frequências Modelo de ressonância da cavidade supraglotal tem uma

Sinal de Fala Formantes � Frequências Modelo de ressonância da cavidade supraglotal tem uma ordem Ordem de polinômio = número de raízes

Sinal de Fala Formantes � Frequências Modelo de ressonância da cavidade supraglotal tem uma

Sinal de Fala Formantes � Frequências Modelo de ressonância da cavidade supraglotal tem uma ordem Ordem de polinômio = número de raízes

Sistema de Produção de Fala Laringe � Funcionamento Sons para vocalização não-vocálicos Cordas vocais

Sistema de Produção de Fala Laringe � Funcionamento Sons para vocalização não-vocálicos Cordas vocais “completamente” abertas ou fechadas.

Sistema de Produção de Fala Laringe � Sinal glotal “Microfone” colocado imediatamente acima das

Sistema de Produção de Fala Laringe � Sinal glotal “Microfone” colocado imediatamente acima das cordas vocais

Sistema de Produção de Fala Engenheiros e o sistema de produção de fala Laringe

Sistema de Produção de Fala Engenheiros e o sistema de produção de fala Laringe = Modelo duas massas Trato supraglotal = Tubos acústicos conectados

Sistema de Produção de Fala Trato supra-glotal � No domínio da frequência: modulação!

Sistema de Produção de Fala Trato supra-glotal � No domínio da frequência: modulação!

Sistema de Produção de Fala Vocálicos � Sinais Que quase-periódicos (quase-estacionários) vogal é esta?

Sistema de Produção de Fala Vocálicos � Sinais Que quase-periódicos (quase-estacionários) vogal é esta?

Sistema de Produção de Fala Vocálicos � No domínio da frequência. . . Espectrograma

Sistema de Produção de Fala Vocálicos � No domínio da frequência. . . Espectrograma de 20 Hz e 200 Hz

Sistema de Produção de Fala Vocálicos � No domínio da frequência. . . Espectrograma

Sistema de Produção de Fala Vocálicos � No domínio da frequência. . . Espectrograma de 20 Hz e 200 Hz Com um pouco de “zoom”. . .

Sistema de Produção de Fala Não-vocálicos � Sem vibração das cordas vocais! Exemplo: “sapato,

Sistema de Produção de Fala Não-vocálicos � Sem vibração das cordas vocais! Exemplo: “sapato, sapatos”

Sistema de Produção de Fala Não-vocálicos � No domínio da frequência. . . Espectrograma

Sistema de Produção de Fala Não-vocálicos � No domínio da frequência. . . Espectrograma de 20 Hz e 200 Hz

Sistema de Produção de Fala Não-vocálicos � No domínio da frequência. . . Espectrograma

Sistema de Produção de Fala Não-vocálicos � No domínio da frequência. . . Espectrograma de 20 Hz e 200 Hz Com um pouco de “zoom”. . .

Análise Espectral Transformada de Fourier � Ferramenta usada para calcular “espectro” Spectrum/Power. Spectrum Espectrograma

Análise Espectral Transformada de Fourier � Ferramenta usada para calcular “espectro” Spectrum/Power. Spectrum Espectrograma � Formalmente: Números � Janela calcula, para cada frequência. . . complexos Magnitude e Fase de tamanho fixo Como escolhê-la?

Análise Espectral Transformada de Fourier � Calcula � No os senos/cossenos presentes num sinal

Análise Espectral Transformada de Fourier � Calcula � No os senos/cossenos presentes num sinal computador: Componentes harmônicas da frequência de amostragem Senos e cossenos com frequência = k � famostragem � No mundo teórico Senos � Qual e cossenos em QUALQUER frequência o problema desses “mundos”?

Análise Espectral Transformada de Fourier � Como FFT o computador calcula? Fast Fourier Transformada

Análise Espectral Transformada de Fourier � Como FFT o computador calcula? Fast Fourier Transformada Rápida de Fourier � Exemplo Sinal com 2048 amostras Modo convencional = 2048 * 2048 = 4. 194. 304 contas Modo fast = 2048 * log 2(2048) = 22. 528 contas

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10*t – π/6)

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10*t – π/6) Frequência de amostragem = 1 KHz

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10*t – π/6)

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10*t – π/6) Frequência de amostragem = 1 KHz

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10, 3*t –

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10, 3*t – π/6) Frequência de amostragem = 1 KHz

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10, 3*t –

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10, 3*t – π/6) Inserindo vários zeros para melhorar “resolução”!

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10, 3*t –

Análise Espectral Transformada de Fourier � Exemplo: x(t) = 1 * cos(2*π*10, 3*t – π/6) Usando mais amostras do próprio sinal

Análise Espectral Transformada de Fourier � Ideal. . . Frequência do tom desejável é

Análise Espectral Transformada de Fourier � Ideal. . . Frequência do tom desejável é divisível pela frequência de amostragem � Não tão ruim. . . Usamos � Lutando a maior janela possível com o que temos. . . Calculamos a FFT com um bom número de zeros

Análise Espectral Transformada de Fourier � Sinais não-periódicos CVC, ditongos, . . .

Análise Espectral Transformada de Fourier � Sinais não-periódicos CVC, ditongos, . . .

Análise Espectral Transformada de Fourier � Sinais Se não-periódicos assumirmos que o sinal é

Análise Espectral Transformada de Fourier � Sinais Se não-periódicos assumirmos que o sinal é periódico. . .

Análise Espectral Transformada de Fourier � Sinais Se não-periódicos assumirmos que o sinal é

Análise Espectral Transformada de Fourier � Sinais Se não-periódicos assumirmos que o sinal é periódico. . .

Análise Espectral Transformada de Fourier � Sinais O não-periódicos que aconteceu? Mistura de informações!

Análise Espectral Transformada de Fourier � Sinais O não-periódicos que aconteceu? Mistura de informações!

Análise Espectral Espectrograma � Como o sinal de fala não é adequado à FFT.

Análise Espectral Espectrograma � Como o sinal de fala não é adequado à FFT. . . Dividimos o sinal de fala em trechos de tamanho fixo Igualmente espaçados Podem se sobrepor uns aos outros Calculamos a magnitude da FFT nesses trechos Juntamos tudo num gráfico

Análise Espectral Espectrograma � “Bem vindos à U T F P R”

Análise Espectral Espectrograma � “Bem vindos à U T F P R”

Análise Espectral Espectrograma � Apenas alterando o tamanho da janela. . .

Análise Espectral Espectrograma � Apenas alterando o tamanho da janela. . .

Análise Espectral Espectrograma � Outra Um forma de ver o Espectrograma. . . gráfico

Análise Espectral Espectrograma � Outra Um forma de ver o Espectrograma. . . gráfico tridimensional Tempo vs Frequência vs Magnitude

Análise Espectral Espectrograma/Janelas � Aplica-se um tipo de “janela” em cada trecho antes de

Análise Espectral Espectrograma/Janelas � Aplica-se um tipo de “janela” em cada trecho antes de calcular sua FFT! Objetivo: melhorar a qualidade do “espectro” � “Principais” tipos de janela Retangular Mais básica! Bartlet (triangular) Hamming/Hanning Gaussiana Lembram da distribuição normal?

Análise Espectral Espectrograma/Janelas

Análise Espectral Espectrograma/Janelas

Análise Espectral Espectrograma/Janelas

Análise Espectral Espectrograma/Janelas

Análise Espectral Espectrograma/Janelas

Análise Espectral Espectrograma/Janelas

Filtros Eliminar características indesejáveis do sinal � “Limpar ruído” Projetados no domínio da frequência

Filtros Eliminar características indesejáveis do sinal � “Limpar ruído” Projetados no domínio da frequência � Atuando no domínio do tempo Podem ser analógicos ou digitais � No Praat, são digitais

Filtros Características/parâmetros principais � Banda / Largura de Banda � Frequência de Corte Tipos

Filtros Características/parâmetros principais � Banda / Largura de Banda � Frequência de Corte Tipos básicos � Passa-baixa � Passa-alta � Passa-banda � Rejeita-banda

Filtros ideais

Filtros ideais

Filtros ideais

Filtros ideais

Filtros ideais (quando usamos d. B)

Filtros ideais (quando usamos d. B)

Filtros Exemplos do que posso conseguir na prática. . .

Filtros Exemplos do que posso conseguir na prática. . .

Filtros Exemplos do que posso conseguir na prática. . .

Filtros Exemplos do que posso conseguir na prática. . .

Filtros Na prática. . . � Somos mais “flexíveis” Atenuação na banda de rejeição

Filtros Na prática. . . � Somos mais “flexíveis” Atenuação na banda de rejeição não tão significativa Flutuações na banda de passagem Existência de banda de transição

Filtros No Praat. . .

Filtros No Praat. . .

Filtros Aplicando filtro passa-banda � Sinal original

Filtros Aplicando filtro passa-banda � Sinal original

Filtros Aplicando filtro passa-banda � Mantendo tudo entre 50 e 150 Hz. . .

Filtros Aplicando filtro passa-banda � Mantendo tudo entre 50 e 150 Hz. . .

Filtros Aplicando filtro passa-banda

Filtros Aplicando filtro passa-banda

Filtros Aplicando filtro passa-banda � Mantendo tudo, EXCETO entre 250 - 750 Hz

Filtros Aplicando filtro passa-banda � Mantendo tudo, EXCETO entre 250 - 750 Hz

Filtros Aplicando filtro passa-banda � Mantendo tudo, EXCETO entre 250 - 750 Hz

Filtros Aplicando filtro passa-banda � Mantendo tudo, EXCETO entre 250 - 750 Hz