You are on page 1of 17

Modelamento Acústico do

Aparelho Fonador Humano

INF203 –
PROCESSAMENTO
DE VOZ E ÁUDIO
PROF. MÁRIO
MINAMI
Elementos do Modelo de Produção da Voz
Humana

 Tipo de Fonte de Excitação


 P. ex., Sonoras e Surdas

 Formato do Trato Vocal


 P. ex., nasalisado ou oralizado

 Efeito da Radíação da Fala


 P. ex., Posição Labial
Exemplo para um sinal sonoro, como uma vogal

S (Ω) = U (Ω).H (Ω).R(Ω)

Modelo da Modelo do Modelo da


Glote Trato Radiação
Vocal da Fala
• Os três modelos lineares e separáveis, para
simplicidade
• Propagação desde os pulmões, na traquéia, glote e
trato vocal, através de uma onda de pressão plana,
propagando-se progressivamente até os lábios
Modelo da Fonte de Excitação

Sonora: Cadeia quase-periódica de


bolsões de ar
Surda: tipo turbulento, como ruído

Plosiva: Escape de ar após oclusão total


Sussurro: Passagem através da glote
semi-fechada
Silêncio: regiões do sinal sem som
Seção Transversal da Larige

 Epiglote
 Falsas Cordas Vocais
 Cordas Vocais
 GLOTE: Cordas+Cavidade

 Traquéia

GLOTE

Fonte: http://www.evmsent.org/voice_mecha.asp
Ciclo Completo de Produção do Som na
Glote (Fonação)

 Músculos abdominais forçam o diafragma


a empurrar o ar a saírem dos pulmões para
a traquéia, subindo para a glote
 Este fluxo de ar provoca o movimento
periódico das cordas vocais
 A abertura e o fechamento da glote ocorre
em resposta à pressão subglotal na
traquéia:
 1 a 2: pressão sub-glotal empurra as cordas,
que se inicialmente se fecham
 3 a 4: a mesma pressão força a abertura
 5 a 7: o fluxo de ar consegue passar,
diminuindo a pressão sub-glotal
 8 a 10: pressão sub-glotal reinicia o ciclo

 Fonte: http://www.evmsent.org/voice_mecha.asp
Excitação SONORA (“Voiced”)

 Características importantes:
 Frequência fundamental f0
 Duração de cada fase (aberta e fechada)
 O instante da oclusão da Glote
 O formato de cada pulso (abertura, fechamento)
 Exemplo de Modelo, no domínio-Z:

S ( z ) = Θ 0U ( z ) H ( z ) R( z )
= Θ 0 E ( z )G ( z ) H ( z ) R ( z )
Comentários sobre o modelo:

 Os termos no domínio Z, correspondem exatamente aos


análogos em w (contínuo)
 Coeficiente de ganho Θ0
 E(z) é a transformada Z do trem de impulsos e(n), com
período de pitch P
 G(z) é o filtro de trato vocal (glote), g(n) sua reposta
impulsiva

 Logo,

u ( n) =
i = −∞
g (n − iP )
Excitação SURDA

 Um tipo de excitação surda são sons que friccionam


com grandes constrições no trato vocal (fricativo)
 Outro tipo é um súbito escape de ar depois da
abertura rapidíssima de uma oclusão (plosivo)
 O modelo para ambos é um ruído branco N(z):

S ( z ) = Θ0 N ( z ) H ( z ) R( z )
Ou, no domínio da frequência (DTFT):
S ( w) = Θ 0 N ( w) H ( w) R( w)
Modelamento do Trato Vocal

 Comprimento de onda de uma onda plana acústica de 4kHz:


vsom 340 m/s
λ4 kHz = = = 8.5 cm
f 4000 ciclos/s
 Como o diâmetro do trato vocal é de ± 2 cm, a hipótese de
uma onda plana se propagando dentro dele, é razoável.
 Leis importantes: da Continuidade e
de Newton
1 ∂p ( x, t ) r
p(x,t) pressão sonora 2
= −∇vζ ( x, y, z , t )
r Vetor velocidade no ar ρvsom ∂t
vζ ( x, y, z , t ) de uma partícula ζ r
∂vζ ( x, y, z , t )
ρ Densidade do ar no tubo ρ = −∇ • p( x, t )
∂t
Aproximação onda plana propagando na direção x
(origem na glote para os lábios):

A(x,t)
r seção transversal variável do trato vocal, na posição x e instante t
v ( x, t ) velocidade de um volume de ar, na posição x e instante t:
r r
v ( x, t ) = A( x, t )vζ ( x, t )
Substituindo nas expressões tridimensionais:

∂v( x, t ) 1 ∂[ p ( x, t ) A( x, t )] ∂A( x, t )
− = 2 +
∂x ρvsom ∂t ∂t
∂p ( x, t ) ∂[v( x, t ) / A( x, t )]
− =ρ
∂x ∂t
Modelo de 1 Tubo sem Perdas
Glote Lábios

0 x 17,5 cm

Terminação ABERTA, lábios abertos, o desvio da pressão será


nulo em x=l (l = 17,5cm), em relação à pressão ambiente:
p (l , t ) = plabios (t ) = 0
Para regime permanente, a fonte na glote pode ser modelada
por exponencial complexa:
v(0, t ) = u glote (t ) = U glote (Ω)e jΩt
Modelo para lábios abertos:

U glote (Ω) def


v(l , t ) = e jΩt = U labios (Ω)eiΩt
cos(Ωl / vsom )
Onde U glote (Ω) é o fasor para o sinal uglote(t).
A função de transferência para o trato vocal é dada pela relação
entre os fasores das velocidades nos lábios e na glote:

U labios (Ω) ulabios (t ) 1


H (Ω) = = =
U glote (Ω) u glote (t ) cos(Ωl / vsom )
Resultados para lábios abertos:

 As frequências de ressonância fi para este modelo são obtidas


igualando o denominador a zero:
Ωi l π
= (2i − 1) para i = 1,2,3,4,...
vsom 2
 Como Ωi = 2πfi , as ressonâncias ocorrerão nas frequências:

vsom
fi = (2i − l ) para i = 1,2,3,4,...
4l
Resposta em Frequência, modelo 1 Tubo

vsom = c = 353.027 m/s, Θ = 37oC, l = 17.5 cm


fonte: http://www.sengpielaudio.com/calculator-speedsound.htm
 // inf203 - aula 3: modelamento acustico do trato vocal
 // Minami - 20 set 2010
 maxgain = 50; // ganho maximo = 50dB
 l = 17.5e-2; // comprimento do trato vocal em m
 v = 350; // velocidade do som, m/s, no ar na temperatura de 37 celsius
 fat = l/v;
 omega = 0:6000;
 w = 2*%pi*omega*fat;
 den = cos(w);
 ntot = prod(size(den));
 for i=1:ntot
 H(i) = 20*log10(abs(1/den(i)));
 if H(i)>maxgain
 H(i) = maxgain;
 end
 end
 clf
 plot(omega,H);
 xtitle( 'Resposta em Frequência de um Tubo Acústico Uniforme', 'frequência, f(kHz)',
'20log(|H(f)|)');
Digite CD

Digite CD scilab

Verifique se o arquivo
inf203_1.sce está aqui

Digite este comando

You might also like