You are on page 1of 38

La seal de voz

Asuncin Moreno

Indice

El aparato fonador La seal vocal Parmetros fundamentales Modelo de produccin de la voz Fontica acstica El odo Percepcin del sonido

El aparato fonador

La glotis

Seal de voz (fm= 8Khz/12 bits)

x104

El

gol -pe de ti - mn f - ue sobr-e co-g-e - do - r

800 600 400 200 0 -200 -400 -600 -800

150 100 50 0 -50 -100 -150 -200 0 100 200 300 400 0 100 200 300 400

-1000

Seal sonora: /e/

Seal sorda: /s/

Representacin temporal y frecuencial


200 100 0 -100 -200 0 5 10 15 20 25 30

0 -50 -100 -150

500

1000

1500

2000

2500

3000

3500

4000

Espectrograma

Variabilidad
Tres realizaciones de la palabra el pronunciadas por tres locutores distintos
1000

1000 500 0 -500 -1000 -1500 0 500

500

1000

1500

500

-500

0 500 1000 1500

-500

-1000
0 500 1000

Factores de variabilidad
Culturales Volumen de la voz Conjunto de sonidos Duracin Entonacin Formas de formar frases Velocidad del habla Vocabulario

Fisiolgicas
Tracto vocal Cuerdas vocales y frecuencia de vibracin Forma del pulso glotal Cansancio Congestin nasal

Ambientales

Ruido de fondo Factores mecnicos: vibraciones Estado emocional Acstica de la sala Ambiente: calor

Gramtica Espaola

Variabilidad intra locutor

Articulada

Susurrada

Alta voz

Normal

Enfado

Suave

Rpida

Palabra cero pronunciada en diversos estilos

Anlisis estadstico

No estacionariedad
600 400 200 0 -200 -400 -600 -800 -1000 0 200 400 600 800

Transicin del fonema /f/ al fonema /u/

Histograma

Aproximacin del histograma


1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -3 -2 -1 0 1 2 3

Representacin conjunta de dos muestras consecutivas

Tramas sorda y sonora con su autocorrelacin


800 600 400 200 0 -200 -400 -600 -800 -1000 0 100 200 300 400 100 50 0 150

-50
-100 -150 -200 0 100 200 300 400

2.5 2 1.5 1 0.5 0 -0.5

5 Corr. M./seg.=459 Sol.= 0% V.Dat: Rect Estim:Corr. Inse M./seg.=357 Sol.= 0% V.D x 10 3000

2500 2000 1500 1000 500 0

Tramas sorda y sonora: densidad espectral de potencia


800 600 400 200 0 -200 -400 -600 -800 -1000 0 100 200 300 400 -50 -100 -150 -200 0 100 200 300 400 100 150

50
0

Period. Mues./seg.=460 Sol.= 0% Vent. Hamm Period. Mues./seg.=459 Sol.= 70 60 50

45 40 35 30

40 30

25 20

Parmetros fundamentales

Tono (frecuencia fundamental) Formantes Ancho de banda

Tono (frecuencia fundamental)


Gama de variacin entre 50 Hz y 400 Hz Tono medio:


mujeres: 220 Hz varones: 130 Hz

1 octava de variacin en el habla normal.

Tono o frecuencia fundamental

Hz

Formantes de un sonido sonoro

4 kHz

Formantes de las vocales

Tringulo de las vocales


F1 800 a

i 2000 F2

200
800

F3:

2.24 kHz (u) 3.01 kHz (i)

Formantes de un sonido sordo

4 kHz

Evolucin de los formantes

Hz

Parametrizacin de la voz

Hz

Ancho de banda
50 Hz 300 Hz naturalidad

canal telefnico
3.4 kHz

inteligibilidad
7 kHz

Modelo de produccin de la voz


tren peridico de pulsos ruido excitacin
sonidos sonoros

H(z)
sonidos sordos

voz

tracto vocal

Fontica acstica
Oclusin No Total Nasales Si Sonoridad Vocales Oclusivas Oclusivas Africadas Parcial Fricativas Aproximantes Vibrantes Laterales Fricativas

No

Fontica acstica

Puntos de articulacin Alfono Fonema Variabilidad

Puntos de articulacin

labios: [p], [b], [m] dientes: [t], [d] alveolos: [n], [s] paladar: [J], [L] velo: [k], [g], [x]

Alfono

Cada uno de los sonidos propios de una lengua

Fonema

Conjunto de alfonos con el mismo valor fonolgico en una lengua


/s/, /z/ casa, mismo /n/, /N/ cana, tango

Variabilidad

contexto

coarticulacin prosodia factores individuales ... y sociolingsticos

locutor

El odo

Odo interno

Percepcin del sonido

Respuesta a la composicin frecuencial (no a la forma de onda) Enmascaramiento en frecuencia

Bandas crticas

Escalas de Bark y mel

Enmascaramiento Simultneo

You might also like