You are on page 1of 23

MÉTODOS DE EXPLORACIÓN FUNCIONAL DE LA VOZ

Los métodos para explorar la laringe y la voz se pueden dividir dos grandes grupos: exploración
endoscópica y exploración funcional.

Métodos de exploración endoscópica

Los métodos de exploración endoscópica son considerados métodos invasivos ya que se realizan por
vía endoscópica, como lo señala su nombre. Consisten básicamente en la introducción por vía oral o
nasal de una óptica rígida o flexible para poder observar el estado estructural y funcional de las
estructuras de la laringe, faringe y nariz. A continuación de presentan en detalle los métodos de
exploración endoscópica más utilizados en la clínica de voz. Estos exámenes son normalmente
realizados por un médico otorrinolaringólogo o foniatra.

Métodos de exploración funcional

Los métodos funcionales de exploración de la voz son considerados procedimientos no invasivos ya


que no es necesaria la introducción de ninguna óptica por vía endoscópica (oral o nasal). Como lo
señala su nombre, estos métodos miden diferentes parámetros de la función vocal. A continuación se
entrega una descripción detallada de los métodos funcionales más utilizados para evaluar la voz.

Electroglotografía

La electroglotografía es un método no invasivo que permite obtener información sobre los movimien-
tos vibratorios de las cuerdas vocales.

El término electroglotografía hace referencia a un dispositivo que permite visualizar indirectamente los
movimientos de los pliegues vocales mediante una pequeña corriente eléctrica que pasa a través del
cuello, a nivel de la laringe, utilizando dos electrodos de sobre la superficie del cuello.

Para realizar este estudio es necesario colocar un par de electrodos sobre la superficie del cartílago
tiroides, a la altura de los pliegues vocales. Un débil voltaje de alta frecuencia es aplicado a un elec-
trodo y el otro electrodo recoge la corriente eléctrica que pasa a través de la laringe. La impedancia
eléctrica varía con la apertura y cierre de la glotis, lo que se traduce en una variación de la corriente
eléctrica en fase con la fase vibratoria de los pliegues vocales.
Realización del examen de electroglotografía

A la izquierda, se observan los electrodos utilizados en la electroglotografía. A la


derecha, un paciente con los electrodos colocados a ambos lados del cartílago tiroides

Análisis de los parámetros cualitativos de la electroglotografía

1. Regularidad de frecuencia y amplitud.


2. Estudio de fases del ciclo glóticos (abierta, en cierre, cerrada y en apertura).
3. Existencia de doble pico en el trazado.
4. Oscilaciones en la región del pico de cierre.
5. Grado de amplitud de la onda electroglotográfica.

1 = Mínimo contacto entre las cuerdas vocales.


a = Área de contacto comienza a aumentar rápidamente,
inicio de la fase de cierre, contacto margen inf.
a-b = Prosigue la aproximación del margen inferior
b = Margen superior hace contacto
b-c = Se alcanza el cierre glótico
c = pto. De máximo contacto de las cuerdas vocales. Termina la fase de cierre
c-d = Máxima área de contacto. La glotis es mínima
d = Inicio de la fase de apertura
d-e = Prosigue la separación gradual del margen inf. de las cuerdas vocales
e = separación completa del margen inf. Inicio de la separación del margen sup
E-f = Espacio glótico aumenta
f = Punto de mínimo contacto, glotis máxima.
f-a = Pico de alejamiento entre las cuerdas vocales.
Esquema ideal de un ciclo de electroglotografía
Parámetros cuantitativos de la electroglotografía

Los parámetros cuantitativos más utilizados son: promedio de frecuencia fundamental, frecuencia
fundamental máxima, frecuencia fundamental mínima, desviación estándar de la frecuencia funda-
mental, Jitter, Shimmer, cociente de contacto y cociente de apertura.

Ejemplos de Ondas de electroglotografía

Onda EGG de una voz normal en registro modal

Onda EGG de una voz normal en registro de falsete (fase abierta más larga que la fase de contacto).

Onda EGG de una voz normal en registro vocal fry


Onda EGG de paciente con disfonía (voz soplada). Se observa una prolongación de la fase abierta del ciclo fonatorio.

Onda EGG de paciente con voz apretada. Se observa una prolongación de la fase cerrada.

Onda EGG irregular.

Medidas aerodinámicas de la fonación

Las medidas aerodinámicas de la fonación constituyen un método clínico de evaluación para obtener
información acerca de la función vocal de forma no invasiva. Estas medidas son consideradas objeti-
vas conjuntamente con el análisis acústico de la voz y la electroglotografía. Las medidas aerodinámi-
cas más comúnmente utilizadas en la clínica son: presión subglótica, flujo transglótico y resistencia
glótica.
Equipo para la realización del examen de las
medidas aerodinámicas de la fonación.

El promedio de la velocidad de flujo transglótico es definido como la velocidad con que el aire pasa
entre los pliegues vocales durante la fonación y es medido en ml/seg. Dicho en otras palabras, es el
volumen en litros dividido por el tiempo máximo de fonación en segundos.

La presión subglótica, que es medida en cm. de H2O, actúa como una fuerza debajo de los pliegues
vocales, subiendo hasta que supera la resistencia de los éstos y dando comienzo así a la oscilación.
Esta presión representa la energía disponible para la creación de la señal acústica de la voz.

La resistencia laríngea es una medida derivada que combina las medidas de presión y de flujo, no
puede ser medida directamente. Se calcula dividiendo la presión subglótica por el promedio de velo-
cidad de flujo. Esta medida sirve como una estimación de la función de válvula de la laringe.

Para mayor información sobre este tema, se recomienda leer el artículo de medidas aerodinámicas
de la fonación que estará disponible en algunos módulos más adelante.

Este gráfico muestra como el flujo de aire transglótico (línea roja) aumenta desde una fonación apretada (izquierda),
pasando por una fonación normal (tercio medio) y llegando a una fonación soplada (tercio derecho).
A medida que disminuye la resistencia de los pliegues vocales, el flujo de aire incrementa entre ellos.
Gráficos representativos de la disminución de la velocidad de flujo después de la terapia vocal.
A la izquierda (pre-terapia) se ve un mayor flujo que en el gráfico de la derecha (post-terapia).

Gráficos representativos de la disminución de la presión subglótica después de la terapia vocal.


A la izquierda (pre-terapia) se ve una mayor presión subglótica que en el gráfico de la derecha (post-terapia).

De izquierda a derecha se observa un aumento del flujo glótico al ir cambiando los registros vocales.
En el extremo izquierdo la voz está siendo producida con registro de vocal fry, el cual es caracterizado por un largo tiempo cierre de las
cuerdas vocales (alto cociente de aducción). En la zona central, el registro utilizado es el modal o voz de pecho con un grado de cierre
glótico medio. Al extremo derecho la producción vocal corresponde al registro de falsete donde las cuerdas vocales tienen un disminuido
cierre glótico (en ocasiones no hay cierre) lo que se demuestra con el más alto flujo glótico de la secuencia.
Filtro inverso

Es una técnica de análisis que se aplica tanto a la señal acústica como aerodinámica de la voz para
un análisis especializado de la forma de onda.

Debido a que este tipo de señales (acústicas y aerodinámicas) son medidas a nivel de la boca, la
forma de onda resultante (la que se ve) es el producto de dos componentes: el sonido de la fuente
glótica (cuerdas vocales) y las características de resonancia del tracto vocal (filtro acústico).

El filtro inverso es una técnica que aísla estos dos componentes. A través de una serie de procesos
de filtros computacionales, los efectos de las influencias del tracto vocal o cavidades supraglóticas
(filtro acústico) pueden ser eliminados para analizar aisladamente lo que ocurre en la fuente glótica.

La forma de onda que queda después de este proceso de filtro reflejara los elementos glóticos del
sonido o flujo (sin las influencias del tracto vocal). Por lo tanto, la técnica de filtro inverso permite al
clínico o investigador observar los patrones acústicos de la fuente glótica o los patrones de flujo de
aire en la glotis.

La señal de filtro inverso usualmente es descrita por las pendientes de apertura y cierre de la forma
de onda. Medidas típicas incluyen rasgos de tiempo tales como proporciones del tiempo de apertura y
cierre comparado con el largo total del período, y rasgos de la forma, tales como los mínimos o los
picos de la forma de onda.

Utilizando la máscara de Rothenberg Máscara de Rothenberg se utiliza para hacer filtro inver-
so y medidas aerodinámicas (Foto: Glottal).
Software utilizado para la realización del filtro inverso de a señal acústica o aerodinámica.

Análisis acústico

Oscilogama

El oscilograma o forma de onda es una representación temporal del sonido

Oscilogramas de voz normal (onda periódica compuesta).


Ambas ondas son las mismas, pero la segunda está más descomprimida para una mejor visualización.
Espectro FFT

La FFT (Transformada rápida de Fourier) muestra la amplitud relativa de los armónicos, reflejando la
combinación del espectro de la fuente, la función de transferencia y las características de radiación.
La FFT no es precisa para determinar la frecuencia de los formantes ya que en ocasiones el centro
de frecuencia de estos no coincide con los armónicos.

FFT de la vocal /i/ con filtro de banda estrecha.


Se observa buena definición para los armónicos de la voz.

FFT de la vocal /i/ con filtro de banda ancha.


No se observa buena definición para los armónicos de la voz si la comparamos con la FFT de con banda estrecha (arriba).
FFT en cascada de la vocal /i/ con filtro de banda estrecha. Se observa el FFT en función del tiempo.

Espectrograma

El espectrograma también se realiza aplicando un análisis de Fourier. Se diferencia del spectrum FFT
en que entrega la información de forma diferente. El espectrograma se observa en función del tiempo,
no es un corte en un momento determinado como lo es el spectrum. A través del espectrograma po-
demos ver los cambios de armónicos y formantes en una ventana con un tiempo determinado.

Espectrograma vocal /a/ voz normal con filtro de banda ancha


(Buena definición para los formantes y ciclos)
Espectrograma vocal /a/ voz normal con filtro de banda estrecha
(Buena definición para los armónicos de la voz)

Espectrograma voz disfónica con escape de aire. Se observa ruido interarmónico y pérdida de energía
de los armónicos de alta frecuencia. Los armónicos mas altos desaparecen y son completamente reemplazados por ruido.

Espectrograma de un glisando (con filtro banda estrecha). A medida que aumenta la frecuencia fundamental en el glisando, la distancia
interarmónica es mayor. La secuencia se inicia con registro de vocal fry, luego modal, falsete, modal y finaliza con vocal fry nuevamente.
Espectrograma de banda ancha de una secuencia vocálica /i, e, a, o, u/ (con filtro de banda ancha). Gran variación de los formantes 1º y 2º
a medida que se modifica el tracto vocal cambiando el molde vocálico. La vocal /i/ de caracteriza por un F1 en frecuencias bajas y F2 en
frecuencias altas. La vocal /a/ se caracteriza por un F1 y F2 muy cercanos en frecuencias medias.
La vocal /u/, F1 y F2 muy cercanos en frecuencias bajas.

Mismo espectrograma anterior con historia formántica (LPC).

Espectrograma de banda estrecha o angosta de una secuencia vocálica. Los formantes no son notorios por el hecho de ser con banda
estrecha. Si existe una clara diferenciación de los armónicos de la voz.
Espectrograma vocal /a/ cantada con vibrato. Se pueden ver las oscilaciones del vibrato en cada armónico
y además se observa claramente el “formante del cantante” cercano a los 3000 Hz.

Espectro promedio a largo plazo (LTAS)

LTAS (Long-term Average Spectrum) pone en un sólo espectro la medida de varios espectros obteni-
dos en un periodo de tiempo determinado, mientras el paciente habla, lee un texto o canta una can-
ción. Es especialmente útil para obtener características tanto de la fuente (cuerdas vocales), como del
filtro (tracto vocal), siendo mas importante las primeras. A través del LTAS es posible obtener varias
variables relacionadas con la distribución de la energía espectral de la voz, por medio de pendientes
espectrales, siendo una de las más utilizadas el Alpha Ratio.

Este gráfico LTAS corresponde a al habla espontanea de un actor con “voz resonante”.
Posee gran amplitud de los armónicos de alta frecuencia.
Este gráfico LTAS corresponde a al habla espontanea de un actor con “voz opaca”.
Posee pobre amplitud de los armónicos de alta frecuencia si la comparamos con la imagen anterior perteneciente a una voz “resonante”.

LTAS de una voz severamente disfónica. Se observa ausencia completa de energía armónica en casi todo el espectro. Solo se pueden
distinguir los dos primeros armónicos. Desde 700 Hz hacia arriba sólo se observa energía no armónica (ruido)

Espectro LPC

La LPC (Lineal Predicting Code) muestra una envolvente del espectro y por lo tanto la identificación
de los formantes es fácil. No se pueden ver los armónicos. El LPC se puede graficar de dos formas:
como historia formántica o como un corte.
Corte LPC de vocal /a/.

FFT y LPC de la vocal /a/ juntos. Al estar ambos juntos se obtiene una
buena aproximación visual de la coincidencia formantes-armónicos.

LPC en historia formántica de una frase hablada. Lineas rojas muestran los formantes durante le habla.
LPC en historia formántica de una secuencia de dos vocales /i/ y /a/ en forma consecutiva.
La línea de color rojo muestra el primer formante (F1), la línea de anaranjada señala el segundo formante (F2),
más arriba la línea de color verde muestra el tercer formante (F3) y finalmente la línea azul señala el cuarto formante (F4)

LPC en cascada de la vocal /i/. se observan los cortes de LPC en función del tiempo.

Cepstrum

El análisis cepstral provee una forma efectiva de derivar el valor de la F0 y evaluar algunas caracte-
rísticas de la fuente y función del filtro del tracto vocal de una forma no invasiva. La palabra cepstrum
se origina de la inversión de la primera sílaba de la palabra “spectrum”. La razón de esto es porque el
análisis cepstral es de alguna forma lo inverso del análisis espectral. En otras palabras, el método
cepstrum consiste en aplicar dos transformadas de Fourier a la forma de onda del sonido vocal.
En esta imagen se observa la FFT (arriba) y el cálculo del cepstrum (abajo). Este último resulta en la determinación del pico de mayor am-
plitud en una escala temporal, lo que permite calcular el valor de la frecuencia fundamental, y la amplitud de este pico del cepstrum, entre-
gando información relacionada con grado de periodicidad de la voz.

Cepstrum voz normal. Se observa un pico con un valor de 7,6. Este valor representa el periodo de la F0 y a través de éste podemos derivar
que el valor de la frecuencia fundamental es 131 Hz. La intensidad de ese pico está dada por el valor de 150, señalado presencia de alta
energía en la F0 (atribuido a una voz de buena calidad). Además podemos observar que existe un ancho reducido del pico cepstral, indi-
cando alta estabilidad de la frecuencia.

Cepstrum voz disfónica. Nuevamente se observa un pico con un valor de 7,6. y por lo tanto el valor de la frecuencia fundamental es 131 Hz.
Pero, en forma contraria a la imagen anterior, acá vemos un pico de F0 de baja intensidad (50) y más ancho. Lo primero señala poca ener-
gía en este componente espectral y lo segundo indica alto grado de inestabilidad. Ambos rasgos característicos de voces de mala calidad.
Análisis de índices acústicos

Los índices acústicos son valores numéricos que entregan información acerca de diferentes paráme-
tros de la fonación tales como: perturbación de la frecuencia, perturbación de la amplitud, cantidad de
ruido y energía armónica en la voz, cantidad de sub-armónicos, quiebres vocales, temblor vocal e
irregularidades.

Gráfico de índices acústicos de una voz normal


(todos los índices están en verde, dentro de rangos normales)

Gráfico de índices acústicos de una voz alterada (paciente con nódulos de cuerdas vocales).
Se ven índices en rojo (fuera del rango de normalidad). Por ejemplo, se observa que los índices jitter (Jitt) y shimmer (Shim), perturbación
de la frecuencia y de la amplitud respectivamente, están fuera de rangos normales.
Gráfico de índices acústicos de una voz severamente alterada (parálisis de cuerda vocal).
La mayoría de los índices acústicos están en color rojo indicando que están fuera del rango de normalidad.

Fonetograma

El fonetograma es una representación gráfica de los rangos de frecuencia e intensidad de una voz.
Rango vocal y rango dinámico respectivamente. Mediante la grabación se le pide al paciente que emi-
ta cada nota de la extensión tonal a la mínima y máxima intensidad que sea capaz de hacerlo. Esto
dará un área denominada campo vocal. El fonetograma es muy útil para registrar el estado pre y post
tratamiento fonoaudiológico, médico o quirúrgico, de esta forma se pueden observar en forma gráfica
los avances del tratamiento a través de los parámetros ya mencionados: rango vocal, rango dinámico
y campo vocal.

Fonetograma perteneciente a una voz normal.


Fonetograma perteneciente a una voz patológica. Campo vocal disminuido (disminución del rango dinámico y rango vocal).

Histograma

El histograma es un gráfico que muestra el número de veces que se repite cada valor de frecuencia
fundamental o F0 (histograma de frecuencia) y cada valor de intensidad (histograma de intensidad o
amplitud) durante la emisión de la voz. Dicho de otra forma, el histograma muestra las frecuencias
fundamentales (en Hz) y las intensidades (en dB) que más utiliza el paciente durante la emisión de
voz. Para obtener la F0 y la intensidad más utilizada por un paciente, se le pide que produzca una
vocal mantenida, diga alguna frase o hable en forma normal (habla espontánea), esta señal se grafica
posteriormente en los histogramas ya mencionados. El histograma es la forma objetiva más confiable
para obtener el “Tono medio hablado” de una persona.

Histograma de Intensidad o amplitud correspondiente a una voz normal (vocal mantenida).


La barra más larga es la intensidad más utilizada por el paciente. Este caso muestra una voz estable.
Histograma de Frecuencia correspondiente a una voz normal (vocal mantenida). La barra más larga es la F0 más utilizada por el paciente.
Voz estable.

Histograma de F0 correspondiente a una voz con quiebre vocal (comúnmente encontrado en la puberfonía). Se observan dos picos clara-
mente diferenciados producto de la gran diferencia de F0 de la voz antes y después del quiebre vocal. Voz con inestabilidad.

Histograma de amplitud correspondiente a una voz con quiebre vocal. Se observan dos picos claramente diferenciados producto de la gran
diferencia de amplitud de la voz antes y después del quiebre vocal.
Contornos

Los contornos grafican la variación ciclo a ciclo de la frecuencia fundamental (F0) y la amplitud. Mien-
tras más parejo sean los contornos se demuestra menos variación ciclo a ciclo y por lo tanto mejor
calidad vocal durante una vocal mantenida en el tiempo. Las escalas de F0 e intensidad son diferen-
tes e independientes.

Gráfico mostrando una voz normal con frecuencia fundamental (F0) y amplitud estables. Arriba, la línea de color azul se observa el contorno
de amplitud y abajo, la línea de color rojo, el contorno de F0 o contorno melódico.

Gráfico mostrando un quiebre vocal. Arriba en azul se observa el contorno de amplitud el cual baja bruscamente producto del quiebre vocal.
Abajo en color rojo el contorno melódico, el cual asciende bruscamente pasando desde registro de pecho a falsete durante el quiebre tonal.
Gráfico mostrando contornos de intensidad y F0 muy inestables. Se le solicitó al paciente producir una vocal mantenida los más estable
posible, sin embargo no fue capaz de realizar la tarea solicitada.

Estos contornos de intensidad y F0 pertenecen a un paciente con temblor de voz. Esta patología es de origen neurológico. En el gráfico se
observa claramente que tanto el contorno de amplitud, como el de F0 presentan modulaciones reflejando en temblor del paciente.

Fonoaudiólogo Marco Guzmán

You might also like