You are on page 1of 55

Captulo 1

Definiciones generales y amplificaci


on.
1.1.

Valor medio, de pico y rms.

En general las se
nales que se utilizan en un sistema de audio contienen componentes
alternas, por lo cual su valor instantaneo resulta poco interesante a la hora de dimensionar
los sistemas que se van a utilizar. Las caractersticas de las se
nales que nos interesaran son:
su valor de pico, y su valor medio.
Dada una se
nal x(t) expresada en terminos de tension se define su valor medio en un
intervalo T como:
1
hx (t)i =
T

x (t) dt

(1.1)

El valor de pico se define como el maximo valor que alcanza la se


nal en el intervalo de observacion. El valor de pico es importante en cuanto nos dice la maxima potencia instantanea
que va consumir la se
nal. La potencia instantanea la definiremos como:

Pi (t) =

x2 (t)
R

(1.2)

Donde x(t) es una onda de tension y R es la carga donde medimos la potencia. Sin embargo los dispositivos de audio (mesas de mezclas, amplificadores) son capaces de soportar
una potencia instantanea relativamente alta mientras que sus limitaciones vienen dadas por
la potencia consumida en un periodo largo de observacion, es decir por la potencia media.
Se define la potencia media en un intervalo T como el valor medio de x2 (t) en un ese intervalo:

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

1ZT 2
Pm = x (t) =
x (t) dt
(1.3)
T 0
La ecuacion anterior se puede interpretar como la media en un intervalo de la potencia
instantanea considerando una carga de 1 . A partir de esta potencia media definimos el
valor rms 1 como:
D

Vrms =

Pm

(1.4)

El valor rms es por lo tanto un valor de tension y representa la tension eficaz en terminos
de generacion de potencia, es decir la tension equivalente que contribuye a la generacion de
la potencia media liberada en la carga.

1.2.

Unidades logartmicas.

Las unidades logartmicas son las mas utilizadas para expresar relaciones de potencias y
tensiones en aplicaciones de audio y vdeo. Hay dos razones principales: los calculos con este
tipo de unidades resultan sencillos e intuitivos debido a que las ganancias y atenuaciones
de un sistema se suman en vez de multiplicarse; la segunda razon es que el odo presenta
una respuesta logartmica a las variaciones de nivel sonoro: un aumento del 50 % de presion
sonora no se percibe como un aumento del 50 % del volumen. Sin embargo si variamos la
presion sonora de forma logartmica la sensacion sera un aumento lineal del volumen sonoro.
Existen gran cantidad de unidades logartmicas, pero las mas utilizadas en el campo del
audio son los dB, dBW, dBm, dBV y dBu.
Los decibelios o dB son unidades que expresan la relacion entre dos
potencias. Se define un dB como:

dB, dBW y dBm

P1
)
(1.5)
P2
Donde P1 y P2 son dos potencias en vatios. Los dB son unidades adimensionales. Para
poder expresar una potencia en unidades logartmicas se utiliza el dBW y el dBm, que se
definen como:
dB = 10log(

dBW = 10log(
1 Root

Mean Square

P (W )
)
1(W )

(1.6)

CAPITULO 1. Definiciones generales y amplificacion.

Sistemas de Audio e Vdeo. Curso 2003-2004

dBm = 10log(

P (mW )
)
1(mW )

(1.7)

Es decir, una referencia de 0 dBW indica una potencia de un vatio y una referencia de 0
dBm una potencia de un milivatio.

dBV En determinados casos es necesario expresar una relaci


on entre tensiones tambien
en unidades logartmicas. Si disponemos de una tension V aplicada a una resistencia R
generara una potencia:

V2
R
Tomando como referencia un voltio aplicado a la misma resistencia:
P =

(1.8)

V2
dBV = 10log( 2 ) = 20log(V )
(1.9)
1
En general la tension V no sera continua sino alterna y por lo tanto se utilizaran valores
rms. Un nivel de 0 dBV indicara una tension de 1 V rms independientemente de la carga
sobre la que esa tension este actuando. Observese que los dBV indican una relacion entre
potencias por lo que sigue siendo posible operar con dB y dBV conjuntamente.

Muchos de los equipos de audio habituales utilizan como medida dBu (algunas veces
denominados dBv) en vez de dBm o dBV. Un valor de 0 dBu corresponde al nivel de tension
que aplicado sobre una carga de 600 genera una potencia de 1 mw. Los dBu toman por lo
tanto una referencia de 0.774 V rms.

dBu

dBu = 20log(

V
)
0,774

(1.10)

La impedancia de 600 es la estandar para diversos dispositivos y medios de transmision


(por ejemplo la linea telefonica), por lo cual se toma como carga por defecto. El sufijo u significa unloaded, es decir sin carga, expresando que una medida en dBu se toma sin a
nadir una
carga adicional; esto evidentemente sera cierto si estamos midiendo en una lnea telefonica
o en cualquier otro medio que presente esa impedancia. En ese caso, si medimos sobre una
carga de 600 , los valores obtenidos en dBu coinciden numericamente con los obtenidos en
dBm (puesto que los dBm toman como referencia un milivatio).

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Smbolo
dBV
dBu
dBW
dBm

Referencia para 0 dB
1 V rms
0.775 V rms
1W
1 mw

Cuadro 1.1: Unidades logartmicas

A pesar de lo dicho los dBu se utilizan independientemente de la carga sobre la que


este actuando la se
nal. Una referencia de 0 dBu indica siempre un nivel de tension de 0.774
V . Si por ejemplo las especificaciones de un dispositivo indican un nivel maximo de salida
de 20 dBu sobre una resistencia de 10 K deducimos que es capaz de ofrecer un maximo de
7.74 V.
!

(1.11)

X = 0,774 10 20 = 7,74V

(1.12)

X(V )
20dBu = 20log
0,774
20

En la mayora de los equipos de audio modernos, las salidas y entradas son sensibles
a niveles de tension y no de potencia (excepto en las conexiones entre amplificadores de
potencia y altavoces) por lo que de las unidades de la tabla 1.2 las mas utilizadas son el dBV
y dBu. La conversion entre dBV y dBu es sencilla de deducir:
X(V )
XdBu = 20log
0,775

= 20log(X(V )) 20log(0,775)

XdBu = XdBV + 2,2dB

1.3.

(1.13)
(1.14)

Niveles operativos.

Aunque los niveles operativos utilizados por los dispositivos de audio varan en un rango
muy amplio, se suelen distinguir tres tipos diferentes:
Nivel de Microfono Mic Level.
Se consideran de este tipo niveles hasta -20 dBu (77.5 mV). Se obtienen a la salida de
microfonos, giradiscos, cintas magneticas y pastillas de guitarras y otros instrumentos.

CAPITULO 1. Definiciones generales y amplificacion.

Sistemas de Audio e Vdeo. Curso 2003-2004

Nivel de linea Line Level


Se consideran de linea niveles un rango de -20 a 30 dBu. Generan se
nales de este orden
de magnitud teclados electronicos, previos, mesas de mezclas, procesadores de se
nal y
en general la mayora de los dispositivos implicados en un estudio de grabacion, excepto
los amplificadores de potencia.
Nivel de altavoz Speaker level.
Se consideran de este tipo niveles mayores de 30 dBm. Se obtienen a la salida de los
amplificadores de potencia y de los altavoces.

1.4.

Medidores.

Las mesas de mezclas disponen de medidores que permiten al tecnico comprobar los niveles
de se
nal que circulan por los canales. Se utilizan dos tipos de medidores: el de unidades de
volumen (VU meter y el PPM o Peak Program Meter, siendo el primero de ellos el mas com
un.
Las mesas mas modernas sustituyen sin embargo el tradicional VU meter por medidores
digitales basados en LEDs. Veremos una breve descripcion de cada uno de estos dispositivos.
1.4.1.

VU meter

El VU meter es un sistema de medicion bastante antiguo pero que sigue utilizandose


ampliamente hoy en da. Su popularidad reside en que la medida que proporciona coincide
bastante fielmente con la sensacion de volumen sonoro que percibe el odo.
Hay varias razones para esto. Por una parte el VU meter responde al valor rms de la
se
nal de entrada de la misma manera que hace el propio odo, por lo que su medida da una
idea mucho mas aproximada del volumen de la se
nal que si respondiese a valores maximos
de se
nal. Ademas, el tiempo que la aguja tarda en alcanzar su maxima deflexion es de aproximadamente 0.33 s, lo cual produce que los picos instantaneos de se
nal no se reflejen en el
medidor as como no afectan a la sensacion de volumen que percibimos.
Fsicamente el VU meter consiste en una aguja que recorre una escala graduada de -10 a
3 VU (unidades de volumen). El valor cero corresponde a un nivel de referencia de 4 dBu.
La medida obtenida respecto a la referencia coincide con decibelios si se utiliza una se
nal
sinusoidal. Si la se
nal es mas compleja, la lectura del VU meter es superior al nivel en dB.

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

1.4.2.

PPM

El PPM es un medidor activo (frente al VU meter que es pasivo). La principal diferencia


con el anterior es que tiene un tiempo de respuesta de 10 ms, mucho menor que el VU meter
y por lo tanto es capaz de responder a picos de se
nal.
Existen varios tipos de medidores PPM que se diferencian en la escala utilizada, aunque en
todos estan graduados en dB.

1.4.3.

Medidores digitales.

Disponibles en los dispositivos modernos, estos medidores presentan ciertas ventajas respecto a los anteriores. Consisten en hileras de LEDs o visores de cristal lquido que de
iluminan indicando el nivel de la se
nal de entrada. Ademas de ser mas exactos permiten
la visualizacion simultanea del valor de pico y del nivel rms, generalmente el nivel de pico
alcanzado se mantiene iluminado durante unos instantes permitiendo al usuario su lectura.

1.5.

Niveles de referencia.

Al realizar una grabacion es imprescindible ajustar los margenes de variacion de las se


nales
que se pretende almacenar a los permitidos por los distintos elementos que intervienen en
el proceso de mezcla. Esta variacion se vera limitada superiormente por el maximo nivel
soportado por el dispositivo e inferiormente por el nivel de ruido o noise floor. Si se supera el
maximo nivel permisible, la se
nal resultara distorsionada y en el peor de los casos el aparato da
nado. Si el nivel de se
nal desciende por debajo del nivel de ruido, la se
nal sera inaudible.
Si tomamos como ejemplo una grabacion en directo, el margen de ruido vendra dado por
el ruido ambiental que se introduce por el microfono, y el nivel maximo por el propio vocalista. En caso de una grabacion de estudio donde no existe ruido ambiental, el nivel mnimo
vendra fijado por el ruido electrico que introducen los dispositivos y el maximo, igual que
antes, por los pasajes mas fuertes de la grabacion.

La diferencia entre ambos niveles, maximo y mnimo es lo que denominamos margen dinamico. En una grabacion de m
usica moderna, el margen dinamico puede
alcanzar un valor de hasta 120 dB, superior al permitido por cualquier sistema de almacenamiento, lo que obliga a su reduccion mediante dispositivos especiales denominados compresores y limitadores que estudiaremos mas adelante.

Margen din
amico

CAPITULO 1. Definiciones generales y amplificacion.

Sistemas de Audio e Vdeo. Curso 2003-2004

El margen dinamico obtenido a la salida del instrumento se mantendra durante toda la


cadena de mezcla (a menos que utilicemos dispositivos especficos para reducirla) independientemente de que variemos los niveles electricos. Por ejemplo, si obtenemos a la entrada
de un microfono un rango de 40 a 130 dB SPL, es decir un margen dinamico de 90 dB,
podremos ajustar su preamplificador para recibir a la entrada de la mesa de mezclas el nivel
de se
nal electrica que deseemos. Este proceso no modificara el margen dinamico.

Aunque una grabacion presente un margen dinamico muy alto, la mayor


parte del tiempo el nivel de la se
nal mantendra unos valores mas o menos constantes. Es
conveniente que este nivel medio coincida con el de funcionamiento optimo de los dispositivos
utilizados para la mezcla. Las mesas de mezclas estan dise
nadas para funcionar a un nivel
de se
nal que se denomina nivel nominal u operativo que corresponde a un valor de 4 dBu
(1,23 V), este valor ofrece una lectura cero en el medidor de unidades de volumen o VU meter.

Nivel nominal

Habitualmente se ajustara el nivel medio de se


nal mediante el preamplificador del instrumento o de la mesa de mezclas para que coincida con el nivel nominal, que representara el
nivel normal de funcionamiento de la mesa.

Una vez ajustado el nivel nominal de funcionamiento, obtendremos unos


margenes de variacion de la se
nal de entrada limitados superiormente por el nivel de saturacion del dispositivo e inferiormente por su nivel de ruido o el de la propia se
nal.

Headroom y S/N

A la diferencia entre el nivel nominal y el nivel de ruido se le denomina relacion se


nal
ruido (S/N) y nos dice el margen inferior de variacion de la se
nal que podemos permitir sin
que el ruido del dispositivo afecte a la grabacion.
La diferencia entre el nivel nominal y el maximo permitido por el dispositivo se denomina
headroom. El headroom indica el margen superior de variacion de la se
nal permisible antes
de que esta se vea recortada o distorsionada. En la mayora de las mesas de mezclas, el
headroom es de unos 20 dB, es decir se permite un nivel maximo de 24 dBu.
Por ejemplo, en el caso de una entrada de microfono con un margen dinamico de 40 dB
SPL (ruido ambiente) a 130 dB SPL (maxima se
nal), ajustaremos el preamplificador de forma que el maximo nivel recibido por el microfono (130 dB SPL) coincida con el maximo de
la mesa de mezclas (24 dBu) con lo cual el nivel nominal correspondera a una presion sonora
de 110 dB SPL. En este caso, el headroom sera de 24 dBu - 4dBu=20 dB, el nivel de ruido
7

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Nivel
(dBu)

24 dBu

20

14 dBu
Headroom

10

Nivel Nominal 4 dBu

0
-10
Margen
Dinmico

-20
-30

S/N

-40
-50

-55 dBu

-60
Nivel de Ruido -66 dBu

Figura 1.1: Ejemplo de margen din


amico..

(40 dB SPL) correspondera a -66 dBu y la relacion se


nal ruido sera de 70 dB.
En la figura 1.1 puede verse la representacion del margen dinamico, nivel de ruido y headroom de una grabacion. Tambien puede observarse la variacion en los niveles producida por
un compresor (que sera estudiado mas adelante).
Dependiendo del tipo de m
usica que pretendamos grabar es posible que un headroom de
20 dB sea insuficiente. Por ejemplo, una orquesta sinfonica produce un nivel medio menor
que un grupo de rock y sin embargo un margen dinamico igual o mayor. En este caso deberemos proveer un headroom mayor (hasta 30 dB frente a los 20 de la m
usica moderna)
para permitir picos mayores sobre el nivel medio y evitar que el sonido resulte distorsionado
en los pasajes fuertes. El metodo es ajustar el nivel nominal a un nivel de grabacion 10 dB
por debajo del utilizado normalmente, con esto aumentaremos el headroom hasta un valor
adecuado a costa de reducir la relacion S/N.

CAPITULO 1. Definiciones generales y amplificacion.

Sistemas de Audio e Vdeo. Curso 2003-2004

R2

Ei
R1

Eo

Figura 1.2: Amplificador operacional con realimentaci


on negativa.

1.6.

Amplificadores.

Los amplificadores se utilizan extensamente en el mundo del audio profesional no solo en


su faceta mas conocida: amplificadores de potencia que alimentan sistemas de altavoces, sino
en otras tareas como adaptacion de niveles de se
nal e incluso impedancias.
Internamente, el proceso de amplificacion de una se
nal se realiza mediante valvulas de
vaco o transistores. Como es bien sabido si la se
nal de entrada supera los margenes de funcionamiento del transistor o valvula, se produce el fenomeno denominado saturacion, y la
se
nal de salida se ve recortada, generandose una serie de armonicos que producen un efecto
de distorsion bien conocido.
El circuito basico amplificador en los sistemas de audio es el amplificador operacional 1.2,
llamado as porque posibilita la realizacion de operaciones matematicas con se
nales analogicas. El amplificador operacional permite la obtencion de ganancias altas con gran estabilidad
y ancho de banda. Idealmente el amplificador operacional se modela como un componente
con ganancia infinita (100 a 110 dB), impedancia de entrada tambien infinita (en realidad
del orden de los 10 M) e impedancia de salida cero (unos pocos ).

1.7.

Preamplificadores.

Los preamplificadores o previos se utilizan para adaptar se


nales muy debiles (-70 a -50
dBu), a los niveles requeridos por las entradas de las mesas de mezcla (-20 a 4 dBu).
El dise
no de los preamplificadores es de gran importancia ya que por ser el primer elemento activo de la cadena la calidad que proporcionen va a influir de manera importante en
el resto de la mezcla.

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Las caractersticas exigibles a los preamplificadores son un nivel de ruido muy bajo y
una distorsion peque
na. El nivel de ruido es especialmente importante puesto que fijara el
margen dinamico para el resto de la mezcla.
Los previos se utilizan para amplificar microfonos y en ciertos casos guitarras electricas.
Las mesas de mezclas disponen de un preamplificador a la entrada de cada canal que permite
la conexion directa de microfonos.

1.8.

Amplificadores de potencia.

Los amplificadores de potencia se utilizan para elevar la se


nal de entrada a los niveles
necesarios para alimentar sistemas de altavoces.
Las caractersticas que buscaremos en un amplificador de potencia seran una respuesta
plana para el rango de frecuencias audible (20 Hz a 20 KHz), una tasa de distorsion baja y
una determinada potencia nominal de salida dependiendo de nuestras necesidades.

1.8.1.

Distorsi
on arm
onica y ruido.

Una medida habitual de la calidad de los amplificadores es su distorsion armonica. Se


produce a causa de no linealidades en su respuesta, siendo mas acusado el efecto cuando nos
acercamos a la zona de saturacion.
La distorsion armonica consiste en la aparicion de armonicos no presentes en la se
nal de
entrada que colorean el sonido. En algunos casos este efecto de coloracion es deseable, como
en los amplificadores de guitarra, pero en el caso de amplificadores de potencia el resultado sera un sonido poco natural y por tanto interesara que esta distorsion sea lo menor posible.
En la figura 1.3 puede verse un ejemplo de este tipo de distorsion. La se
nal introducida al
amplificador es un tono puro con una frecuencia F . A la salida de este aparecen componentes de frecuencia 2F (segundo armonico) y 3F (tercer armonico), no presentes en la se
nal
original.
La distorsion armonica se mide como el nivel relativo de uno o varios de los armonicos frente
al nivel de la se
nal de entrada. Por ejemplo una distorsion del 1 % del 2o armonico indica
que el nivel del segundo armonico es el 1 % del tono de prueba. Otra especificacion habitual
es la distorsion armonica total o THD que indica el nivel de la suma de todos los armonicos
respecto al nivel de la se
nal original.

10

CAPITULO 1. Definiciones generales y amplificacion.

Sistemas de Audio e Vdeo. Curso 2003-2004

Tono de prueba

Distorsin

2do
Armnco

3er
Armnco

Figura 1.3: Distorsion armonica

La medida de la distorsion armonica de un dispositivo se realiza inyectando un tono puro


y midiendo el nivel de los armonicos a la salida. Si el nivel de los armonicos es suficientemente
bajo, es posible que estos se encuentren enmascarados por el nivel de ruido del amplificador
y por lo tanto el nivel medido puede corresponder a ruido y no a distorsion armonica, por
esta razon en algunos casos se especifican valores de distorsion + ruido, indicando que es
imposible diferenciar un efecto del otro.
La distorsion armonica depende del nivel y frecuencia de la se
nal que utilicemos como test.
Si el nivel de se
nal es cercano al nivel de saturacion del amplificador, se producira un efecto
de saturacion o recorte. Este efecto se traduce directamente en la aparicion de armonicos del
tono fundamental, por lo cual la distorsion armonica crecera dramaticamente para valores
de se
nal cercanos a la maxima potencia de salida del amplificador (figura 1.4). En cuanto a
la frecuencia, la distorsion armonica no es constante para todo el ancho de banda del amplificador siendo habituales valores mayores para frecuencias altas y bajas, y menores para
medias. En ocasiones el fabricante suministra graficas de variacion de la distorsion armonica
en funcion de la frecuencia.
Un ejemplo de especificacion de la distorsion armonica:
THD (-3dB at rated output, 8 ): 0.003 %
Donde se indica una THD del 0.003 % para una potencia de salida 3 dB por debajo de la
nominal y actuando sobre una carga de 8 .

11

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

THD (%)
.1

10 KHz
.01
1 KHz
100 Hz
.001
0

10

100

Potencia de Salida (W)

Figura 1.4: Distorsion armonica en funci


on de la potencia de salida.

1.8.2.

Potencia nominal.

Generalmente se expresa como la maxima potencia media de una onda sinusoidal continua
que se puede liberar en una carga de 4 . Este valor se da para una distorsion maxima y un
rango de frecuencias determinado. Las especificaciones pueden incluir tambien la potencia
maxima de salida para otras cargas ( 8 y a veces 2 ) y para funcionamiento estereo y mono,
por ejemplo:
Potencia de una onda sinusoidal contin
ua para una distorsi
on THD menor del 0.05
Estereo 8 .
Ambos canales activos: 240 W por canal.

Estereo 4 .
Ambos canales activos: 400 W por canal.

Como se puede comprobar, debido a limitaciones de corriente, el amplificador ofrece algo


menos del doble de potencia a la mitad de carga, es por esto que son u
tiles las especificaciones
para diferentes valores de carga.

12

CAPITULO 1. Definiciones generales y amplificacion.

1.8.3.

Sistemas de Audio e Vdeo. Curso 2003-2004

Respuesta en frecuencia y ancho de banda de potencia.

Respuesta en frecuencia y ancho de banda de potencia son dos especificaciones complementarias que nos indican la capacidad del amplificador de ofrecer una respuesta sin distorsion
para diferentes frecuencias, en el primer caso se fija una potencia baja y se mide
Indica el rango de frecuencias para el cual el amplificador mantiene inalterada la se
nal de entrada, es decir presenta una respuesta plana. Generalmente la
medida de la respuesta en frecuencia se da para una se
nal de test de 1 W. Se suelen indicar
los margenes de tolerancia de la medida, por ejemplo:
Respuesta en frecuencia.

Frecuency Response (at 1 W): 1Hz - 250 KHz +0dB, -3dB


Nos indica que la respuesta en frecuencia del aparato es plana en un rango de 1 Hz a 250
KHz con -3dB de tolerancia.

La especificacion de la respuesta en frecuencia no es del todo


u
til puesto que se calcula para una se
nal de 1 W. Para potencias mas altas es de esperar
que la distorsion sea mayor y por lo tanto la respuesta en frecuencia diferente. Ademas, la
ganancia del amplificador suele ser variable con la frecuencia, decayendo para los extremos
del ancho de banda del amplificador. Para cuantificar esta variabilidad se utiliza el Ancho de
banda de potencia que se define como el margen de frecuencias en el cual el amplificador es
capaz de ofrecer al menos la mitad de su potencia nominal sin recortar la se
nal. Este valor
se puede especificar numericamente o mediante una grafica en la que se muestra la potencia
de salida en funcion de la frecuencia. Una especificacion tpica:
Ancho de banda de Potencia

Power Bandwidth (8 , THD 0.03 %): 5 Hz - 50 KHz


Estos datos estan tomados del mismo amplificador que en el ejemplo anterior, pudiendose
comprobar que el ancho de banda de potencia es mucho menor que la respuesta en frecuencia.
El ancho de banda de potencia es una especificacion mas restrictiva y mas realista que la
respuesta en frecuencia, ya que nos indica la distorsion que se obtendra para diferentes
frecuencias utilizando la maxima potencia del amplificador. En este caso se deduce que para
una distorsion THD del 0.03 % y actuando sobre una carga de 8 la potencia de salida del
amplificador decae a la mitad de su valor nominal para una frecuencia inferior de 5 Hz y una
superior de 50 KHz (suponemos que la referencia es el valor nominal de potencia puesto que
no se indica ning
un otro valor).
13

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

AMPLIFICADOR
FUENTE

Zs

Zs
Zin
Zout
Zl

DESTINO

Entrada

Zin

Zout

Salida

Zl

Impedancia de Fuente
Impedancia de Entrada
Impedancia de Salida
Impedancia de Carga

Figura 1.5: Impedancias de entrada y salida.

1.8.4.

Impedancias de entrada y salida.

Aunque este no es un tema especfico de los amplificadores de los amplificadores de potencia, introduciremos aqu los conceptos de impedancia de entrada y salida.
Como impedancia de entrada y salida entendemos respectivamente la resistencia que se
ve a la entrada y la salida de un dispositivo. Existen dos formas basicas de realizar una
conexion: en algunos casos la salida esta pensada para ser conectada a una entrada con una
impedancia mas o menos del mismo valor (normalmente del orden de 600 ), conexion denominada adaptada (matched); en otros casos el dispositivo dispone de una impedancia de
salida baja pensada para su conexion a una entrada con impedancia muy alta, permitiendo
as que la mayor potencia posible se libere en la carga , a esta conexion se le denomina en
puente bridged.
En general la especificacion de un dispositivo indicara su impedancia de entrada y o bien
la impedancia maxima de la fuente o bien un rango de impedancias posible. Por ejemplo:
Source Impedance: 200 to 600 nominal.
Input Impedance: 2.8k .
Se indica que el dispositivo presenta una impedancia de entrada de 2.8K y esta pensado
para la conexion de fuentes con una impedancia de salida entre 200 y 600 , es decir para
una conexion en puente.
Para las impedancias de salida, se especificara la impedancia mnima de la carga conectable. Puesto que la carga mnima aceptable dara unos resultados pobres, se indica tambien
la carga recomendada o nominal:

14

CAPITULO 1. Definiciones generales y amplificacion.

Sistemas de Audio e Vdeo. Curso 2003-2004

Output impedance:
100 .
load impedance:
2k .
Nominal load impedance: 10k .
La impedancia de salida es de 100 estando pensada para su utilizacion con entradas de
10k. Si se conecta una carga menor de 2K el funcionamiento no sera correcto y habra peligro
de da
nar el aparato.

El Damping factor se utiliza en ocasiones para especificar la impedancia


de salida de un amplificador. Indica el cociente entre la impedancia de la carga (8 para un
altavoz) y la de salida del amplificador. Una especificacion tpica podra ser:
Damping Factor

Damping Factor: (8 load)


400
minimun below 250 Hz.
50
minimun below 10 KHz.
Seg
un estos datos podemos deducir que la impedancia de salida es como maximo 0.16
a 10 KHz y 0.02 por debajo de 250 Hz. Observese por lo tanto que la impedancia no es
constante respecto a la frecuencia.

1.8.5.

Otras caractersticas

Tiempo de respuesta.Slew Rate

Mide la habilidad del amplificador para responder a cambios rapidos de la tension de


la se
nal. Un tiempo de respuesta bajo puede causar una distorsion importante en la se
nal
amplificada. El efecto se hace mas pronunciado para potencias grandes.
Sensibilidad.

Indica el nivel rms de tension que debe tener una onda sinusoidal para conducir el amplificador a su nivel nominal de salida utilizando una impedancia determinada (habitualmente
8 ).

15

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

16

Captulo 2

Control del margen din


amico
El maximo rango dinamico que se suele considerar en una pieza musical es del orden de
unos 120 dB, mientras que muchos medios de transmision y/o almacenamiento presentan un
rango menor; por ejemplo, una cinta magnetica puede tener unos 60 dB y un disco compacto
de 80 a 90 dB. Esta disparidad en el margen dinamico de unos medios a otros hace que sea
necesario incluir un control para evitar problemas de saturacion de la etapa siguiente o un
deterioro considerable de la se
nal debido a la presencia de distintos ruidos existentes, como
ya comentaremos.

2.1.

Margen din
amico

Una vez ya introducido previamente el concepto de margen din


amico, o rango din
amico,
y su importancia, pasemos ahora a comentar un par de cuestiones de interes.
2.1.1.

Detecci
on del nivel

A la hora de detectar el nivel de una se


nal sonora podemos usar varias aproximaciones:
1. Valor de pico instantaneo: se usara siempre que deseemos controlar que la se
nal no
supere un cierto valor, ni la mas mnima fraccion de tiempo (dependiendo de la rapidez
de respuesta del circuito detector, claro)
2. Valor medio de la se
nal o tambien calcular su Valor cuadr
atico medio (rms): para
etiquetar un cambio de nivel, la se
nal debera mantenerse en el nuevo nivel durante
un cierto tiempo, ya que estamos efectuando un promediado a lo largo de un cierto
perodo. La deteccion del nivel usando el valor rms suele proporcionar resultados mas
satisfactorios desde un punto de vista perceptual.
17

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

La descripcion del cambio en los distintos niveles de la se


nal y en su rango dinamico al
usar compresores y expansores de este, suelen quedar reflejados en una curva caracterstica
similar a la presentada en Figura 2.1, donde se plasma la correspondencia entre los niveles
de entrada y de salida.

Figura 2.1: Curva caracterstica de un compresor

Apliquemos el proceso que apliquemos, es de destacar la importancia de mantener la imagen estereo, es decir, el balance de potencias entre el canal izquierdo y derecho para evitar
posibles desplazamientos de la posicion percibida si aplicamos amplificaciones o atenuaciones
distintas en ambos canales.

2.1.2.

Tpicos rangos din


amicos

Como se puede observar en la siguiente relacion, el margen dinamico que nos podemos
encontrar en distintos medios es sumamente variado. Por ejemplo, son valores tpicos:
M
aximo rango musical Unos 120 dB aprox.
Mesa de mezclas anal
ogica mayor que 90 dB
Cinta digital / Disco compacto 90 dB aprox.
18

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

Cinta anal
ogica 70 dB aprox.
Radio (FM) unos 60 dB
Disco de vinilo unos 50 dB
Cinta de vdeo unos 50 dB
Radio (AM) de 20 a 30 dB
Ruido ambiente del hogar de 35 a 45 dB SPL como Nivel de Presion Sonora habitual.
Estos valores plasman la necesidad de disponer de unos elementos que adec
uen los distintos
rangos dinamicos de unos equipos a otros. Si los amplificadores son usados para hacer corresponder niveles de entrada y salida ajustados a los elementos interconectados, los compresores
y expansores nos facilitaran el aprovechamiento de todo el margen dinamico disponible en un
sistema, independientemente de los rangos de trabajo de los sistemas anteriores y posteriores.

2.2.

Compresores

Como su propio nombre indica, comprimen el margen dinamico a base de aplicar un


control automatico de ganancia. La relacion entre el nivel logartmico de entrada y el del
nivel logartmico modificado de salida es el llamado factor de compresi
on, activandose
habitualmente el compresor a partir de un cierto umbral (threshold of compression, knee,
rotation point). Tiene un detector de nivel que gobierna al otro elemento, el propio Control Automatico de Ganancia (que es habitualmente un amplificador controlado por voltaje
(VCA)). Dicho detector de nivel viene caracterizado por un umbral, un tiempo de ataque
(attack time) y un tiempo de cada (decay, recovery, release time)1 , ajustables en muchos casos, y proporciona una se
nal de control para el VCA (ver Figura 2.2), ademas de informacion
para monitorizar los niveles de entrada/salida y la ganancia aplicada en cada instante.
El factor de compresion y la curva caracterstica quedan reflejados en la Figura 2.1,
correspondiente a una compresion aplicada en todo el margen de niveles de entrada (sin
considerar un umbral).
2.2.1.

Efecto sobre la se
nal

Veamos un ejemplo: supongamos que aplicamos un compresor 2:1 en todo el margen


dinamico de entrada, es decir, modificando cualquier valor de entrada a un nuevo valor. Si
1 El tiempo de ataque y el de ca
da marcan la evoluci
on de la ganancia a lo largo del tiempo; si estos tiempos son nulos,
el cambio de la ganancia ante una variaci
on brusca del nivel ser
a instant
aneo, mientras que normalmente existe un tiempo de
transici
on en el que la ganancia va cambiando hacia el nuevo valor.

19

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Figura 2.2: Esquema de un circuito compresor

la se
nal de entrada, p.e. proveniente de un disco compacto, tuviera un margen de 90 dB,
con +20 dBm de maximo y - 70 dBm de mnimo, y la etapa posterior fuera una emision de
radio FM (+10 dBm/-40 dBm), ocurrira lo reflejado en la Figura 2.3:

Figura 2.3: Rango din


amico antes y despues de la compresi
on

Es decir, el nuevo margen dinamico de 45 dB puede ser emitido a traves de la etapa de


radio sin ning
un problema aparente. Pero ya comentamos que el detector tiene lo que se
llaman unos tiempos de ataque y cada no ideales, es decir, distintos de cero segundos. Esto
hace que, dependiendo de la se
nal de entrada, pueda haber partes de la se
nal a las que no se
les aplica la compresion deseada. Pongamos por caso que se pretende comprimir una se
nal
temporal como la mostrada en la Figura 2.4 y supongamos que los tiempos de respuesta del
compresor viene dados por la Figura 2.5, donde se muestran conjuntamente la ganancia ideal
20

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

que se debera aplicar y la real , debida a la no idealidad del compresor. La se


nal de salida
va a ser la mostrada en 2.6 que, como se puede observar, queda claramente distorsionada
debida a la aplicacion de ganancias incorrectas en los cambios de la se
nal. La razon es la
aplicacion de un incremento en el nivel de salida para trozos de se
nal correspondientes a un
elevado nivel de entrada y, viceversa, la atenuacion de partes que deberan ser amplificadas
debido a su bajo nivel de entrada.

Figura 2.4: Se
nal de entrada

Figura 2.5: Ganancia aplicada (a trazos la ideal)

Esto puede ser nefasto en ambos casos, pero especialmente en el primero: el aplicar un
nivel sumamente elevado a la siguiente etapa provocara, probablemente y como mal menor,
un recorte en la se
nal debido a la saturacion del sistema o, en el caso peor, da
nos debido al
21

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Figura 2.6: Despues de pasar por el compresor

exceso de potencia de entrada en la siguiente etapa. El segundo caso puede hacer que ciertas
partes mas debiles de la se
nal desaparezcan durante un cierto perodo de tiempo, hasta que
el compresor recupere su ganancia adecuada.
2.2.2.

No idealidades: problemas y soluciones

Una forma de evitar estos casos extremos pasa por limitar la capacidad de compresion
del sistema, por ejemplo usando la curva caracterstica de la Figura 2.7, donde la nueva
compresion tiene unos valores maximos de amplificacion y atenuacion debido al cambio de
pendiente. El forzar que a partir de unos ciertos niveles bajos y altos de entrada la pendiente pase a ser la unidad garantiza que este acotada la maxima amplificacion y atenuacion
alcanzada.
Los valores tpicos de compresion no suelen ser demasiado altos (excepto los limitadores,
que veremos a continuacion), con valores desde un factor 1.5:1 hasta 4:1, habitualmente.
Los tiempos de ataque y cada (o recuperacion) mnimos varan mucho en funcion del
hardware usado, pero valores del margen 100 s-1ms para el tiempo de ataque y de unos
0.5s-2s para el de recuperacion suelen ser habituales. Muchos compresores tienen mandos
externos que facilitan el control de estos tiempos, para hacerlos mayores que el mnimo
dependiendo de la aplicacion. Y por que puede interesar hacer mas largos estos tiempos? El
tener un tiempo de ataque cuasi- instantaneo parece algo deseable, pero corremos el riesgo
de que al final se perciba como tal, esto es, como un cambio brusco en el nivel del sonido.
22

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

Figura 2.7: Valores extremos de ganancia acotados

La aparicion de cambios de nivel muy seguidos en el tiempo puede provocar una oscilacion
claramente audible en el nivel medio de la se
nal, especialmente en componentes de muy
baja frecuencia, por lo que se pueden arbitrar soluciones que introduzcan una cierta inercia
temporal, de forma que el cambio no sea tan brusco y, por tanto, no tan perceptible. As,
algunos incorporan una inercia en la deteccion del nivel, de forma que un breve cambio
en la potencia de la se
nal (muy habitual en audio) no dispare un cambio en la ganancia a
aplicar. Incluso la deformacion en la se
nal que acabamos de estudiar puede ser interesante
para ciertos instrumentos (p.e.: para aumentar la pegada de un bajo electrico). Recordemos:
siempre en funcion de la aplicacion: si el objetivo es evitar que un pico supere un cierto nivel
a toda costa, este tiempo debera ser lo mas corto posible.
En cuanto al tiempo de cada, suele ser mas largo para aliviar precisamente estos cambios de nivel repentinos, de forma que la transicion se haga de forma mas suave. Incluso,
dependiendo del tipo de m
usica, puede interesar tener ese tiempo especialmente largo, pero
hay que tener en cuenta el efecto que esto puede provocar en las partes mas debiles de la se
nal.
Algunos compresores a
naden un detector de cruces por cero, que activa un cambio en la
ganancia solo si la se
nal es de muy bajo nivel, minimizando el efecto subjetivo del cambio.
Como el proceso exige un retardo, debido a la no idealidad de los elementos, una configu23

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

racion muy habitual es el desplazar el compresor a una rama lateral (side chain) e introducir
un retardo en la rama principal o aprovechar el retardo provocado por alg
un otro proceso,
de forma que la accion se haga sncrona a los cambios de la se
nal o, incluso, preceda a dichos
cambios; el efecto conseguido puede variar mucho dependiendo de como apliquemos esta
configuracion.
2.2.3.

Limitadores

Los limitadores son un caso particular de los compresores, donde se procede exclusivamente a una compresion de los niveles mas altos, permaneciendo los niveles mas bajos inalterados,
como se ve en la Figura 2.8. Su factor de compresion suele ser muy elevado (8:1, 10:1, 20:1
e incluso mas2 son valores tpicos) y sus tiempos de ataque y cada deben ser muy cortos ya
que su aplicacion fundamental es garantizar que nunca superamos unos ciertos valores en
el nivel de la se
nal de salida del limitador.

Figura 2.8: Curva de un limitador

2.2.4.

Uso de los compresores

Entre los muchos usos que pueden tener estos elementos podemos destacar, ademas del
ya mencionado de ajuste a un cierto rango dinamico deseado, por ejemplo:
2

Si no queremos que el nivel exceda nunca de un determinado valor aplicaremos un factor de compresi
on : 1

24

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

1. Uniformidad en el nivel sonoro: si la distancia entre la fuente sonora y el captador vara


(p.e. un vocalista y su microfono), la fuente tiene mas margen dinamico que el deseado
debido a la propia ejecucion del instrumento (p.e. un bajo electrico) o se desea que haya
una uniformidad en el conjunto (p.e. un programa de radio). La eleccion del umbral y
los tiempos de ataque y cada es especialemente crtica en estas aplicaciones.
2. Atenuacion dependiente de una segunda se
nal : se puede hacer que el umbral o el factor
de compresion dependan de otra se
nal, como por ejemplo la reduccion del nivel del
fondo musical cuando entra hablando un locutor de radio.
3. Control de picos: evitar lo ya comentado, que existan picos excesivos que puedan provocar recortes en la se
nal sonora, efectos no deseados (p.e. intermodulaciones en un
transmisor de radio) o da
nos en el sistema siguiente (p.e. cada de un microfono y peligro de da
no en las pantallas acusticas que estan presentando esa entrada amplificada).
Suelen ser limitadores los encargados de esta funcion.
4. Reduccion de ciertas bandas de frecuencia: ante determinados siseos provocados por
ciertos sonidos sibilantes (p.e. /s/), se puede aplicar una compresion (de-esser ) restringida a la zona de altas frecuencias (6-8 KHz). Esta compresion no afecta al resto de la
banda.
5. Elevacion del nivel medio de grabacion: en fuentes con muchos transitorios, como puede
ser la voz humana, el aplicar un limitador solo a las partes de mayor nivel hace que,
en media, podamos elevar el nivel de se
nal que captamos o registramos, lo que facilita
una mejor relacion Se
nal a Ruido, sin saturacion (overloading) en el medio usado para
la grabacion (p.e. cinta magnetica). Si se aplica a una fuente concreta en una mezcla,
podemos enfatizar su presencia ya que la sensacion sonora va a aumentar aunque los
picos se reduzcan, ya que en media se eleva su nivel. Si se aplica a toda una cancion, por
ejemplo, su nivel de presencia sera mayor en un programa de radio que otras canciones
que no sean comprimidas.

2.3.

Expansores

Producen el efecto inverso al ya comentado en la seccion anterior, en este caso se expande el


margen dinamico a base de aplicar un control automatico de ganancia. La relacion logartmica
(en dB) entre el nivel de entrada y el del nivel modificado de salida es el llamado factor
de expansi
on, activandose habitualmente el expansor tambien a partir de un cierto umbral
(threshold ). El detector de nivel y el control de ganancia son basicamente similares a los ya
comentados en los compresores.
El factor de expansion y la curva de transferencia quedan reflejados en la Figura 2.9,
afectando a todos los niveles de entrada (sin aplicar un umbral). La combinacion de un
25

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Figura 2.9: Expansor

compresor seguido mas adelante de un expansor forma lo que se llama un compansor, que
si los procesos fueran exactamente inversos equivaldra a un sistema que no modificara la
se
nal. La presencia de distintas curvas o tiempos de ataque y cada no complementarios en
el compresor y en el expansor hacen que esto no sea as habitualmente.
2.3.1.

Efecto sobre la se
nal

Como ya comentamos, el aplicar una amplificacion o atenuacion incorrecta puede distorsionar la se


nal a su paso por el compresor, como tambien ocurre a su paso por el expansor.
Ademas el expandir la se
nal hace que los niveles mas bajos se vean atenuados, lo que
puede ser usado para eliminar el ruido de fondo. Si esta eliminacion es brusca (factor 1 : )
a partir de un umbral, el cambio en el ruido de fondo puede llegar a ser perceptible y, por
tanto, molesto, por lo que suele ser recomendable usar tiempos de reaccion largos o aplicar
factores de expansion bajos.
2.3.2.

No idealidades: problemas y soluciones

La deformacion en la se
nal, provocada por tiempos de respuesta no nulos y cambios
bruscos en la se
nal, se puede controlar usando retardos en la rama principal por donde
evoluciona la se
nal original o con la aplicacion de la misma tecnica que ya mencionamos
26

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

en el compresor, limitando la ganancia (tanto amplificacion como atenuacion) aplicada a la


se
nal. La clave esta en volver a una pendiente unidad en la curva de transferencia a partir
de ciertos valores umbrales, como ya se comento anteriormente.
2.3.3.

Puertas de ruido

Como caso particular de los expansores podemos comentar las llamadas Puertas de Ruido,
que afectan solamente a los niveles mas bajos en la se
nal de entrada, aplicandoles una fuerte
atenuacion.
2.3.4.

Uso de los expansores

Mencionemos ahora la principal aplicacion de estos sistemas, ademas de la ya mencionada


de ajustar el margen dinamico antes de una determinada etapa:
1. Eliminacion del ruido de fondo: si sabemos el margen de trabajo que nos interesa en un
cierto captador (p.e. un microfono), podemos usar una Puerta de Ruido para eliminar
todo aquello que no supere un cierto nivel umbral, asociado casi siempre a ruidos de
fondo existentes (p.e. otras fuentes sonoras, paso de paginas, ruido de ropas,etc.). La toma puede quedar especialmente limpia siempre que los valores de ajuste sean adecuados
para la aplicacion.
2. Modificacion del sonido: si queremos eliminar ciertos niveles de un instrumento; por
ejemplo, aplicarlo en los golpes de la caja de una batera puede ayudar a conseguir
una buena referencia de sincrona (claqueta), sin los efectos de resonancia de la caja.
El disparo (trigger ) para que act
ue o no una puerta de ruido, opcion habitual en las
mismas, puede venir de una se
nal externa, lo que facilita su uso.
3. Reduccion de interferencias: si observamos problemas con interferencias entre canales
(crosstalk ), pistas de grabacion, etc., podemos aplicar un expansor para eliminar esas
se
nales residuales ajenas a la pista actual.

2.4.

Reductores de ruido

Hemos discutido como podemos aumentar o disminuir el margen dinamico de excursion


de la se
nal de audio, dependiendo de la aplicacion concreta que queramos desarrollar. Una
de esas aplicaciones es la utilizacion conjunta de un proceso de compresion seguido de un
proceso de expansion, lo que se entiende por compansi
on, para conseguir minimizar los
efectos de ciertos ruidos presentes en la cadena de audio.
27

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

2.4.1.

Compansores en tiempo

La compresion, en general, como hemos visto suele atenuar los niveles altos, pero amplifica
los mas bajos; esta u
ltima car cterstica puede ser usada para elevar el nivel de la se
nal en sus
partes mas debiles, de forma que supere a ciertos niveles de ruido presentes en otros modulos sucesivos. Pongamos un ejemplo: un sistema de grabacion (una cinta de cassette, por
ejemplo) que tiene un determinado nivel de ruido intrnseco al proceso de almacenamiento.
Deseamos grabar una se
nal que tiene el margen dinamico presentado en la Figura refcompansor que, previamente, vamos a comprimir. Durante el proceso de grabacion se a
nade un
ruido de un nivel inferior al nuevo nivel comprimido de las partes mas debiles en la se
nal.
Esto hace que dicho ruido no se mezcle en el mismo rango dinamico de la se
nal comprimida,
sino por debajo. Si ahora expandimos la se
nal a sus valores iniciales, el ruido de grabacion
se vera reducido en nivel por debajo, probablemente, del mnimo nivel presente en el nuevo
margen dinamico. Se ha conseguido, aparentemente, eliminar el ruido presente en el dispositivo de almacenamiento. Evidentemente el sistema de almacenamiento tiene mas fuentes de
distorsion, pero este sencillo metodo consigue reducir considerablemente el ruido presente al
final del proceso. Es decir, para conseguir el efecto necesario necesitamos expandir la se
nal
recogida en la cinta con el mismo factor que la hemos comprimido. El reproducir la cinta
sin expandir el margen nos llevara a escuchar el audio con un margen que no es el original,
totalmente descompensado con respecto a los niveles originales. En principio, cuanto mayor
sea el factor de compresion/expansion, mayor es la reduccion del ruido presente.
Por ejemplo, el sistema comercial dbx efect
ua este proceso en el dominio del tiempo,
tomando como referencia la banda completa de frecuencias, usando un factor de compresion
de 2:1 entre los niveles - 90 dBm y +25 dBm, con el punto de ganancia unidad en +4 dBm
(0VU), sin depender del nivel.
El usar una compansion en toda la banda puede dar problemas dependiendo del nivel de
la se
nal a lo largo de la frecuencia, es decir, de su distribucion de energa en el espectro. Si la
se
nal tiene un gran contenido en bajas frecuencias (como suele ser lo habitual en se
nales de
audio), entonces la compansion puede que no afecte a ruidos existentes en altas frecuencias,
habituales en las cintas como puede ser el siseo, ya que el proceso queda gobernado por la
energa predominante, la de bajas frecuencias. Veamos como solucionar este problema en la
proxima seccion.
2.4.2.

Compansores por bandas de frecuencia

Aunque el sistema dbx dispone tambien de unos filtros de preenfasis y deenfasis de las
frecuencias mas altas para intentar resolver este u
ltimo problema, centremonos en la forma
de trabajo de otro sistema comercial con una larga tradicion, los sistemas de reduccion de
28

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

ruido Dolby: Dolby spectral recording (SR), Dolby A y los sistemas para equipos domesticos
Dolby B y Dolby C, ademas del u
ltimo Dolby HX.
Dolby A usa cuatro compansores distintos, uno para cada una de las cuatro bandas de
frecuencia en las que divide el espectro: 0-80 Hz, 80 Hz- 3 KHz, 3-20 KHz y 9-20 KHz. Las
bandas tienen un cierto solape entre ellas, lo que hace su efecto mas equilibrado. Dolby B y
C usan esquemas similares en su filosofa, aunque con bandas no fijas.
Cualquiera de estos esquemas funciona con una filosofa marcada por los siguientes puntos:
Trabajan con compresores distintos para cada banda de frecuencias, ya sean estas fijas
o moviles.
La compansion se aplica basicamente a los niveles mas bajos de se
nal.
Operan con un sistema en paralelo, que se activa o no dependiendo del nivel de la se
nal.
Para su correcto funcionamiento requieren una se
nal de calibracion.
La reduccion de ruido que podemos conseguir va a variar, por tanto, de la zona de frecuencia en la que trabajemos. Pongamos un ejemplo para discutir esta nueva tecnica: supongamos
una division uniforme del espectro en cuatro bandas y los cuatro compresores obedeciendo
una misma relacion entrada-salida, actuando sobre una se
nal que en un momento dado tiene
la distribucion espectral de energa reflejada en la Figura 2.10, en la que tambien se presenta
el nivel de ruido que el sistema de grabacion va a introducir (supongamos ruido blanco, por
simplicidad).

Figura 2.10: Espectro con la se


nal original y el ruido

29

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

El espectro de la se
nal muestra una distribucion de energas tpica en muchos fragmentos
musicales: mucha mas energa en bajas frecuencias que en altas. Si el ruido se sumara a la
se
nal original, probablemente quedara enmascarado en las dos primeras bandas, debido a la
presencia de mucha energa en bajas frecuencias, pero en las dos bandas siguientes interferira
claramente con la se
nal e incluso enmascarara la u
ltima banda, eliminando la informacion
presente en esta, ya que la relacion Se
nal-a-Ruido sera extremadamente baja. Si la se
nal es
comprimida por bandas, su espectro se aproximara al reflejado en la Figura 2.11, donde las
dos u
ltimas bandas han sido amplificadas quedando ahora por encima del ruido que se introduce a continuacion. Una vez almacenada, la se
nal se debe expandir para ser reproducida,
de forma que se obtiene la se
nal mostrada en la Figura 2.12, donde se observa claramente
como el ruido ha sido perfilado, disminuyendo claramente en las bandas superiores y manteniendose enmascarado en las bandas inferiores.

Figura 2.11: Acci


on del compresor en las bandas altas

2.4.3.

Curiosidades

Si escuchamos material grabado usando un metodo en frecuencia como los que acabamos de comentar, pero sin expandir, realmente lo que omos es el espectro mostrado en
la Figura refespeccompreyruido, que es muy distinto al original, evidentemente. De todas
formas ocurre a veces que resulta subjetivamente mas agradable no conectar el expansor que
conectarlo, ya que en caso de hacerlo, el audio suena demasiado apagado. Una explicacion
para este fenomeno la podemos encontrar al tener en cuenta que el sistema de grabacion va
30

CAPITULO 2. Control del margen din


amico

Sistemas de Audio e Vdeo. Curso 2003-2004

Figura 2.12: Despues de expandir

a introducir mas distorsiones que un simple ruido de grabacion, y entre las distorsiones mas
habituales figura la del filtrado paso-bajo, tanto mas exagerado cuanto peor sea la calidad de
la cinta magnetica, la suciedad de los cabezales o las car actersticas del equipo reproductor
en s. Esto hace que no aplicar el expansor, que equivale a una amplificacion de las bandas
mas altas (las mas afectadas por dicho filtrado), proporcione una audicion mas agradable ya
que se recupera la informacion en las bandas superiores, a
un a costa de escuchar el siseo de la
cinta (ruido bastante estacionario en sus caractersticas y, por consiguiente, perceptualmente
soportable por adaptacion). Obviamente, si es posible, es mejor expandir la se
nal y aplicar
una ecualizacion controlada para realzar esas frecuencias superiores y evitar el ruido de la
cinta.
Como el objetivo de estos sistemas es la reduccion de ruido, la respuesta conjunta del
compresor y del expansor debe aproximarse lo mas posible a la unidad, lo que invalida el
uso de otro tipo de expansor que no sea el correspondiente al proceso inverso del compresor
usado.

31

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

32

Captulo 3

Procesos sobre la se
nal de audio
3.1.

Ecualizaci
on y bancos de filtros

3.1.1.

Conceptos generales. Tipos de filtros

Un filtro simple se puede definir a traves de varios parametros:


1. Ganancia asociada: factor de multiplicacion que afecta a la se
nal de entrada en una
determinada zona de frecuencias, si el filtro es lineal. Dependiendo del perfil del filtro,
dicha ganancia va cambiando en funcion de la frecuencia.
2. Frecuencia central: va asociada usualmente a la descripcion de filtros paso-banda.
Posicion en frecuencia de su centro, si el filtro es simetrico; el valor en dicha posicion
define la ganancia del filtro.
3. Frecuencia(s) de corte: se suelen definir como la frecuencia para la cual la ganancia
del filtro ha cado 3 dB con respecto a su valor maximo (ganancia del filtro en su
frecuencia central).
fc
4. Factor de calidad (Q): Es la relacion f
, siendo f su ancho de banda asociado y
fc su frecuencia central. Si Q es elevado, el perfil del filtro es muy abrupto.

5. Ancho de banda: se puede definir de muchas formas, aunque una de las mas usadas
es el llamado ancho de banda a 3 dB, es decir, la distancia entre las frecuencias donde la
ganancia en la frecuencia central del filtro ha disminudo en dicha cantidad (la distancia
entre las frecuencias de corte).
Los filtros, en relacion a la zona de frecuencias que seleccionan, se suelen denominar de
la siguiente forma:
Filtros paso-bajo: su frecuencia de corte inferior se supone inexistente, ya que la
ganancia es estable idealmente desde 0 Hz. y cae 3 dB en su frecuencia de corte superior.
33

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Filtros paso-alto: su frecuencia de corte superior se supone inexistente, con una ganancia estable idealmente desde el tope total de la banda del sistema, cayendo 3 dB en
su frecuencia de corte inferior.
Filtros paso-banda: definidos por su frecuencia central y por las frecuencias de corte
inferior y superior.
Filtros paso-todo: no modifican el modulo de la se
nal en el dominio de la frecuencia,
pero s modifican su fase.
Filtros banda eliminada: son filtros paso-banda cuya ganancia es una atenuacion
mas o menos rigurosa del nivel de la se
nal de entrada. Si su factor de calidad es muy
elevado, se denominan filtros (notch).
La relacion entre las frecuencias de corte y la frecuencia central nos informa sobre la
descomposicion que podemos efectuar al usar un determinado banco de filtros que cumpla
dicha relacion para todos sus elementos. As, tendremos descomposiciones en frecuencia:
Uniformes: en ellas el ancho de banda se mantiene constante a lo largo de todo el eje
de frecuencias, es decir, fs fi = K, siendo fs la frecuencia de corte superior, fi la
frecuencia de corte inferior y K una constante.
No uniformes: obedecen a la relacion ffsi = K, por lo que proporcionan una division
con filtros mas estrechos cuanto mas bajas sean las frecuencias centrales y mas anchos
cuanto mas altas estas sean. Los mas usados son filtros en octava (K = 2), en un tercio
de octava (K = 21/3 ) y de un decimo de octava (K = 21/10 ).
3.1.2.

Ecualizadores

Por ecualizadores vamos a entender un conjunto de filtros que, combinados adecuadamente, nos van a facilitar la variacion de la distribucion espectral de la energa en la se
nal de
entrada. La precision en el perfilado que podremos aplicar dependera del n
umero de filtros
y del ancho de banda y posiciones de cada uno de ellos.
Ecualizador gr
afico

Se suele denominar as un banco de filtros cuyo interfaz consiste en unos potenciometros que regulan la ganancia asociada a cada uno de los filtros paso-banda. La forma y la
frecuencia central son fijas, permitiendose solamente la variacion de la ganancia de cada
banda.
Suelen, dependiendo del n
umero de bandas, evolucionar de octava en octava en su forma
y frecuencia central.
34

CAPITULO 3. Procesos sobre la se


nal de audio

Sistemas de Audio e Vdeo. Curso 2003-2004

Ecualizador param
etrico

Un ecualizador parametrico generico permite la variacion de los tres parametros fundamentales en el filtro que definen:
Frecuencia central: por cuestiones de dise
no de los filtros, suelen limitarse a un margen
de frecuencias: por ejemplo, tendremos la posibilidad de variar la frecuencia central en
el margen 30-1000 Hz. para una banda, en el margen 200-5000 Hz. en otra y una u
ltima
en el margen 3-16 KHz. en el caso simple muy habitual de disponer de tres filtros.
Factor de calidad (Q): Este parametro en muchos casos no esta presente, usando un
factor de calidad constante para todos los filtros. Actualmente cada vez mas ecualizadores proporcionan la posibilidad de variarlo, de forma que podemos obligar a que el
filtro afecte a un ancho de banda mayor o menor a voluntad.
Ganancia: El parametro que siempre suele estar. Nos facilita la modificacion de la
energa presente en cada banda, como ya se ha comentado.

3.2.

Aplicaciones de un filtrado

El uso de filtros es una herramienta basica al trabajar con se


nales de audio, aunque no
hay que perder de vista que siempre es recomendable intentar mejorar las caractersticas de
un sistema, o grupo de sistemas, antes de intentar arreglar alg
un problema existente con una
ecualizacion apropiada.
Estos son algunos ejemplos de aplicacion:
Medida de distorsiones: una forma de medir la distorsion armonica y el ruido de un
sistema es aplicar un tono o tonos de referencia a la entrada del mismo, y usando un
filtro de banda eliminada suprimir de la salida las frecuencias de la se
nal de prueba.
Eliminacion de ruidos: tanto para evitar siseos de alta frecuencia como para eliminar
interferencias debidas a la red de alimentacion electrica, por ejemplo.
Compensar el efecto de un sistema: si ecualizamos antes o despues de un sistema que
modifique la distribucion espectral de una se
nal, podemos minimizar este efecto.
Compensar el efecto de una sala: si el sistema es un recinto ac
ustico, podemos ecualizar
la se
nal que vamos a presentar a traves del sistema de sonorizacion, para compensar
perdidas o resonancias de la sala.
Evitar realimentaciones: en un sistema realimentado (p.e. un sistema de sonorizacion
con microfonos y altavoces) el efecto de un sistema dentro del bucle puede llevar a la
inestabilidad al conjunto. Atenuando ciertas componentes donde resuene el sistema se
puede evitar el acople.
35

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Perfilar sonidos de instrumentos: para variar el timbre del instrumento a gusto del
usuario o para facilitar la mezcla con otros sonidos de forma que un instrumento no
oculte a otro.

3.3.

Otros procesos en la se
nal

Desde el punto de vista del Procesado Digital de la Se


nal existen multitud de formas de
llevar a cabo modificaciones de interes en la se
nal de audio. La combinacion de dos se
nales,
por ejemplo, se puede implementar con un simple sumador, y con dos multiplicadores ya
tenemos lo que se suele llamar un mezclador, es decir, combinar las se
nales con ganancias
diferentes de la unidad. El retardar la se
nal nos proporciona una version retrasada de la
misma, que si la combinamos apropiadamente con otra se
nal, o ella misma, puede ayudarnos
a crear algunos efectos interesantes. Veamos algunos de ellos:
3.3.1.

Creaci
on de ecos y reverberaci
on

Un eco ac
ustico es, usualmente, una version retrasada de la se
nal original una vez se
ha desplazado por un determinado medio y ha sido reflejada en una superficie o interfaz.
Realmente lo u
nico que se debe hacer para generar un eco es retardar la se
nal y sumarsela a
ella misma; para completar el esquema a
nadiremos una determinada ganacia en el lazo que
refleje las posibles perdidas en el modulo debidas a la propagacion de la onda. Un esquema
simple sera el mostrado en la Figura 3.1, donde figuran los dos parametros variables: la
ganancia de retorno y la distancia temporal del eco con respecto a la se
nal origen.
s(n)

Retardo

Ganancia
G

Figura 3.1: Celula b


asica de retardo

Si quisieramos modelar una combinacion de ecos determinada, deberamos acumular ecos


con retardos y ganancias distintas. En concreto, si la intencion es modelar la respuesta de
36

CAPITULO 3. Procesos sobre la se


nal de audio

Sistemas de Audio e Vdeo. Curso 2003-2004

una sala, es decir, su reverberacion, deberemos tener en cuenta las caractersticas que esta
tiene. El llamado ecograma, como captacion de la energa que llega a un microfono cuando
introducimos un impulso, nos proporciona una salida similar a la mostrada en la Figura 3.2.
Como podemos ver, despues del sonido directo, el llamado rayo directo, aparecen las primeras
reflexiones seguidas de lo que propiamente se suele denominar cola reverberante. Esta cola
viene perfilada en su energa por una cada de tipo exponencial, por lo que si quisieramos
componer un sistema que tuviera esa respuesta deberamos empezar a combinar celulas
basicas de retardo para conseguir dicha respuesta. Los valores colocados en cada celula,
ganancia y retardo, son claves para conseguir que el audio procesado suene como si realmente
fuera originado en un recinto ac
ustico determinado.

Primeras
reflexiones

Rayo
directo

Reverberacin

Figura 3.2: Ecograma

3.3.2.

Desfasado (phasing): flanger

Si el conexionado del camino retardado se hace de forma ligeramente distinta, como el


mostrado en la Figura 3.3, el efecto puede ser radicalmente distinto. La respuesta del sistema
es un filtrado todo-ceros, lo que provoca que la se
nal sufra un perfilado en frecuencia tipo
peine, ya que las se
nales se van cancelando conforme llegan al captador en determinados
puntos en frecuencia relacionados con el espaciamiento temporal de llegada.
3.3.3.

Generaci
on de coros (chorus)

Otro efecto muy usado es el llamado chorus, en el que se pretende simular la respuesta
de distintas fuentes sonando al unsono; que este unsono sea imperfecto, como lo es en la
realidad, crea un cambio en el sonido especialmente interesante para se
nales provenientes de
fuentes armonicas individuales. Un coro real cantando al unsono se puede modelar con tres
parametros fundamentales que varan de una a otra fuente de forma ligera:
37

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

s(n)

Ganancia
G
Retardo

Figura 3.3: Celula b


asica de desfase

Retardo: las fuentes pretenden conseguir un unsono, pero siempre existe un peque
no
desfase temporal en la evolucion de la se
nal proveniente de cada fuente.
Tono (pitch) : aunque se pretende conseguir entonar la misma nota en cada momento,
las fuentes tienen siempre una ligera desviacion unas con respecto a las otras.
Ganancia: no todas las fuentes reales consiguen, aunque lo pretendan, emitir la misma
energa ac
ustica en cada instante.

s(n)

Retardo

Modulacin
en frecuencia

Ganancia
G

Figura 3.4: Celula b


asica de un chorus

Un esquema similar al de la Figura 3.4 es suficiente para generar un efecto chorus bastante
real, siempre y cuando no se exageren los valores de variacion de los parametros de una fuente
virtual a otra.
38

CAPITULO 3. Procesos sobre la se


nal de audio

3.3.4.

Sistemas de Audio e Vdeo. Curso 2003-2004

Modificaci
on del pitch y del tempo

Si por pitch entendemos las variaciones en el tono o la nota asociados a una determinada
pieza musical y por tempo la cadencia de aparicion de los sucesos (el ritmo), existen situaciones en las que es muy interesante el poder modificar estos parametros y/o su duracion total.
Tomemos como ejemplo un pasaje musical en el que presentamos un tono de una frecuencia
f1 durante un tiempo L1, cambiamos a otro de frecuencia superior f2 (armonico del anterior
por simplicidad) y lo mantenemos otro perodo L2 (identico a L1 por simplicidad), volvemos a retomar el tono de frecuencia f1 y as sucesivamente. Aqu el pitch viene claramente
marcado por f1 y f2, mientras que el tempo, o cadencia de aparicion de cambios, viene dado
por el inverso de L1 (L2). La duracion total del pasaje vendra determinado por la cantidad
de perodos de uno y otro tono que tengamos, y por la velocidad de reproducci
on que
utilicemos. Hay que tener en cuenta que aumentar esta velocidad equivaldra a suponer que
la frecuencia de muestreo es mayor que la real y disminuirla supondra la consideracion de
una frecuencia de muestreo menor, lo cual influye evidentemente en el ancho de banda que
estamos considerando como parte de la se
nal.
Si nosotros, manteniendo la velocidad, eliminamos una duracion T 1 = 1/f 1 de cada uno
de los fragmentos de uno y otro tono, conseguiremos reducir la duracion total sin haber
cambiado el valor del pitch de la cancion. El tempo, por contra, habra aumentado ya que la
cadencia de aparicion de cambios de un tono al otro se ha visto incrementada en un factor
L1/(L1 T 1). El inverso de este factor es el valor por el que se ha reducido la duracion total
de la pieza.
Si ahora redujeramos la velocidad de reproduccion por un factor (L1 T 1)/L1, la duracion volvera a su valor inicial, el tempo tambien, pero el pitch, debido a esa reduccion
disminuira en dicho factor.
Si en vez de eliminar un perodo T 1, lo a
nadieramos en cada fragmento de uno y otro
tono (cada L1 = L2), manteniendo la velocidad de reproduccion, conseguiramos aumentar
la duracion.

39

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

40

Captulo 4

Interconexi
on y mezcla de sonidos
Dedicaremos ese captulo a una breve introduccion a los protocoles de interconexion y a lo
que se suele denominar el proceso de mezcla. Ademas de comentar brevemente como podemos interconectar sistemas e intercambiar informacion entre ellos, describiremos la estructura
y propondremos un metodo de trabajo asociado al sistema de conmutacion y encaminamiento
de se
nales que se conoce por el nombre de mesa de mezclas.

4.1.

Protocolos de interconexi
on

La produccion de audio y vdeo implica hoy en da una gran diversidad de fuentes de


se
nal. Una grabacion tpica puede exigir la mezcla de varias fuentes de sonido pregrabadas
con efectos o m
usica generados en vivo y con una grabacion en vdeo. Todos los dispositivos implicados deben estar correctamente sincronizados, bien mediante se
nales especiales de
sincronismo o cualquier otro mecanismo que permita una base de tiempos com
un para todos.
El problema se ve agravado por la variedad de soportes utilizados para el almacenamiento,
por ejemplo, los sistemas de almacenamiento en cinta magnetica presentan variaciones de
velocidad de arrastre debidos a la tension de la cinta y el estado del motor del dispositivo.
Las soluciones desarrolladas a lo largo del tiempo son muy variadas: desde la sincronizacion de sonido e imagen en cinematografa mediante la impresion optica del sonido en la
pelcula utilizando como referencia las perforaciones de esta, hasta la utilizacion de sistemas
digitales con referencias temporales absolutas.
Los sistemas de sincronizacion mas utilizados hoy en da son los siguientes:

41

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Figura 4.1: Pulso FSK de sincronismo.

Relojes propietarios.
Algunos sintetizadores y cajas de ritmo electronicas poseen sistemas propios de sincronizacion basados en la generacion de pulsos a una determinada frecuencia. Las tasas
mas utilizadas consisten 24, 48 y 96 pulsos por negra. Estos pulsos de sincronismo no
generan por lo tanto una referencia temporal fija, sino que consisten en el equivalente
digital a un metronomo, dependiente del tiempo y el compas utilizado.
FSK
Este sistema fue ampliamente utilizado antes de la aparicion del MIDI. Inicialmente se
generaba una se
nal TTL de 5v como se
nal de sincronismo que era almacenada en una
pista de audio, esta se
nal consista en un tren de pulsos cuadrados a una frecuencia de
24 o 48 pulsos por negra. La mayor desventaja del sistema resultaba ser la distorsion
que se produca en la onda cuadrada debido a la mala respuesta de la cinta magnetica
a bajas frecuencias. La solucion fue la utilizacion de una se
nal FSK compuesta de dos
trenes de pulsos cuadrados a frecuencias 1,25 y 2.5 KHz (figura 4.1).
SMPTE/EBU
Los sistemas de sincronismo basados en pulsos como los dos descritos anteriormente,
presentan el problema de que no ofrecen informacion temporal absoluta, sino referente
a la velocidad de reproduccion de los dispositivos. Los codigos de tiempo SMPTE se
crearon en los a
nos 60 con el nacimiento de los sistemas de vdeo para permitir su sincronizacion. Se basan en la generacion de una trama que marca temporalmente puntos
de la cinta, generando una referencia temporal absoluta.
MIDI
La norma MIDI, aunque creada para la comunicacion entre instrumentos digitales se
utiliza extensivamente para sincronizacion en conjunto con los sistemas SMPTE. La
version basica de la norma incluye como veremos mas adelante generadores de sincronismo basados en pulsos, que frecuentemente son convertidos a FSK. Posteriormente
se ha desarrollado una extension de la norma denominada MTC 1 con el objetivo de
1 MIDI

time code.

42

CAPITULO 4. Interconexi
on y mezcla de sonidos

Sistemas de Audio e Vdeo. Curso 2003-2004

obtener un sistema compatible con SMPTE y con sus mismas prestaciones.


A continuacion estudiaremos brevemente las normas SMPTE, MIDI y MTC que son las
mas utilizadas hoy en da para el sincronismo de dispositivos.

4.2.

SMPTE time code.

El objetivo de los codigos de tiempo SMPTE 2 es permitir la sincronizacion entre diferentes sistemas de cinta analogica superando el problema que supone las diferencias de
velocidad de arrastre de cinta de los distintos reproductores. Los codigos SMPTE consisten
en tramas con informacion temporal que se insertan con determinada frecuencia en la cinta
de audio o de vdeo, marcando temporalmente un segmento de la cinta y que pueden ser
recuperadas por los lectores, permitiendo su posicionamiento temporal. Cada segmento temporal marcado se denomina cuadro (termino proveniente de la produccion de vdeo) y suelen
1
1
almacenarse cada 24
o 30
de segundo.
El codigo de tiempo SMPTE se representa como un n
umero de 8 dgitos con el significado
que puede verse en la figura 4.2. En general los lectores tienen capacidad para leer los codigos
de tiempo y los representan bien superpuestos a la propia imagen o bien en visores especiales.

01:23:50:18
horas

min.

seg. cuadros.

Figura 4.2: Informacion SMPTE

El usuario puede conocer la posicion temporal de cada segmento de la cinta respecto a su


origen y por lo tanto utilizar los mandos de movimiento rapido y rebobinado para posicionarse en el cuadro deseado.

4.2.1.

Estructura de la trama SMPTE

La trama SMPTE consta de 80 bits repartidos en 10 bytes. Las horas, minutos, segundos
y n
umero de cuadro se almacenan separando unidades y decenas en codigo BCD.
2 Society

of Motion Picture and Television Engineers

43

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

El segundo nibble 3 de cada byte, a excepcion de los dos u


ltimos, se utiliza para informacion de usuario. Existen por lo tanto 8 grupos de usuario donde se puede almacenar fecha
de grabacion, codigos ASCII o cualquier otra informacion u
til. Los dos u
ltimos bytes contienen una palabra de sincronizacion que permite al lector reconocer el fin de cada palabra y
detectar si la cinta se esta moviendo en uno u otro sentido.
Respecto al bit 10, se denomina drop frame bit y veremos a continuacion su utilidad.

4.2.2.

Drop frame

El estandar SMPTE fue pensado para una tasa de vdeo de 30 cuadros por segundo, que
es la que se utiliza para vdeo en blanco y negro. Sin embargo con la aparicion del vdeo en
color se introdujo una nueva tasa de 29.97 cuadros/s. Esto significa una desviacion de 0.03
cuadros/s respecto a la medida dada por la trama SMPTE, es decir 108 cuadros en una hora,
lo cual implica que en una hora el reloj SMPTE se habra retrasado 3,6 s respecto al real. En
ocasiones esta desviacion puede despreciarse, pero para aplicaciones tipo television o radio,
puede ser necesaria una sincronizacion perfecta entre la lectura SMPTE y el reloj. Esto se
puede conseguir simplemente despreciando (no almacenando) 108 cuadros cada hora. En la
practica se desprecian dos tramas cada minuto excepto en los minutos 00, 10, 20, 30, 40 y 50.
Existen sistemas de vdeo en color que u
tilizan este metodo y sistemas que permiten la discrepancia descrita, esto se indica en la trama SMPTE mediante el bit 10 llamado drop frame.

4.2.3.

Almacenamiento de la trama.

La trama SMPTE se almacena bien en una canal separado o bien insertado en la propia
informacion de vdeo. La modulacion utilizada es de tipo manchester bifase. Existen varias
tasas de almacenamiento dependiendo del tipo de aplicacion y el estandar utilizado.
30 cuadros por segundo
Utilizada para vdeo NTSC en blanco y negro y audio. Es la tasa original para la que
fueron dise
nados los codigos SMPTE.
30 cuadros por segundo, con drop frame
Creada para vdeo en color (ver apartado anterior).
25 cuadros por segundo
Utilizada en Europa para vdeo en color y blanco y negro (no existe version drop frame.
3 Se

denomina nibble a un grupo de 4 bits, es decir medio byte

44

CAPITULO 4. Interconexi
on y mezcla de sonidos

Sistemas de Audio e Vdeo. Curso 2003-2004

24 cuadros por segundo


Utilizada en la industria cinematografica para mantener compatibilidad con el est
andar
de cine.
La tasa principal es 30 cuadros por segundo utilizada para vdeo NTSC en blanco y negro.

Maestro.
Sincronismo
Sincronizador
Control

Esclavo

Figura 4.3: Sincronizaci


on por bucle cerrado.

4.2.4.

Sincronizaci
on mediante SMPTE.

La sincronizacion mediante SMPTE requiere la utilizacion de un dispositivo especial llamado sincronizador, cuyo objetivo es controlar la velocidad de uno o varios reproductores
de audio o vdeo, llamados esclavos, tomando como referencia los codigos recibidos desde un
dispositivo maestro.
La sincronizacion del dispositivo esclavo se efect
ua mediante un sistema de realimentacion
en bucle cerrado (figura 4.3). Cada reproductor enva la informacion SMPTE obtenida de
la cinta al sincronizador, el cual esta conectado a los motores de los dispositivos pudiendo
controlar su velocidad y su direccion de arrastre.
El sincronizador compara las referencias de tiempo obtenidas y seg
un el tipo de sincronizacion que se solicite puede situar todos los dispositivos en la misma referencia temporal
que el maestro, deteniendolos o poniendolos en marcha cuando este lo haga o bien utilizar
los codigos SMPTE como pulsos de sincronismo para mantener a todos los dispositivos a la
misma velocidad de reproduccion que el maestro.

4.3.

Interfaz AES/EBU.

El interfaz AES/EBU es un protocolo serie de transmision de audio digital creado por la


Audio Engineering Society (AES) y la European Broadcasting Union (EBU). Para audio no
45

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Preambulo

Auxiliar

20
Muestra de audio

1 1

V U C P

Figura 4.4: Estructura de la trama AES/EBU

profesional se utiliza una version simplificada de esta norma denominada SPDIF (Sony/Philips
Digital Interface). Los DATs y la mayora de los grabadores digitales utilizan este interface
para transmitir la informacion de audio digital generada.
El protocolo AES/EBU es un protocolo serie, que permite la transmision de dos canales
de audio por un solo cable y de manera independiente a la frecuencia de muestreo utilizada
que seg
un el estandar puede ser de 32 KHz, 44.1 KHz y 48 KHz. Las muestras de audio
se codifican con 24 bits en complemento a dos utilizando codigo Manchester bifase (igual
que en SMPTE) y formando tramas que son enviadas con una tasa igual a la frecuencia de
muestreo utilizada.
Cada trama esta formada por dos subtramas de 32 bits correspondientes a los canales derecho e izquierdo con el formato representado en la figura 4.4. El campo preambulo identifica
si la subtrama corresponde al canal A, al canal B o si corresponde al canal A y ademas al
comienzo de una trama de estado del canal cuyo uso se explica mas adelante. Los cuatro
siguientes bit pueden emplearse para enviar informacion auxiliar si no se utiliza la resolucion
maxima de 24 bits. Los cuatro u
ltimos bits tienen el siguiente significado:
V (Audio Sample Validity). Indica si la muestra de audio esta libre de errores.
U (User Bit Data): Indica si la trama incluye informacion de usuario.
C (Audio Channel Status): Se utiliza para crear la trama de estado de canal.
P (Subframe Parity): Paridad de la subtrama.
Los bits de estatus de canal de 192 tramas consecutivas se utilizan para formar una palabra
de 24 bytes que contiene la informacion del estado del canal, donde se indica la frecuencia
de muestreo utilizada, un codigo de redundancia cclica, informacion de sincronizacion, etc.

4.4.

MIDI

4.4.1.

Introducci
on

La norma MIDI (Musical Interface for Digital Instruments) fue creada para permitir la interconexion de instrumentos de manera que los m
usicos pudiesen utilizar los sonidos de varios
sintetizadores desde un solo teclado. La popularidad de este interfaz se extendio rapidamente,
46

CAPITULO 4. Interconexi
on y mezcla de sonidos

Sistemas de Audio e Vdeo. Curso 2003-2004

apareciendo otros instrumentos (guitarras, controladores de viento) con capacidades MIDI e


interfaces con ordenadores que permiten el control de los dispositivos MIDI desde programas
especiales que ademas estan dotados de capacidades de grabacion, edicion etc.
Por u
ltimo, la extension de la norma MIDI y su flexibilidad ha permitido que se introduzca
en los estudios profesionales de grabacion, tanto como metodo de sincronizacion entre distintos dispositivos como para el control de mesas de mezcla, grabadoras multipista e incluso
sistemas de luces.
4.4.2.

Generalidades.

La transmision de datos va el interfaz MIDI se realiza en serie a una velocidad de 31,25


Kb/s. Generalmente los dispositivos MIDI disponen de dos conectores tipo DIN de 5 pines
(figura 4.5), que se denominan MIDI IN y MIDI OUT, y opcionalmente de un tercero denominado MIDI THRU.

Optoacoplador

2
5

MIDI IN

Buffer

2
5

MIDI TRHU

Buffer

2
5

MIDI OUT

4
1

Figura 4.5: Conectores de un sistema MIDI.

Los conectores MIDI IN y MIDI OUT se utilizan respectivamente para recibir y enviar
tramas MIDI, mientras el MIDI THRU presenta a su salida una copia exacta de lo recibido
en el MIDI IN, de forma que es posible la conexion de dispositivos en cascada.
En la figura 4.6 puede verse la interconexion de tres dispositivos MIDI. El dispositivo
maestro tiene conectada su salida MIDI OUT a la entrada MIDI IN del dispositivo 1. Este
a su vez conecta su salida MIDI THRU a la entrada MIDI IN del siguiente dispositivo y
as sucesivamente.
Cuando el instrumento maestro enva informacion MIDI a traves de su salida, indicando
47

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

por ejemplo la pulsacion de una nota, el dispositivo siguiente la recibe a traves de su entrada
poniendo una copia exacta del mensaje en su salida MIDI THRU. De esta manera todos los
dispositivos conectados reciben la informacion y por lo tanto desde el dispositivo maestro es
posible controlar cualquiera de la cadena.
Para direccionar los dispositivos, cada mensaje lleva asignado un n
umero de canal, existiendo 16 canales en cada conexion MIDI. Cada instrumento debe estar sintonizado a uno o
a varios canales, ignorando el resto de los mensajes. Por ejemplo, suponiendo que los dispositivos de la figura 4.6 son sintetizadores, podemos configurar el dispositivo 2 para recibir a
traves del canal 1 y asignar a ese canal un sonido de piano, al dispositivo 3 le asignamos a su
vez el canal 2 y un sonido de guitarra. Si desde el dispositivo maestro seleccionamos el canal
1 como salida, al pulsar una tecla obtendermos un sonido de piano en el dispositivo 1, si por
el contrario seleccionamos como canal de salida el 2, obtendremos un sonido de guitarra en
el dispositivo 3.

OUT
Dispositivo Maestro

IN

THRU

Dispositivo 1

IN

THRU

Dispositivo 2

Figura 4.6: Interconexi


on en cascada de tres dispositivos MIDI

Los mensajes MIDI llevan solamente informacion sobre el canal y la accion que debe realizarse en este, la asignacion de un sonido depende de la configuracion del dispositivo que
recibe el mensaje.

4.4.3.

Estructura de la trama MIDI.

Los datos MIDI se estructuran en palabras de 8 bits (bytes) denominadas mensajes MIDI
que se envan precedidas de un bit de comienzo (cero) y un bit final (uno). Cada mensaje esta compuesto de un byte de estado que indica el tipo de comando a realizar y uno o
dos bytes de datos, indicando informacion dependiente del comando. Los bytes de estado
comienzan siempre con un 1 mientras los de datos comienzan con un 0.
Existen dos tipos de mensajes MIDI: mensajes de canal y mensajes del sistema. Los
primeros envan informacion destinada a un canal determinado, mientras los segundos se
envan a todos los dispositivos en la cadena.
48

CAPITULO 4. Interconexi
on y mezcla de sonidos

Sistemas de Audio e Vdeo. Curso 2003-2004

Mensajes de canal.

Utilizan cuatro bits del byte de estado para identificar el canal direccionado y los cuatro
restantes para codificar el tipo de mensaje. Ademas pueden necesitar uno o dos bytes de
datos adicionales. Se distinguen a su vez dos tipos de mensajes de canal:

Voice Messages. Controlan los sonidos de un instrumento determinado. Este tipo de


mensajes constituyen el grueso de los que se envan habitualmente en una conexion
MIDI. Pueden ser de diversos tipos: comienzo final de una nota, variaciones en la presion
de una tecla, cambios de programa, controles de parametros, etc.
Mode Messages. Definen la respuesta del instrumento a los Voice Messages. Se envan
con el mismo byte de estado que el mensaje Control Change, diferenciandose por el
primer byte de datos que para los Mode Messages toma valores de 120 a 127. Los ocho
Mode Messages existentes controlan el comportamiento de los controles, polifonas, etc.
Por ejemplo, un voice message puede indicar la aparicion de una nueva nota en un canal,
mientras un mode message podra indicar al instrumento que interrumpa todas las notas que
estan activadas.
En general un instrumento puede recibir mensajes MIDI en mas de un canal, en ese caso,
el canal por el que se reciben las instrucciones principales (las que indican el modo de funcionamiento del instrumento en general) se denomina canal basico. Los Mode Messages se
suelen enviar por el canal basico y afectan a la respuesta de todo el instrumento, mientras
los Voice Messages se pueden enviar por cualquier canal (incluyendo el canal basico).

Tipo de Mensaje s

Mensajes
de Canal

Voice
Messages

Mensajes
de Sistema

Mode
Messages

System
Exclusive
Messages

System
Common
Messages

Figura 4.7: Tipos de mensajes MIDI.

49

System
Real Time
Messages

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Dispositivo Esclavo
Almacenamiento

In
Thu

In

Out
Secuenciador

Dispositivo Maestro
Out

in

Figura 4.8: Ejemplo de un sistema MIDI con secuenciador


Mensajes del Sistema.

Son mensajes no asignados a un canal que se destinan a todos los dispositivos en la cadena. Se usan para controlar secuenciadores, sincronizar dispositivos MIDI, enviar mensajes
exclusivos de un fabricante, etc.

4.4.4.

Secuenciadores MIDI

En la figura 4.8 puede verse el esquema de un sistema tpico de grabacion y reproduccion


MIDI. Un secuenciador con capacidad de almacenamiento se comunica directamente con el
dispositivo master, que a su vez se conecta al resto de la cadena mediante su salida MIDI
THRU.
Los secuenciadores son dispositivos digitales que permiten la grabacion edicion y posterior
reproduccion de la informacion MIDI generada por el teclado master. Se utilizan tres tipos
de secuenciadores: aquellos integrados en los propios sintetizadores, que suelen ser bastante
simples y con pocas posibilidades; dispositivos especficos, mas flexibles pero caros, y ordenadores. Los ordenadores son los dispositivos mas utilizados como secuenciadores MIDI ya
que al disponer de software variado resultan muy flexibles, teniendo ademas un interfaz de
usuario mucho mas eficiente que los secuenciadores especializados. Existen interfaces MIDI
para la conexion de dispositivos MIDI a cualquier tipo de ordenador, e incluso ordenadores
con el interfaz integrado en la propia placa base.
Por comodidad, los secuenciadores MIDI suelen tener la apariencia de grabadoras multipista en el sentido de que la informacion se organiza en pistas sobre las cuales se pueden
realizar las mismas operaciones que permite un grabador (editar pistas, grabar varias en
una, etc). Sin embargo el concepto es diferente en un secuenciador y un grabador analogico.
En un secuenciador, cada pista puede contener informacion MIDI correspondiente a uno o
varios canales, siendo por lo tanto un contenedor para informacion MIDI, mientras que un
canal es una conexion logica entre el secuenciador y un instrumento en la cadena.
50

CAPITULO 4. Interconexi
on y mezcla de sonidos

Sistemas de Audio e Vdeo. Curso 2003-2004

La restriccion de 16 canales impuesta por la norma es facilmente superable disponiendo


de un interfaz con varias salidas MIDI. Los secuenciadores son capaces de asignar pistas a
canales de cualquiera de las salidas MIDI disponibles, de manera que es posible el manejo
gran cantidad de pistas.

4.4.5.

Sincronizaci
on mediante MIDI

La sincronizacion mediante un sistema MIDI se realiza mediante los mensajes System


Real Time y System Common Song Position Pointer. La informacion generada por estos
mensajes circula a traves del propio cable MIDI por lo que a diferencia del sistema SMPTE
no es necesaria la utilizacion de sincronizadores externos.

4.4.6.

MIDI Time Code

Los sistemas de sincronizacion soportados por la norma MIDI que hemos visto en el
apartado anterior tienen la desventaja de que no ofrecen una referencia temporal fija, sino
dependiente del tempo y compas de la secuencia, estan por lo tanto sometidos a cambios de
velocidad.
Para obtener una referencia absoluta de tiempo, se creo una extension a la norma MIDI
original denominada MIDI Time Code o MTC utilizando aquellos mensajes MIDI no definidos en la norma. Los mensajes MTC permiten ademas una traduccion directa de los codigos
SMPTE a mensajes MIDI facilitando la interconexion de dispositivos analogicos y digitales.

51

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

4.5.

Introducci
on al sistema de mezclas

Las aplicaciones que suelen llevar asociadas un proceso de mezclas de sonidos pueden ser
muy variadas, pero hay tres fundamentales: la monitorizaci
on, que nos permite presentar
al tecnico o m
usico el resultado de la mezcla, la amplificaci
on de potencia, que desarrolla
la presentacion ac
ustica del resultado final de la mezcla y la grabaci
on en alg
un medio de
almacenamiento del producto final, una vez mezclado.
Aunque algunos de los elementos puedan variar, o faltar alguno de ellos, veamos cuales son
las partes fundamentales de un estudio de grabacion, entorno en el cual la mesa de mezclas
hace de sistema central de control
Mesa de mezclas: la mesa. El sistema central que gobierna y direcciona las se
nales
electricas provenientes de m
ultiples elementos.
Transductores ac
ustico-el
ectricos: conjunto de microfonos y sensores de distintos
tipos que nos facilitan la captacion de la se
nal ac
ustica y su conversion.
Fuentes sonoras el
ectricas: todos los instrumentos electronicos que generan sonido
a partir de informacion guardada en su interior. No es necesaria la transduccion y
alimentan directamente a la mesa con se
nales electricas.
Grabador multipista: dispositivo de almacenamiento que, usualmente, permite grabar y reproducir al mismo tiempo varias se
nales independientes.
Procesadores externos de efectos: sistemas externos a la mesa que reciben se
nales
de esta y se las devuelven procesadas.
Monitorizaci
on: conjunto de transductores electrico- ac
usticos (pantallas, auriculares, . . . ) que presentan la se
nal resultado de la mezcla para que se pueda hacer un
seguimiento de la misma.
Se
nales de control externo: se
nales de sincronismo o automatizacion que facilitan el
control de elementos externos o la modificacion del modo de funcionamiento de la mesa
en funcion de se
nales de control externas. Por ejemplo, se
nales de sincronismo temporal,
comandos MIDI, etc.
Recinto: el entorno ac
ustico en s. Ya sea la sala de grabacion o la llamada sala de
control.
Si usaramos un smil grafico, un sistema de mezcla nos permite dibujar sonidos: los microfonos e instrumentos son los pinceles, el dispositivo de grabacion el lienzo y la mesa de
mezclas hace de paleta en la que podemos mezclar los colores que luego plasmaremos en la
imagen ac
ustica final.

52

CAPITULO 4. Interconexi
on y mezcla de sonidos

4.5.1.

Sistemas de Audio e Vdeo. Curso 2003-2004

Nomenclatura

Estos son los conceptos basicos que definen la arquitectura de una mesa de mezclas:
Ganancia variable: potenciometros deslizantes o rotatorios.
Bus: camino de propagacion de la se
nal. Su interconexion posibilita la mezcla.
Conmutador: desvo de la informacion hacia otro bus distinto. A veces la se
nal se propaga a varios buses con ganancias distintas en cada uno.
Conectores: clavijas de conexion electrica.
Sistemas: distintos procesos que se pueden intercalar en determinados puntos del camino
de la se
nal.

4.6.
4.6.1.

Mesa de mezclas
Buses de informaci
on

Podemos hablar de los siguientes caminos de informacion dentro de la mesa:


Bus de canal (de pista o de entrada): es el camino de la se
nal electrica que se recoge
como entradas a la mesa, previas a ninguna mezcla con otros buses de canal.
Bus de efectos: de envo y retorno. En el se mezclan uno o mas canales para enviarlos
en el bus de envo de efectos y procesar la se
nal conjunta. La vuelta viene a traves
del bus de retorno de efectos.
Bus de grupos auxiliares: permiten agrupar se
nales provenientes de varios buses en uno
solo.
Bus estereo (par estereo): en grabaciones estereo es el par de buses L (izquierdo) y R
(derecho) que contienen la mezcla final. El producto definitivo en grabaciones multicanal
vendra contenido en tantos buses como canales finales haya.
4.6.2.

M
odulo de canal (m
odulo de entrada/salida I/O)

Es el conjunto de conexiones y procesos que suelen ir asociados a cada bus de canal de


entrada, y los elementos basicos son:
Conexion: suele ser de tipo XLR, para microfonos, y de JACK, para lnea
53

Antonio Pena, apena@gts.tsc.uvigo.es. E.T.S.E.Telecomunicaci


on. Univ. de Vigo

Preamplificacion de la se
nal: es conveniente ajustar los niveles de entrada para que no
saturen la entrada ni queden demasiado debiles para mantener una SNR razonable.
Suelen disponer de un atenuador adicional de ganancia fija (20dB, p.e.) para usar con
las entradas de nivel muy alto.
Control de volumen: el bus lleva asociado un potenciometro (suele ser deslizante -fader ), que permite modificar la energa de la se
nal que discurre a traves de el.
Con estos elementos primarios ya podemos hacer una mezcla basica. Vayamos a
nadiendo
ahora varios elementos habituales que a
naden flexibilidad al sistema:
Control de panoramica (P AN): un potenciometro rotatorio nos facilita el enviar una
misma se
nal a dos canales con ganancias separadas. Pero tambien es interesante disponer de un conmutador que nos permita optar entre dos o mas buses, por lo que juntando
estos dos elementos obtenemos un mando habitual en la mesa de mezclas. Consta de un
interruptor que nos permite seleccionar pares de pistas, los que se deseen simultaneamente, de forma que la se
nal se transmite a los pares de buses activados. La ganancia
relativa asociada a cada par viene dada por la posicion del mando rotatorio P AN.
Ecualizador: en serie dentro de cada bus de entrada suele existir un ecualizador (parametrico, usualmente), que nos permite perfilar espectralmente la se
nal antes de la
mezcla con otros canales.
Sin ecualizacion: es habitual disponer de una opcion de bypass para activar o desactivar
el ecualizador.
4.6.3.

Bucles de efectos: envo y retorno en paralelo y en serie

Bucle serie de efectos: para acceder a un procesador ajeno al propio modulo de entrada,
puede haber un conector que facilite la extraccion y retorno, en el llamado punto de
acceso o insercion. Se suele usar para aplicar ecualizaciones, compresiones y puertas de
ruido.
Bucle paralelo de efectos: mientras que el bucle serie vuelve a colocar la se
nal modificada
en el propio canal, el bucle paralelo, llamado de envo y retorno, suele enviar la se
nal
modificada a un bus de efectos, donde se pueden agrupar con otras se
nales. La mezcla
de la se
nal sin procesar (dry) y la procesada se realiza mas adelante.
Toma de se
nal PRE y POST: esta toma en paralelo de la se
nal se puede hacer antes
(PRE) de la influencia de la ecualizacion y fader del modulo de entrada, o despues
(POST).
54

CAPITULO 4. Interconexi
on y mezcla de sonidos

4.6.4.

Sistemas de Audio e Vdeo. Curso 2003-2004

Otros elementos adicionales

MUTE: boton que nos permite silenciar el canal en la mezcla final (sin tener que modificar sus parametros de mezcla).
SOLO: boton que permite escuchar solamente el canal en la mezcla final, sin modificar
los parametros de los demas canales.
Desfasador: boton al comienzo del modulo de entrada que permite un desfase de 180.
para conexiones desfasadas.
Util
Mezcla de monitorizacion: aunque se pueden obtener de otras formas, a veces hay
una seccion especfica para proporcionar una segunda mezcla que presentemos en las
pantallas (monitores) o auriculares.
CUE: similar a la anterior. Se suele usar para proporcionar una mezcla extra para los
m
usicos que estan grabando, de forma que tengan la referencia del resto de instrumentos
ya grabados previamente.
Medidores: VU-metros, LEDs, etc. Si el indicador es de aguja, hay que tener en cuenta el
tiempo de respuesta de la misma, lo que hace que los picos de se
nal no se vean reflejados
claramente y puede estar saturando sin llegar a reflejarse en el medidor. Para eso suele
existir un LED relacionado con un medidor mas rapido que indica si hemos llegado al
pico.

55

You might also like