Professional Documents
Culture Documents
1
De dedo no de dgito!
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
introduccin). En este caso, su curiosidad quedar satisfecha. Y quin sabe, tal vez incluso le
acabe picando el gusanillo
Despus estn los programadores, que intuyen el potencial que se oculta tras el MIDI y el
audio digital, pero no encuentran la informacin necesaria. Para ellos, dedicamos dos extensos
captulos a la programacin MIDI, con ejemplos operativos en Visual Basic y en lenguaje
C.
Por ltimo, este libro tambin tiene bastante que aportar a los msicos que trabajan con el
MIDI desde hace tiempo, y que dominan con soltura sus aspectos ms prcticos. Aquellos
que acaban de cambiar de ordenador, y que se han decidido a jubilar aquel Atari que tan
buenos momentos y resultados les ha proporcionado, podrn descubrir todas las prestaciones
de un sistema que, como el PC de hoy en da, es mucho ms potente y abre un sinfn de
nuevas posibilidades (samplers econmicos, grabacin multipista a disco duro, etc.). Y los
que deseen consolidar sus conocimientos y profundizar en los aspectos ms tericos de las
tecnologas que usan a diario, tambin encontrarn aqu una importante fuente de
conocimientos, as como una rpida referencia para muchas de las dudas que les puedan ir
surgiendo. Varios cursos de informtica musical, impartidos a estudiantes de cierto nivel, me
han evidenciado que muchos conocimientos, supuestamente bsicos, no siempre estn tan
claros como cabra esperar.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Cmo usar este libro
La idea de este libro surgi a raz de varios cursos de informtica musical y programacin
MIDI impartidos en el Institut Universitari de lAudiovisual, de la universidad Pompeu
Fabra de Barcelona, al observar que la bibliografa sobre el tema, sigue siendo hoy bastante
reducida. La mayora de libros interesantes estn en ingls y no son adems fciles de
conseguir. Los pocos publicados en castellano, son, salvo honrosas excepciones, demasiado
superficiales o han quedado desfasados. La intencin inicial era dar una base slida y
completa tanto para el msico que comienza, como para el que desea consolidar sus
conocimientos, en el rea de la informtica musical.
Por otro lado, es innegable que con el auge del multimedia, existen muchos nuevos usuarios
con inquietudes y disposicin, que no encuentran la informacin necesaria para comenzar a
adentrarse en estos terrenos. Por ello, este libro intenta combinar los aspectos tericos
fundamentales que rigen el sonido digital y la msica por ordenador, con las posibilidades
prcticas que los ordenadores multimedia ofrecen hoy en da. Cuando ha habido que elegir
una plataforma y un sistema en los que mostrar los ejemplos y los productos actualmente
disponibles, la eleccin ha recado sobre el PC y el sistema operativo Windows
(especialmente la versin 95).
Los productos cambian muy rpido, y es por ello peligroso aconsejar determinadas
aplicaciones o dispositivos de hardware, pero creemos que el salto cuantitativo importante
que se ha producido en el terreno de los ordenadores PC compatibles durante los aos 1995
y 1996, dejar sus secuelas durante cierto tiempo.
Material necesario
Se asume que el lector dispone de un ordenador y de una tarjeta de sonido. Si no fuera as, en
los captulos 11 y 12 se estudian las tarjetas de sonido en profundidad, lo cual puede servir de
ayuda a la hora de adquirir una. En los captulos 5 y 6 es conveniente la utilizacin de un
software editor de sonido para aplicar los conceptos tratados. El libro no sigue ninguno en
particular, aunque en esos captulos, se recomiendan varias utilidades shareware. Ms
adelante se estudia el software secuenciador, tambin de forma genrica, por lo que sera muy
conveniente que el usuario dispusiera de uno, as como de un teclado MIDI. Muchos de los
programas shareware o de dominio pblico que se mencionan a lo largo de la obra pueden
obtenerse en Internet, y en un apndice se incluyen algunas direcciones interesantes.
Como reza el ttulo, este libro trata dos grandes temas, que en la prctica se combinan, pero
que estn conceptualmente separados: el audio digital y el MIDI. Nos ha parecido
incuestionable comenzar por el audio digital, para pasar despus al MIDI, y mostrar
finalmente en el ltimo captulo el inmenso potencial que ofrece el uso combinado de ambas
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
tecnologas; posibilidad que en el terreno de los ordenadores compatibles est disponible, a
nivel masivo, slo desde 1996.
Aconsejamos una lectura progresiva, aunque el lector impaciente podr saltar de un tema a
otro intentando respetar los bloques que se indican a continuacin. Asimismo muchos de los
captulos podrn ser utilizados para consultas posteriores, por lo que hemos dedicado un
especial esfuerzo en facilitar la localizacin y el acceso a informaciones puntuales.
El audio digital se trata en los captulos 1 a 6. El captulo 1 estudia principios bsicos de
acstica musical y el captulo 2, los aspectos fundamentales del audio digital. Aunque en
ambos se han evitado complejas frmulas y demostraciones matemticas, incluyen todo lo
necesario para la comprensin de lo que sigue. Un lector con conocimientos en ambos
campos podra tal vez saltrselos, pero un breve repaso le ayudar a refrescar la memoria y a
aclarar conceptos.
El captulo 3 explica las peculiaridades y el uso del audio digital en los ordenadores, de forma
totalmente independiente de cualquier plataforma. El captulo 4, se centra en cambio en la
implementacin que del audio digital hace Windows 95 (indicando cuando las hubiera, las
particularidades de Windows 3.1), y aunque su contenido terico es muy escaso, ayudar a
cualquier usuario de este sistema, a configurar bien el ordenador, a comprender sus
peculiaridades y a realizar las operaciones ms bsicas (digitalizacin de sonido, control del
mezclador, etc.) algunas de ellas fundamentales para el resto de la obra. Un usuario de otra
plataforma (Apple, Unix, etc.) podr saltarse este tema.
En los captulos 5 y 6 se explican los procesos tpicos disponibles en un programa editor de
sonido. En ambos se describen ejemplos con varios programas de Windows (en su mayora
de dominio pblico), por lo que para seguirlos sera conveniente que el lector dispusiera de
algunos de ellos. Las tcnicas descritas en el captulo 5 pueden considerarse ms bsicas,
mientras que las del captulo 6 implican un contenido terico superior. Por ello, se discuten
tambin de forma sencilla algunos conceptos de proceso digital de seal.
Los captulo 7 a 14, tratan del MIDI en general. El captulo 7 es una introduccin al tema, que
podrn saltarse los que lleven tiempo trabajando con l. El captulo 8, trata en cambio todos
los mensajes MIDI en profundidad, por lo que es de lectura (y relectura) obligada. En algunos
puntos se asumen ciertos conocimientos informticos bsicos (sistema binario), por lo que es
posible que, en el primer acercamiento, este capitulo pueda parecer un tanto denso, pero est
estructurado de forma que permita una utilizacin como referencia rpida. Por ello, si la
primera lectura se le hace excesivamente farragosa, podr volver a l siempre que necesite
reafirmar sus conocimientos.
El captulo 9 cubre la sntesis digital. En principio est enfocada a los sintetizadores MIDI y al
sampler, pero tambin podra leerse como continuacin del captulo 6. En cualquier caso
incluye muchos aspectos fundamentales que sern desarrollados en los captulos 11 y 12,
dedicados a las tarjetas de sonido.
Los captulos 10, 11 y 12 se dedican al hardware MIDI. En el 10, se tratan brevemente
desde los dispositivos ms frecuentes (como el teclado) a otros que no lo son tanto. No se
trata de adquirirlos todos, sino de obtener una visin global de la multiplicidad de enfoques
permitidos y de las posibilidades actuales. Los captulos 11 y 12 se centran en las tarjetas de
sonido. Primero de forma ms terica, estudiando los diversos tipos y sus caractersticas, para
realizar, en el captulo 12, un anlisis comparativo de los modelos ms aconsejables,
disponibles a principios de 1997.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Los captulos 13 y 14, tratan sobre el software MIDI. El primero se dedica por completo al
secuenciador, el programa ms importante de todo estudio MIDI, mientras que en el segundo,
se contemplan los restantes tipos de programas disponibles. En ambos casos se analizan las
prestaciones de varios paquetes disponibles para Windows.
Los captulos 15, 16 y 17, cubren varios aspectos de la configuracin, gestin y programacin
MIDI en Windows. El primero es obligado para entender las peculiaridades de este sistema
operativo en lo que al MIDI se refiere. Los dos siguientes se reservan para los
programadores. El captulo 16 trata el uso de comandos MCI, mientras que el 17 se centra en
la programacin MIDI de bajo nivel. Ambos pueden estudiarse de forma independiente. En
los dos casos puede resultar conveniente repasar previamente el captulo 8.
Finalmente, en el captulo 18 se abordan las nuevas posibilidades de integracin del MIDI y el
audio digital, para finalizar con un repaso de los dispositivos analgicos imprescindibles en
todo estudio de msica por ordenador.
Termina el libro con tres apndices. El primero, destinado a aclarar algunos trminos y
conceptos musicales, est pensado para el lector con escasa formacin musical. En el segundo
se presentan en modo de tablas, algunas especificaciones tcnicas referentes al MIDI,
mientras que en el tercero se incluye una lista comentada de direcciones en Internet,
relacionadas con la informtica musical.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Agradecimientos
Me gustara dar las gracias a todas aquellas personas que a lo largo de los ltimos diez aos
me han ayudado o encaminado a seguir en el campo de la informtica musical, y en especial a
Adolfo Nuez del Laboratorio de Informtica y Electrnica Musical de Madrid y a Xavier
Serra de la Fundaci Phonos de Barcelona. Tambin quisiera agradecer a Marisa Manchado
y a Gabriel Brncic por haberme animado a seguir componiendo en algunos momentos en que
no lo he tenido tan claro, a Marcel.l Antnez que me fuerza, con sus propuestas, a descubrir
cada da nuevos horizontes informtico-creativos y a Cristina Casanova que ha colaborado en
las imgenes del libro y con sus apreciaciones, sugerencias y acertados comentarios.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1. Principios de acstica
1.1. Introduccin
Aunque se puede hacer msica sin tener demasiados conocimientos de acstica, parece
imposible comprender lo que es el sonido digital si no se tiene una idea de lo que es el sonido
en general. Por ello, este captulo describe de forma bsica los aspectos fsicos y matemticos
de las ondas sonoras que, junto con sus consecuencias psicolgicas, son la base de toda
experiencia musical. Empecemos pues por el principio.
Lo que entendemos por sonido es fruto de una compleja interaccin entre un objeto vibrante,
un medio transmisor (frecuentemente el aire), el odo, y el cerebro. Para que la vibracin sea
audible para un ser humano, este objeto debe oscilar aproximadamente entre 20 y 20.000
veces por segundo. Al oscilar, el objeto desplaza el aire que lo rodea, comprimiendo y
descomprimiendo peridicamente las molculas que lo integran, y modificando por
consiguiente la presin del aire de forma peridica. Dado que las molculas desplazadas van
empujando a las contiguas, la variacin peridica de la presin se propaga originando lo que
recibe el nombre de ondas sonoras. Cuando las ondas llegan al odo, el cerebro interpreta
estas variaciones de presin como sonido. Si la presin del aire que circunda el odo se
mantiene constante, no omos nada, u omos el silencio.
Las ondas sonoras se propagan en el espacio, formando invisibles esferas centradas en el
objeto que oscila. Conforme aumenta la distancia al origen y el radio de estas ondas, aumenta
tambin el volumen y la masa de aire que stas deben desplazar, por lo que las oscilaciones se
hacen cada vez ms dbiles (la presin del aire vara cada vez menos, aunque siga hacindolo
con la misma frecuencia) hasta que, a una cierta distancia, se tornan imperceptibles.
Este principio es vlido independientemente del objeto oscilador, que puede ser por ejemplo
una cuerda (guitarras, violines, pianos, cuerdas vocales, etc.), una columna de aire
semicerrada y excitada por una caa o una boquilla (saxofones, flautas, trompetas, rganos,
etc.), una pieza de madera, metal, piel, piedra, etc. golpeada (percusiones), o un cono de
papel (altavoces). En muchos casos, los objetos que entran en vibracin son en realidad
varios, como es el caso de la guitarra (o de la voz) donde lo que omos es la suma de las
vibraciones de las cuerdas y de la caja.
Asimismo, cuando estas ondas encuentran un obstculo, parte de las molculas que las
componen son absorbidas por el material, mientras que las restantes son reflejadas. Este
fenmeno origina que en la mayora de los casos, lo que nos llega al odo sea una suma del
sonido directo combinado con mltiples reflexiones de este sonido, ligeramente retardadas1.
1 El tiemp o de estos retardos ser proporcional a la distancia adicional recorrida, teniendo en cuenta que la
velocidad del sonido en el aire, es de aproximadamente 344 m/s.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3. Caractersticas de los sonidos musicales
Para describir un sonido musical se utilizan tres trminos: altura, timbre e intensidad. Todo
sonido tiene una duracin y, a lo largo de sta, cualquiera de estos tres parmetros puede
variar (los sonidos naturales jams son perfectamente estables o constantes).
2Por este motivo hemos aadido el epteto "musicales", en el ttulo de este apartado. Eso no significa que
estos sonidos sean los nicos vlidos para hacer msica, y la percusin es un claro ejemplo de ello.
3El Hz o hertzio es la magnitud fsica que mide la frecuencia, e indica el nmero de veces por segundo que
se repite determinado fenmeno.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3.2. La octava y las notas
Do Re Mi Fa Sol La Si
C D E F G A B
Conviene indicar que antes de J.S.Bach (siglo XVIII), la divisin de la octava se basaba en las
teoras del filsofo griego Pitgoras, segn la cual los intervalos formados por cada nota y la
siguiente no eran siempre idnticos. Para simplificar la construccin de instrumentos, en el siglo
XVIII se decidi dividir la octava en doce partes iguales, por lo que actualmente, la relacin
de frecuencias entre cualquier nota y la siguiente es siempre igual a 21/12 (1.05946). De esta
forma, al avanzar doce semitonos (una octava), obtenemos un factor de (21/12)12 que es
efectivamente igual a 2.
El timbre podra definirse como el "color" de un sonido, y es lo que nos ayuda a caracterizar y
distinguir diferentes tipos de instrumentos, o a reconocer a las personas por su voz. Un La de
440 Hz en una clarinete suena diferente que el mismo La en un saxo; aunque ambos tienen la
misma altura, sus timbres no son iguales. La figura 1.2, que muestra fragmentos de estos dos
sonidos, junto con un tercer fragmento correspondiente a onda sinusoidal pura de la misma
altura, nos puede ayudar a comprender la naturaleza fsica del timbre. En los tres fragmentos,
el perodo es el mismo (pues tienen la misma altura), pero sus formas son diferentes.
4 En el apndice B se indican las frecuencias de todas las notas MIDI, y se puede observar como
efectivamente, estas frecuencias se duplican en cada nueva octava.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Figura 1.2. Fragmentos de tres sonidos de la misma altura (La de 440 Hz) en un
clarinete (a), un saxofn (b) y una onda sinusoidal pura (c)
El motivo de esta diferencia de forma, es que las ondas de los sonidos naturales son ms
complejas porque vibran con varias frecuencias simultneas. En la naturaleza no se encuentran
sonidos puros con una sola frecuencia, como el de la figura 1.2.c; stos slo son obtenibles
por medios electrnicos.
En los sonidos naturales, la frecuencia de vibracin ms grave es la que determina
normalmente el perodo y la altura, y se denomina frecuencia base. Las restantes frecuencias,
que suelen ser mltiplos de la frecuencia base se denominan armnicos, y cada tipo de
instrumento tiene, por su construccin, una serie diferente de armnicos de amplitudes
diferentes, que son los que definen su timbre y otorgan las "seas de identidad" al instrumento.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Las matemticas relacionadas con este concepto, fueron establecidas en el siglo XIX por el
fsico Jean-Baptiste Fourier, que descubri que toda seal peridica, por compleja que esta
sea, puede descomponerse como una suma de seales sinusoidales armnicas, es decir de
frecuencias mltiplos de la original. En la figura 1.3 se muestra la descomposicin de una onda
peridica (d) en sus varias ondas sinusoidales simples armnicas, de amplitudes diferentes.
Dicho de otro modo, la seal d es la resultante de sumar de las seales a, b y c.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3.4. La intensidad y los decibelios
Esta expresin determina un nivel o diferencia de intensidad entre dos amplitudes. El origen (0
dB) corresponde al umbral de audicin (mnimo sonido audible). Por debajo de este valor
tenemos el autntico silencio, aunque en el mundo en que vivimos la experimentacin del
silencio se hace francamente difcil, por lo que muchos de nosotros probablemente no
lleguemos a conocer nunca el significado real de esta palabra. Por encima de los 130 dB se
produce una sensacin dolorosa. Valores superiores prolongados llegan a destrozar el
tmpano. En la tabla 1.1 siguiente se muestran algunos valores tpicos.
.
Descripcin Nivel (dB) Relacin de intensidad
Despegue de cohete espacial 190 1019
Despegue de un reactor 150 1015
Umbral de dolor 130 1013
Concierto de heavy metal 120 1012
Martillazos sobre una plancha metlica (a 50 cm) 110 1011
Trfico en calle concurrida 70 10.000.000
Conversacin normal (a 1 m) 60 1.000.000
Restaurante concurrido 50 100.000
Casa en la ciudad 40 10.000
Iglesia vaca 30 1.000
Estudio de grabacin 20 100
Umbral de audicin 0 1
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
1.3.5 El rango dinmico
La diferencia entre los valores mnimos y mximos en dB, que un sistema puede producir se
denomina rango dinmico. En la tabla 1.2 se indican algunos valores tpicos.
Clarinete 86
Piano 94
Disco compacto 96
Trombn 107
Orquesta sinfnica 120
Hasta la aparicin de los ordenadores, el sonido se grababa siempre de forma analgica. Pero
qu significa exactamente este trmino?
El trmino analgico se utiliza actualmente en contraposicin a digital. Las seales analgicas
son funciones de variables continuas (frecuentemente del voltaje) cuyas evoluciones
temporales imitan (son una analoga de) las seales originales. La representacin grfica de
un sonido grabado analgicamente tendr aproximadamente la misma forma que el sonido
original, pero la curva indicar variaciones de voltaje, en lugar de variaciones de presin de
aire. Estas nuevas seales analgicas se obtienen por medio de transductores, trmino con el
que se designa a todo dispositivo capaz de convertir una magnitud fsica en otra.
El micrfono y los altavoces son los dos transductores bsicos utilizados en la grabacin y
reproduccin del sonido. En primer lugar, el micrfono convierte la variacin de la presin de
5 Aunque ambos trminos no son exactamente idnticos, de momento podemos obviar la diferencia.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
aire ejercida sobre su membrana, en una seal de voltaje variable en el tiempo. Este voltaje
puede ser grabado, utilizando diferentes tecnologas, sobre una cinta magntica o en los surcos
de un disco de vinilo. Cuando deseamos reproducir el sonido, la seal elctrica generada por
el cabezal de la pletina o la aguja del tocadiscos, es amplificada y enviada a los altavoces,
donde un nuevo transductor la convierte en un campo magntico capaz de desplazar y de
hacer oscilar (con las frecuencias originales) los conos de papel de los altavoces.
Conviene resaltar que aunque la grabacin se realice digitalmente, tal como se describe en el
prximo captulo, Principios de sonido digital, se seguirn llevando a cabo las
transducciones analgicas en el micrfono y en los altavoces. En la figura 1.4 se esquematizan
los dos procesos de grabacin alternativos.
Al contrario de lo que opina la mayora, una grabacin analgica no tiene por qu sonar peor
que una grabacin digital (en condiciones ptimas, suena de hecho mejor). Sus inconvenientes
radican en que la seal analgica se degrada mucho ms rpidamente (las cintas magnticas se
desmagnetizan, y los surcos en el vinilo se desgastan), y que en cada nueva generacin se
produce una pequea pero inevitable perdida, de forma que, a cada nueva copia, la seal se
parece cada vez menos a la original.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Por estas razones el sonido digital ha tomado definitivamente el relevo del analgico. Al
margen de la discutible cuestin de la calidad, en este libro se ver porque el sonido digital
aporta un sinfn de nuevas y excitantes posibilidades en la manipulacin, creacin y
experimentacin sonoras.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2. Principios del sonido digital
2.1 Introduccin
El principio fundamental del audio digital consiste en discretizar las seales sonoras continuas
(como las emitidas por un micrfono) para convertirlas en secuencias de nmeros. La
discretizacin de estas seales se lleva a cabo en dos niveles diferentes, el temporal y el de la
amplitud. En la figura 2.1 se muestra una seal continua, discretizada slo en el tiempo
(cuadros blancos) y en el tiempo y la amplitud (puntos negros). Cuanto menor sea la
cuadrcula, mayor similitud existir entre la seal original y la seal digitalizada.
Para aclarar algunos conceptos, haremos una analoga con el cine y el vdeo digital. En ambos
medios, existe una discretizacin temporal (incluso en el caso del cine que no es un medio
digital). En el cine, la unidad de discretizacin temporal es el fotograma (24
fotogramas/segundo), mientras que en el vdeo esta unidad se suele denominar con el trmino
ingls frame (dependiendo del sistema, este valor suele ser de 25 30 frames/segundo). Esto
correspondera, en el audio, a la discretizacin temporal.
Pero en el caso del vdeo digital se producen dos discretizaciones adicionales. La segunda
convierte cada frame en una matriz de puntos (por ejemplo 800x600), y la tercera asigna un
nmero (de entre un conjunto finito de valores) a cada punto, de forma que cada uno de estos
nmeros corresponde a un color y un brillo determinado.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
Es obvio que cuantos ms puntos apliquemos, y cuantos ms nmeros utilicemos para cada
punto, mayor ser la similitud entre la seal analgica original y la seal digitalizada. Si
disponemos de pocos puntos, la imagen aparecer cuadriculada, y si el nmero de valores
posibles para cada punto es pequeo, perderemos matices en los colores y en los brillos. En
la figura 2.2 se muestran estos casos. Algo parecido sucede con el sonido.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2.3. Muestreo del sonido - Frecuencia de muestreo
La palabra muestreo es el equivalente del trmino ingls sampling, y se utiliza para indicar la
accin de tomar muestras a intervalos de tiempo regulares. Para digitalizar un sonido es
necesario muestrearlo, pero con qu frecuencia? En el apartado anterior comentbamos que
para la imagen animada, la frecuencia de muestreo suele estar entre los 24 y los 30 fotogramas
por segundo. Con esta frecuencia se consigue engaar a la retina, hacindole creer que lo que
recibe no son imgenes discontinuas, sino un flujo continuo de luz, pero estos valores son
totalmente insuficientes en el caso del sonido.
Para comprender este fenmeno observemos la figura 2.3 que representa una seal sinusoidal
de 30 Hz. (el ciclo se repite 30 veces por segundo) Que ocurre si la muestreamos a una
frecuencia de 20 Hz? En este caso, estaremos tomando el valor de la onda original cada 0,05
segundos (corresponden a los seis cuadros de la figura). La nueva seal obtenida juntando los
puntos muestreados tiene un perodo aparente de 0,1 segundos, es decir una frecuencia de
10 Hz, lo cual no se corresponde en absoluto con la seal original!
En nuestro ejemplo anterior, una frecuencia de 60 Hz hubiese pues bastado para muestrear
correctamente la seal original. Pero tal como indicamos en el captulo 1,Principios de
acstica, el odo humano es capaz de detectar frecuencias sonoras de hasta
aproximadamente 20.000 Hz, por lo que, para muestrear correctamente cualquier sonido se
necesitar una frecuencia de muestreo superior o igual a 40.000 Hz. De aqu proceden los
famosos 44.100 Hz. utilizados en los discos compactos!
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2.4. Muestreo con frecuencias inferiores - El aliasing
Si muestreamos a una frecuencia inferior, como por ejemplo a 30.000 Hz, los resultados que
obtengamos podrn ser correctos para las frecuencias por debajo de los 15.000 Hz (la mitad
de la frecuencia de muestreo). Para las aplicaciones que no precisen de la mxima fidelidad,
esto es ms que suficiente. El sonido ser un poco menos brillante, pero se parecer todava
bastante al original, pues la zona frecuencial con mayor energa suele estar aproximadamente
entre los 1.000 y los 3.000 Hz.
Existe, sin embargo un problema adicional, algo complicado de entender. Tal como vimos en
el ejemplo grfico anterior, al muestrear con frecuencias inferiores, surgen frecuencias
fantasmas que realmente no estn en el sonido original (como los 10 Hz que aparecan
misteriosamente en nuestro ejemplo) y que alteran el sonido muestreado. Este fenmeno
recibe el nombre de aliasing.
Si lo que sigue le parece excesivamente complicado, no se preocupe: volveremos a tratar el
tema con ms detalle en el apartado 5.7. Efectos simples aplicables a la frecuencia, pero
para los ms impacientes, he aqu un pequeo adelanto.
El aliasing inventa frecuencias de valores aproximados a la diferencia entre la frecuencia
original y la frecuencia de muestreo. Para evitarlo, cuando se desee muestrear a frecuencias
inferiores a 44.100 Hz, se debera filtrar previamente la seal entrante, eliminando todos sus
valores por encima de la mitad de la frecuencia de muestreo. Si decidimos muestrear a 20.000
Hz, deberamos filtrar la seal original, eliminando todos sus componentes por encima de
10.000 Hz. Esto no siempre es posible si no se dispone del hardware adecuado, ya que la
mayora de tarjetas de sonido no permiten modificar el filtro de entrada. Existe una solucin
para realizar todo este proceso por software, consistente en:
muestrear a 44.100 Hz
filtrar por software el sonido obtenido, a la mitad de la frecuencia deseada (e.g. 10.000
Hz)
reconvertir por software el sonido a la frecuencia deseada (e.g. 20.000 Hz)
Parece muy complicado, pero no se apure; como veremos, la mayora de editores de sonido
facilitan bastante esta tarea.
Hasta aqu, hemos resuelto la primera parte terica de la digitalizacin, consistente en obtener
una serie de muestras a intervalos regulares. Falta todava la segunda parte, que consiste en
asignar a cada una de estas muestras un valor numrico que pueda ser manejado por un
ordenador. Para ello, volveremos momentneamente al ejemplo del vdeo digital, que para
muchos lectores resultar ms familiar. La resolucin de color de una imagen (y de las tarjetas
de vdeo) se mide en bits. As, una imagen de 8 bits, podr incluir 256 (28) colores diferentes,
mientras que una de 24 bits podr representar ms de 16 millones (224) de colores. Con el
sonido sucede algo parecido: cuantos ms bits apliquemos, ms niveles o escalones tendr el
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
sonido digitalizado y ms parecido ser en consecuencia al sonido analgico original (que al
ser continuo, posea un nmero infinito de niveles).
El rango dinmico en decibelios viene dado aproximadamente por la frmula:
Hasta aqu la teora. Veamos ahora como funciona un sistema digitalizador de sonido. El
sistema se compone de dos conversores: un conversor analgico/digital (a partir de ahora
A/D) en la entrada, y un conversor digital/analgico (a partir de ahora D/A) en la salida.
Ambos estn controlados por un reloj digital que determina la frecuencia de muestreo. Para
evitar el aliasing se coloca en la entrada un filtro pasa-bajo (vase apartado 6.4.3), que
elimina de la seal analgica todos los componentes con frecuencias superiores a los 22.050
Hz. En el proceso de digitalizacin, el conversor A/D genera un nmero binario (de 8 16
bits) a cada pulso del reloj. Este nmero es almacenado en la memoria o grabado en un disco
duro. Para la audicin de esta seal digital, es necesaria la reconversin inversa, de forma que
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
los nmeros almacenados son enviados a un conversor D/A que los convierte en voltajes, a la
misma frecuencia de reloj. Esta seal analgica es suavizada mediante un nuevo filtro,
amplificada y enviada a unos altavoces, que con su vibracin, convierten finalmente los
voltajes en variaciones de presin de aire. La figura 2.4 esquematiza este proceso.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997
2.8. Breve historia del audio digital
Los primeros experimentos en audio digital datan de finales de los cincuenta, cuando Max
Mathews obtuvo en los laboratorios Bell los primeros sonidos generados por ordenador. En
esta poca, la escasa potencia de las computadoras no permita una velocidad suficiente para
digitalizar el sonido. Los experimentos consistieron en obtener sonidos sintticos, generando
los nmeros en el ordenador.
Tras muchos experimentos que ayudaron a comprender mejor la naturaleza del sonido digital,
el primer grabador comercial, el Sony PCM-1, vio la luz en 1977. El conversor era de 13 bits
y utilizaba como soporte cintas de vdeo Beta (al ao siguiente, el modelo PCM-1600, ya
utilizaba conversin de 16 bits). En 1982 apareci el disco compacto, desarrollado
conjuntamente por Sony y Philips, con un xito fulminante.
A principios de los ochenta aparecieron tambin los primeros sintetizadores digitales y los
primeros samplers, pero de ello hablaremos profusamente en el captulo 9, Sntesis y
generacin digital de sonido.
Los primeros sistemas domsticos de grabacin digital no llegaron hasta finales de los
ochenta, inicialmente con la cinta DAT (Digital Audio Tape), y posteriormente con el DCC
(Digital Compact Cassette), el MiniDisc, la grabacin a disco duro, los CD-R (grabadores de
discos compactos) y varios formatos de multipistas digitales (Alesis, Tascam, etc.). Las
tarjetas de sonido para ordenadores, dotadas de conversores A/D y D/A, aparecidas en los
ltimos aos, han supuesto la definitiva democratizacin del sonido digital. A ellas dedicamos
el prximo captulo.
Sergi Jord Puig, Audio digital y MIDI, Guas Monogrficas Anaya Multimedia, Madrid 1997