Audio en Internet - 1

Transmisin de Audio en Internet Acstica AUDIO EN INTERNET La PC ha influido profundamente en la evolucin del audio digital, pero son las
redes de computadoras, y la digitalizacin de las comunicaciones en general, las que han experimentado los cambios ms espectaculares. Internet est cambiando de forma el modo en el que la gente difunde y accede a la informacin.
REDES DE COMPUTADORAS Y TRANSFERENCIAS DE ARCHIVOS Las conexiones de audio dedicadas operan punto a punto, con el flujo continuo de datos y en tiempo real, las redes de computadoras son tpicamente asncronas, transmitiendo los datos en paquetes discretos, y pudiendo interconectar lo dispositivos ms dispares.
Servicios Telefnicos Las lneas telefnicas que suministra una compaa de telfonos se conocen como bucles de abonado, o lneas de central. Las lneas troncales conectan a los usuarios a un punto privado de acceso (PBX). La respuesta en frecuencia de audio en general e de 300 a 3,400 Hz. La seal de habla se codifica con 8 bits PCM, a una frecuencia de muestreo de 8 kHz, que proporciona un rendimiento de 64 kbps; el ancho de banda se limita a 3,4 kHz. Los circuitos de comunicaciones digitales en serie T-1 proporcionan un ancho de banda en las comunicaciones punto a punto dedicadas de 1,544 Mbps; la seal que transportan se denomina DS-I. Cada final de una lnea T-1 termina en una unidad de servicio al cliente (CSU), sta realiza la interfaz de datos desde el equipamiento local del cliente (CPE) y lo codifica para la transmisin sobre el T-1. Un circuito T-1 est formado por 24 subcanales (denominados DSO o ranuras) cada uno transportando 64 Kbps. Muchas aplicaciones diferentes, como voz, datos o video, pueden compartir una lnea T-1, con canales individuales asignados a uno o varios DSO multiplexados. Todos los niveles DS utilizan un canal de codificacin con inversin de marcas alternativa (AMI); la seal tiene 3 niveles, positivo, negativo y masa referencia. Las velocidades en Europa de T-1 a T-4 son: 2,048, 8,448, 34,368 y 565,000 Mbps, respectivamente.
RDSI 1 EQUIPO # 3
Transmisin de Audio en Internet Acstica La red Digital de Servicios Integrados es un servicio avanzado de acceso telefnico con funcionamiento dplex, proporciona una conexin digital entre el consumidor y la central de conmutacin telefnica. Se soportan velocidades de transferencia de datos hasta 144 kbps. La velocidad bsica RDSI est pensada para uso domstico. Utiliza un par de hilos de cobre estndar para suministrar dos circuitos de 64 kbps. Se puede transmitir audio, video, fax, telefona y otro tipo de datos. La velocidad principal de RDSI est pensada para empresas. Existe tanto en cable coaxial o en fibra ptica; puede proporcionar 23 canales a 64 kbps, junto con un canal D de 64 kbps, totalizando un ancho de banda de 1,544 Mbps. Las seales de datos numricos y video comprimido se envan sobre RDSI, con velocidades que superan a los mdems de acceso telefnico. En RDSI, el usuario debe disponer de un conversor A/D y D/A, un codificador/decodificador de reduccin de datos y una conexin ISDN, para intercambiar datos de audio. El retardo de codificacin en un sistema RDSI debe ser tenido en cuenta, por ejemplo, cuando se graba en modo sobreescritura desde una ubicacin remota, pues el usuario podra enviar la mezcla sobre RDSI y escuchar la misma con retardo en los monitores. La mezcla recibida (retardada) se remezclara y grabara. La parte sobreescrita podra presentar problemas de sincronizacin con la mezcla. La RDSI, el sistema de acceso Switched-56 proporciona un canal de datos bidireccional a 56 kbps. Las unidades de servicio de canal (CSU) se utilizan para realizar la interfaz entre la aplicacin del usuario y la lnea Switched-56.
Lnea de Suscripcin Asimtrica Digital (ADSL) Los mdems telefnicos actuales son demasiados lentos. La atencin parece dirigirse hacia los mdems para cable que se conectan a las lneas CATV con el fin de aprovechar el gran ancho de banda del cable. Las lneas de suscripcin asimtricas digitales (ADSL) proporcionan canales de datos de alta capacidad. Al igual que RDSI, ADSL, necesita dos mdems, pero al contrario que RDSI, ADSL utiliza el cableado y la numeracin telefnica existente. Sin embargo, ADSL necesita la instalacin de dispositivos DSLAM (Multiplicadores de Acceso a Lneas de Suscripcin Digital). ADSL se desarroll para las compaas telefnicas con el fin de proporcionar servicios de televisin interactiva. ADSL puede entregar hasta 8 Mbps en el domicilio. ADSL proporciona una conexin siempre activa. La velocidad de transferencia de datos de salida puede llegar a ser de 640 kbps.
2 EQUIPO # 3
Transmisin de Audio en Internet Acstica La tecnologa DMT (multi-tonos discretos) es la codificacin utilizada en ADSL. DMT divide el ancho de banda, monitoriza y analiza cada subcanal continuamente, y variando la distribucin de dato para cada subcanal. ADSL compite con los mdems para cable. CATV fue diseado para transferir datos en una sola direccin, y por ello los mdems para cable necesitan mdems telefnicos para el camino de retorno, adems, del sndrome <<party-line>>, por el cual muchos hogares comparten una lnea de retorno comn. Cuantos ms usuarios se introducen en el sistema, ms lento se hace el trfico. ADSL no es tan rpido como las conexiones de modem para cable, pero los usuarios de ADSL disfrutan de una lnea privada a un ordenador central de conmutacin. La velocidad de ADSL depende de la distancia desde el ordenador de conmutacin. Las velocidades se realizan con la distancia: 1,5 Mbps y 64 kbps hasta 5,4 km. El servicio podra no ser posible para distancias superiores. Para todos los usuarios ADSL, el camino de retorno es siempre lento. Una videoconferencia de alta calidad entre dos usuarios de PC necesitara un gran ancho de banda en ambas direcciones, algo que ADSL no puede proporcionar.
Redes de Computadoras Un enlace de radio digital dedicado proporciona un ancho de banda que es suficiente para transmitir un programa en tiempo real, una red est diseada para interconectar mltiples dispositivos con nodos de red. La tarea de transportar datos que necesiten un gran ancho de banda necesita una consideracin especial en el diseo de redes, un nodo podra transmitir mltiples canales de audio, o un canal de video, pudiendo necesitarse un ancho de banda de 30 a 40 Mbps. Una red multimedia permite la reduccin de datos. La codificacin perceptual de datos de audio y video puede multiplicar de forma efectiva el ancho de banda de una red. Las redes se pueden configurar de varias maneras. Una configuracin en bus ubica los nodos a lo largo de un bus serie, una configuracin en anillo sita los nodos alrededor de un circuito cerrado y una configuracin en estrella da a cada nodo su propio acceso directo al controlador central. En una configuracin en estrella se necesita un concentrador central para monitorizar y dirigir el trfico del bus. Cuando se alcanza el mximo nmero de nodos de una red o se llega a la distancia mxima, puede expandirse con un repetidor. Un encaminador es un ordenador con dos tarjetas de red; puede permitir el paso de diferentes tipos de redes. Todas las redes deben definir reglas para el acceso al almacenamiento fsico y a los dispositivos terminales; ello limita el ancho de banda de la red. Dos 3 EQUIPO # 3
Transmisin de Audio en Internet Acstica mtodos de control son el paso de testigo y la deteccin de colisiones. Con el paso de testigo, cuando un nodo finaliza una transmisin, enva un testigo al nodo siguiente: un nodo puede transmitir slo cuando tiene el testigo. ARCnet, que opera a 2,5 Mbps, utiliza el paso de testigo. Una red de interfaz de transmisin de datos por fibra ptica (FDDI) configurada en anillo y utilizando el paso de testigo puede proporcionar 100 Mbps; FDDI se encuentra definida en el estndar ISO 9314, Con el acceso mltiple con deteccin de portadora y deteccin de colisiones (CSMA/CD), la transmisin ocurre sobre comando, y si ocurre una colisin, se asigna una prioridad y se retransmiten los datos. Un protocolo CSMA/CD puede aproximadamente un 40 por 100. proporcionar una eficiencia global
Una red distribuida con un ancho de banda modesto de 10 a 15 Mbps podra ser adecuada para muchas aplicaciones; por ejemplo, se podra permitir la transferencia de datos de audio varias veces ms rpido que en tiempo real. Una red (WAN) conecta mltiples estaciones, alcanzando distancias globales. Por ejemplo, una red WAN puede utilizarse para una interconexin RDSI. Una red rea local (LAN) distribuye los datos a travs de una oficina, edificio o campus. Una LAN puede utilizar los protocolos FDDI, CSSI o ATM. Una instalacin FDDI utiliza cables de fibra ptica dplex, especifica un ancho de banda de 100 Mbps. FDDI usa el protocolo Token Ring. La interfaz de Datos Distribuidos por Cobre (CDDI) es una implementacin sobre cobre de FDDI que permite un rendimiento de 100 Mbps sobre un cable de par trenzado Clase 5. El cable de par trenzado se clasifica en 5 niveles: nivel 1 (voz), nivel 2 (datos de baja velocidad RS-232), nivel 3 (Ethernet 10 Mbps), nivel 4 (Token ring 16 Mbps), y nivel 5 (100 Mbps alta velocidad).
ATM ATM (Asynchronous Transfer Mode) es una red estndar de elevado ancho de banda y bajo retardo de comunicacin. La arquitectura de ATM genera mediante conmutacin y multiplexado un canal virtual temporal, al canal virtual se le asigna el suficiente rgimen binario. Muchos usuarios ATM pueden compartir el canal mediante el multiplexado; manteniendo una relacin fija en el tiempo, entre las distintas clulas de datos. Esto ayuda a asegurar que el flujo de datos sea continuo, un criterio importante en las transferencias de audio y video en tiempo real.
4 EQUIPO # 3
Transmisin de Audio en Internet Acstica Algunos canales ATM implementados permiten velocidades de 155 Mbps, 620 Mbps o 2,4 Gbps a travs de cobre o fibra. ATM transmite datos en campos de longitud de datos fija. Utiliza clulas de 53 bytes de encaminamiento y cabecera de control, y 8 bits de correccin de errores. El protocolo ATM est basado en el modelo de interconexin de sistemas abiertos OSI (Open Systems Interconection), modelo que especifica el medio fsico y los enlaces.
MediaNet MediaNet es una red local multimedia dedicada de alta velocidad. MediaNet est implementada sobre los protocolos CDDI y FDDI. Utilizando CDDI, la red puede simultneamente manejar mltiples canales de audio y video comprimido con regmenes de 24 Mbps entre nodo y nodo. Mediante ATM, se pueden obtener transferencias de 120 Mbps. El control del trfico de datos se realiza mediante Token Ring. Utilizando este tipo de redes locales, los datos multimedia pueden ser directamente manipulados de forma remota. MediaNet ha sido desarrollada por Sonic Solutions.
INTERNET Y EL AUDIO EN INTERNET Internet es un conjunto de redes interconectadas a nivel global que permiten la transmisin de datos de diversos tipos a uno o varios usuarios. Internet naci en Septiembre de 1969. En Diciembre de ese mismo ao, la Agencia de Investigacin de Proyectos Avanzados (ARPA), present oficialmente ARPANET, enlazando cuatro ordenadores entre California y Utah. En 1984 MILnet se separ nicamente para uso militar, en 1987, la National Science Foundation fund NSFNET. En 1990, la NSF decomision ARPANET, expandiendo ampliamente su propia red. La NFSNET comenzaba a ser la columna vertebral de internet en los Estados Unidos. Internet constituye la mayor red de ordenadores que existe en el mundo. Internet opera mediante los protocolos definidos por el Departamento de Defensa de los Estados Unidos. La comunicacin y el encaminamiento estndar que Transmission Control Protocol/Internet Protocol (TCP/IP). Utilizando estos protocolos, las redes comparten las fuentes de informacin. 5 EQUIPO # 3
Transmisin de Audio en Internet Acstica La cabecera del protocolo de Internet (IP), est contenida en un paquete nico IP, conteniendo en cada campo la informacin transmitida por internet, y basada en palabras de 32 bits. Las redes por paquetes como internet operan bajo el principio del primero que llega primero en ser atendido, por lo que la velocidad de transferencia de los datos es imprevisible. Internet no puede garantizar ni reservar al remitente un porcentaje de la red. As, el nmero de paquetes entregados por segundo es variable. Las memorias de almacenamiento intermedio (buffers) pueden suavizar las discontinuidades, pero introducen un retardo considerable en la transferencia de datos. Cada direccin de internet est gobernada por la estructura del sistema de dominios. Cuando se cre Internet se establecieron seis dominios de alto nivel con la finalidad de distinguir los tipos de usuarios: com (comercial), edu (educacional), gov (gubernamental), mil (militar), org (otras) y net (redes). El acceso a Internet requiere un ordenador, un enlace de comunicaciones tal como una conexin a una red local o un modem, y un nodo o punto de acceso a una red de comunicaciones. El modem convierte los datos binarios en una seal de audio, que modulada es la que se transmite por la lnea telefnica convencional. Hoy en da, internet adolece de grandes imperfecciones para el transporte de la seal de audio. El rgimen binario es siempre variable y su valor medio tpico no es suficiente para transportar de forma eficiente msica con un elevado grado de calidad. Adems, es susceptible de sufrir retardos en los procesos de codificacin y decodificacin. Debido a que internet es inherentemente un sistema de comunicacin de paquetes, es muy difcil transmitir de forma contnua la seal musical. Con un rgimen binario mximo de 32,5 kbps, MIDI puede transportar 16 canales de informacin multiplexados. Aunque puedan existir latencias del orden de 1 a 20 ms, las actualizaciones en directo realizadas con instrumentos MIDI va red han demostrado la utilidad de este sistema.
MP3 Es difcil transportar va internet formas de onda musicales. La msica puede ser codificada y transmitida en diferentes formatos de archivo, tales como AU, WAV, y AIFF. Estos archivos tienen un tamao considerable para ser fcilmente cargados y descargados a travs de internet.
6 EQUIPO # 3
Transmisin de Audio en Internet Acstica Una pista de un CD con una duracin de 3 minutos (31,7 Mbytes) requerira de un tiempo de descarga de ms de una hora a travs de un modem de 56 k. Los sistemas ptimos para la transmisin de la seal de audio son aquellos formatos que emplean algoritmos de compresin de datos. Idealmente, los regmenes binarios deben ser inferiores a 96 kbps para un programa estreo con calidad sonora razonable y 16 kbps para una seal mono. MP3 y Liquid Audio son de los formatos ms empleados en este tipo de procesos. El algoritmo de reduccin de datos MPEG Layer III es uno de los sistemas ms utilizados para comprimir los archivos. Al algoritmo de codificacin de audio MPEG 1 Layer III se le conoce familiarmente como MP3. Estos archivos pueden ser almacenados en disco duro, grabados en CD-ROM o almacenados en un reproductor de estado slido que utilice memorias de tipo flash. Los datos deben pasar a travs de un decodificador de MP3 para su reproduccin. El algoritmo MP3 no especifica sistema para el cifrado encriptado o proteccin anticopia. El banco de filtros hbrido consiste en una transformada inversa del coseno modificada (IMDCT) y un conjunto de filtros con una estructura polifase. La IMDCT se realiza 32 veces sobre 18 valores espectrales, para transformar un espectro de 576 valores en 18 espectros consecutivos de una longitud de 32. El filtro polifase contiene un mapeado de frecuenciasy un filtro FIR con 512 coeficientes. Muchas empresas comercializan reproductores porttiles con memorias flash, que vuelcan los archivos MP3 directamente desde un ordenador personal, reproducindolos mediante el decodificador de la propia unidad. Los datos se almacenan en mdulos de memoria no voltil como Smartmedia, Compact Flash, Multimedia Card. Los archivos MP3 pueden ser codificados con una gran variedad de regmenes binarios. El decodificador no puede seleccionar diferentes subconjuntos de la cadena de datos con el fin de reproducir seales con diferentes grados de calidad. Liquid Audio ha desarrollado un amplio paquete que permite la distribucin, el almacenamiento y la venta segura de archivos de audio a travs de internet. Se pueden crear archivos en Dolby Digital o en MPEG-2 AAC (de 96 a 256 kbps) para obtener alta fidelidad a una gran variedad de regmenes binarios. La cadena de datos contiene adems campos de datos con las letras de las canciones, ttulos de crdito, cartula del disco y otra informacin adicional. Liquid Audio efecta todas las tareas del comercio electrnico, como la transaccin electrnica segura, marca de agua digital y encriptado de seguridad de los datos RSA. Liquid Audio permite realizar la grabacin y un 7 EQUIPO # 3
Transmisin de Audio en Internet Acstica buen nmero de funciones de edicin. Hay tambin otros formatos para la descarga de audio en internet, como el de AT&T a2b technology, que como el Liquid Audio aporta una descarga eficiente y las caractersticas de cifrado de los datos y marca de agua.
SDMI La Secure Digital Music Initiative (SDMI) consiste en una estructura abierta y un conjunto de especificaciones para que la msica protegida con copyright pueda ser distribuida electrnicamente va internet. El SDMI puede ser utilizado para codificar msica para su distribucin por intnernet, para el almacenamiento en reproductores de estado slido o para su almacenamiento en discos CD-R o CD-RW. Se utiliza un proceso de autentificacin para que los datos codificados con SDMI puedan ser distribuidos solo sobre unos medios y dispositivos determinados; por lo que el contenido es transmitido y almacenado de forma criptogrfica, para prevenir la transmisin, copia o reproduccin no autorizada. Los archivos pueden ser almacenados en formato MP3 o grabados en CD; pero siempre tienen que ser reproducidos en el equipo para el que fueron descargados; no siendo posible ni la descarga ni la reproduccin en otro equipo diferente. El desarrollo de SDMI fue coordinado por la Recording Industry Association of America. Con los sistemas de reduccin de rgimen binario adecuados, un modesto disco duro de 20 Gbytes puede almacenar ms de 300 lbumes, permitiendo una clasificacin perfecta de ellos y su acceso instantneo.
TRANSMISIN CONTINUA DE AUDIO (STREAMING AUDIO) Cuando se ha conseguido reducir sustancialmente el tamao del archivo, de forma que pueda ser recibido tan rpidamente como se reproduce, es cuando hablamos de la transmisin continua de audio. En esta aplicacin, la msica comienza a sonar tan pronto como la memoria de almacenamiento intermedio del receptor se llena. Un formato popular de este tipo de transmisin de audio es RealNetworks Real Audio. Los archivos RealAudio pueden ser decodificados con diversos regmenes binarios, y el formato soporta la escalabilidad dentro de la cadena de datos. Los archivos pueden ser transmitidos desde cualquier ordenador con 8 EQUIPO # 3
Transmisin de Audio en Internet Acstica HTTP. El RealPlayer soporta la recepcin continua de audio y video a las velocidades tpicas de modem. El protocolo TCP de Internet es muy eficiente en la trasmisin de paquetes, Sin embargo, la sobrecarga introducida por el tratamiento de audio ralentiza los procesadores, disminuyendo el rendimiento en la velocidad de los sistemas. Una alternativa al TCP es el Protocolo de datagrama para usuario (UDP) es un sencillo protocolo de paquetes sin verificacin ni correccin de errores. Los servidores de RealSystem utilizan UDR. RealNetworks ha desarrollado tambin el Real-Time Streaming protocol (RTSP). El software QuickTime de Apple ofrece varias opciones de compresin para aplicaciones musicales y de palabra, El QuickTime no es una aplicacin software en sentido estricto sino ms bien una extensin del sistema operativo. Utilizando el controlador de sonido, los elementos audiovisuales se almacenan en un formato de pelcula MOV, permitiendo la sincronizacin entre diversos elementos. Los campos de datos pueden almacenar informacin de usuario y los archivos de audio pueden incluir video, texto y MIDI. El formato de QuickTime es la base para la especificacin de archivos del MPEG-4. El Shockwave de Macromedia, basndose en la codificacin MPEG Layer III, trabaja con cualquier servidor HPPT. Los archivos de audio Shockwave son codificados como archivos SWA. Cuando el explorador carga una pagina HTML y encuentra embebida una marca que identifica un archivo Shockwave, el propio explorador carga un plug-in y descarga el archivo. Shockwave aparece integrado en el programa Director de Macromedia. La plataforma de Microsoft denominada Windows Media Technologies es utilizada para proveer de trasmisin de audio y video. Media Technologies emplea un algoritmo de comprensin conocido a veces como MSAudio para aportar una calidad comparable a la de una trasmisin FM, el algoritmo trasmite audio en estero muestreado a 44,1 kHz y con un rgimen binario de 20kbps. El contenido es codificado de acuerdo al formato de archivos (ASF), el reproductor de Medios (Media Player) puede soportar archivos MP3, WAV,AVI,MIDI. QuickTime y MPEG, incluyendo MPEG-4 V.3 para trasmisin de video. El Reproductor de Medios detecta automticamente las versiones de tipo de cadena, para poder descargar nuevas (<<codecs>>) si es que son necesarias.El contenido soportado vara desde 3kbs de audio hasta 6Mbps para audio/video. Los protocolos de transmisin soportados son UDP, TCP y HTTP. El sistema Windows Media Rights Manager reduce la piratera y permite la distribucin digital.
9 EQUIPO # 3
Transmisin de Audio en Internet Acstica
CODIFICADOR DE AUDIO REALAUDIO G2 RealAudio G2 es un codificador que utiliza una combinacin de algoritmos rpidos y aproximaciones para obtener alta calidad de audio con rapidez de calculo. Cuando los datos a ser trasmitidos va red no son en tiempo real, los datos perdidos pueden ser trasmitidos, mientras que con audio en tiempo real no es posible para el servidor reenviar los datos perdidos cuando emplea protocolos como el UDP. Esto es problemtico para los codificadores que utilizan algoritmos predictivos, ya que obtienen los datos actuales en funcin de los previos, y cuando se han perdido de un paquete se degradara tanto el audio actual como el que venga a continuacin. Para codificar el dato actual, el algoritmo del RealAudio G2 se limita a los datos previos. Codifica el dato actual, el algoritmo de RealAudio G2 se limita a los datos previos, codifica los datos ajustndose a pequeas unidades independientes, denominadas tramas, de forma que la perdida de una de ellas no se ve afectada a la decodificacin de las circundantes. El codificador G2 puede manejar perdidas de paquetes de datos de hasta un 10 o incluso 15 por 100 con una degradacin en calidad de audio mnima. El cdec RealAudio G2 ha sido optimizado para Internet con unos regmenes binarios entre 16 y 32kbps. Si una seleccin musical es particularmente difcil de codificar, el codificador disminuye dinmicamente la respuesta en frecuencia, con el fin de que los datos sean capaces de reproducir con mayor correccin el ancho de banda escogido. Todos los reproductores RealNetworks G2 utilizan la decodificacin musical G El protocolo SureStream es empleado por RealNetworks para distribuir archivos RealAudio y Real video a travs de Internet. SureStream crea un archivo para todo el entorno de la conexin. Con SureStream pueden codificarse simultneamente mltiples cadenas a diferentes regmenes binarios y combinarse en un archivo nico. Este control adaptativo de cadenas (ASM) en el protocolo RealSystem G2 es lo que permite la entrega de paquetes de una forma tan eficiente. El formato de los archivos y la difusin de los <<plug-ins>> definen las reglas de ASM que asignan propiedades predefinidas yales como prioridad y ancho de banda para agrupar los paquetes.
10 EQUIPO # 3
Transmisin de Audio en Internet Acstica DIFUSION DE AUDIO POR INTERNET Internet es eficiente en el envi de datos de un punto a otro, lo mismo puede aplicarse a las transmisiones musicales directas. Pero para algunas aplicaciones, la comunicacin punto a punto no es muy eficiente. El protocolo de Internet para multidifusin (IP) esta diseado precisamente para esto. La difusin mltiple puede enviar una copia a muchos usuarios individuales. El protocolo que se emplea para la entrega de datos sincronizados es el RTP (<< Real-Time Protocolo>>), que trabajando conjuntamente con el controlador RTCP (<<Real-Time Protoco>>), permite tener una informacin sobre la calidad del servicio en los caminos que sufre la trasmisin. Para aplicaciones de trasmisin en flujo de datos, hay protocolos especficos como el RTSP (<<RealTime Streaming Protocol>>). Para la reserva de recursos de red con los protocolos RTP o RTSP se emplea el protocolo de RSVP (<<Resouce Reservation Protocolo>>), el cual permite asegurar la calidad del servicio desde un extremo a otro. El sistema de RealSystem G2 soporta difusin mltiple IP de dos tipos: con canal de respaldo y escalable. Los datos son difundidos mediante UDP, pero como esto no garantiza la entrega, se incluye un canal de respaldo para el reenvi. La opcin de reenvi de paquetes puede ser empleada cuando en la difusin se pierden paquetes UDP. Se utilizan dos puertos RTP: uno aporta la trasmisin de datos, mientras que el otro informa de la calidad de los datos entregados. La difusin escalable mediante SureStream difunde cada cadena de datos a travs de nica direccin o puerto.
MPEG-4 MPEG-4 est formado por una familia de herramientas y algortimos para la codificacin de contenidos audiovisuales interactivos. Permite la operacin correcta sobre internet y otras redes. MPEG-4 especifica: como representar el contenido de audio y video con objetos, tanto si son naturales como sintticos; define como deben trasmitirse o almacenarse dichos objetos, y como se pueden para formar escenas completas.
INTERACTIVIDAD MPEG-4 utiliza un lenguaje denominado Formato Binario de Escenas (<<BInary Format for Scenes>>, BIFS) para describir y modificar dinmicamente las escenas. BIFS utiliza aspectos de lenguaje de modelado de realidad virtual. VRML (Virtual Reality Modelinc Lenguage) VRML describe objetos de formato 11 EQUIPO # 3
Transmisin de Audio en Internet Acstica texto, VIFS lo hace de formato binario. VIFS admite la trasmisin mediante una cadena de datos que represente la escena en tiempo real. MPEG-4 utiliza un lenguaje orientado al objeto para codificar la informacin multimedia. El estndar utiliza un lenguaje con una sintaxis flexible y extensible denominada MSDL (MPEG syntax description language). La versin 1 del estndar MPEG-4 se concluy en Octubre de 1998. MPEG-1 y 2 describen las formas para comprimir, transmitir y almacenar el audio y el video basado en tramas, y con una mnima interactividad, MPEG-4 aporta el control sobre los objetos individuales y la forma de relacionarse entre estos, MPEG-4 no especifica el mecanismo de trasporte. Esto permite utilizar diversos mtodos, como los paquetes de trasporte MPEG-2, modos de trasmisin asncrona (ATM), protocolos de trasmisin en tiempo real en Internet (RTP) o sobre redes de datos o medios alternativos. Las aplicaciones de MPEG-4 son: Multimedia en Internet, videojuegos interactivos, comunicaciones interpersonales tales como videoconferencia y videotelfono, almacenamiento de contenidos interactivos en soportes pticos, correo multimedia, servicios de bases de datos en red, multidifusin de televisin en alta definicin, sistemas de emergencia a distancia, sistemas de vigilancia, multimedia sin hilos y aplicaciones genricas de trasmisin de televisin. El MPEG-4 utiliza el protocolo DMIF (<<Delivery Multimedia Integration Framework>>) para manejar las cadenas de datos multimedia.
CODIFICACION DEL AUDIO MPEG-4 unifica la codificacin de audio de alta calidad, la codificacin de seal vocal, la sntesis de voz y la msica para ordenador. Soporta seales mono de alta calidad, estero y multicanal, utilizando tanto codificacin MPEG-2 AAC como MPEG-4. MPEG-4 apunta hacia el empleo de tasa binarias muy bajas, codificando en audio natural a regmenes binarios de 2 hasta 64 kbps. MPEG-4 soporta la codificacin de seal vocal en banda ancha, con banda estrecha, inteligible, voz sintetizada y audio sintetizado. Para audio se definen 4 perfiles. El perfil vocal SP (Speech Profile) esta compuesto por un codificador paramtrico de voz de muy bajo rgimen binario (HVXC), un codificador vocal de banda ancha/estrecha CELP y un interfaz texto-voz. El perfil de sntesis introduce las herramientas de sntesis utilizando SAOL. El perfil escalable, superconjunto del perfil de voz, aporta codificacin escalable de voz y msica con vista a las difusin por redes tales como Internet y Radiodifusin digital de banda estrecha (NADIB). El rango de regmenes
12 EQUIPO # 3
Transmisin de Audio en Internet Acstica binarios esta comprendido entre 6 y 24 kbps, con anchos de banda entre 3.5 y 9khz. La codificacin de la voz a regmenes binarios entre 2 y 24 es soportada mediante el codificador Harmonic Vector eXcitation Coding (HVXC). El codificador HVXC tambin puede trabajar en un modo de rgimen binario variable con un valor medio de 1,2 kbps. La codificacin sintetizada es conocida como codificacin hibrida natural sintetizada (SNHC). Una ventaja del MPEG-4 es proporcionar escalabilidad sin degradar la eficacia de la codificacin. La codificacin permite los cambios de <<pitch>> y tiempo, amn de estar diseada para adaptarse a la aparicin de errores. EL MPEG-4 define formatos de audio estructurado y lenguaje algo rtmico de sonido. Las escenas sonoras se cran y son trasmitidas por un canal, ejecutndose en el receptor. La msica sintetizada y los efectos sonoros pueden ser trasportados a regmenes binarios entre 0,01 y 10 kbps. El audio en MPEG-4 esta definido mediante un lenguaje orientado al objeto. Un objeto de audio puede ser definido como cualquier entidad semntica audible. Puede ser una grabacin mono o multicanal, pudiendo los objetos ser agrupados o mezclados y manejados de forma conjunta. La decodificacin utiliza un Lenguaje Orquestal de Audio Estructurado (SAOL- Lenguaje simblico procesado). SAOL es similar al lenguaje de sntesis Music V, basado en la interaccin de modelos osciladores. SAOL define una <<orquesta>> como un compendio de un conjunto de <<instrumentos>>, que son descargados en la cadena de datos y no fijados el codificador. Las <<partituras>> o <<guiones>> son los encargados de controlar la sntesis. Una partitura es un conjunto de comandos secuenciado en el tiempo, que invoca a uno o varios instrumentos en instantes especficos, con la finalidad de obtener una interpretacin musical o un efecto sonoro. La descripcin de la partitura es descargada en un lenguaje denominado Lenguaje para Partituras de Audio Estructurado (SASL). Tambin puede utilizarse MIDI para el control de la orquesta. MPEG-4 define un lenguaje de procesado de seal para describir los mtodos de sntesis, pero no los estandariza. As, cualquier mtodo de sntesis puede tener cabida en la cadena de datos. LA versin 1 de MPEG-4 se finalizo en Octubre de 1988. La versin 2 ha aadido nuevas herramientas, pero mantiene inalterada la versin anterior. Aumenta la flexibilidad con respecto a errores en los algoritmos de audio; el mismo cdigo fuente en la codificacin Huffman del AAC es ms robusto debido al a reordenacin de las palabras cdigo, y se introducen sistemas de correccin de errores para los esquemas de codificacin de audio MPEG-4. La versin 2 permite adems la codificacin de audio con un retardado muy bajo. 13 EQUIPO # 3
Transmisin de Audio en Internet Acstica La versin 2 utiliza una codificacin aritmtica en paralelo BSAC ( Bit-Sliced Arithmetic Coding) para proporcionar una escalabilidad en pasos relativamente pequeos, se introduce la codificacin paramtrica de audio; mejora el rendimiento en la codificacin de audio en las aplicaciones. El estndar MPEG-7 es el denominado Interfaz de Descripcin de Contenidos Multimedia, su objetivo es permitir una bsqueda eficiente de los contenidos multimedia utilizando las descripciones estandarizadas. MPEG-7 deber permitir la bsqueda utilizando descripciones audiovisuales. CRIPTOGRAFIA Y MARCAS DE AGUA La criptografa (Cifrado) puede ser utilizada para prevenir la copia de los datos y la marca de agua, puede identificar las propiedades del contenido, aunque este se mueva a travs de diferentes plataformas, medios y en diferentes formatos. La criptografa aporta un sistema de proteccin del contenido de los archivos. El algoritmo de cifrado consiste en un conjunto de reglas matemticas con el objetivo de desarrollar la informacin para que sea ininteligible. Para descifrar un archivo se necesita la clave para poder descifrar los datos del mismo. Una clave puede ser un nmero binario entre 40 y 128 bits de longitud. En la mayora de los formatos de archivos de audio, los datos aparecen dispuestos en tramas, incluyendo cada trama una cabecera con informacin auxiliar con la finalidad de realizar decodificacin. Con este sistema, los decodificadores no autorizados no pueden reproducir legtimamente los archivos no autorizados, si los datos de audio se separan de la clave, o si esta es hackeada, el archivo de audio podra ser reproducido o copiado sin restricciones. En la criptografa simtrica, la informacin original es cifrada utilizando una clave, para luego ser descifrada mediante la utilizacin de la clave original. En la criptografa asimtrica se utiliza una clave pblica. El estndar de cifrado de datos DES (Data Encryption Standard) es un ejemplo de cifrado simtrico. Es un sistema de cifrado por bloques, con un tamao de bloque de 64 bits y una clave de 56 bits. El DES es idntico al ANSI Standard Data Encryption Algorithm (DEA), definido en el ANSI X3.921981. El triple DES utiliza una secuencia de cifrado/descifrado/cifrado con bloques de 64 bits y dos o tres claves no relacionadas de 56 bits. El sistema Blowfish es un mtodo de cifrado simtrico. Es un sistema por bloques, utilizando un bloque de 64 bits de tamao y una clave de 32 y 448 bits de longitud. El International Data Encryption Algorithm (IDEA) es un ejemplo de cifrado simtrico, con cifrado por bloques y una clave de 128 bits de longitud. 14 EQUIPO # 3
Transmisin de Audio en Internet Acstica Dependiendo de los recursos (hardware) empleados, un ataque frontal a un cdigo puede descubrir una clave de 40 bits en un tiempo comprendido entre 2 ms y 2 segundos; una clave de 56 bits requiere entre 2 minutos y 35 horas; y una clave de 128 bits puede requerir entre 1016 y 1019 aos. La marca de agua digital ofrece otro mecanismo de seguridad, el cual es intrnseco con los propios datos de audio. La marca de agua relaciona propietario y contenido, pudiendo verificar la autenticidad de los contenidos. El objetivo de la marca de agua es ser embebida como un cdigo digital inaudible dentro de la propia seal de audio, para que dicho cdigo de identificacin pueda extraerse y aportar dentro de una auditora un rastro electrnico con el fin de determinar el propietario. La marca de agua en la fuente se disea de forma especfica para un determinado soporte o medio de transmisin, identificando y protegiendo el contenido. Las marcas de agua, tambin conocidas como esteganografa, consisten en el proceso de ocultar informacin dentro de los datos. En algunos casos, la marca de agua puede ser encriptada en s misma. Las marcas de agua alteran los datos de audio, idealmente deben ser transparentes e inaudibles para el usuario final, no debiendo afectar la calidad sonora de la seal de audio. Una marca de agua debe ser lo suficientemente robusta como para que pueda siempre ser recuperada de la seal de audio y que tenga la suficiente supervivencia como para que incluso despus de ser procesada, como comprimida o codificada perceptualmente, la marca de agua permanezca intacta. Una marca de agua tampoco debe verse afectada por un cambio de formato de archivo de audio, debe tambin asegurar que no pueda ser eliminada, alterada o cambiada por un usuario no autorizado. Si la marca de agua es atacada, debe sufrir una degradacin tal que modifique tan claramente la seal de audio o produzca una tasa de errores tan palpable que evidencie que el archivo a sufrido una violacin. Debe tambin protegerse cintra las falsas positivas; es decir, un receptor no debe errneamente identificar como marca de agua unos datos donde no existen, o malinterpretar los datos de una marca de agua correcta. No debe sobrecargar al archivo con una elevada cantidad de datos. Las marcas de agua ms simples consisten en unos cuantos bits, lo que hace que sea ms difcil escucharlas y por lo tanto de una supervivencia potencial mayor. Sin embargo, las marcas con bajo rgimen binario son mucho ms vulnerables. 15 EQUIPO # 3
Transmisin de Audio en Internet Acstica Las marcas de agua pueden aplicarse a diferentes tipos de archivos, tales como PCM, WAV y AIFF, adems, pueden ser aplicadas a las grabaciones mono o multicanales, a varias frecuencias de muestreo y para varias longitudes de palabra. En la codificacin por espectro ensanchado, la marca de agua se distribuye sobre todo el rango de frecuencia, lo que se modula y multiplica por una secuencia de ruido pseudoaleatorio. La seal resultante de la marca de agua ocupa un cierto espectro, siendo atenuada y combinada con la seal de audio como si fuera ruido. Una marca de agua para el control de copia est diseada para prevenir la copia no autorizada. Este tipo de marcas se embeben en la grabacin, siendo detectadas por el grabador posterior. La marca podra estar codificada para no permitir ninguna copia, para limitarla a una o para que sea un nmero ilimitado. Una marca de agua forense est diseada para detener la piratera profesional. Este tipo de marcas almacena una cantidad de datos lo suficientemente elevada como para que el archivo pueda ser autentificado y detectada cualquier alteracin mediante la utilizacin de una clave. El archivo puede estar diseado para ser muy frgil, de forma que si es sometido o procesado, la marca de agua original se pierda o deteriore y su alteracin pueda ser entonces fcilmente detectada. Una marca de agua con un control anticopia ms robusto podra identificar la fuente de la grabacin. La tecnologa de marcas de agua embebidas ARIS/Solana han sido seleccionadas para su utilizacin en aplicaciones de audio como SDMI y DVD-Audio. La criptografa, marcas de agua y otras nuevas tecnologas dentro de las nuevas industrias del audio jugarn un papel cada vez ms importante en la distribucin musical por internet, en las descargas de msica a travs de la red y otros medios alternativos.
Transmisin de Audio y Video por Internet
Introduccin: Con el desarrollo del audio y el video, y la llegada de Internet se ha intentado hacer realidad uno de los viejos sueos del hombre, la video conferencia, la 16 EQUIPO # 3
Transmisin de Audio en Internet Acstica transmisin de "multimedia" por Internet. Mucha gente ha visto pelculas futuristas donde se mostraban conversaciones a travs de una pantalla que siempre identificamos con un monitor de ordenador (de hecho siempre lo asemejamos a una conversacin gracias a un ordenador). Todo esto ya casi, y digo casi es, realidad con limitaciones, claro. Los ordenadores necesarios estn al alcance de todo el mundo, siempre y cuando no queramos hacer grandes cosas. Con un equipo que casi todo el mundo tiene (Pentium 100 como mnimo) podemos hacer nuestros primeros pinitos en estos temas. Esto es algo que tenemos a favor, algo a tener muy en cuenta, es la velocidad de Internet. Internet actualmente es sinnimo de lentitud, aquellos que se conecten va Infovia vern que es realmente lenta consiguiendo ratios de 1 Kb por segundo con mucha suerte (por lnea telefnica) a horas punta y con un mdem rpido (unos 33.000 baudios), con RDSI pueden conseguirse medias de 4 o 5 Kb por segundo, algo mejor pero aun no es suficiente. El Audio Tener audio grabado (digitalizado) ocupa mucho, un minuto a calidad CD ocupa casi 15 megas ; audio a 44.100 Hz a 16 bits en estreo ocupa 172 Kb por segundo, una cifra nada despreciable y ms si intentamos transmitirla por la Internet, debido a su velocidad. Las soluciones que se nos muestran son dos, o bajar la calidad (hasta limites realmente bajos) o comprimir el audio. Actualmente se esta optando por comprimir el audio en mltiples y diferentes formatos, pese a ello podemos considerar dos tipos de compresiones de audio dedicadas a la transmisin de este.
Compresiones Offline Llamaremos a este tipo de compresiones a usadas, en las cuales nos bajamos el archivo y le escuchamos nosotros aparte, como los lectores de correo o news. Ahora nos preguntaremos : por qu comprimir estos archivos ?, fcil, si comprimimos estos archivos ocuparan menos y tardaremos poco en trarnoslos a nuestra casa para escucharlos. Los estndares de estos archivos son muy diversos y de hecho necesitaremos reproductores especficos para ellos (luego hablaremos de estos reproductores). El motivo de hacer esto (lo interesante es or la msica a tiempo real segn se esta emitiendo) es la calidad. Un fichero grabado que tengamos que bajar puede tener ms calidad que uno que se emita a tiempo real puesto que ya no depende de la velocidad de la conexin (la calidad, claro), es decir, si tenemos 17 EQUIPO # 3
Transmisin de Audio en Internet Acstica que estar tres minutos para escuchar una cancin, en esos tres minutos se tiene que recibir los correspondientes tres minutos de audio (hasta aqu todo claro), si tenemos que transmitir ese audio en calidad CD tendremos que tener un ancho de banda de 172 Kb por segundo sin ningn tipo de corte o disminucin de este ancho (algo bastante difcil). La solucin es traerte el fichero y leerlo por tu cuenta, "con todo el tiempo del mundo". Que tipos de ficheros de esta categora existen ?. Bueno como siempre estn saliendo cosas nuevas, para cuando leis este articulo habr tres o cuatro ms, pero por ahora los principales son los siguientes : Fichero de Onda plana ms conocido como wav, es decir, el tpico fichero de Windows que creamos. Estos ficheros en un principio estn en formato crudo (o RAW) en el cual se mete una cabecera para saber el formato (el tipo) y luego se meten todos los datos sin ningn tipo de norma, es decir, hablando en plano a porrn. La desventaja que tiene este tipo es que ocupa mucho (una cancin suele rondar los 45 megas) y la velocidad de transferencia que necesita es muy grande ; como mucho se pueden escuchar a tiempo real en redes pequeas con ordenadores contiguos, es decir, la tpica red de casa con un par de ordenadores conectados por tarjetas de red. Si intentamos transmitir esto debemos mantener 172 Kb por segundo lo cual es prcticamente imposible, y bajarse (traerse) 45 megas por cancin con un mdem de 9.600 baudios es una tarea de gente con mucha paciencia. Las ventajas que tiene que es el formato de mayor calidad de todos.
PCM, ADPCM estos formatos son como el anterior solo que comprimen los datos. El fichero tiene una cabecera donde indica que es y el tipo de compresin y luego vienen todos los datos (comprimidos, eso si). El ratio ha bajado de 8 o 16 bits a 4 bits, necesita (en 4 bits estero a 44.100 Hz) 43 Kb por segundo de transferencia. Esto significa una mejora respecto del anterior y de hecho es el que ms se suele usar para audio en tiempo real (con Mbone como luego veremos). Un fichero pasa de 45 a unos 12 o 13 megas, que es una reduccin notable. Del ADPCM existen dos variantes: el estndar de Microsoft y el estndar de IMA que se diferencian poco ms en el sistema de descompresin, con el de Microsoft que es el ms rpido. Se trata de compresin sin perdidas. Ley CCITT y Ley a CCITT, bastante mejor que el anterior respecto a calidad. Es una compresin anterior a la PCM y ADPCM. El audio se comprime en paquetes (llamados o a) que siguen una regla parecida al pkzip (pero en versin menos optimizada). El audio pasa todo el a 8 bits con un ratio de 88 Kb por segundo (en calidad CD). Es compresin con perdidas. 18 EQUIPO # 3
Transmisin de Audio en Internet Acstica Lernout & Haupie, la compresin sigue el mtodo de estos dos seores de reduccin de redundancia de paquetes. La velocidad varia de 4.8 Kb por segundo a 16 Kb por segundo (el de 4.8 se llama CELP a partir de este todos se llaman SBC - de Sound Box Codec o mtodo de codificacin por paquetes). Parece ser que se esta empezando a usar un poco ms sobre todo en audio a tiempo real, de todas formas se pueden encontrar en ficheros grabados por los internautas. DSP Group True Speech, para aquellos que tengan un DSP en su tarjeta de sonido, es uno de los sistemas ms eficientes equiparndose a la compresin por Mpeg, el nico fallo es que este estndar esta por ahora limitado a un mximo de 8000 Hz (calidad de lnea telefnica). Compresin sin perdidas. R.A. o Real Audio, este tambin se engloba en los compresores online (lo contrario a offline). Mp3 o Mpeg 1 Layer 3 (Mpeg Group), este es el sistema de compresin de moda actualmente, es casi el de mejor ratio de compresin (dependiendo de la calidad de grabacin) que oscila entorno a 10 :1. Se esta haciendo famoso no solo por su "cantidad" sino por su calidad de compresin, para cualquiera con odos normales, son casi indistinguibles los ficheros comprimidos de los originales. Se trata de una compresin con perdidas, pero son casi inaudibles. Lo que ha hecho famoso a este sistema es el mtodo de compresin, que se supone ser modelo para los siguientes, no se trata de mtodos matemticos para comprimir los paquetes de audio (como en los mtodos anteriores), sino que es un mtodo dedicado al odo humano. El mtodo de compresin a groso modo es el siguiente : nosotros, normalmente, cuando omos msica, los tonos graves y los tonos agudos (sobre todo los graves) eliminan los tonos medios, es decir, un sonido muy grave (como un bajo, o la batera en bacalao) destroza o hace que dejemos de or un tono medio o agudo (la voz del cantante, unas cuerdas, un sonido sintetizado, etc...) as que se logramos cuantificar cuanto dejamos de or podramos eliminar ese sonido (o atenuarle) con lo cual ya vamos reduciendo la cancin (no hace falta guardar tantos sonidos, tantos matices). Esto es lo que hace un compresor de Mp3. Antiguamente, intentar descomprimir un fichero va software era prcticamente imposible (los procesadores eran muy lentos) y el descomprimirlo va hardware era costoso ( la compresin por Mpeg era conocida hace bastante tiempo), pero ahora con los procesadores potentes (gama Pentium) esto ya es posible. La nica desventaja que tiene es que, mientras la descompresin se hace a tiempo real (algunos de los mtodos anteriores han de ser descomprimidos antes de ser tocados a no ser que tengamos un DSP, un chip dedicado exclusivamente a eso), la compresin es lenta (comprimir una cancin de 3 minutos puede costar media hora en un Pentium 166, dedicado exclusivamente). 19 EQUIPO # 3
Transmisin de Audio en Internet Acstica Tampoco hay que creer que esto es una novedad, en Estados Unidos, desde hace bastante tiempo (dos, tres aos) las discogrficas se pasaban los discos en este formato va mdem, ya que un fichero de 45 megas pasa a 4 o 5 megas como mucho. Este formato es ms o menos gratuito ya que por ahora hay muchos temas legales relacionados con los ficheros comprimidos en este formato (pasa algo parecido que con el formato GIF), debido a que actualmente, su circulacin es ms que fluida.
Compresiones Online Estas compresiones son las utilizadas para or audio a tiempo real, segn se emite. De aqu en adelante tenemos que considerar el tipo de transmisin, es decir, para quien se transmite, por esto tenemos varios casos (en un principio no afecta a las compresiones). A una nica persona o unicast, de esto modo se emite a una nica persona, directamente a ese ordenador ; los paquetes (suponemos transmisin TCP/IP) van todos asignados con la IP de destino.
A un grupo reducido de personas o multicast, aqu transmitimos a una serie de personas, normalmente a un dominio (un grupo de ordenadores con una IP ms o menos parecida). As lo transmitido, lo recibir solo un grupo de personas (por ejemplo si queremos emitir para todos los ordenadores del Grupo Universitario de Informtica seria emitir para 157.88.36.0. A todo el mundo o broadcast, emitimos en lo que se considera alcance mundial, es decir, para todo el mundo que quiera recibirlo. Tanto el broadcast como el multicast tienen un gran parecido, siendo su diferencia el alcance de la emisin (el nmero de routers por los que ha de pasar el paquete, el nmero ttl como se denomina). Volviendo a las compresiones online, este tipo de compresiones tiene pocos estndares, siendo algunos de ellos los utilizados de manera offline. Todos estos compresores tienen la desventaja de una calidad baja, debido a que as se puede aumentar la eficiencia de transmisin. Real Audio, es el ms conocido. Son ficheros con extensin ra o ru. De una calidad mas baja, de hecho podemos comprimir media hora en tan solo 3 megas con una calidad tipo emisora de AM (aproximadamente unos 11.000 Hz). Una de las ventajas que tiene es que podemos engancharnos de una 20 EQUIPO # 3
Transmisin de Audio en Internet Acstica manera fcil a la transmisin ; con esto nos referimos a que no tenemos que conectarnos desde un principio de la emisin ya que de vez en cuando se mandan paquetes de control, indicando el formato y la calidad de la transmisin. Dicho esto puede parecer un poco tonto y extrao, pero normalmente el paquete que indica el tipo y calidad de transmisin suele ser el primero en enviarse y los restantes es el audio, con lo cual si nos conectamos a mitad de transmisin no conseguiramos nada. Mpeg Layer3 y Layer4, todos o casi todos los descompresores de formato Mpeg tienen incorporados la recepcin por streaming o la conexin a una emisin online. Estas transmisiones tambin son de baja calidad, siendo la mayora a 22.000 Hz en estreo (frente a los 11.000 Hz en mono o en estreo del Real Audio). Este formato no esta muy extendido, aunque con la nueva WebTV se supone que ser uno de los ms usados. Necesita un ancho de banda bastante grande, recomendando un mdem de 33.600 baudios para obtener una recepcin optima.
PCM, PCM2, PCM3, GSM, el formato PCM se utiliza fundamentalmente para las transmisiones con programas de uso ms o menos comercial (WebPhone, Iphone, Mbone), mientras que la GSM, la de los mviles, se utiliza fundamentalmente en herramientas tipo Mbone, cuando la calidad no es lo fundamental, pero si el tamao (actualmente se encuentra en la versin 6.10). El ancho de banda necesario oscila entorno a 9 Kb por segundo a 44.100 Hz en mono (no deja transmitir en estreo). MSN Audio o MicroSoft Network Audio, el intento de Microsoft por acercarse a Real Audio. La compresin es prcticamente idntica a Real Audio, salvo que aqu las cosas se miden por los baudios de la conexin. Solo se puede transmitir en mono, con una calidad mxima de 44 KHz a 71.663 baudios a 9 Kb por segundo (a ojo de buen cubero). H.218, tambin muy utilizado, sobre todo en sistemas operativo de ordenadores de gama alta (Solaris, Unix con sus variantes) y tomado como estndar en muchas de las aplicaciones desde hace bastante tiempo (Mbone, Iphone). Compresin con perdidas, de baja-media calidad. En sus numerosas revisiones ha sido mejorado de una manera significativa. Actualmente, junto con el GSM es uno de los ms usados en las videoconferencias. El Video Qu seria de un sistema de video-conferencia sin el Video ?. Comunicarnos con otra persona solo mediante la voz es algo que esta bastante bien, de hecho lo usamos siempre que llamamos por telfono, pero si a esto le aadimos el Video conseguiremos un sistema de comunicacin ideal. 21 EQUIPO # 3
Transmisin de Audio en Internet Acstica Con el Video pasa lo mismo que con el audio, transmitir un segundo de Video ocupa lo inimaginable, as si usamos uno de los medios de almacenamiento masivo (un CD-ROM), a mxima calidad (sistema PAL, 768x576, trucolor, 30 frames o pantallazos por segundo) solo tendramos la posibilidad de tener 3 o 4 segundos, eso solo en cada CD. Por eso tenemos que hacer lo mismo que con el audio, comprimir. Aun no esta mejorado ya que necesitamos un gran ancho de banda, muchsimo mayor que para el audio. Aunque comprimamos si queremos enviar una imagen de 320x200 de resolucin, multiplicando nos da cosa de 60.000 pixels que son aproximadamente 60 Kb por segundo (si transmitimos varias), pero si adems queremos transmitirla con movimiento son 30 frames por segundo que multiplicando a lo anterior son 1.800 Kb por segundo, esto es una cifra astronmica para las redes actuales ya que si tenemos un mdem de 28.800 bps. tendremos un ancho de 2 Kb por segundo. Tenemos que diferenciar el tipo de compresin: puede que no haya compresin alguna en los frames, que haya lo que se llama un cuadro maestro, es decir, no se transmite todo el fotograma cada vez, sino que hay un cuadro que se transmite entero y los dems son deformaciones de este (realmente los datos que varan) o un tipo hbrido con cuadro maestro, con compresin y con lo que se denomina prediccin de cuadro, (algo muy nuevo) donde el ordenador prev cual ser el cambio del fotograma al fotograma siguiente. Aqu tambin existen multitud de formatos. Uniremos los formatos Online con los Offline. FLI, FLC, SMK, todos estos son bastante parecidos. Admiten un mximo de 256 colores (8 bits, aunque el SMK admite hasta 16 bits), el formato FLI a 320x200, el FLC sin limite de tamao y el SMK con sonido. No tiene compresin alguna salvo la de cada pantalla, es decir, estos formatos son como una sucesin de grficos en formato GIF (para que nos entendamos) sin ningn tipo de compresin salvo la que pueda tener cada frame, es decir, no tiene cuadros maestros. AVI, MOV, aunque parezcan formatos tan diversos, podemos considerar que ambos evolucionan al mismo tiempo. El formato AVI de Microsoft, se trata de Video comprimido, sin cuadros maestros, pero con cuadros comprimidos reescalables, con los cuales podemos variar el tamao de la imagen. La cantidad de informacin que grabamos depende de la calidad, as a ms calidad ms informacin grabamos. Realmente no nos vale para transmitirlo en tiempo real, como su compaero de versin MAC (el MOV), primer formato Mpeg de compresin de Video. Este formato tiene cuadro maestro y adems va comprimido. Eso ocurre hasta la versin 2, es decir hasta el Mpeg2, que es como actualmente se transmiten todos los canales digitales. 22 EQUIPO # 3
Transmisin de Audio en Internet Acstica Real Audio, tambin mediante este mtodo podemos transmitir Video. Basado en el Mpeg2, pero uniendo el estndar H.320, incluye cuadro maestro comprimido, con Video escalable. H.320, uno de los ms usados por sus tasas de velocidad, estn varan dependiendo del ancho de banda que tengamos. Capaz de transmitir en formato PAL, NTSC, convirtindola de un formato a otro segn haga falta. El H.320 engloba cinco formatos de Video y tres de audio. H.261, para canales de menos de 64 Kb. Con dos mtodos, el CIF (352x288 a 30 frames por segundo) y el QCIF (de menor tamao 175x144 con solo 15 frames). H.323, H.324, exclusivamente para cuando hay dos personas hablando, no admiten ni broadcast ni multicast. Estos dos estndares consumen un ancho de banda reducidsimo (prcticamente con 3 o 4 Kb por segundo nos vale), siendo su diferencia la resolucin que admiten, idntica al CIF y QUIF, respectivamente.
Audio y Video junto Consideraremos aqu las aplicaciones que pueden ser especificas para esto. No esperes demasiado, pensar que siempre escucharas el audio como una radio mal sintonizada y el Video lo veras a saltos. Esto no es porque nuestro ordenador sea lento (bueno, depende, a veces si), sino por el famoso ancho de banda. Ya sabes cuanto ms mejor. Tambin tienen que ofrecer. Ciertos servicios como : Pizarra electrnica o White Board, para comunicarse mediante texto, por si algo falla y alguien nos puede echar una mano. Ideal para los Brain Storm. Compartir aplicaciones, nos debe permitir el poder visualizar aplicaciones que tengamos en nuestro ordenador como el Gimp (programa de diseo grfico), el Power Point, etc? para poder mostrar nuestros trabajos. Compartir documentos, como la pizarra electrnica pero solo puede escribir un usuario cada vez. Mbone La ms practica porque existe en multitud de plataformas (Unix, MacOs, Windows95, Windows NT, Solaris, etc...). Es la herramienta universal y gratuita. Podemos emitir tanto en unicast, como en multicast o en broadcast, simplemente indicndole el numero de ttl. 23 EQUIPO # 3
Transmisin de Audio en Internet Acstica Necesitaremos una capturadora de Video y una tarjeta de sonido, ms un ordenador lo suficientemente potente como para poder comprimir audio y Video a tiempo real y al mismo tiempo (un Pentium 120 se queda pequeo, lo mnimo es un Pentium 166). Existe, mundialmente, una agenda de conferencias que esta a nuestra disposicin para ver que se esta retransmitiendo en esos momentos, y podamos engancharnos y verlo en directo. Adems podemos anunciar la nuestra para que todo el mundo la vea. Pueden estar conectados tanto usuarios como quieran, no es para una conferencia entre dos personas. Dispone de pizarra electrnica, podemos compartir documentos y esta en proyecto el poder compartir aplicaciones. Admite multitud de compresiones tanto de audio como de Video y nos permite controlar el ancho de banda que utilizamos con cada aplicacin.
CU-SeeMee Programa comercial para la plataforma Windows y MacOS. Se hizo famoso con la llegada de las Quick-Cam o cmaras que podemos conectar al puerto paralelo para digitalizar. En su ultima versin admite varias personas al mismo tiempo. Sus primeras versiones eran totalmente gratuitas, salvo que solo funcionaban bajo plataforma UNIX. Al ser comercial soporta los ltimos estndares (H.323 y H.263). Necesitaremos un Pentium 100 con 16 megas como mnimo y por supuesto mdem. Se empez a hacer famoso por los IRCs donde sus usuarios galanteaban de tenerla y de poder hablar con ellos de esta manera.
VocalTec Internet Phone Est sustituyendo al CU-SeeMe puesto que es la que actualmente esta en los packs de las cmaras digitalizadoras. Con pizarra, compartir documentos (multiplataforma, eso si) y soporte para chat o irc "de serie". Connectix VDOPhone Creado por Connectix. Ms sencillo que los productos anteriores, casi no requiere control por el usuario (al contrario que Mbone, que necesita un control casi constante). Admite a varios usuarios conectados al mismo tiempo. Su motor es el usado por el RealAudio cuando transmite Video. 24 EQUIPO # 3
Transmisin de Audio en Internet Acstica Microsoft NetMeeting Se distribuye conjuntamente con el InterNet Explorer 4.0, con lo cual esta ganando terreno rpidamente. Con un Pentium y 16 megas conseguiremos que se ejecute "sin peligro". Admite mltiples usuarios (hasta un mximo de 32, segn dicen), transferencia de archivos y pizarra. Sigue el estndar H.323.
Iris Phone 2.5 Bastante moderno, y sencillo. Se encuentra en versin beta y por ello podemos comunicar los fallos que veamos a la pagina WEB de la compaa. Consume muy pocos recursos, permitindonos grabar nuestra conversacin, as como emitir videos que tengamos grabados.
25 EQUIPO # 3

Audio en Internet - 1

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Audio en Internet - 1

Uploaded by

Copyright:

Available Formats

Transmisin de Audio en Internet Acstica AUDIO EN INTERNET La PC ha influido profundamente en la evolucin del audio digital, pero son las

Transmisin de Audio en Internet Acstica

Transmisin de Audio y Video por Internet

You might also like