You are on page 1of 21

Escuela Superior de Informtica Universidad de Castilla La Mancha

Modelos Avanzados de Bases de Datos Funcionalidad 3


Antonio Jess Arteche Lpez Jess Galindo Alfonso Pablo Garca Bastante David Garca Fernndez Vctor Martn Ramrez Miguel ngel Martnez Pinedo

26 de Febrero de 2008

Funcionalidad 3. Bases de datos Web y Multimedia

NDICE
BASES DE DATOS WEB ..........................................................................................................3
1.1-INTRODUCCIN ......................................................................................................................... 3 1.2- INTEGRACIN WEB BBDD ................................................................................................. 4 1.3. CARACTERSTICAS DE BBDD WEB ..................................................................................... 5 1.4. DATOS SEMIESTRUCTURADOS............................................................................................ 5 1.4.1 Soluciones para el tratamiento de los datos semiestructurados ......................... 5 1.5 TECNOLOGAS WEB DINMICAS .......................................................................................... 8 1.6 EJEMPLO DE BBDD-WEB ......................................................................................................11 1.7 VENTAJAS E INCONVENIENTES DE LA BBDD-WEB ......................................................11

BASES DE DATOS MULTIMEDIA ...................................................................................... 13


2.1 INTRODUCCIN .......................................................................................................................13 2.2.INTEGRACIN MULTIMEDIA EN LAS BASES DE DATOS .............................................13 2.2.1. SISTEMAS DE BASES DE DATOS MULTIMEDIA .........................................................14 2.2.2. REQUISITOS DE BASES DE DATOS MULTIMEDIA ....................................................15 2.2.3 METODOLOGA DE UNA BASE DE DATOS MULTIMEDIA........................................15 2.3 CUESTIONES DE LA BASE DE DATOS MULTIMEDIA ....................................................16 2.4 TCNICAS DE RECUPERACIN DE LA INFORMACIN .................................................17 2.5 VENTAJAS E INCONVENIENTES DE UNA BASE DE DATOS MULTIMEDIA .............18 2.6 EJEMPLOS DE UNA BASE DE DATOS MULTIMEDIA .....................................................18

COMPARATIVA: BBDD MULTIMEDIA Y BBDD WEB ................................................. 20 BIBLIOGRAFA ...................................................................................................................... 21

Funcionalidad 3. Bases de datos Web y Multimedia

BASES DE DATOS WEB


1.1-INTRODUCCIN La utilizacin de la World Wide Web (www) para presentar y acumular datos se ha desarrollado mucho ms all de la sencilla presentacin de pginas, ya no se hacen los antiguos diseos web en los que los diseadores creaban una pgina independiente para cada elemento de la coleccin que queran mostrar, esas pginas eran difciles de mantener y de organizar. Cabe hacer mencin especial al gran nmero de aplicaciones a las que da soporte Internet, as como a la naturaleza de las mismas, ya que no son aplicaciones estticas sino que estn en constante renovacin (esto hace que sea especialmente importante separar los datos con los que se trabaja de la aplicacin que los gestiona). Todo ello influye en la forma de almacenar y organizar la informacin, debiendo de tener en cuenta todos estos factores a la hora de crear una BBDD para la web. Cualquier sitio web que presente informacin sobre un conjunto de elementos similares es candidato para la utilizacin de una base de datos web. La solucin general consiste en definir una base de datos, aadir un registro para cada elemento (directamente en la base de datos o dinmicamente por la web) y despus consultar dicha base de datos para generar pginas web sobre la marcha. Una pgina de men codificada en HyperText Markup Language (HTML) convierte en una consulta a una base de datos de varios registros. Esto supone una increble ventaja sobre todo a la hora del mantenimiento ya que es ms fcil tratar una base de datos que muchas pginas individuales. Tambin un aumento de las capacidades del HTML ya que ste tiene muchas limitaciones. Las tecnologas web estn reemplazando arquitecturas como la terminal o cliente-servidor, incluyendo servicios y servidores web y de base de datos entre ellos. El funcionamiento de un navegador web es el siguiente: 1. El usuario haciendo uso del navegador web (sistema cliente) solicita visualizar una pgina web. 2. El navegador solicita esta pgina (que est codificada en lenguaje HTML, el lenguaje que puede interpretar) al servidor web (sistema servidor). 3. El servidor web enva la informacin que le han pedido, en HTML, al navegador del usuario. 4. El navegador muestra la pgina web en la pantalla del usuario. El servidor debe devolver la informacin solicitada en HTML, as la informacin puede estar almacenada en el servidor de forma esttica (un fichero .html) o ser generada de forma dinmica y codificada en HTML.

Funcionalidad 3. Bases de datos Web y Multimedia

HTML Dinmico

Servidor Web Cliente 1 Peticin 2 Peticin

Servidor BB.DD.

Respuesta

Respuesta

1.2- INTEGRACIN WEB BBDD Tras observar la necesidad de que los servidores contacten con las bases de datos se necesitan mecanismos para conseguir esta comunicacin; stos mecanismos son conocidos cmo middleware web a bases de datos. Como hemos visto en el primer apartado, es necesario integrar la web con Bases de Datos; para conseguir esta integracin necesitamos una extensin que nos permite la comunicacin entre el servidor web y la base de datos. Esta extensin se conoce como middleware web a Bases de Datos. Nuestro servidor web se puede comunicar con este middleware a travs de dos interfaces: CGI (Common Gateway Interface) Interfaz de entrada comn (en castellano) es tecnologa web que permite a un cliente (explorador web) solicitar datos de un programa ejecutado en un servidor web. CGI especifica un estndar para transferir datos entre el cliente y el programa. Es un mecanismo de comunicacin entre el servidor web y una aplicacin externa cuyo resultado final de la ejecucin son objetos MIME. En una aplicacin CGI, el servidor web pasa las solicitudes del cliente a un programa externo. Este programa puede estar hecho en cualquier lenguaje que soporte el servidor, aunque por razones de portabilidad se suelen usar lenguajes de script (PHP, Perl, Python, ASP..), y puede realizar multitud de operaciones incluyendo el acceso a la base de datos. La salida de dicho programa es enviada al cliente en lugar del archivo esttico tradicional. El CGI tiene una gran desventaja y es que al utilizar scripts que son programas externos, estos deben de ejecutarse con cada solicitud lo que disminuye mucho la eficiencia del sistema servidor; sin embargo las tecnologas web estan ampliando horizontes y pasando parte de la carga que antes soportaba el servidor al cliente por medio de tecnologas como AJAX (Javascript asncrono y XML). API (Application Programming Interface) Interfaz de Programa de Aplicacin (en castellano). Proporcionan unas funciones que suelen permitir entre otras cosas el acceso a BBDD y la gestin de sesiones de usuario. Tiene la ventaja de que se ejecutan cmo parte del servidor, ganando con ello tiempo ya que no se tienen que ejecutar cada vez que se solicite una pgina, adems permite conexiones compartidas.

Funcionalidad 3. Bases de datos Web y Multimedia

La mayor desventaja que presenta es que es dependiente del servidor que utilicemos, decrementando de ese modo la portabilidad del sistema. 1.3. CARACTERSTICAS DE BBDD WEB Los distintos Sistemas Gestores de Bases de Datos (SGBD) existentes incorporan en sus ltimas versiones software de tipo middleware (capa de software que se sita sobre el SGBD) para aadir conectividad a la base de datos a travs de Internet, por lo que realmente las bases de datos web no son mas que SGBD utilizados y orientados con vistas a la web. Los middleware desarrollados en los distintos SGBD suelen emplear ODBC (traduce las consultas de datos de la aplicacin en comandos que el SGBD entienda) para conectar con la BD, junto con diversos conjuntos de herramientas para facilitar al usuario la implementacin de la comunicacin con la BD a travs de Internet. Las principales caractersticas que debe cumplir un SGBD utilizado en tecnologa web son las siguientes: 1. 2. 3. 4. Permitir acceso concurrente a los datos. Ofrecer mecanismos de seguridad. Soportar transacciones. Permitir almacenar grandes volmenes de datos, y almacenamiento de diferentes archivos.

1.4. DATOS SEMIESTRUCTURADOS Los datos semiestructurados son datos que pueden ser irregulares o incompletos y cuya estructura puede cambiar de forma rpida o impredecible. Debido a esto, a este tipo de datos no se les puede fijar un esquema fijo de antemano. La informacin asociada a dicho esquema normalmente est contenida dentro de los propios datos. La diferencia entre los SGBD semiestructurados con los relacionales o los orientados a objetos es que estos ltimos deben seguir un esquema predefinido, como es el caso de los relacionales, cuyo esquema est orientado a tablas, o los orientados a objetos, que ofrecen la posibilidad de crear estructuras ms ricas pero aun as los datos deben estar fijados a un esquema predefinido. Es por eso que estos SGBD tienen problemas a la hora de manejar datos semiestructurados. 1.4.1 Soluciones para el tratamiento de los datos semiestructurados Existen una serie de modelos y SGBD que permiten tratar con datos semiestructurados: 1. Modelos de Intercambio de Objetos (OEM, Object Exchange Model): Es un modelo de objetos anidados que fue diseado originalmente para el proyecto TSIMMIS (The Standford-IBM Manager of Multiple Information Sources) para soportar la integracin de datos de diferentes origines de datos. Los datos OEM son carentes de esquema y auto-descriptivos y puede considerarse como un grafo dirigido etiquetado, donde los nodos son objetos

Funcionalidad 3. Bases de datos Web y Multimedia

Como se puede observar en la figura, un objeto OEM est compuesto por un identificador nico de objeto, por ejemplo &9, una etiqueta textual descriptiva, name, un tipo, string, y un valor, Ann Beech. Estos objetos pueden clasificarse como atmicos o complejos. Los atmicos son objetos que contienen un valor para el tipo base (entero, cadena de caracteres, ) y pueden reconocerse en el diagrama por que no tienen ninguna arista saliente. Todos los dems son objetos complejos, cuyo tipo es un conjunto de identificadores de objetos. Los objetos complejos pueden ser padres de mltiples objetos o hijos de mltiples padres. Este tipo de objetos se puede considerar como una cudrupla (label,oid, type, value). Por ejemplo: {staff, &4, set, (&9,&10)} {name, &9, string, Ann Beech} {salary, &10, decimal, 12000} 2. Lore (Lightweight Object Repository): Lore es un SGBD para datos semiestructurados que utiliza el modelo OEM. Tiene un lenguaje de consulta propio, Lorel, que es una extensin del lenguaje OQL (Object Query Lenguaje). Las caractersticas ms notables de este SGBD son: Tiene una sintaxis similar a SQL Obtiene resultados significativos an en ausencia de algunos datos Opera uniformemente con datos de diferentes tipos Devuelve informacin heterognea Resmenes de datos que se generan y mantienen dinmicamente que permiten realizar consultas significativas y son utilizados por el procesador de consultas para aumentar la eficiencia de cada consulta

Un ejemplo de consulta Lorel seria: SELECT s.Oversees FROM DreamHome.Staff s WHERE s.name = Ann Beech

Funcionalidad 3. Bases de datos Web y Multimedia

Cuyo resultado sera: Answer PropertyForRent &5 street &11 2 Manor Rd type &12 Flat monthlyRent &13 375 OverseenBy &4 PropertyForRent &6 Street &14 18 Dale Rd type &15 1 annualRent &16 7200 OverseenBt &4 3. XML (eXtensible Markup Lenguage): XML es un metalenguaje (un lenguaje para describir otros lenguajes) que permite a los diseadores crear sus propias etiquetas personalizadas para proporcionar funcionalidad no disponible en HTML. Fue en 1998 cuando la W3C (World Wide Web Consortium) ratifico formalmente la primera versin de XML como un estndar de intercambio de datos. Existen dos modelos de datos principales a la hora de trabajar con XML. Estos son el modelo centrado en los datos y el modelo centrado en los documentos. En un modelo centrado en los documentos, XML se utiliza como formato de almacenamiento e intercambio para datos que estn estructurados. En este caso, los datos podran almacenarse en un SGBD relacional, objeto-relacional u orientado a objetos. Por tanto, para poder almacenar datos XML en SGBD tradicionales es necesario transformar las colecciones XML en esquemas compatibles con los SGBD tradicionales. Por ejemplo, XML ha sido completamente integrado en los sistemas Oracle9i, Oracle10g y Oracle11g a travs de una extensin llamada Oracle XML DB. En el caso de las consultas SQL, en el estndar SQL:2003 hay definidas una serie de extensiones a SQL que permiten la publicacin de cdigo XML. Estas extensiones son conocidas como SQL/XML. En el caso de que XML se use para codificar datos semiestructurados, los SGBD tradicionales no podrn gestionarlos correctamente. Para realizar esto se necesitara un modelo centrado en los documentos. Para estos sistemas se usa una base de datos XML nativa (NXD, Native XML Database). Las NXD Definen un modelo de datos (lgico) para un documento XML (para el documento, no para los datos contenidos en el) y almacena y extrae documentos de acuerdo con dicho modelo. Ejemplos de estos modelos son el modelo de los datos de XPath, los XML Infoset, y los modelos explicitados por el DOM y los eventos en SAX 1.0.Se pueden distinguir dos tipos de NXD segn su almacenamiento: Basados en texto: almacenan el cdigo XML como texto, por ejemplo como un archivo de un sistema de archivos o como un dato de tipo CLOB en un SGBD relacional. Basados en modelo: almacenan el cdigo XML en alguna representacin interna en forma de rbol.

Funcionalidad 3. Bases de datos Web y Multimedia

1.5 TECNOLOGAS WEB DINMICAS CGI (COMMON GATEWAY INTERFACE) La interfaz de pasarela comn (Common Gateway Interface, CGI) es un protocolo estndar que permite extender las capacidades de HTTP, permitiendo interactuar una aplicacin con un servidor web. sta aplicacin puede estar escrita en varios lenguajes como C, C++, Java, Perl, Python La tarea de un servidor es responder las peticiones (en el caso de un servidor web, de navegadores web) devolviendo una salida. Cada vez que llega una peticin, el servidor analiza que se est pidiendo y devuelve la respuesta apropiada. A continuacin se describe la forma de actuacin de un CGI de forma esquemtica: 1. En primera instancia, el servidor recibe una peticin (el cliente ha activado un URL que contiene el CGI), y comprueba si se trata de una invocacin de un CGI. 2. Posteriormente, el servidor prepara el entorno para ejecutar la aplicacin. Esta informacin procede mayoritariamente del cliente. 3. Seguidamente, el servidor ejecuta la aplicacin, capturando su salida estndar. 4. A continuacin, la aplicacin realiza su funcin: como consecuencia de su actividad se va generando un objeto MIME que la aplicacin escribe en su salida estndar. 5. Finalmente, cuando la aplicacin finaliza, el servidor enva la informacin producida, junto con informacin propia, al cliente, que se encontraba en estado de espera. Es responsabilidad de la aplicacin anunciar el tipo de objeto MIME que se genera (campo CONTENT_TYPE), pero el servidor calcular el tamao del objeto producido. Ejemplo de cmo conectarse a una Base de Datos ODBC usando PERL Paso 1. Conectarse a la Base de Datos.
$dbName = "BaseDatos"; $dbDriver = "ODBC"; $dbUserName = "Usuario"; $dbPassword = "Password"; $sql = SELECT * FROM USUARIOS;; $dbh = DBI->connect($dbName, $dbUserName, $dbPassword, $dbDriver);

Paso 2. Realizar Consulta y traer registros a un array.


$dataObject = $dbh->prepare($sql); $dataObject->execute(); @dbRows = $dataObject->fetchall_arrayref();

Paso 3. Cerrar Result y Conexion


$dbh->disconnect();

PHP (Hypertext Pre-Processor) PHP es un lenguaje de programacin interpretado usado normalmente para la creacin de pginas web dinmicas. PHP es un acrnimo recursivo que significa "PHP Hypertext Preprocessor" (inicialmente PHP Tools, o, Personal Home Page Tools). Cuando el cliente hace una peticin al servidor para que le enve una pgina web, el servidor ejecuta el intrprete de PHP.

Funcionalidad 3. Bases de datos Web y Multimedia

ste procesa el script solicitado que generar el contenido de manera dinmica (por ejemplo obteniendo informacin de una base de datos). El resultado es enviado por el intrprete al servidor, quien a su vez se lo enva al cliente. Permite la conexin a diferentes tipos de servidores de bases de datos tales como MySQL, Oracle, ODBC o Microsoft SQL Server. Tal vez la mayor ventaja de PHP sobre sus competidores es la integracin con los sistemas de bases de datos y el soporte nativo a las distintas bases de datos existentes, libres y comerciales. Ejemplo de cmo conectarse a una Base de Datos MySQL Paso 1. Conectarse a la Base de Datos. $link=mysql_connect("localhost","usuario","Password") Paso 2. Seleccionar Base de Datos y Realizar Consulta mysql_select_db("base_datos",$link) $result=mysql_query("select * from prueba",$link); Paso 3. Recoger registros del resultado de la consulta. while($row = mysql_fetch_array($result)) { printf("Nombre: %s Apellidos: %s", $row["Nombre"],$row["Apellidos"]); } Paso 4. Cerrar Result y Conexion mysql_free_result($result); mysql_close($link); ASP.NET Herramienta de desarrollo web comercializado por Microsoft. Es usado por programadores para construir sitios web, aplicaciones web y servicios XML. Forma parte de la plataforma .NET de Microsoft y es la tecnologa sucesora de la tecnologa Active Server Pages (ASP). ASP.net ofrece dos maneras de conectarse a una base de datos web: Controles de Origen de Datos: Permiten encapsular el acceso a los datos en un control que se puede configurar con informacin sobre la conexin y la consulta.Estos controles sern utilizados por otros controles para mostrar resultados de consultas en la Base de Datos.Para conectarse a una base de datos mediante un control de origen de datos, deber realizar las operaciones siguientes:

Determinar el tipo de control de origen de datos que necesita, dependiendo del tipo elegido puede necesitar seleccionar un proveedor, como System.Data.SqlClient para SQLServer, System.Data.OleDb para OleDb, System.Data.Odbc para conexiones mediante Odbc o System.Data.OracleClient para bases de datos Oracle. Agregar el control de origen de datos a la pgina y establecer sus propiedades para el acceso a datos. Codificacin mediante clases de ADO.net: Esta prctica es aconsejable si sus requisitos son demasiado complejos para utilizar los controles de origen de datos o si desea crear un componente independiente que realice el acceso a los datos fuera de sus pginas Web. ADO.net, el cual es un conjunto de los componentes del software que pueden ser usados por los programadores para accesar a datos y a servicios de datos, el cual

10

Funcionalidad 3. Bases de datos Web y Multimedia

proporciona objetos Connection, Reader, DataSet, para conectarse a una Base de Datos realizaramos lo siguiente: Paso 1. Creamos un objeto SqlConnection: Dim myConnection As New SqlConnection ("server=(local)\NetSDK;database=pubs;Trusted_Connection=yes") Paso 2. Crear un Adaptador de Objetos SqlDataAdapter Dim myCommand As New SqlDataAdapter("select * from Authors", myConnection) Paso 3. Crear un DataSet y ejecutar la consulta Dim ds As New DataSet() myCommand.Fill(ds, "Authors") Paso 4. Cerrar DataSet y Conexin ds.close() myConnection.close() JSP (JavaServer Pages) JavaServer Pages (JSP) es una tecnologa Java que permite generar contenido dinmico para web, en forma de documentos HTML, XML o de otro tipo. El funcionamiento general de la tecnologa JSP es que el Servidor de Aplicaciones interpreta y compila el cdigo contenido en la pgina JSP para construir el cdigo Java del servlet a generar. Este servlet ser el que genere el documento (tpicamente HTML) que se presentar en la pantalla del Navegador del usuario. JDBC es una API pura de Java que se usa para ejecutar comandos de SQL. Suministra una serie de clases e interfaces que permiten al desarrollador de web escribir aplicaciones que gestionen Bases de Datos. La interaccin tpica con una base de datos consta de los siguientes cuatro pasos bsicos: Paso 1. Abrir la conexin a la base de datos. Connection conexion = DriverManager.getConnection("jdbc:odbc:Nombre_ODBC","usuario","passwor d"); Paso 2. Ejecutar consultas a la base de datos. Statement consulta = conexion.createStatement(); ResultSet rs = consulta.executeQuery("select dni,nombre,apellidos,edad from agenda"); Paso 3. Procesar los resultados. En este caso los muestra en pantalla. while (rs.next()) { out.println("DNI ->"+ rs.getString("dni")); out.println("NOMBRE ->"+ rs.getString("nombre")); out.println("APELLIDOS ->"+ rs.getString("apellidos"));

Funcionalidad 3. Bases de datos Web y Multimedia

11

out.println("EDAD ->"+ rs.getInt("edad")); } Paso 4 . Cerrar la conexin a la base de datos. rs.close(); consulta.close(); conexion.close(); 1.6 EJEMPLO DE BBDD-WEB Como ejemplo de una base de datos Web se presenta una Web simplificada de comercio electrnico. Esta base de datos Web deber soportar la capacidad de mostrar los productos o servicios disponibles y realizar transacciones de ventas bsicas. Como tablas contaremos con: CUSTOMER: tabla con los detalles de un cliente registrado, de forma general contendr los datos sobre el nombre, apellidos, datos de facturacin, pago, etc PRODUCT: tabla con los detalles individuales de cada producto como pueden ser su identificador, nombre, categora a la que pertenece, precio, unidades disponibles ORDER: detalles generales del pedido, como pueden ser la fecha, identificador del cliente, etc ORDLINE: lnea del pedido que contiene los productos seleccionados en cada pedido, as como su cantidad. SHOPCART: tabla auxiliar que contiene los productos seleccionados por el cliente en su carro de compra, as como su cantidad. Esta es una tabla de trabajo, cuyo contenido se borrara cuando el cliente cierre su sesin en la pagina o cierre el explorador.

Como las tablas anteriores podremos incluir muchas mas para hacer el sistema mas completo como puede ser, tablas que hagan referencia a impuestos aplicables a cada uno de los pases, una tabla que contenga a los clientes que desean ser notificados si el precio de un producto alcanza un cierto nivel, una tabla que tenga una serie de ofertas o promociones para un articulo determinado Ya dentro de cada tabla podramos complicarlo todo lo que quisiramos aadiendo mas informacin a cada una de las tablas, como por ejemplo mantener informacin sobre el ultimo acceso de un cliente para mostrar los ltimos productos visitados, aadir distintos tipos de miembros (cliente normal, mayorista, ) 1.7 VENTAJAS E INCONVENIENTES DE LA BBDD-WEB Las principales ventajas e inconvenientes que proporciona el uso de un SGBD en la web se mencionan a continuacin: Ventajas.1. Independencia del Hardware y el Software 2. Independencia de la ubicacin 3. Facilita el mantenimiento de las aplicaciones web, materializando la separacin entre la persistencia de datos y las capas de presentacin y dominio de la aplicacin. 4. Facilita la portabilidad del sistema. 5. Independencia de la plataforma.

12

Funcionalidad 3. Bases de datos Web y Multimedia

Inconvenientes.1. Decremento de la seguridad al estar accesible desde cualquier ubicacin. 2. Incremento de la complejidad de diseo de la aplicacin web. 3. Fiabilidad dependiente de la disponibilidad de red del servidor y/o servidores donde se aloja la Base de Datos.

Funcionalidad 3. Bases de datos Web y Multimedia

13

BASES DE DATOS MULTIMEDIA


2.1 INTRODUCCIN Este tipo de bases de datos tienen mucha relacin con los SGBD objeto relacionales (SGBDOR) y los orientados a objetos (SGBDOO) ya que pueden almacenar tipos de datos multimedia:
Tipos

Formatos

Texto Grficos Imgenes Animaciones Video

Formateado o sin formatear CMG, PICT, Postcript JPEG, MPEG


Secuencias temporales de imgenes

AVI, MPEG 4 WAV, MPEG 3, WMA

Audio

Podemos distinguir dos tipos de bases de datos multimedia fundamentales: Bases de datos referenciales: son bancos de datos sobre material como pelculas, series de televisin o msica. En la mayora de los casos, la informacin que se almacena hace referencia a cuestiones descriptivas (autor, ttulo, duracin, productor, etc.) o a cuestiones tcnicas (formato, duracin, etc.). Bases de datos descriptivas: se trata de sistemas de anlisis de contenido que, ms all de los datos tcnicos o generales que contiene la mayora de bases de datos referenciales, aportan informacin especfica sobre el contenido. Estos bancos de datos no resultan tan habituales y de hecho se encuentran en un estado de desarrollo embrionario, ya que el anlisis de la imagen y del sonido no se halla tan automatizado como el del texto.

Existe, sin embargo, un nmero importante de bases de datos referenciales que actualmente se emplean tanto en entornos cerrados (por ejemplo, las bases de datos que gestionan las plataformas de televisin) como en redes abiertas del tipo Internet, que permiten una consulta en muchos casos gratuita y libre por parte de los usuarios. 2.2.INTEGRACIN MULTIMEDIA EN LAS BASES DE DATOS El nacimiento de la multimedia ha renovado por completo la idea de base de datos. Si bien desde siempre se han visto como almacenes de informacin (textual y numrica), regidos por un conjunto de normas que le aportaban semntica. Con la llegada de la Multimedia el abanico se ampla con la posibilidad de completar los objetos a los que representan. El ambiente de un sistema de gestin de bases de datos multimedia integra texto, datos, video, imagen (esttica y dinmica) y sonido.

14

Funcionalidad 3. Bases de datos Web y Multimedia

Las bases de datos multimedia estn en un marco que adems de los datos se le incluye la nueva caracterstica de que pueden tener variabilidad espacial y temporal. Por lo tanto, un documento introducido en una base de datos multimedia es una composicin temporal, en la cual hay que introducir los diferentes tipos de datos, tanto como las relaciones de configuracin y temporales existentes entre ellos. Los datos deben estar sincronizados, controlando tanto su estado como su comportamiento. Los documentos multimedia se forman mediante la agregacin de objetos de diferentes tipos, objetos que pueden ser de gran tamao, y llegan a mostrar gran variedad en lo referido a estructura y representacin. La representacin del documento multimedia busca comunicar de forma efectiva no slo el documento y su contenido, sino tambin la semntica, los conceptos subyacentes y la relacin entre ellos. Uno de los enfoques bsicos es el anlisis de las caractersticas de los usuarios humanos del sistema, para lo cual es indispensable conocer los patrones de comportamiento del usuario en el acceso y comprensin de las estructuras informativas. En el momento en el que se comienza a disear e implantar una base de datos multimedia, el objeto de trabajo ya no resulta ser el registro tradicional: el usuario est tratando con un documento electrnico con todo lo que ello conlleva (texto, grficos, imgenes, datos, imgenes animadas, sonidos). Adems a esto hay que sumarle los grandes volmenes de informacin almacenadas en diferentes plataformas y aplicaciones, distribuidas en diferentes localizaciones geogrficas... Todo esto condiciona a que las Bases de Datos Multimedia tengan dos caractersticas principales: La disponibilidad de bases de datos avanzadas, en un entorno de fcil utilizacin por parte del usuario El establecimiento de redes de telecomunicaciones de alta velocidad.

2.2.1. SISTEMAS DE BASES DE DATOS MULTIMEDIA Tambin llamadas "gestores de informacin hipermedial" los Sistemas gestores de bases de datos se diferencia de a otros SGBD tradicionales (que ofrecan limitaciones en aspectos como el acceso complejo a datos, la transferencia de datos con otros sistemas, o la inexistencia de adecuados interfaces de usuario) en intentar disear e implementar Sistemas que sean capaces de utilizar "inteligentemente" los datos disponibles, e integrar las viejas y las antiguas aplicaciones de forma conjunta y sin problemas. Una base de informacin hipermedial tiene varios componentes: 1. 2. 3. 4. Base de presentacin: parmetros a aplicar para mostrar la informacin al usuario. Base de estructura: visin lgica del hiperdocumento, segn un modelo. Base de contenido: conjunto de documentos que se integran en el hiperdocumento. Base de utilizacin: informacin sobre hbitos y comportamiento de cada usuario.

En su modelaje conceptual (correspondiente al esquema conceptual definido por ANSI/X3/SPARC), las bases de datos multimedia debe cumplir dos fases: 1. Cognicin, centrado en cmo reconocer el mundo real, sus entidades y relaciones. 2. Modelizacin, centrado en cmo representar los conocimientos obtenidos en la fase anterior, de manera que sean manipulables por la mquina.

Funcionalidad 3. Bases de datos Web y Multimedia

15

A pesar de ser la integracin de bases de datos heterogneas una de las razones del desarrollo de sistemas de gestin de bases de datos multimedia, la industria todava no ha establecido todava estndares de formato entre ellas, por lo que se repite la misma situacin que en momentos anteriores, entre ficheros de base de datos correspondientes a aplicaciones como dBASE, Paradox, etc. Aunque las aplicaciones tradicionales ya ofrecen "puentes" para compartir sus bases de datos, por el momento esto no es posible en lo que respecta a las bases de datos multimedia. Sin embargo, estn comenzando a aparecer en el mercado nuevas aplicaciones que, sin cumplir los requerimientos clsicos de un SGBD, pueden generar documentos multimedia, tomando como base informacin y datos contenidos en otros tipos de fichero. Los lmites entre la base de datos "real", y el documento multimedia resultante "virtual", son difciles de establecer en el estado actual de la tecnologa. Si puede decirse que es posible establecerse un algoritmo que define el proceso de formateo y composicin del documento, en dos niveles: 1. Jerarqua lgica del contenido del documento. 2. Jerarqua fsica del documento formateado. 2.2.2. REQUISITOS DE BASES DE DATOS MULTIMEDIA Un adecuado SGBD Multimedia debera ofrecer herramientas para buscar, recuperar, manipular, ordenar y organizar los textos, imgenes, vdeos en un entorno de formato libre, de tal forma que pueda utilizar documentos de muy diverso formato, tamao y disposicin. El SGBD de datos multimedia debera ofrecer lenguajes de descripcin de documentos avanzados, permitir el diseo de estructuras de datos muy flexibles, y ofrecer mecanismos de bsqueda altamente efectivos. Como resumen, un sistema de base de datos multimedia debera: Encontrar rpidamente la informacin multimedia, buscando cualquier nmero de objetos referidos a un contenido de informacin. Conectar documentos segn su contenido informativo, relacionando extractos de informacin relacionada, de varios documentos, en un documento nuevo. Facilitar el acceso instantneo a los ficheros pertinentes, incluyendo los mecanismos necesarios de compresin y descompresin para la manipulacin de aquellos. Conocer y manipular, por parte del usuario, la estructura misma de la informacin. Crear relaciones entre grupos de elementos informativos. La implantacin y explotacin de Bases de datos Multimedia exige dos elementos importantes: Disponibilidad de Bases de Datos Avanzadas, en un entorno de fcil utilizacin por parte del usuario. Establecimiento de redes de telecomunicaciones de alta velocidad. 2.2.3 METODOLOGA DE UNA BASE DE DATOS MULTIMEDIA La creacin e implantacin de un sistema de bases de datos multimedia no puede separarse de la adopcin de una metodologa adecuada para ello. De la misma forma que en los sistemas "tradicionales" de bases de datos, el enfoque a utilizar es el basado en un sistema integrado de informacin: 1. Definicin de las tareas y objetivos a cumplir por la unidad informativa. 2. Desarrollo de un metamodelo y de una metodologa para el desarrollo de un sistema de informacin estratgica. 3. Inventario de los elementos de tecnologas de la informacin disponibles. 4. Inventario de las herramientas y de los repositorios de informacin existentes

16

Funcionalidad 3. Bases de datos Web y Multimedia

5. Creacin de un diccionario de metadatos y de su metodologa. 6. Consolidacin de las conclusiones obtenidas, a travs de metamodelos.

Fig.6.1. Los tres niveles de un sistema de bases de datos multimedia. La utilizacin de este tipo de bases de datos, en lo que se incluyen representaciones complejas de la realidad, hace necesario la utilizacin de dos niveles de organizacin y de descripcin. En primer lugar, una nivel de conocimiento, de metadatos, conceptual y difuso. En segundo lugar, un nivel de datos, concreto y analtico. El concepto clave de las nuevas bases de datos, a partir de la presente dcada, ser "significado", superando el clsico "dato" o "informacin". 2.3 CUESTIONES DE LA BASE DE DATOS MULTIMEDIA Estos son algunos de las cuestiones que aun quedan por discutir a la hora de tratar con bases de Datos Multimedia: Modelado Dado que se va a trabajar con objetos complejos, que van desde simples textos hasta videos, pasando por imgenes y sonido, el objetivo es encontrar un modelo que permita describir la estructura de los objetos, y sobre el que pueda definirse lenguajes de acceso especializados. Si queremos almacenar datos de texto, la mejor opcin es una Base de Datos Relacional, pero para almacenar objetos de video, por ejemplo, una mejor opcin sera una base de Datos Orientada a Objetos. Elegir una u otra a sabiendas de que habr ambos tipos de datos es algo sobre lo que se debe seguir investigando. Y es que en un objeto multimedia que represente el parte de una compaa de seguros en un accidente, por ejemplo, este podra tener imgenes del accidente, formularios de los implicados, grabaciones de audio de ambas partes, informe sobre los hechos decidir que modelado es ms conveniente constituye una cuestin compleja sobre la que aun se debate. Indexacin de imgenes A la hora de indexar la informacin de una imagen, la cuestin es optar por tcnicas de reconocimiento y procesamiento de imgenes o bien por la asignacin manual de frases y trminos. La primera de estas tcnicas sufre un problema de escalabilidad, ya que no es capaz de manejar el crecimiento continuo de trabajo, debido en gran parte a que es una tcnica a la que le queda mucho por avanzar. La asignacin manual de trminos est actualmente ms acogida por

Funcionalidad 3. Bases de datos Web y Multimedia

17

su sencillez de adaptacin, aunque resolver sus problemas de ambigedad de trminos requiere tcnicas ms complejas. Por ejemplo, si decidiramos buscar Calatrava podramos encontrarnos con obras del famoso arquitecto, con poblaciones con ese nombre o con personas con ese apellido. Una solucin a esto es relacionar el termino con su contexto. Es decir, diferenciar las imgenes con Calatrava que estn junto a Venecia o Puente no trataran sobre lo mismo que si acompaa a Ciudad Real o Poblacin. Recuperacin de textos Un problema que tambin est relacionado con la recuperacin de la informacin. Por un lado, y similar a lo expuesto con las imgenes, hay problemas a la hora de indexar correctamente frases. En contraposicin a la utilizacin de trminos unitarios, parece que aadir descriptores supone una mejora sustancial, estos deben ser buenos indicadores del contenido. Por otro lado, el vocabulario del usuario es usualmente diferente del usado a la hora de indexar el documento, por lo que sera ideal el uso de un diccionario de sinnimos para ampliar la consulta del usuario. El problema de esto es, una vez ms, la ambigedad del lenguaje. La solucin, de nuevo, puede solucionarse relacionando el trmino con el contexto. 2.4 TCNICAS DE RECUPERACIN DE LA INFORMACIN Los nuevos elementos que se presentan en los documentos (audio, video, imgenes fijas o dinmicas) han hecho que se investigue sobre nuevas tcnicas para la recuperacin de los mismos. Cabe citar: Recuperacin de Audio: este problema se divide en varios niveles. 1. Primitivas bsicas: se asignan identificadores textuales a los archivos y el sistema se encarga de recuperarlos con ese identificador. 2. Primitivas a nivel sintctico: amplan las posibilidades de recuperacin de sonidos teniendo en cuenta aspectos como la frecuencia a la que se muestreo el archivo de audio, cuantificacin, tamao de archivo, formato de compresin utilizado, y otras relacionadas fuertemente con la acstica como niveles de agudos, grabes, dB, etc. 3. Primitivas a nivel semntico: tienen en cuenta el contexto en el que se genera el audio, permitiendo diferenciar entre una conversacin o una pieza de msica. Recuperacin de Vdeo al igual que en audio podemos dividirlo en: 1. Primitivas bsicas: tienen la capacidad de detectar planos, pudiendo detectar el encuadre de escenas. 2. Primitivas a nivel sintctico en ella se tratan caractersticas propias de la imagen como pueden ser brillo, luminosidad,... 3. Primitivas a nivel semntico al igual que en del sonido nos permite recuperar pelculas por aspectos caractersticos de sta como tipo de pelcula Con todo esto llegamos a la conclusin de que el problema de recuperacin es tan complejo debido a que el usuario espera del sistema que encuentre elementos relevantes basados en semnticas personales o culturales. La representacin de informaciones de carcter semntico es muy compleja y requiere de tcnicas que implican a ciencias como la Inteligencia Artificial.

18

Funcionalidad 3. Bases de datos Web y Multimedia

Fig. Ejemplos de algunos sistemas multimedia que implementan su propio sistema de recuperacin de imgenes por contenido. 2.5 VENTAJAS E INCONVENIENTES DE UNA BASE DE DATOS MULTIMEDIA Ventajas

La posibilidad de integrar en un nico sistema una gran diversidad de formatos (imgenes, texto, video, sonido, etc). Ofrecen mayor variedad a la hora de representar la informacin. Un gran, y creciente, mercado potencial que augura que se siga investigando activamente en el futuro.

Inconvenientes

Necesita grandes espacios para almacenar toda la informacin que queremos. Este tipo de bases de datos necesitan grandes anchos de banda para obtener un rendimiento ptimo. Complejidad en cuanto a programar operaciones, o incluso la interfaz, debido a la alta cantidad de formatos que hay que manejar, lo que puede repercutir en su rendimiento. 2.6 EJEMPLOS DE UNA BASE DE DATOS MULTIMEDIA

Es de esperar que las aplicaciones a gran escala de bases de datos multimedia abarquen un gran nmero de disciplinas y mejoren las posibilidades ya existentes. Algunas de las aplicaciones importantes que se vern incluidas son: Gestin de documentos y registros: un gran nmero de industrias y empresas llevan registros muy detallados as como diversos documentos. Los datos pueden incluir diseos de ingeniera y datos de fabricacin, historiales mdicos de pacientes, material de publicacin y expedientes de reclamaciones de indemnizaciones de seguros. Difusin de conocimientos: la modalidad multimedia, que es un medio muy eficaz de difusin de conocimientos, experimentar un crecimiento extraordinario en libros electrnicos, catlogos, manuales, enciclopedias y almacenes de informacin sobre numerosos temas.

Funcionalidad 3. Bases de datos Web y Multimedia

19

Educacin y formacin: se puede disear material de enseanza para diferentes pblicos (desde preescolares a operadores de equipo o a profesionales) a partir de fuentes multimedia. Marketing, publicidad, comercio minorista, entretenimiento y viajes: es muy amplio el uso de efectos especiales para el cine y la publicidad, el empleo de objetos prediseados almacenados en bases de datos multimedia amplia el abanico de estas aplicaciones. Control y supervisin en tiempo real: la presentacin multimedia de la informacin puede resultar un medio muy eficaz de supervisar y controlar tareas complejas como son las operaciones de fabricacin, centrales nucleares, pacientes en unidades de cuidados intensivos y sistemas de transporte.

En 1997 William I. Grosky, en su libro Managing Multimedia Information in Database Systems defina unas aplicaciones para las bases de datos multimedia y su modelado, uno de los ms llamativos es este: Un modelo de datos es una coleccin de conceptos abstractos que pueden ser usados para representar objetos del mundo real, con propiedades y relaciones entre ellos, estos objetos tienen una posible implementacin fsica en el sistema de base de datos. Como se puede ver en el figura se tienen unos objetos con un atributo de tipo imagen y con unos datos adyacentes como es el Id. Se podran comparar imgenes de distintos objetos y obtener una comparacin como si estuviramos hablando de un objeto de tipo INTEGER.

Sistemas comerciales para la gestin de la informacin multimedia Hasta ahora no existen SGBD con el nico propsito de gestionar datos multimedia y por tanto no hay ninguno que tenga la funcionalidad necesaria para servir plenamente de soporte para las aplicaciones de gestin de datos multimedia nombradas anteriormente. En la actualidad existen diversos SGBD que sirven de soporte a tipos de datos multimedia como son Informix, Dynamic Server, DB2 Universal database (UDB) de IBM, Oracle 8.0. Todos estos SGBD soportan objetos, lo que resulta esencial para soportar tratamientos complejos de datos multimedia.

20

Funcionalidad 3. Bases de datos Web y Multimedia

COMPARATIVA: BBDD MULTIMEDIA Y BBDD WEB


Es frecuente encontrar estos dos tipos de bases de datos relacionados entre ellos, ya que cuando se habla de base de datos multimedia, normalmente, son bases de datos a las que se accede va Web. Por esta razn, muchos son los aspectos que tienen en comn. Citemos algunos de los ms representativos: Ambos se pueden desarrollar sobre Bases de Datos Relacionales, Bases de Datos Orientado a Objetos, o Bases de Datos Objeto Relacional. El rendimiento de ambas bases de datos depende, en gran medida, de los componentes hardware utilizados para el almacenamiento de los datos (servidores), y distribucin de los mismos (altas velocidades en las redes de comunicacin). Es por ello por lo que se requieren redes de transmisin de datos con una buena Calidad de Servicio, de modo que los datos se sirvan en el momento oportuno. Debido a las exigencias del mercado y al formato de los datos que viajen por la red, ambos sistemas gestores estn en continua evolucin (surgen nuevos sistemas de compresin de datos, nuevas tcnicas de recuperacin de informacin, nuevos lenguajes con funcionalidades especficas para el tratamiento multimedia y web, etc.). Ambas deberan estar preparadas para soportar un alto nivel de concurrencia. Actualmente el mercado demanda modelos de bases de datos hbridos entre bases de datos multimedia y bases de datos web, como ejemplo SIG PAC y SIG OLEICOLA. No obstante, por muchos aspectos comunes que tengan ambos modelos, hay que tener presente que no todas las bases de datos que hay en la Web soportan y gestionan datos multimedia.

Funcionalidad 3. Bases de datos Web y Multimedia

21

BIBLIOGRAFA
Mario Piattini Velthuis El Futuro de Las Bases de Datos (III) Grosky, William I. Managing Multimedia Information in Database Systems, University of Detroit, 1997 Connolly T., Begg C., Sistemas de b ases de datos - Un enfoque practica para diseo, implementacin y gestin. Ed PearsonAddison-Wesley. Rob P., Coronel C., Sistemas de bases de datos - Diseo Implementacion y Administracion. Ed. Thomson. Atzeni P.,Stefano C., Database Systems - Concepts, Languages and Architectures. Ed. McGraw Hill. Introduccin a la Documtica http://tramullas.com/documatica/indice.html , Jess Tramullas y Kronos 1997, 2000.

http://es.wikipedia.org/wiki/Common_Gateway_Interface.html http://es.wikipedia.org/wiki/AJAX http://es.wikipedia.org/wiki/P%C3%A1gina_web http://es.wikipedia.org/wiki/Contenido_din%C3%A1mico http://www.iec.csic.es/criptonomicon/bd/ http://msdn2.microsoft.com/es-es/library/ms178371(VS.80).aspx http://www.geocities.com/claudiahernandez/wdb.htm http://www.javahispano.com

You might also like