Metadatos (del griego , meta, 'despus de, ms all de'
1 y latn datum, 'lo que se da', dato 2 ), literalmente sobre datos, son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos, llamado recurso. El concepto de metadatos es anlogo al uso de ndices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, ttulos, casas editoriales y lugares para buscar libros. As, los metadatos ayudan a ubicar datos. 3
Para varios campos de la informtica, como la recuperacin de informacin o la web semntica, los metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo semntico.
DEFINICIONES El trmino metadatos no tiene una definicin nica. Segn la definicin ms difundida de metadatos es que son datos sobre datos. Tambin hay muchas declaraciones como informaciones sobre datos, 4 datos sobre informaciones 5 e informaciones sobre informaciones. 6
Otra clase de definiciones trata de precisar el trmino como descripciones estructuradas y opcionales que estn disponibles de forma pblica para ayudar a localizar objetos 7 o datos estructurados y codificados que describen caractersticas de instancias conteniendo informaciones para ayudar a identificar, descubrir, valorar y administrar las instancias descritas. 8 Esta clase surgi de la crtica de que las declaraciones ms simples son tan difusas y generales que dificultarn la tarea de acordar estndares, pero estas definiciones no son muy comunes. Podemos tambin considerar los metadatos, en las reas de telecomunicaciones e informtica, como informacin no relevante para el usuario final pero s de suma importancia para el sistema que maneja la data. Los metadatos son enviados junto a la informacin cuando se realiza alguna peticin o actualizacin de la misma. En el campo biolgico los metadatos se han convertido en una herramienta fundamental para el descubrimiento de datos e informacin. En este contexto se pueden definir los metadatos como una descripcin estandarizada de las caractersticas de un conjunto de datos con esto se incluye la descripcin del contexto en el cual los datos fueron coleccionados y adems se refiere al uso de estndares para describirlos
http://es.wikipedia.org/wiki/Metadato
Metadatos: definicin, aplicaciones y estndares 2013 FEBRERO 28 by classora Los metadatos son simplemente datos sobre datos, es decir, informacin estructurada que describe a otra informacin y que nos permite encontrarla, gestionarla, controlarla, entenderla y preservarla en el tiempo. Los metadatos no son un concepto nuevo: la inclusin de metadatos es el mtodo utilizado tradicionalmente en el mundo de las bibliotecas para gestionar libros y archivos. Sin embargo, el nacimiento de la informtica y, ms concretamente, las posibilidades de intercambio de informacin surgidas en torno a la Web Semntica, hizo que aumentara la popularidad del trmino. Del mismo modo se hizo patente la necesidad de describir estndares. Para ilustrar su utilidad, podemos ver unos sencillos ejemplos de metadatos empleados porClassora Knowledge Base. Si tomamos una unidad de conocimiento como Fernando Alonso, vemos que tiene asociados diferentes atributos en su ficha: fecha de nacimiento, profesin, carreras en F1 etc. Cada uno de estos atributos dispone en Classora de un conjunto de metadatos asociados como el que se describe a continuacin: Tipo de dato: indica si es una fecha, un valor numrico, otra unidad de conocimiento, una cadena de caracteres etc. Por ejemplo: la fecha de nacimiento es de tipo DATE, la profesin es de tipo KNOWLEDGE-UNIT y el n de carreras es de tipo INTEGER. En general, tener los datos tipificados resulta imprescindible en cualquier base de datos estructurada. Unidades: indica las unidades en las que est medido el dato, si procede. Por ejemplo, la fecha de nacimiento y la profesin no tienen unidades asociadas, mientras que el n de carreras tiene una unidad especfica para indicar que se trata de eventos de Frmula 1. Modalidad de carga: indica si el dato fue cargado manualmente (por un miembro deClassora Technologies o por un usuario del portal pblico de datos) o bien si fue cargado automticamente (a travs de los robots de carga -crawlers- de Classora). Autor: indica, si procede, la persona o el bot que modific el dato por ltima vez. Fecha de actualizacin: indica la fecha de la ltima vez que se modific el dato. Fuente: indica la fuente de donde se extrajo el ltimo valor del dato. Frecuencia de refresco: indica la periodicidad con la cual los robots de Classora deben conectarse a la fuente original de datos para mantenerlo actualizado. Por ejemplo, la fecha de nacimiento de Fernando Alonso es un dato constante (es decir, no necesita ser actualizado), mientras que el n de carreras disputadas en F1 es un dato que es necesario contrastar en las fuentes originales cada 15 das. Fiabilidad: hay datos que estn disponibles en ms de una fuente. Por ejemplo, la fecha de nacimiento de Fernando Alonso puede estar disponible en la Wikipedia en ingls, laWikipedia en espaol, la pgina de la FIA, y Freebase. Con los metadatos adecuados, los robots pueden saber que se trata del mismo dato y evaluar si su valor coincide en todas las fuentes. Por ello, si tres de las cuatro indican la misma fecha, podra establecerse una fiabilidad aproximada del 75%. Otro tema muy importante en este sentido es el orden y la actualizacin de las fuentes. Por ejemplo, si el mismo dato est disponible en dos fuentes diferentes, pero su valor no coincide cul se escoge de entre los dos? Para ello Classora utiliza la precedencia de las fuentes, que establece cuales son, a priori, ms fidedignas. Por ejemplo, en el caso de la Wikipedia, los bots de Classora siempre otorgan mayor precedencia a la versin inglesa que a la espaola. Significado: es probablemente uno de los metadatos ms importantes, ya que permite que el dato sea interpretado automticamente va software. Classora sabe que el 29 de Julio de 1981 es la fecha de nacimiento de Fernando Alonso, que es un piloto de F1. Por tanto, es posible crear un informe va CQL que devuelva todos los pilotos de F1 nacidos en ese ao. Historial de cambios: entre los metadatos de cada unidad de conocimiento se encuentra una lista con los valores anteriores de cada atributo, incluyendo tambin para cada caso la fecha en la que fue includo el valor, su autor etc. Se trata de tener una perspectiva histrica de los cambios tanto para fines consultivos como para fines preventivos (posibilidad de recuperarse de ataques o deshacer aportaciones incorrectas). Esta capa de inteligencia basada en metadatos es lo que hace que el repositorio digital de Classora sea considerado una base de conocimiento, y no solo una base de datos. Tipos de metadatos En general, los metadatos pueden clasificarse en tres amplias categoras con lmites no siempre bien definidos, y muchas veces superpuestos: Metadatos descriptivos: son aquellos que sirven para la descripcin e identificacin de los recursos de informacin. Permiten la bsqueda y recuperacin de los datos, as como distinguir recursos y entender sus contenidos. Se realizan mediante estndares como Dublin Core,estndares MARC, microdatos de HTML etc. Metadatos estructurales: son los que ms influyen en la recuperacin de la informacin, facilitando la navegacin y presentacin de los recursos. Ofrecen informacin sobre su estructura interna y permiten establecer relaciones entre ellos, de manera que pueden incluso unir los archivos de imagen y textos que estn relacionados. Los estndares ms difundidos para en este sentido son SGML, RDF y EAD (Encoded Archival Description). Metadatos administrativos: incluyen datos para la gestin de derechos, firma digital, auditoras de calidad, control de acceso mediante contraseas etc. Tambin se podran enmarcar en esta categora los metadatos sobre preservacin a largo y corto plazo. Ejemplo, imgenes DICOM que incluyen metadatos como: tipo y modelo de escner utilizado, resolucin, paciente, limitaciones de reproduccin etc. Dublin Core y otros estndares Dublin Core es probablemente el estndar de metadatos ms extendido. Su nombre hace referencia a Dubln (Ohio, Estados Unidos), ciudad que en 1995 alberg la primera reunin a nivel mundial de muchos de los especialistas en metadatos y Web de la poca. Dublin Core describe material digital como videos, sonidos, imgenes, textos y pginas web. Para ello utiliza bsicamente XML, HTML y RDF. Adems, proporciona un conjunto de convenciones simples y estandarizadas para describir recursos de forma que se facilite su encuentro online. Para la transmisin de datos, tiene asociado el protocolo OAI- PMH. Dublin Core est gestionado por la DCMI (Dublin Core Metadata Iniciative), una organizacin que trata de fomentar la adopcin de estndares y generar un foro abierto para el desarrollo de vocabularios especializados en describir recursos, que permitan sistemas de recuperacin ms inteligentes. La siguiente tabla es una recopilacin no exhaustiva de algunos de los ms importantes estndares para metadatos que se han generado hasta el momento. Recursos en general Dublin Core (DCMES, DCMI Metadata Terms) Obras de arte CDWA (Categories for the Description of Works of Art) CDWA Lite VRA (Visual Resources Association) Core Categories Recursos bibliogrficos MODS (Metadata Object Description Schema) MARC21, UNIMARC, MARCXML TEI (Text Encoding Initiative) Headers Archivos y preservacin EAD (The Encoded Archival Description) OAIS (Reference Model for an Open Archival Information System) PREMIS (Preservation Metadata: Implementation Strategies) Recursos educativos IMS LOM (Learning Object Metadata) CanCore SCORM (Sharable Content Object Reference Model) Publicacin ONIX (ONline Information Exchange) Derechos de autor CopyrightMD DOI (Digital Object Identifier) ODRL (Open Digital Rights Language) Recursos cientficos CSDGM (Content Standard for Digital Geospatial Metadata) Darwin Core Multimedia MPEG-7 Multimedia Content Description Interface PBCore (The Public Broadcasting Metadata Dictionary) Redes sociales y personas vCard FOAF (Friend Of A Friend) Informacin geogrfica ISO-19115 FGDC (Federal Geographic Data Committee) Libro electrnico EPUB (Electronic Publication) Imgenes mdicas DICOM (Digital Imaging and Communication in Medicine) En definitiva, tal y como hemos comentado en otras ocasiones, si ests interesado en este tema, no dudes en contactar con nosotros para que te hagamos llegar ms enlaces y documentacin adicional. Desde Classora Technologies quedamos completamente a tu disposicin.
Las sigla que se conoce como SQL corresponde a la expresin inglesa Structured Query Language (entendida en espaol como Lenguaje de Consulta Estructurado), la cual identifica a un tipo de lenguaje vinculado con la gestin de bases de datos de carcter relacional que permite la especificacin de distintas clases de operaciones entre stas. Gracias a la utilizacin del lgebra y de clculos relacionales, el SQL brinda la posibilidad de realizar consultas con el objetivo de recuperar informacin de las bases de datos de manera sencilla. El cientfico Edgar Frank Codd (1923-2003) fue quien propuso un modelo relacional para las bases de datos y cre un sublenguaje para acceder a los datos a partir del clculo de predicados. En base al trabajo de Codd, IBM (International Business Machines) defini el lenguaje conocido como Structured English Query Language (SEQUEL). El SEQUEL se considera el antecesor de SQL, un lenguaje de cuarta generacin que se estandariz en 1986. La versin ms primitiva de SQL, por lo tanto, fue la que se bautiz como SQL-86 (tambin conocida como SQL1). En esencia, el SQL es un lenguaje declarativo de alto nivel ya que, al manejar conjuntos de registros y no registros individuales, ofrece una elevada productividad en la codificacin y en la orientacin a objetos. Una sentencia de SQL puede resultar equivalente a ms de un programa que emplee un lenguaje de bajo nivel. Una base de datos, dicen los expertos, implica la coexistencia de mltiples tipos de lenguajes. El denominado Data Definition Language (tambin conocido como DDL) es aqul que permite modificar la estructura de los objetos contemplados por la base de datos por medio de cuatro operaciones bsicas. SQL, por su parte, es un lenguaje que permite manipular datos (Data Manipulation Language o DML) que contribuye a la gestin de las bases de datos a travs de consultas. Cmo construir una base de datos eficiente? Toda empresa que apunte a un futuro brillante, con posibilidades de crecimiento y expansin, debe contar con una base de datos, que ser diferente en cada caso, ajustndose a las necesidades particulares de cada tipo de negocio, pero que deber ser confeccionada cuidadosamente, con una estructura slida y configurable, abierta a potenciales modificaciones sin que esto amenace su integridad. Uno de los puntos bsicos a la hora de construir una base de datos es la indexacin. Para entender este concepto, veamos brevemente un ejemplo prctico de base: supongamos que una compaa desea almacenar la informacin personal de sus clientes y hacer un seguimiento de sus transacciones; para ello, una posibilidad consistira en tener una tabla para sus datos (nombre, apellido, direccin de e-mail, etctera), otra para la descripcin de los productos (nombre del artculo, precio, detalles) y una para las ventas. Antes de pasar a detallar qu campos podran estar presentes en esta ltima tabla, cabe mencionar que en las restantes falta un elemento indispensable para una buena organizacin: una clave nica de identificacin. Generalmente llamada ID, suele ser un nmero entero (sin decimales) y positivo que la base de datos asigna automticamente a cada nuevo registro (en este caso, cada nuevo cliente o producto) y que nunca se repite, de modo que lo identifique desde su nacimiento (momento de creacin) hasta su muerte (cuando se elimine). De esta forma, si tomamos por ejemplo el registro 103 Pablo Bernal pbernal@proveedor.com, notamos que su ID es 103. Cul es su utilidad? En pocas palabras, buscar un cliente cuyo nombre sea n, su apellido, a, y su e-mail, e, toma mucho ms tiempo que pedir a la base que nos devuelva todos los datos del cliente con ID 103. Si bien es probable que en la primera operacin especifiquemos toda suinformacin, una vez que el programa lo encuentre, podremos valernos de este nmero para el resto de las consultas. Retomando el ejemplo, dado que las tablas de clientes y productos tendran su ID, relacionarlas con la de ventas resulta muy sencillo; sus campos podran ser: id de transaccin, id de cliente, id de producto, fecha, observaciones. Sin entrar en tecnicismos, es claro que cada venta contiene mucha ms informacin de la que se aprecia a simple vista, ya que, por ejemplo, el id de un cliente nos sirve para acceder a todos sus datos en la tabla correspondiente. En la puesta en prctica, sobra decir que la complejidad puede ser muchsimo mayor, pero es importante comenzar por lo bsico para entender la importancia de relaciones slidas y eficientes.
Lee todo en: Definicin de SQL - Qu es, Significado y Concepto http://definicion.de/sql/#ixzz2xe1XV0Au
http://definicion.de/sql/
SQL El lenguaje de consulta estructurado o SQL (por sus siglas en ingls Structured Query Language) es un lenguaje declarativo de acceso abases de datos relacionales que permite especificar diversos tipos de operaciones en ellas. Una de sus caractersticas es el manejo del lgebra y el clculo relacional que permiten efectuar consultas con el fin de recuperar de forma sencilla informacin de inters de bases de datos, as como hacer cambios en ellas. http://es.wikipedia.org/wiki/SQL