You are on page 1of 9

METADATO

Metadatos (del griego , meta, 'despus de, ms all de'


1
y latn datum, 'lo que se da',
dato
2
), literalmente sobre datos, son datos que describen otros datos. En general, un grupo
de metadatos se refiere a un grupo de datos, llamado recurso. El concepto de metadatos es
anlogo al uso de ndices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se
usan fichas que especifican autores, ttulos, casas editoriales y lugares para buscar libros. As, los
metadatos ayudan a ubicar datos.
3

Para varios campos de la informtica, como la recuperacin de informacin o la web semntica, los
metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo
semntico.

DEFINICIONES
El trmino metadatos no tiene una definicin nica. Segn la definicin ms difundida de
metadatos es que son datos sobre datos. Tambin hay muchas declaraciones como
informaciones sobre datos,
4
datos sobre informaciones
5
e informaciones sobre
informaciones.
6

Otra clase de definiciones trata de precisar el trmino como descripciones estructuradas y
opcionales que estn disponibles de forma pblica para ayudar a localizar objetos
7
o datos
estructurados y codificados que describen caractersticas de instancias conteniendo informaciones
para ayudar a identificar, descubrir, valorar y administrar las instancias descritas.
8
Esta clase
surgi de la crtica de que las declaraciones ms simples son tan difusas y generales que
dificultarn la tarea de acordar estndares, pero estas definiciones no son muy comunes.
Podemos tambin considerar los metadatos, en las reas de telecomunicaciones e informtica,
como informacin no relevante para el usuario final pero s de suma importancia para el sistema
que maneja la data. Los metadatos son enviados junto a la informacin cuando se realiza alguna
peticin o actualizacin de la misma.
En el campo biolgico los metadatos se han convertido en una herramienta fundamental para el
descubrimiento de datos e informacin. En este contexto se pueden definir los metadatos como
una descripcin estandarizada de las caractersticas de un conjunto de datos con esto se incluye
la descripcin del contexto en el cual los datos fueron coleccionados y adems se refiere al uso de
estndares para describirlos

http://es.wikipedia.org/wiki/Metadato

Metadatos: definicin, aplicaciones y estndares
2013 FEBRERO 28
by classora
Los metadatos son simplemente datos sobre datos, es decir,
informacin estructurada que describe a otra informacin y que
nos permite encontrarla, gestionarla, controlarla, entenderla y
preservarla en el tiempo.
Los metadatos no son un concepto nuevo: la inclusin de
metadatos es el mtodo utilizado tradicionalmente en el mundo
de las bibliotecas para gestionar libros y archivos. Sin embargo,
el nacimiento de la informtica y, ms concretamente, las
posibilidades de intercambio de informacin surgidas en torno a
la Web Semntica, hizo que aumentara la popularidad del
trmino. Del mismo modo se hizo patente la necesidad de
describir estndares.
Para ilustrar su utilidad, podemos ver unos sencillos ejemplos
de metadatos empleados porClassora Knowledge Base. Si
tomamos una unidad de conocimiento como Fernando Alonso,
vemos que tiene asociados diferentes atributos en su ficha: fecha
de nacimiento, profesin, carreras en F1 etc. Cada uno de estos
atributos dispone en Classora de un conjunto de metadatos
asociados como el que se describe a continuacin:
Tipo de dato: indica si es una fecha, un valor numrico, otra
unidad de conocimiento, una cadena de caracteres etc. Por
ejemplo: la fecha de nacimiento es de tipo DATE, la profesin es
de tipo KNOWLEDGE-UNIT y el n de carreras es de
tipo INTEGER. En general, tener los datos tipificados resulta
imprescindible en cualquier base de datos estructurada.
Unidades: indica las unidades en las que est medido el dato,
si procede. Por ejemplo, la fecha de nacimiento y la profesin
no tienen unidades asociadas, mientras que el n de carreras
tiene una unidad especfica para indicar que se trata de eventos
de Frmula 1.
Modalidad de carga: indica si el dato fue cargado
manualmente (por un miembro deClassora Technologies o por
un usuario del portal pblico de datos) o bien si fue cargado
automticamente (a travs de los robots de carga -crawlers- de
Classora).
Autor: indica, si procede, la persona o el bot que modific el
dato por ltima vez.
Fecha de actualizacin: indica la fecha de la ltima vez que
se modific el dato.
Fuente: indica la fuente de donde se extrajo el ltimo valor del
dato.
Frecuencia de refresco: indica la periodicidad con la cual
los robots de Classora deben conectarse a la fuente original de
datos para mantenerlo actualizado. Por ejemplo, la fecha de
nacimiento de Fernando Alonso es un dato constante (es decir,
no necesita ser actualizado), mientras que el n de carreras
disputadas en F1 es un dato que es necesario contrastar en las
fuentes originales cada 15 das.
Fiabilidad: hay datos que estn disponibles en ms de una
fuente. Por ejemplo, la fecha de nacimiento de Fernando
Alonso puede estar disponible en la Wikipedia en ingls,
laWikipedia en espaol, la pgina de la FIA, y Freebase. Con los
metadatos adecuados, los robots pueden saber que se trata del
mismo dato y evaluar si su valor coincide en todas las fuentes.
Por ello, si tres de las cuatro indican la misma fecha, podra
establecerse una fiabilidad aproximada del 75%. Otro tema
muy importante en este sentido es el orden y la actualizacin
de las fuentes. Por ejemplo, si el mismo dato est disponible en
dos fuentes diferentes, pero su valor no coincide cul se
escoge de entre los dos? Para ello Classora utiliza
la precedencia de las fuentes, que establece cuales son, a priori,
ms fidedignas. Por ejemplo, en el caso de la Wikipedia, los
bots de Classora siempre otorgan mayor precedencia a la
versin inglesa que a la espaola.
Significado: es probablemente uno de los metadatos ms
importantes, ya que permite que el dato sea interpretado
automticamente va software. Classora sabe que el 29 de Julio
de 1981 es la fecha de nacimiento de Fernando Alonso, que es
un piloto de F1. Por tanto, es posible crear un informe va CQL
que devuelva todos los pilotos de F1 nacidos en ese ao.
Historial de cambios: entre los metadatos de cada unidad
de conocimiento se encuentra una lista con los valores
anteriores de cada atributo, incluyendo tambin para cada caso
la fecha en la que fue includo el valor, su autor etc. Se trata
de tener una perspectiva histrica de los cambios tanto para
fines consultivos como para fines preventivos (posibilidad de
recuperarse de ataques o deshacer aportaciones incorrectas).
Esta capa de inteligencia basada en metadatos es lo que hace
que el repositorio digital de Classora sea considerado una base
de conocimiento, y no solo una base de datos.
Tipos de metadatos
En general, los metadatos pueden clasificarse en tres amplias
categoras con lmites no siempre bien definidos, y muchas veces
superpuestos:
Metadatos descriptivos: son aquellos que sirven para la
descripcin e identificacin de los recursos de informacin.
Permiten la bsqueda y recuperacin de los datos, as como
distinguir recursos y entender sus contenidos. Se realizan
mediante estndares como Dublin Core,estndares
MARC, microdatos de HTML etc.
Metadatos estructurales: son los que ms influyen en la
recuperacin de la informacin, facilitando la navegacin y
presentacin de los recursos. Ofrecen informacin sobre su
estructura interna y permiten establecer relaciones entre ellos,
de manera que pueden incluso unir los archivos de imagen y
textos que estn relacionados. Los estndares ms difundidos
para en este sentido son SGML, RDF y EAD (Encoded Archival
Description).
Metadatos administrativos: incluyen datos para la gestin
de derechos, firma digital, auditoras de calidad, control de
acceso mediante contraseas etc. Tambin se podran
enmarcar en esta categora los metadatos sobre preservacin a
largo y corto plazo. Ejemplo, imgenes DICOM que incluyen
metadatos como: tipo y modelo de escner utilizado, resolucin,
paciente, limitaciones de reproduccin etc.
Dublin Core y otros estndares
Dublin Core es probablemente el estndar de metadatos ms
extendido. Su nombre hace referencia a Dubln (Ohio, Estados
Unidos), ciudad que en 1995 alberg la primera reunin a nivel
mundial de muchos de los especialistas en metadatos y Web de
la poca.
Dublin Core describe material digital como videos, sonidos,
imgenes, textos y pginas web. Para ello utiliza
bsicamente XML, HTML y RDF. Adems, proporciona un
conjunto de convenciones simples y estandarizadas para
describir recursos de forma que se facilite su encuentro online.
Para la transmisin de datos, tiene asociado el protocolo OAI-
PMH.
Dublin Core est gestionado por la DCMI (Dublin Core
Metadata Iniciative), una organizacin que trata de fomentar la
adopcin de estndares y generar un foro abierto para el
desarrollo de vocabularios especializados en describir recursos,
que permitan sistemas de recuperacin ms inteligentes.
La siguiente tabla es una recopilacin no exhaustiva de algunos
de los ms importantes estndares para metadatos que se han
generado hasta el momento.
Recursos en general
Dublin Core (DCMES, DCMI Metadata Terms)
Obras de arte
CDWA (Categories for the Description of Works of Art)
CDWA Lite
VRA (Visual Resources Association)
Core Categories
Recursos bibliogrficos
MODS (Metadata Object Description Schema)
MARC21, UNIMARC, MARCXML
TEI (Text Encoding Initiative) Headers
Archivos y preservacin
EAD (The Encoded Archival Description)
OAIS (Reference Model for an Open Archival Information System)
PREMIS (Preservation Metadata: Implementation Strategies)
Recursos educativos
IMS
LOM (Learning Object Metadata)
CanCore
SCORM (Sharable Content Object Reference Model)
Publicacin
ONIX (ONline Information Exchange)
Derechos de autor
CopyrightMD
DOI (Digital Object Identifier)
ODRL (Open Digital Rights Language)
Recursos cientficos
CSDGM (Content Standard for Digital Geospatial Metadata)
Darwin Core
Multimedia
MPEG-7 Multimedia Content Description Interface
PBCore (The Public Broadcasting Metadata Dictionary)
Redes sociales y
personas
vCard
FOAF (Friend Of A Friend)
Informacin geogrfica
ISO-19115
FGDC (Federal Geographic Data Committee)
Libro electrnico
EPUB (Electronic Publication)
Imgenes mdicas
DICOM (Digital Imaging and Communication in
Medicine)
En definitiva, tal y como hemos comentado en otras ocasiones,
si ests interesado en este tema, no dudes en contactar con
nosotros para que te hagamos llegar ms enlaces y
documentacin adicional. Desde Classora
Technologies quedamos completamente a tu disposicin.

http://blog.classora.com/2013/02/28/metadatos-definicion-aplicaciones-y-estandares/

QUE ES SQL

Las sigla que se conoce como SQL corresponde a la expresin inglesa Structured
Query Language (entendida en espaol como Lenguaje
de Consulta Estructurado), la cual identifica a un tipo de lenguaje vinculado
con la gestin de bases de datos de carcter relacional que permite la
especificacin de distintas clases de operaciones entre stas. Gracias a la utilizacin
del lgebra y de clculos relacionales, el SQL brinda la posibilidad de realizar
consultas con el objetivo de recuperar informacin de las bases de datos de manera
sencilla.
El cientfico Edgar Frank Codd (1923-2003) fue quien propuso
un modelo relacional para las bases de datos y cre un sublenguaje para acceder a
los datos a partir del clculo de predicados. En base al trabajo
de Codd, IBM (International Business Machines) defini el lenguaje
conocido como Structured English Query Language (SEQUEL).
El SEQUEL se considera el antecesor de SQL, un lenguaje de cuarta generacin que
se estandariz en 1986. La versin ms primitiva de SQL, por lo tanto, fue la que
se bautiz como SQL-86 (tambin conocida como SQL1).
En esencia, el SQL es un lenguaje declarativo de alto nivel ya que, al manejar
conjuntos de registros y no registros individuales, ofrece una elevada productividad
en la codificacin y en la orientacin a objetos. Una sentencia de SQL puede
resultar equivalente a ms de un programa que emplee un lenguaje de bajo nivel.
Una base de datos, dicen los expertos, implica la coexistencia de mltiples tipos de
lenguajes. El denominado Data Definition Language (tambin conocido
como DDL) es aqul que permite modificar la estructura de los objetos
contemplados por la base de datos por medio de cuatro operaciones bsicas. SQL,
por su parte, es un lenguaje que permite manipular datos (Data Manipulation
Language o DML) que contribuye a la gestin de las bases de datos a travs de
consultas.
Cmo construir una base de datos eficiente?
Toda empresa que apunte a un futuro
brillante, con posibilidades de crecimiento y expansin, debe contar con una
base de datos, que ser diferente en cada caso, ajustndose a las necesidades
particulares de cada tipo de negocio, pero que deber ser confeccionada
cuidadosamente, con una estructura slida y configurable, abierta a potenciales
modificaciones sin que esto amenace su integridad.
Uno de los puntos bsicos a la hora de construir una base de datos es la
indexacin. Para entender este concepto, veamos brevemente un ejemplo
prctico de base: supongamos que una compaa desea almacenar la informacin
personal de sus clientes y hacer un seguimiento de sus transacciones; para ello, una
posibilidad consistira en tener una tabla para sus datos (nombre, apellido,
direccin de e-mail, etctera), otra para la descripcin de los productos (nombre
del artculo, precio, detalles) y una para las ventas. Antes de pasar a detallar qu
campos podran estar presentes en esta ltima tabla, cabe mencionar que en las
restantes falta un elemento indispensable para una buena organizacin:
una clave nica de identificacin.
Generalmente llamada ID, suele ser un nmero entero (sin decimales) y positivo
que la base de datos asigna automticamente a cada nuevo registro (en este caso,
cada nuevo cliente o producto) y que nunca se repite, de modo que lo identifique
desde su nacimiento (momento de creacin) hasta su muerte (cuando se elimine).
De esta forma, si tomamos por ejemplo el registro 103 Pablo Bernal
pbernal@proveedor.com, notamos que su ID es 103. Cul es su utilidad? En
pocas palabras, buscar un cliente cuyo nombre sea n, su apellido, a, y su e-mail, e,
toma mucho ms tiempo que pedir a la base que nos devuelva todos los datos del
cliente con ID 103. Si bien es probable que en la primera operacin
especifiquemos toda suinformacin, una vez que el programa lo encuentre,
podremos valernos de este nmero para el resto de las consultas.
Retomando el ejemplo, dado que las tablas de clientes y productos tendran su ID,
relacionarlas con la de ventas resulta muy sencillo; sus campos podran ser: id de
transaccin, id de cliente, id de producto, fecha, observaciones. Sin entrar en
tecnicismos, es claro que cada venta contiene mucha ms informacin de la que se
aprecia a simple vista, ya que, por ejemplo, el id de un cliente nos sirve para
acceder a todos sus datos en la tabla correspondiente. En la puesta en prctica,
sobra decir que la complejidad puede ser muchsimo mayor, pero es importante
comenzar por lo bsico para entender la importancia de relaciones slidas y
eficientes.


Lee todo en: Definicin de SQL - Qu es, Significado y
Concepto http://definicion.de/sql/#ixzz2xe1XV0Au

http://definicion.de/sql/




SQL
El lenguaje de consulta estructurado o SQL (por sus siglas en ingls Structured Query
Language) es un lenguaje declarativo de acceso abases de datos relacionales que permite
especificar diversos tipos de operaciones en ellas. Una de sus caractersticas es el manejo
del lgebra y el clculo relacional que permiten efectuar consultas con el fin de recuperar de forma
sencilla informacin de inters de bases de datos, as como hacer cambios en ellas.
http://es.wikipedia.org/wiki/SQL