You are on page 1of 9

Unidad 4: Desarrollo con XML

XML (eXtensible Markup Lenguaje, Lenguajes de Marcado eXtensible) es un sistema


gramatical para la construcción de lenguajes de marcación personalizados. Cada lenguaje
personalizado depende de su gramática subyacente.
Basado en la misma tecnología de HTML.
Si una etiqueta identifica datos, estos datos estarán disponibles para otras tareas.
Un programa puede diseñarse para extraer sólo la información que se necesite, unir los
datos a los de otra fuente y colocar la combinación resultante en otro formulario para otros
propósitos.
XML es muchísimo más exigente que HTML. Por ejemplo, XML es sensible a mayúsculas.
Un esquema define el lenguaje de marcado personalizado que se crea con XML, tanto si se
escribe como DTD o con el lenguaje esquematizado de XML. El esquema especifica las tareas
que puede usar en sus documentos y qué etiquetas y atributos pueden contener.
XSLT (Lenguaje de transformación de hojas de estilo extensibles) permite extraer y
transformar la información como se necesite. Por ejemplo se puede usar para convertir XML
en HTML.
XPath es un sistema de identificación de las diferentes partes del documento.
XSL-FO y CSS (Cascading Style Sheets, hojas de estilo en cascada) son sistemas que se usan
para formatear documentos.

4.1 Características del lenguaje.


XML es un formato basado en texto, específicamente diseñado para almacenar y transmitir
datos. Un documento XML se compone de elementos XML, cada uno de los cuales consta
de una etiqueta de inicio, de una etiqueta de fin y de los datos comprendidos entre ambas
etiquetas. Al igual que los documentos HTML, un documento XML contiene texto anotado
por etiquetas. Sin embargo, a diferencia de HTML, XML admite un conjunto ilimitado de
etiquetas, no para indicar el aspecto que debe tener algo, sino lo que significa. Por ejemplo:
un elemento XML puede estar etiquetado como precio, número de pedido o nombre. El
autor del documento es quien decide qué tipo de datos va a utilizar y qué etiquetas son las
más adecuadas.
Los documentos XML son fáciles de crear. En este ejemplo se utiliza XML para describir un
parte meteorológico. Este documento se puede guardar con una extensión de XML, por
ejemplo Tiempo.xml.
<reporte-clima>
<fecha>March 25, 1998</fecha>
<hora>08:00</hora>
<area>
<departamento>MVD</ departamento >
<ciudad>Montevideo</ciudad>
<pais>Uruguay</pais>
</area>
<medidas>
<cielo>parcialmente nublado </cielo>
<temperatura>16</temperatura>
<viento>
<direccion>SO</direccion>
<velocidad>16</velocidad>
</viento>
<h-indice>51</h-indice>
<humedad>87</humedad>
<visibilidad>10</visibilidad>
<uv-indice>1</uv-indice>
</medidas>
</reporte-clima>
En lugar de describir el orden y la disposición de la presentación de los datos, las etiquetas
indican qué significa cada elemento de datos (si es un elemento <fecha>, un elemento
<area>, etc.). Cualquier receptor de estos datos puede descodificar el documento y
utilizarlo para sus propios fines.
Estándares abiertos
XML se basa en una tecnología desarrollada a partir de estándares probados y optimizada
para la Web. La iniciativa XML consta de un conjunto de estándares relacionados entre sí:
XML (Extensible Markup Language). Es una recomendación, que significa que el estándar es
estable y que los desarrolladores de Web y de herramientas pueden adoptarlo plenamente.
Namespaces. En XML es una recomendación que describe la sintaxis y la compatibilidad de
los espacios de nombres para los intérpretes de XML.
DOM (Document Object Model). Es una recomendación que ofrece un estándar para el
acceso mediante programación a los datos estructurados (a través de scripts), de modo que
los desarrolladores puedan interactuar de forma coherente con los datos basados en XML
y computarlos.
XSL (Extensible Stylesheet Language). XLS es la cara de presentación del XML. Este debe
representar de forma independiente a la plataforma utilizada la información existente en
los documentos XML.
XML Linking Language. Es un lenguaje que ofrece vínculos en XML parecidos a los de HTML,
pero más potentes. Los vínculos pueden tener varias direcciones y pueden existir en el nivel
de los objetos, no sólo en el nivel de las páginas.
Características Principales
Extensible
Dentro de XML se pueden definir un conjunto ilimitado de etiquetas. Mientras que las
etiquetas de HTML pueden utilizarse para desplegar una palabra en negrita o itálicas, el
XML proporciona un marco de trabajo para etiquetado de datos estructurados. Un
elemento de XML puede declarar que sus datos asociados sean el precio de venta al público,
un impuesto de venta, el título de un libro o cualquier otro elemento de datos deseado. Al
irse adoptando las etiquetas XML a lo largo de una intranet de alguna organización y a lo
ancho de la Internet, habrá una correspondiente habilidad para buscar y manipular datos
sin importar las aplicaciones dentro de las cuales se encuentre.
Representación estructural de los datos.
El XML proporciona una representación estructural de los datos que ha probado ser
ampliamente implementable y fácil de distribuir. Las implementaciones industriales en la
comunidad del SGML y en otros lugares han demostrado que la calidad intrínseca y la
fortaleza industrial del formato de datos con estructura de árbol del XML. El XML es un
subconjunto del SGML que está optimizado para su transmisión por Web; al estar definido
por el Consorcio de la World Wide Web, asegura que los datos estructurados serán
uniformes e independientes de aplicaciones o compañías. Esta interoperabilidad resultante
está dando el impuso de inicio a una nueva generación de aplicaciones de Web para
comercio electrónico [MSDN en línea. Introducción al XML].
El lenguaje XML proporciona un estándar de datos que puede codificar el contenido, la
semántica y el esquema de una amplia variedad de casos que van desde simples a
complejos, por ejemplo XML puede ser utilizado para marcar lo siguiente:
Un documento ordinario.
Un registro estructurado, tal como un registro de citas u órdenes de compra.
Un registro de datos, tal como el resultado de una consulta.
Metacontenido acerca de un sitio Web, tal como un Formato de Definición de Canal
(Channel Definition Format, CDF).
Presentaciones gráficas, tales como la interfase de usuario de una aplicación.
Una vez que los datos estén en el escritorio del cliente, pueden ser manipulados, editados,
y presentados de una gran variedad de maneras, sin viajes de regreso al servidor. Los
servidores se pueden convertir ahora en más escalables, debido a las menores cargas de
cálculo y ancho de banda. Además, dado que los datos son intercambiados en el formato
XML, pueden ser fácilmente mezclados desde diferentes fuentes.
Los datos son separados de la presentación y el proceso.
El poder y la belleza del XML es que mantiene la separación entre la interfase de usuario y
los datos estructurados. El HTML especifica como visualizar datos en un navegador, en
cambio XML define el contenido. XML solo utiliza etiquetas para describir los datos, tales
como el nombre de la ciudad, temperatura y presión barométrica. Para presentar los datos
en un navegador XML, este utiliza hojas de estilo tales como el Lenguaje de Estilo Extensible
(XSL) y las Hojas de Estilo en Cascada (CSS). El XML separa los datos de la presentación y el
proceso, permitiendo desplegar y procesar los datos tal como usted desee, al aplicar
diferentes hojas de estilo y aplicaciones.
Esta separación de datos de la presentación permite una integración de datos perfecta de
fuentes diversas. La información de clientes, ordenes de compra, resultados de
investigaciones, pagos de facturas, registros médicos, datos de catálogo y cualquier otra
información se puede convertir a XML, permitiendo a los datos ser intercambiados en línea
tan fácilmente como las páginas de HTML despliegan datos hoy. Los datos codificados en
XML pueden ser transmitidos sobre la Web hasta el escritorio. No es necesario retroajustar
información en formatos propietarios almacenados en bases de datos o documentos de
mainframes y, debido a que se usa el HTTP para transmitir documentos XML sobre la red,
no se necesitan cambios para esta función. Los documentos XML son fáciles de crear; si está
familiarizado con el HTML, puede aprender rápidamente a crear uno.
Conversión de los datos XML en autodescriptivos.

Los datos codificados en XML son autodescriptivos, pues las etiquetas descriptivas están
entremezcladas con los datos. El formato abierto y flexible utilizado por XML permite su uso
en cualquier lugar donde sea necesario intercambiar y transferir información. Dado que el
XML es independiente del HTML, se puede insertar código XML en documentos HTML. El
W3C ha definido un formato mediante el cual se pueden encapsular en páginas HTML los
datos basados en XML. Al incrustar datos XML en una página HTML, se pueden generar
varias vistas a partir de los datos entregados, utilizando los datos semánticos que contiene
el XML.
4.2 Lenguaje de Marcado Generalizado.

Generalized Markup Language (GML) (Lenguaje de marcado generalizado en español) es un


conjunto de macros que aplican la base de las etiquetas de marcas para el SCRIPT un
formateador de texto de la IBM, "SCRIPT". SCRIPT es el componente principal de IBM
Document Composition Facility (DCF). Un conjunto de etiquetas de arranque en GML se
proporciona en el producto DCF.
GML simplifica la descripción de un documento en términos de su formato, estructura de
organización, piezas contentas y su relación, y otras características. El margen de beneficio
de GML (o las etiquetas) describe las piezas tales como los capítulos, las secciones
importantes, y las secciones menos importantes (especificando niveles del título), párrafos,
listas, tablas, y así sucesivamente.

GML libera a creador del documento de preocupaciones específicas del formato del
documento tales como especificación de la fuente, línea espaciamiento, y disposición de
página requerida por Script. Usando GML, un documento está marcado para arriba con las
etiquetas que definen cuáles es el texto, en términos de párrafos, los jefes, listas, tablas, y
así sucesivamente. El documento se puede entonces ajustar a formato automáticamente
para los varios dispositivos simplemente especificando un perfil para el dispositivo.

4.3 Lenguaje Extensible de Marcado de Hipertexto.


XHTML, Siglas del inglés eXtensible HyperText Markup Language. XHTML es básicamente
HTML expresado como XML válido. Es más estricto a nivel técnico, pero esto permite que
posteriormente sea más fácil al hacer cambios o buscar errores entre otros. En su versión
1.0, XHTML es solamente la versión XML de HTML, por lo que tiene, básicamente, las
mismas funcionalidades, pero cumple las especificaciones, más estrictas, de XML. Su
objetivo es avanzar en el proyecto del World Wide Web Consortium de lograr una web
semántica, donde la información, y la forma de presentarla estén claramente separadas. La
versión 1.1 es similar, pero parte a la especificación en módulos. En sucesivas versiones la
W3C planea romper con los tags clásicos traídos de HTML.

Ventajas respecto del HTML

Las principales ventajas del XHTML sobre el HTML son:


Se pueden incorporar elementos de distintos espacios de nombres XML (como MathML y
Scalable Vector Graphics).
Un navegador no necesita implementar heurísticas para detectar qué quiso poner el autor,
por lo que el parser puede ser mucho más sencillo.
Como es XML se pueden utilizar fácilmente herramientas creadas para procesamiento de
documentos XL genéricos (editores, XSLT, etc.).

4.4 Definición de Tipo de Documento


Una definición de tipo de documento o DTD (siglas en inglés de document type definition)
es una descripción de estructura y sintaxis de un documento XML o SGML. Su función básica
es la descripción de la estructura de datos, para usar una estructura común y mantener la
consistencia entre todos los documentos que utilicen la misma DTD. De esta forma, dichos
documentos pueden ser validados, conocen la estructura de los elementos y la descripción
de los datos que trae consigo cada documento, y pueden además compartir la misma
descripción y forma de validación dentro de un grupo de trabajo que usa el mismo tipo de
información.

4.5 XSL y CSS

CSS: El nombre hojas de estilo en cascada viene del inglés Cascading Style Sheets, del que
toma sus siglas. CSS es un lenguaje usado para definir la presentación de un documento
estructurado escrito en HTML o XML[2] (y por extensión en XHTML). El W3C (World Wide
Web Consortium) es el encargado de formular la especificación de las hojas de estilo que
servirán de estándar para los agentes de usuario o navegadores.
La idea que se encuentra detrás del desarrollo de CSS es separar la estructura de un
documento de su presentación.

La información de estilo puede ser adjuntada como un documento separado o en el mismo


documento HTML. En este último caso podrían definirse estilos generales en la cabecera
del documento o en cada etiqueta particular mediante el atributo "<style>".

XSL: Es para XML lo que CSS es para HTML. Es un acrónimo en inglés de EXtensible Stylesheet
Language (Lenguaje de hojas de estilo ampliable). Es un lenguaje diseñado para presentar
datos XML en un formato legible. XSL consta realmente de dos partes:
XSLT: un lenguaje para transformar documentos XML
XPath: un lenguaje para navegar en documentos XML
XSLT significa Transformaciones XSL y es la parte más importante de XSL.
XSLT transforma un documento XML en otro documento XML, en una salida XHTML o en
texto sencillo. Esto se suele hacer transformando cada elemento XML en un elemento
HTML. El uso de XSL es imprescindible, ya que las etiquetas XML han sido definidas por el
usuario y, por tanto, los navegadores no saben cómo interpretarlas o representarlas. Su
significado se ha diseñado para ser entendido por las personas, no por las máquinas.
XSLT también puede realizar las siguientes operaciones en un árbol XML:
añadir y eliminar elementos
añadir y eliminar atributos
reorganizar y ordenar elementos
ocultar o mostrar determinados elementos
encontrar o seleccionar elementos específicos

4.6 API simple para XML y Modelo en Objetos para la Representación de Documentos.

Una interfaz de programación de aplicaciones (API) es una especificación destinado a ser


utilizado como una interfaz de componentes de software para comunicarse entre sí. Una
API puede incluir especificaciones para las rutinas, estructuras de datos, clases de objetos y
variables. Una especificación de API puede tomar muchas formas, incluyendo una norma
internacional como la documentación de POSIX o el vendedor como el API de Microsoft
Windows, o las bibliotecas de un lenguaje de programación, por ejemplo, Biblioteca de
plantillas estándar en C + + o Java API. Una API difiere de una interfaz de aplicación binaria
(ABI) en la que el primero es de código abierto basado mientras que el segundo es una
interfaz binaria. Por ejemplo, es una API POSIX, mientras que la base estándar de Linux es
un ABI.

4. 7 Creación y Consumo de servicios web XML.


Los servicios Web XML son un conjunto de aplicaciones o de tecnologías con capacidad para
interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre sí con el
objetivo de ofrecer unos servicios. Los proveedores ofrecen sus servicios como
procedimientos remotos y los usuarios solicitan un servicio llamando a estos
procedimientos a través de la Web, por lo que estos servicios deben estar alojados en un
servidor Web. Los servicios Web XML permiten el manejo distribuido de componentes,
estos permiten tomar ventaja de la infraestructura de Internet para la distribución de
funcionalidad y paquetes de datos. Las principales características de los servicios Web XML
son: Están basados en protocolos estándar para la Web. Los servicios Web XML realizan las
peticiones y proporcionan las respuestas utilizando protocolos estándar de la Web, como
los son HTTP (Hyper Text Transfer Protocol), XML (Extensible Markup Language), y SOAP
(Simple Object Access Protocol), toda plataforma que maneje dichos protocolos, podrá
aprovechar la funcionalidad de los servicios Web XML. Comunicación de aplicación a
aplicación basada en Internet.

You might also like