Bases de Datos

Introduccin
Las bases de datos se han constituido como una de las herramientas ms

ampliamente difundidas en la actual sociedad de la informacin, utilizadas
como fuentes secundarias en cuanto recuperacin y almacenamiento de
informacin en todos los campos ha nivel cientfico, social, econmico, poltico
y cultural. A partir de este trabajo queremos llegar a presentar una panormica
histrica de las bases de datos sistematizadas y su evolucin a travs de las
dcadas, las cuales han sido utilizadas especialmente como fuentes de
consulta y de produccin de conocimiento por investigadores, cientficos y
acadmicos de todas las reas, que han encontrado en estas, una herramienta
importante para el desarrollo del conocimiento. De esta manera la Ciencia de la
Informacin, ha desarrollado una produccin cientfica importante a nivel
mundial, la cual ha utilizado las bases de datos, como repositorio de
almacenamiento y difusin de informacin. Por lo anterior haremos un nfasis
en mostrar una vista histrica de las bases de datos y los principales
distribuidores en nuestra rea del saber, de tal manera que sirva como
referente de consulta de estudiantes, profesores e interesados en el tema, que
conozcan en contexto y el desarrollo de estas fuentes, para concienciar acerca
de las herramientas que se encuentran disponibles para el uso y aportes que
podemos hacer en nuestra rea del saber.
Definicin de base de datos
Una base de datos es un conjunto de datos que pertenecen al mismo contexto

almacenados sistemticamente para su uso posterior. En este sentido, una
biblioteca puede considerarse una base de datos compuesta en su mayora por
documentos y textos impresos en papel e indexados para su consulta.
Breve historia de los sistemas de bases de datos
El uso de sistemas de bases de datos automatizadas, se desarroll a partir de

la necesidad de almacenar grandes cantidades de datos, para su posterior
consulta, producidas por las nuevas industrias que creaban gran cantidad de
informacin.
Herman Hollerit (1860-1929) fue denominado el primer ingeniero estadstico de
la historia, ya que invento una computadora llamada Mquina Automtica
Perforadora de Tarjetas. Para hacer el censo de Estados Unidos en 1880 se
tardaron 7 aos para obtener resultados, pero Herman Hollerit en 1884 creo la
mquina perforadora, con la cual, en el censo de 1890 dio resultados en 2 aos
y medio, donde se poda obtener datos importantes como nmero de
nacimientos, poblacin infantil y nmero de familias. La mquina us sistemas
mecnicos para procesar la informacin de las tarjetas y para tabular los
resultados.
A diferencia con la mquina de Babbage, que utilizaba unas tarjetas similares,

estas se centraban en dar instrucciones a la mquina. En el invento de Herman
Hollerit, cada perforacin en las tarjetas representaba un nmero y cada dos
perforaciones una letra, cada tarjeta tena capacidad para 80 variables. La
mquina estaba compuesta por una perforadora automtica y una lectora, la
cual por medio de un sistema elctrico lea los orificios de las tarjetas, esta
tena unas agujas que buscaban los orificios y al tocar el plano inferior de
mercurio enviaba por medio del contacto
Bases de datos:
La manera ms fcil de explicar que es una base de datos es al compararla con

un almacn, pues en ella se guardan diferentes tipos de informacin
dependiendo la utilizacin que se le vaya dar, puede ser informacin de
nmina, inventario, un listado de estudiantes etc.
Lnea de tiempo:
La antigedad:
En tiempos muy remotos las civilizaciones ya almacenaban informacin el

ejemplo ms claro son las bibliotecas, se almacenaba gran cantidad de datos y
an existen que sera de nosotros si a nuestros antepasados no se les hubiera
ocurrido guardar informacin ya sea sobre medicina o simplemente la historia
del mundo.
1884:
Este ao se dio origen a la maquina automtica de perforacin de tarjetas
inventada por Herman Hollerith (29 de febrero de 1860 17 de noviembre de
1929) la cual fue utilizada para el censo de los Estado Unidos mejorando el
proceso de terminacin de siete aos a solo dos aos y medio
1950:
La creacin de las cintas magnticas sus principios se la atribuyen al ingls
Oberlin Smith, con este mecanismo se empez a automatizar la informacin
referente a nmina.
En este lapso de tiempo el origen de las cintas magnticas, las cuales sirvieron
para suplir las necesidades de informacin de las nuevas industrias. Por medio
de este mecanismo se empez a automatizar la informacin de las nminas,
como por ejemplo el aumento de salario. Consista en leer una cinta o ms y
pasar los datos a otra, y tambin se podan pasar desde las tarjetas perforadas.
Simulando un sistema de Backup, que consiste en hacer una copia de
seguridad o copia de respaldo, para guardar en un medio extrable la
informacin importante. La nueva cinta a la que se transfiere la informacin
pasa a ser una cinta maestra. Estas cintas solo se podan leer secuencial y
ordenadamente.
Utiliza un sistema de lectura secuencial y ordenada es decir si se desea buscar

los datos de "Pablito" se debe avanzar la cinta hasta llegar a dicho punto y si
desea empezar a leer la informacin desde 0 debe devolver la cinta hasta al
principio.
1960:
base de datos informatizada se inici en la dcada de 1960, cuando el uso de
las computadoras se convirti en una opcin ms rentable para las
organizaciones privadas. Haba dos modelos de base de datos ms populares
en esta dcada: un modelo de red llamado CODASYL y un modelo jerrquico
llamado IMS. Un sistema de base de datos que demostr ser un xito comercial
fue el sistema SABRE que fue utilizado por IBM para ayudar a American
Airlines, la gestin de sus datos de reservas.
El uso de los discos en ese momento fue un adelanto muy efectivo, ya que por
medio de este soporte se poda consultar la informacin directamente, esto
ayudo a ahorrar tiempo. No era necesario saber exactamente donde estaban
los datos en los discos, ya que en milisegundos era recuperable la informacin.
A diferencia de las cintas magnticas, ya no era necesaria la secuencialidad, y
este tipo de soporte empieza a ser ambiguo.
Los discos dieron inicio a las Bases de Datos, de red y jerrquicas, pues los
programadores con su habilidad de manipulacin de estructuras junto con las
ventajas de los discos era posible guardar estructuras de datos como listas y
rboles.
1970:
Edgar Frank Codd (23 de agosto de 1923 18 de abril de 2003), en un artculo
"Un modelo relacional de datos para grandes bancos de datos compartidos" ("A
Relational Model of Data for Large Shared Data Banks") en 1970, defini el
modelo relacional y public una serie de reglas para la evaluacin de
administradores de sistemas de datos relacionales y as nacieron las bases de
datos relacionales.
Dos de los principales prototipos de relacin del sistema de bases de datos

fueron creadas entre los aos 1974 y 1977, y fueron los de Ingres, que se
desarroll en la UBC, y del sistema de R, creado en IBM en San Jos. Ingres
utiliza un lenguaje de consulta conocido como QUEL, y condujo a la creacin de
sistemas como Ingres Corporacin, MS SQL Server, Sybase, PACE Wang, y
Britton Lee-. Por otro lado, el Sistema R utiliza el lenguaje de consulta secuela,
y que ha contribuido al desarrollo de SQL / DS, DB2, Allbase, Oracle y SQL Non-
Stop. Fue tambin en esta dcada que Relational Database Management
System, o RDBMS, se convirti en un trmino reconocido.
1976:
Un modelo de base de datos nueva llamada Entidad-Relacin, o ER. Este
modelo ha permitido a los diseadores centrarse en la aplicacin de los datos,
en lugar de estructura de la tabla lgica.
1980:
Lenguaje de consulta estructurado o SQL, se convirti en el lenguaje de
consulta estndar.
Los sistemas de bases de datos relacionales se convirtieron en un xito
comercial como el rpido aumento de las ventas de ordenadores de estmulo al
mercado de bases de datos, y esto provoc un importante descenso en la
popularidad de las redes y los modelos jerrquicos de bases de datos. DB2 se
convirti en el producto insignia de la base de datos de IBM, y la introduccin
de la PC de IBM como resultado en los establecimientos de muchas empresas
de bases de datos nuevas y el desarrollo de productos como Paradox, 5000
RBASE, RIM, Dbase III y IV, OS / 2 de base de datos, y Watcom SQL. Tambin se
da inicio a las bases de datos orientadas a objetos.
1990:
Despus de una sacudida industria de base de datos, la mayora de las
empresas supervivientes vende productos complejos de bases de datos a
precios elevados. Alrededor de este tiempo, las nuevas herramientas de cliente
para el desarrollo de aplicaciones fueron liberadas, y stos incluyen el
desarrollador de Oracle, PowerBuilder, Visual Basic, etc. Una serie de
herramientas para la productividad personal, como ODBC y Excel / Access,
tambin se desarrollaron.
la llegada de la Internet condujo a un crecimiento exponencial de la industria
de la base de datos. Media de usuarios de escritorio comenz a utilizar
sistemas cliente-servidor de base de datos para acceder a los sistemas
informticos.
Para la toma de decisiones se crea el lenguaje SQL, que es un lenguaje

programado para consultas. El programa de alto nivel SQL es un lenguaje de
consulta estructurado que analiza grandes cantidades de informacin el cual
permite especificar diversos tipos de operaciones frente a la misma
informacin, a diferencia de las bases de datos de los 80 que eran diseadas
para las aplicaciones de procesamiento de transacciones. Los grandes
distribuidores de bases de datos incursionaron con la venta de bases de datos
orientada a objetos.
Aunque la industria de Internet experiment un descenso en la dcada de

2000, las aplicaciones de base de datos continuarn creciendo. Las nuevas
aplicaciones interactivas se han desarrollado para PDAs, las transacciones de
punto de venta, y la consolidacin de los proveedores. En la actualidad, las tres
empresas lderes de base de datos en el mundo occidental son Microsoft, IBM y
Oracle.
Principios dcada de los 90
Para la toma de decisiones se crea el lenguaje SQL, que es un lenguaje

programado para consultas. El programa de alto nivel SQL es un lenguaje de
consulta estructurado que analiza grandes cantidades de informacin el cual
permite especificar diversos tipos de operaciones frente a la misma
informacin, a diferencia de las bases de datos de los 80 que eran diseadas
para las aplicaciones de procesamiento de transacciones. Los grandes
distribuidores de bases de datos incursionaron con la venta de bases de datos
orientada a objetos.
Finales de la dcada de los 90
El boom de esta dcada fue la aparicin de la WWW Word Wide Web ya que
por ste medio se facilitaba la consulta de las bases de datos. Actualmente
tienen una amplia capacidad de almacenamiento de informacin, tambin una
de las ventajas es el servicio de siete das a la semana las veinticuatro horas
del da, sin interrupciones a menos que haya planificaciones de mantenimiento
de las plataformas o el software.
Siglo XXI
En la actualidad existe gran cantidad de alternativas en lnea que permiten

hacer bsquedas orientadas a necesidades especificas de los usuarios, una de
las tendencias ms amplias son las bases de datos que cumplan con el
protocolo Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)
los cuales permiten el almacenamiento de gran cantidad de artculos que
permiten una mayor visibilidad y acceso en el mbito cientfico y general.
Cuatro generaciones han manejado datos de computacin: Sistema de

Administracin de Archivos, Sistemas de administracin de Bases de Datos
Jerrquicos, Sistemas de Administracin de Bases de Datos por Relacin,
Sistemas de Administracin Orientada a Objetos de Bases de Datos. Al principio
los lenguajes y las instrucciones de mquina eren similares, lo que produca
un modelo de programacin orientada a procesos. En un principio los
programas ejecutaban las tareas y nunca las escriban en un dispositivo de
almacenamiento. Sin embargo, los programadores se dieron cuenta del valor
de registrar los resultados. La grabacin aument con la aparicin del
almacenamiento en discos magnticos rotatorios.
Sistema de procesamiento en Bases de datos.

Sistemas Centralizados: Es aquel que utiliza los recurso de una sola
computadora, es decir, su memoria, CPU, discos y perifricos.
Respecto al hardware podemos decir que se trata de un computador de gran
potencia, con terminales alfanumricos directamente conectados, una
computadora tipo desktop, donde se alberga las unidades de procesamientos
de los dems componentes.
Ventajas:
Un punto de control. Mayor control de seguridad y proteccin de la

informacin en un solo punto.
Fcil de mantener. Empresa con muchos cambios de requerimientos.
Fcil despliegue de los cambios. Soporte en un solo punto.
Tomas de decisiones. Esta arquitectura es primordial en las tomas de
decisiones centralizadas, en otro punto llamado de lgica de negocio de
la empresa centralizada.
Desventajas:
Interfaz de usuario poco llamativo. Por el uso de la red amplia, se

evita tener pantalla con imgenes. Debe controlar el uso de ancho de
banda de la red.
Velocidad de repuestas lenta, dependiendo la conexin de la red a la
central.
Debe haber mecanismo de respaldo o copia del sistema centralizada
en caso de contingencia muy estricta, muere el sistema central,
muere el sistema a nivel general.
Crecimiento depende de los equipos que lo soporta. Si la empresa
crece en forma exponencial por ejemplo, el equipo debe ser
cambiado al no tener estos estudios de crecimiento o la actualizacin
de equipo debe ser constante.
Sistema cliente servidor: La arquitectura cliente-servidor es un modelo de

aplicacin distribuida en el que las tareas se reparten entre los proveedores de
recursos o servicios, llamados servidores, y los demandantes, llamados
clientes. Un cliente realiza peticiones a otro programa, el servidor, quien le da
respuesta. Esta idea tambin se puede aplicar a programas que se ejecutan
sobre una sola computadora, aunque es ms ventajosa en un sistema
operativo multiusuario distribuido a travs de una red de computadoras.
Algunos ejemplos de aplicaciones computacionales que usen el modelo cliente-
servidor son el Correo electrnico, un Servidor de impresin y la World Wide
Web
Ventajas:
Centralizacin del control: los accesos, recursos y la integrillaad de los

datos son controlados por el servidor de forma que un programa cliente
defectuoso o no autorizado no pueda daar el sistema. Esta
centralizacin tambin facilita la tarea de poner al da datos u otros
recursos (mejor que en las redes P2P)..
Escalabilidad: se puede aumentar la capacidad de clientes y servidores
por separado. Cualquier elemento puede ser aumentado (o mejorado) en
cualquier momento, o se pueden aadir nuevos nodos a la red (clientes
y/o servidores).
Fcil mantenimiento: al estar distribuidas las funciones y
responsabilidades entre varios ordenadores independientes, es posible
reemplazar, reparar, actualizar, o incluso trasladar un servidor, mientras
que sus clientes no se vern afectados por ese cambio (o se afectarn
mnimamente). Esta independencia de los cambios tambin se conoce
como encapsulacin.
Existen tecnologas, suficientemente desarrolladas, diseadas para el
paradigma de C/S que aseguran la seguridad en las transacciones, la
amigabilidad de la interfaz, y la facilidad de empleo.
Desventajas:
La congestin del trfico ha sido siempre un problema en el paradigma
de C/S. Cuando una gran cantidad de clientes envan peticiones
simultneas al mismo servidor, puede ser que cause muchos problemas
para ste (a mayor nmero de clientes, ms problemas para el servidor).
Al contrario, en las redes P2P como cada nodo en la red hace tambin de
servidor, cuanto ms nodos hay, mejor es el ancho de banda que se
tiene.
El paradigma de C/S clsico no tiene la robustez de una red P2P. Cuando
un servidor est cado, las peticiones de los clientes no pueden ser
satisfechas. En la mayor parte de redes P2P, los recursos estn
generalmente distribuidos en varios nodos de la red. Aunque algunos
salgan o abandonen la descarga; otros pueden todava acabar de
descargar consiguiendo datos del resto de los nodos en la red.
El software y el hardware de un servidor son generalmente muy
determinantes. Un hardware regular de un ordenador personal puede no
poder servir a cierta cantidad de clientes. Normalmente se necesita
software y hardware especfico, sobre todo en el lado del servidor, para
satisfacer el trabajo. Por supuesto, esto aumentar el coste.
El cliente no dispone de los recursos que puedan existir en el servidor.
Por ejemplo, si la aplicacin es una Web, no podemos escribir en el disco
duro del cliente o imprimir directamente sobre las impresoras sin sacar
antes la ventana previa de impresin de los navegadores.
Sistemas distribuidos:
Un sistema distribuido se define como una coleccin de computadoras
separadas fsicamente y conectadas entre s por una red de comunicaciones;
cada mquina posee sus componentes de hardware y software que el
programador percibe como un solo sistema (no necesita saber qu cosas estn
en qu mquinas). El programador accede a los componentes de software
(objetos) remotos, de la misma manera en que accedera a componentes
locales, en un grupo de computadoras que usan un middleware entre los que
destacan (RPC) y SOAP para conseguir un objetivo.
Los sistemas distribuidos deben ser muy confiables, ya que si un componente
del sistema se descompone otro componente debe ser capaz de reemplazarlo.
Esto se denomina tolerancia a fallos.
El tamao de un sistema distribuido puede ser muy variado, ya sean decenas
de hosts (red de rea local), centenas de hosts (red de rea metropolitana), o
miles, o millones de hosts (Internet); esto se denomina escalabilidad.
Caractersticas:
Para cada uno de los usuarios debe ser similar al trabajo en el Sistema
Centralizado.
Seguridad interna en el sistema distribuido.
Se ejecuta en mltiples computadoras.
Tiene varias copias del mismo sistema operativo o de diferentes
sistemas operativos que proveen los mismos servicios.
Entorno de trabajo cmodo.
Dependiente de redes (LAN, MAN, WAN, etc.).
Compatibilidad entre los dispositivos conectados.
Transparencia (el uso de mltiples procesadores y el acceso remoto debe
ser invisible).2
Interaccin entre los equipos.
Diseo de software compatible con varios usuarios y sistemas
operativos.
Ventajas:
Economa, pues es mucho ms barato, aadir servidores y clientes

cuando se requiere aumentar la potencia de procesamiento.
El trabajo en conjunto. Por ejemplo: en una fbrica de ensamblado, los
robots tienen sus CPUs diferentes y realizan acciones en conjunto,
dirigidos por un sistema distribuido.
Tienen una mayor confiabilidad. Al estar distribuida la carga de trabajo
en muchas mquinas la falla de una de ellas no afecta a las dems, el
sistema sobrevive como un todo.
Capacidad de crecimiento incremental. Se puede aadir procesadores al
sistema incrementando su potencia en forma gradual segn sus
necesidades.
Se pueden compartir recursos, como programas y perifricos, muy
costosos. Ejemplo: Impresora Lser, dispositivos de almacenamiento
masivo, etc.
Al compartir recursos, satisfacen las necesidades de muchos usuarios a
la vez. Ejemplo: Sistemas de reservas de aerolneas.
Se logra una mejor comunicacin entre las personas. Ejemplo: el correo
electrnico.
Tienen mayor flexibilidad, la carga de trabajo se puede distribuir entre
diferentes ordenadores.
Desventajas:
El principal problema es el software, es el diseo, implantacin y uso del
software distribuido, pues presenta numerosos inconvenientes. Los principales
interrogantes son los siguientes:
Qu tipo de S. O., lenguaje de programacin y aplicaciones son

adecuados para estos sistemas?.
Cunto deben saber los usuarios de la distribucin?.
Qu tanto debe hacer el sistema y qu tanto deben hacer los usuarios?.
La respuesta a estos interrogantes no es uniforme entre los
especialistas, pues existe una gran diversidad de criterios y de
interpretaciones al respecto.
Otro problema tiene que ver con las redes de comunicacin. Por ejemplo:
-Perdida de mensajes, saturacin en el trfico, etc.
Un problema que puede surgir al compartir datos es la seguridad de los
mismos.
En general se considera que las ventajas superan a las desventajas, si
estas ltimas se administran seriamente.
Sistema en Grilla:
Sistema en grilla, es una tecnologa que sigue el paradigma de computacin
distribuida, enlazando un nmero indeterminado de dispositivos heterogneos,
integrndolos a una red (o grilla) para que estos puedan ofrecer su potencia
alfanumrica y espacio de almacenamiento a un usuario o cliente final. Los
equipos que formen parte de la "grilla" distribuyen la carga de procesos para
disminuir drsticamente los tiempos de clculo, sin embargo, a diferencia de
los sistemas computacionales distribuidos tradicionales, los equipos puede
estar separados geogrficamente, ofreciendo una arquitectura computacional
que simula ser un nico sper computador cuyos recursos son prcticamente
ilimitados.
La computacin en grilla ofrece alto poder de clculo, cuya aplicacin se ha
visto limitada a temas de ndole cientfico, sin embargo, se espera que esta
tecnologa se ofrezca al pblico general.
Caractersticas:
El sistema en grilla trata de reunir conceptos, dentro de todas las tecnologas
de la Informacin disponibles, como sistemas operativos distribuidos,
programacin multiprocesador, redes de computadores, computacin paralela,
seguridad de la informacin, bases de datos, entre otras.
El sistema en grilla va ms all de compartir ciclos de CPU para resolver
clculos complejos, sino que ms bien el concepto se centra en crear una
infraestructura de computacin distribuida.
La arquitectura en grilla es una arquitectura de protocolos. Estos protocolos
definen los mecanismos bsicos en los cuales los usuarios de la organizacin
virtual y los recursos negocian, gestionan, establecen y explotan relaciones de
comparticin de recursos. Adems, esta arquitectura es abierta, basada en
estndares que permiten y facilitan la extensibilidad, interoperabilidad,
portabilidad, entre otras caractersticas, ayudados de protocolos estndares
que facilitan la definicin de servicios estndares que potencian las
capacidades de esta arquitectura.
El mejor aprovechamiento de una arquitectura en Grilla es cuando las
aplicaciones o los requerimientos utilizan algoritmos que pueden dividirse
independientemente en partes de ejecucin. Una aplicacin en Grilla intensiva
de CPU puede pensarse como muchos sub-trabajos ejecutndose en recursos o
mquinas diferentes dentro del Grilla. Como consecuencia, si estos sub-
trabajos no necesitan comunicarse entre s, la aplicacin se vuelve escalable.
Un objetivo principal del sistema en Grilla es aprovechar al mximo los
recursos. Por esto, puede pasar que la mquina o recurso en donde la
aplicacin normalmente es ejecutada se encuentre inusualmente ocupada por
algn peak de actividad inusual. Si esto ocurre, podra el proceso completarse
en otra mquina dentro del Grilla. El sistema Grilla es el responsable de enviar
un trabajo a alguna mquina para que sea ejecutado. Los schedulers toman el
trabajo de asignar segn la disponibilidad de los recursos en el Grilla. Si alguna
mquina se vuelve ociosa dentro del Grilla, esto es informado al nodo de
administracin, con el fin de que pueda ser reutilizado lo antes posible y
minimizar as el tiempo de ocio. Los recursos en el Grilla adems pueden ser
reservados por adelantado para algn conjunto de trabajos con el objetivo de
as poder cumplir con fechas requeridas o tiempos, y as garantizar alguna
calidad de servicio.
Sistema en nube:
Conocida tambin como servicios en la nube, informtica en la nube, nube de
cmputo o nube de conceptos (del ingls cloud computing), es un paradigma
que permite ofrecer servicios de computacin a travs de una red, que
usualmente es Internet.
En este tipo de computacin todo lo que puede ofrecer un sistema informtico
se ofrece como servicio,2 de modo que los usuarios puedan acceder a los
servicios disponibles "en la nube de Internet" sin conocimientos (o, al menos
sin ser expertos) en la gestin de los recursos que usan. Segn el IEEE
Computer Society, es un paradigma en el que la informacin se almacena de
manera permanente en servidores de Internet y se enva a cachs La
computacin en la nube son servidores desde Internet encargados de atender
las peticiones en cualquier momento. Se puede tener acceso a su informacin
o servicio, mediante una conexin a internet desde cualquier dispositivo mvil
o fijo ubicado en cualquier lugar. Sirven a sus usuarios desde varios
proveedores de alojamiento repartidos frecuentemente por todo el mundo. Esta
medida reduce los costos, garantiza un mejor tiempo de actividad y que los
sitios web sean invulnerables a los delincuentes informticos, a los gobiernos
locales y a sus redadas policiales pertenecientes.
Caractersticas:
Agilidad: Capacidad de mejora para ofrecer recursos tecnolgicos al
usuario por parte del proveedor.
Costo: los proveedores de computacin en la nube afirman que los
costos se reducen. Un modelo de prestacin pblica en la nube convierte
los gastos de capital en gastos de funcionamiento. Ello reduce barreras
de entrada, ya que la infraestructura se proporciona tpicamente por una
tercera parte y no tiene que ser adquirida por una sola vez o tareas
informticas intensivas infrecuentes.
Escalabilidad y elasticidad: aprovisionamiento de recursos sobre una
base de autoservicio en casi en tiempo real, sin que los usuarios
necesiten cargas de alta duracin.
Independencia entre el dispositivo y la ubicacin: permite a los usuarios
acceder a los sistemas utilizando un navegador web,
independientemente de su ubicacin o del dispositivo que utilice (por
ejemplo, PC, telfono mvil).
La tecnologa de virtualizacin permite compartir servidores y
dispositivos de almacenamiento y una mayor utilizacin. Las
aplicaciones pueden ser fcilmente migradas de un servidor fsico a otro.
Rendimiento: Los sistemas en la nube controlan y optimizan el uso de los
recursos de manera automtica, dicha caracterstica permite un
seguimiento, control y notificacin del mismo. Esta capacidad aporta
transparencia tanto para el consumidor o el proveedor de servicio.
Seguridad: puede mejorar debido a la centralizacin de los datos. La
seguridad es a menudo tan buena o mejor que otros sistemas
tradicionales, en parte porque los proveedores son capaces de dedicar
recursos a la solucin de los problemas de seguridad que muchos
clientes no pueden permitirse el lujo de abordar. El usuario de la nube es
responsable de la seguridad a nivel de aplicacin. El proveedor de la
nube es responsable de la seguridad fsica.5
Mantenimiento: en el caso de las aplicaciones de computacin en la
nube, es ms sencillo, ya que no necesitan ser instalados en el
ordenador de cada usuario y se puede acceder desde diferentes lugares.
Ventajas:
Integracin probada de servicios Red. Por su naturaleza, la tecnologa de

cloud computing se puede integrar con mucha mayor facilidad y rapidez
con el resto de las aplicaciones empresariales (tanto software tradicional
como Cloud Computing basado en infraestructuras), ya sean
desarrolladas de manera interna o externa.6
Prestacin de servicios a nivel mundial. Las infraestructuras de cloud
computing proporcionan mayor capacidad de adaptacin, recuperacin
completa de prdida de datos (con copias de seguridad) y reduccin al
mnimo de los tiempos de inactividad.
Una infraestructura 100% de cloud computing permite tambin al
proveedor de contenidos o servicios en la nube prescindir de instalar
cualquier tipo de software, ya que ste es provisto por el proveedor de la
infraestructura o la plataforma en la nube. Un gran beneficio del cloud
computing es la simplicidad y el hecho de que requiera mucha menor
inversin para empezar a trabajar.
Implementacin ms rpida y con menos riesgos, ya que se comienza a
trabajar ms rpido y no es necesaria una gran inversin. Las
aplicaciones del cloud computing suelen estar disponibles en cuestin de
das u horas en lugar de semanas o meses, incluso con un nivel
considerable de personalizacin o integracin.
Actualizaciones automticas que no afectan negativamente a los
recursos de TI. Al actualizar a la ltima versin de las aplicaciones, el
usuario se ve obligado a dedicar tiempo y recursos para volver a
personalizar e integrar la aplicacin. Con el cloud computing no hay que
decidir entre actualizar y conservar el trabajo, dado que esas
personalizaciones e integraciones se conservan automticamente
durante la actualizacin.
Contribuye al uso eficiente de la energa. En este caso, a la energa
requerida para el funcionamiento de la infraestructura. En los
datacenters tradicionales, los servidores consumen mucha ms energa
de la requerida realmente. En cambio, en las nubes, la energa
consumida es slo la necesaria, reduciendo notablemente el desperdicio.
Desventajas:
La centralizacin de las aplicaciones y el almacenamiento de los datos

origina una interdependencia de los proveedores de servicios.
La disponibilidad de las aplicaciones est sujeta a la disponibilidad de
acceso a Internet.
La confiabilidad de los servicios depende de la "salud" tecnolgica y
financiera de los proveedores de servicios en nube. Empresas
emergentes o alianzas entre empresas podran crear un ambiente
propicio para el monopolio y el crecimiento exagerado en los servicios.7
La disponibilidad de servicios altamente especializados podra tardar
meses o incluso aos para que sean factibles de ser desplegados en la
red.
La madurez funcional de las aplicaciones hace que continuamente estn
modificando sus interfaces, por lo cual la curva de aprendizaje en
empresas de orientacin no tecnolgica tenga unas pendientes
significativas, as como su consumo automtico por aplicaciones.
Seguridad. La informacin de la empresa debe recorrer diferentes nodos
para llegar a su destino, cada uno de ellos (y sus canales) son un foco de
inseguridad. Si se utilizan protocolos seguros, HTTPS por ejemplo, la
velocidad total disminuye debido a la sobrecarga que stos requieren.
Escalabilidad a largo plazo. A medida que ms usuarios empiecen a
compartir la infraestructura de la nube, la sobrecarga en los servidores
de los proveedores aumentar, si la empresa no posee un esquema de
crecimiento ptimo puede llevar a degradaciones en el servicio o altos
niveles de jitter.
Almacenamiento y manejo de bsquedas y consultas
Almacenamiento relativo
Para almacenar los datos en una tabla debemos crear una propiedad en esa
tabla de tipo varbinary(max). Es altamente recomendable almacenar los datos
en una tabla independiente a la de consulta habitual pues estaremos llenando
las tablas de datos con BLOBs y deberemos dividir la informacin para no tener
problemas de rendimiento. Es decir, si tenemos la tabla "Employee" y
queremos guardar la foto del empleado, es preciso tener una tabla que sea
"EmployeePhoto" para almacenar la imagen mediante una relacin 1 a 1
ndices (Teora de eficiencia en consultas)
El ndice de una base de datos es una estructura de datos que mejora la
velocidad de las operaciones, por medio de identificador nico de cada fila de
una tabla, permitiendo un rpido acceso a los registros de una tabla en una
base de datos. Al aumentar drsticamente la velocidad de acceso, se suelen
usar sobre aquellos campos sobre los cuales se hacen frecuentes bsquedas
Almacenamiento secundario:
El almacenamiento secundario es el conjunto de dispositivos y medios de
almacenamiento, que conforman el subsistema de memoria de una
computadora, junto a la memoria principal.
No deben confundirse las "unidades o dispositivos de almacenamiento" con los
"medios o soportes de almacenamiento", pues los primeros son los aparatos
que leen o escriben los datos almacenados en los soportes.
La memoria secundaria es un tipo de almacenamiento masivo y permanente, a
diferencia de la memoria RAM que es voltil.
Almacenamiento secuencial:
El mtodo de acceso secuencial requiere interactuar con el resto de los datos o
espacio fsico del medio de almacenamiento para acceder a un dato especfico.
La lista enlazada es un claro ejemplo de una estructura de almacenamiento de
datos que requiere el acceso secuencial para poder leer o guardar un dato
especfico.
Otros ejemplos de acceso secuencial: el tocadiscos, lectora de cinta de
respaldo, grabador de discos pticos, cuando se graba un disco ptico, como
un CD o un DVD, el lser va guardando la informacin en forma de espiral
sobre la superficie del disco duro.
ndices hash:
La funcin CHECKSUM nos ayuda a crear ndices hash, para reducir el tamao
de un ndice y mejorar el performance.
Columnas con un gran nmero de caracteres usualmente causan problemas a
la hora de indexarlas, debido a que el gran nmero de caracteres es repetido
continuamente dentro del ndice, haciendo que el tamao de este sea tan largo
como la tabla misma. En este tipo de situaciones se puede hacer uso de la
funcin CHECKSUM para construir ndices hash para reducir su tamao y con
un buen performance.
ndices bitmap:
Los ndices Bitmap son aconsejables en situaciones en que los diferentes
valores que puede tomar la columna son relativamente pocos. Ejemplos: sexo,
estado civil, etc. Cuantos menos valores. posibles, mejor. A medida que crece
la cantidad de valores posibles, aumentara el tamao del ndice.
B-tree:
En las ciencias de la computacin, los rboles-B o B-rboles son estructuras de
datos de rbol que se encuentran comnmente en las implementaciones de
bases de datos y sistemas de archivos. Son rboles balanceados de bsqueda
en los cuales cada nodo puede poseer ms de dos hijos.
ndices:
Un ndice es una estructura de disco asociada con una tabla o una vista que
acelera la recuperacin de filas de la tabla o de la vista. Un ndice contiene
claves generadas a partir de una o varias columnas de la tabla o la vista.
Dichas claves estn almacenadas en una estructura (rbol b) que permite que
SQL Server busque de forma rpida y eficiente la fila o filas asociadas a los
valores de cada clave.
Una tabla o una vista puede contener los siguientes tipos de ndices:
Agrupado
Los ndices agrupados ordenan y almacenan las filas de los datos de la tabla o
vista de acuerdo con los valores de la clave del ndice. Son columnas incluidas
en la definicin del ndice. Slo puede haber un ndice clster por cada tabla,
porque las filas de datos slo pueden estar ordenadas de una forma.
La nica ocasin en la que las filas de datos de una tabla estn ordenadas es
cuando la tabla contiene un ndice clster. Cuando una tabla tiene un ndice
clster, la tabla se denomina tabla agrupada. Si una tabla no tiene un ndice
clster, sus filas de datos estn almacenadas en una estructura sin ordenar
denominada montn.
No agrupado
Los ndices no agrupados tienen una estructura separada de las filas de datos.
Un ndice no agrupado contiene los valores de clave de ndice no agrupado y
cada entrada de valor de clave tiene un puntero a la fila de datos que contiene
el valor clave.
El puntero de una fila de ndice no agrupado hacia una fila de datos se
denomina localizador de fila. La estructura del localizador de filas depende de
si las pginas de datos estn almacenadas en un montn o en una tabla
agrupada. Si estn en un montn, el localizador de filas es un puntero hacia la
fila. Si estn en una tabla agrupada, el localizador de fila es la clave de ndice
agrupada.
Puede agregar columnas sin clave al nivel hoja de un ndice no agrupado con el
fin de eludir los lmites existentes para las claves de ndice, 900 bytes y
columnas de 16 claves, as como para ejecutar consultas indizadas y
totalmente cubiertas. Para obtener ms informacin, vea ndice con columnas
incluidas.
Para obtener ms informacin acerca de la arquitectura de ndices, vea
Arquitectura de estructuras de tablas y datos de ndices.
Tanto los ndices agrupados como los no agrupados pueden ser nicos. Esto
significa que dos filas no pueden tener el mismo valor para la clave de ndice.
De lo contrario, el ndice no es nico y varias filas pueden compartir el mismo
valor de clave. Para obtener ms informacin, vea Directrices para disear
ndices nicos.
Los ndices se mantienen automticamente para una tabla o vista cuando se
modifican los datos de la tabla.
ndices y restricciones
Los ndices se crean automticamente cuando las restricciones PRIMARY KEY y
UNIQUE se definen en las columnas de tabla. Por ejemplo, cuando cree una
tabla e identifique una determinada columna como la clave primaria, Motor de
base de datos crea automticamente una restriccin PRIMARY KEY y un ndice
en esa columna. Para obtener ms informacin, vea Crear ndices (motor de
base de datos).
Cmo utiliza los ndices el optimizador de consultas
Los ndices bien diseados pueden reducir las operaciones de E/S de disco y
consumen menos recursos del sistema, con lo que mejoran el rendimiento de la
consulta. Los ndices pueden ser tiles para diversas consultas que contienen
instrucciones SELECT, UPDATE, DELETE o MERGE. Fjese en la consulta SELECT
Title, HireDate FROM HumanResources.Employee WHERE EmployeeID = 250 en
la base de datos AdventureWorks2008R2. Cuando se ejecuta la consulta, el
optimizador de consultas evala cada mtodo disponible para recuperar datos
y selecciona el mtodo ms eficiente. El mtodo puede ser un recorrido de la
tabla o puede ser recorrer uno o ms ndices si existen.
Al realizar un recorrido de la tabla, el optimizador de consultas leer todas las
filas de la tabla y extraer las filas que cumplen con los criterios de la consulta.
Un recorrido de la tabla genera muchas operaciones de E/S de disco y puede
consumir recursos. No obstante, puede ser el mtodo ms eficaz si, por
ejemplo, el conjunto de resultados de la consulta es un porcentaje elevado de
filas de la tabla.
Cuando el optimizador de consultas utiliza un ndice, busca en las columnas de
clave de ndice, busca la ubicacin de almacenamiento de las filas que necesita
la consulta y extrae las filas coincidentes de esa ubicacin. Generalmente, la
bsqueda del ndice es mucho ms rpida que la bsqueda de la tabla porque,
a diferencia de la tabla, un ndice frecuentemente contiene muy pocas
columnas por fila y las filas estn ordenadas.
El optimizador de consultas normalmente selecciona el mtodo ms eficaz
cuando ejecuta consultas. No obstante, si no hay ndices disponibles, el
optimizador de consultas debe utilizar un recorrido de la tabla. Su tarea
consiste en disear y crear los ndices ms apropiados para su entorno de
forma que el optimizador de consultas disponga de una seleccin de ndices
eficaces entre los que elegir. SQL Server proporciona el Asistente para la
optimizacin de motor de base de datos como ayuda en el anlisis del entorno
de la base de datos y en la seleccin de los ndices adecuados.
1. Cules son las tendencias actuales de las bases de datos y su proyeccin

en el mercado, que permitirn resolver las necesidades de informacin
actuales y futuras de la humanidad?.
Las tendecias actuales de las bases de datos son:
Sistemas distribuidos.
Sistemas centralizados.
Arquitectura, Cliente / Servidor.
Base de datos Orientados a Objetos.
La proyeccin en el mercado de la tendencia de las base de datos, nos

permiten contar con la informacin desde cualquien parte del mundo, sin
necesidad de estar presente donde se encuentran almacenados los datos, por
pequea que sea las empresas o su sector de desempeo las bases de datos
son una parte fundamental de la estructura de las mismas.
En el futuro con el desarrollo de la tecnologa, se busca que que toda la
informacin este disponible para las diferentes empresas o entes
gubernamentales y as minimizar la necesidad de tramites que alargan los
tiempos para cualquier proceso.
2. Identifique los tipos de almacenamiento y como estos interfieren en la
optimizacin de bsquedas y consultas de datos dentro de las organizaciones,
se pueden incluir graficas con la cita correspondiente.
Tipos de almacenamiento:
Almacenamiento convencional
El almacenamiento convencional es el ms extendido en casi todos los sectores
industriales y se caracteriza por la escasa utilizacin de mecanismos, el empleo
de equipos de tecnologa comn y la mayor utilizacin de mano de obra.
Almacenamiento de alta densidad

Exige la utilizacin de unos medios especficos con el fin de conseguir la mayor
densidad posible de bultos ubicados por metro cuadrado de superficie de
almacn.
Medios de almacenamiento: Estanteras adaptadas a dimensiones de los
bultos. Las dimensiones de los pasillos para una misma mquina han de ser
iguales.
Almacenamiento automtico
Su concepcin es similar a la de los almacenamientos de alta densidad ya que
se utilizan equipos especficos que circulan por pasillos estrechos y se
almacena a gran altura. La diferencia se basa en que, en este caso, la
ubicacin y desubicacin la realiza un sistema de gestin informtico en
sustitucin de la mano de obra.
Almacenamiento automtico para cargas ligeras

Este almacenamiento se caracteriza por disponer de sistemas automticos que
transportan los materiales en bandejas hasta el operario para que realice las
extracciones y las devuelven a su ubicacin. Este sistema exige que un sistema
informtico controle y administre todas las ubicaciones y los movimientos del
almacn. Los almacenes miniload en general estn formados por un pasillo
central y dos grupos de estanteras a los lados.

Bases de Datos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bases de Datos

Uploaded by

Copyright:

Available Formats

Introduccin

Las bases de datos se han constituido como una de las herramientas ms

Definicin de base de datos

Una base de datos es un conjunto de datos que pertenecen al mismo contexto

Breve historia de los sistemas de bases de datos

El uso de sistemas de bases de datos automatizadas, se desarroll a partir de

A diferencia con la mquina de Babbage, que utilizaba unas tarjetas similares,

La manera ms fcil de explicar que es una base de datos es al compararla con

En tiempos muy remotos las civilizaciones ya almacenaban informacin el

Utiliza un sistema de lectura secuencial y ordenada es decir si se desea buscar

Dos de los principales prototipos de relacin del sistema de bases de datos

Para la toma de decisiones se crea el lenguaje SQL, que es un lenguaje

Aunque la industria de Internet experiment un descenso en la dcada de

Principios dcada de los 90

Para la toma de decisiones se crea el lenguaje SQL, que es un lenguaje

Finales de la dcada de los 90

En la actualidad existe gran cantidad de alternativas en lnea que permiten

Cuatro generaciones han manejado datos de computacin: Sistema de

Sistema de procesamiento en Bases de datos.

Un punto de control. Mayor control de seguridad y proteccin de la

Interfaz de usuario poco llamativo. Por el uso de la red amplia, se

Sistema cliente servidor: La arquitectura cliente-servidor es un modelo de

Centralizacin del control: los accesos, recursos y la integrillaad de los

Economa, pues es mucho ms barato, aadir servidores y clientes

Qu tipo de S. O., lenguaje de programacin y aplicaciones son

Integracin probada de servicios Red. Por su naturaleza, la tecnologa de

La centralizacin de las aplicaciones y el almacenamiento de los datos

1. Cules son las tendencias actuales de las bases de datos y su proyeccin

Las tendecias actuales de las bases de datos son:

La proyeccin en el mercado de la tendencia de las base de datos, nos

Almacenamiento de alta densidad

Almacenamiento automtico para cargas ligeras

You might also like