Bases de Datos Distribuidos

http://www.scribd.
com/doc/24989296/FUTURO-DE-LAS-BASES-DE-DATOS
BASES DE DATOS DISTRIBUIDOS

Los datos se encuentran en diferentes mquinas, generalmente situados en localizaciones
geogrficas diferentes(homogneas o no).
Nodo o emplazamiento: Cada uno de los ordenadores que integran el sistema de Bases
de Datos distribuido.
Tipos de transacciones:
o Locales: cuando se accede a los datos del nico emplazamiento donde se inici
la transaccin.
o Globales: Cuando se accede a datos de emplazamientos distintos al nodo donde
se inici la transaccin
VENTAJAS DEL PROCESAMIENTO DISTRIBUIDO

Existen cuatro ventajas del procesamiento de base de datos distribuido.
La primera, puede dar como resultado un mejor rendimiento que el que se obtiene por un
procesamiento centralizado. Los datos pueden colocarse cerca del punto de su utilizacin,
de forma que el tiempo de comunicacin sea ms corto. Varias computadoras operando en
forma simultnea pueden entregar ms volumen de procesamiento que una sola
computadora.
Figura 2
Un negocio distribuido geogrficamente
Planta A
Almacn
Planta B
Planta C
Segundo, los datos duplicados aumentan su confiabilidad. Cuando falla una computadora,
se pueden obtener los datos extrados de otras computadoras. Los usuarios no dependen de
la disponibilidad de una sola fuente para sus datos. Una tercera ventaja es que los sistemas
distribuidos pueden variar su tamao de un modo ms sencillo. Se pueden agregar
computadoras adicionales a la red conforme aumentan el nmero de usuarios y su carga de
procesamiento. A menudo es ms fcil y ms barato agregar una nueva computadora ms
pequea que actualizar una computadora nica y centralizada. Despus, si la carga de
trabajo se reduce, el tamao de la red tambin puede reducirse.
Por ltimo, los sistemas distribuidos se pueden adecuar de una manera ms sencilla a las
estructuras de la organizacin de los usuarios. La Figura 2 muestra la organizacin de un
fabricante distribuido geogrficamente. Los gerentes generales de cada una de las plantas
poseen una enorme autoridad y libertad en la operacin de sus instalaciones. Si tales plantas
dependieran de una computadora nica centralizada, la arquitectura de sistema entrara en
conflicto con la filosofa y las polticas operacionales de la empresa. Incluso en
organizaciones ms centralizadas, el procesamiento distribuido ofrece una mayor
flexibilidad para adecuarse a la estructura organizacional, de lo que permite el
procesamiento centralizado.
DESVENTAJAS DEL PROCESAMIENTO DISTRIBUIDO
Las primeras dos desventajas de las bases de datos distribuidas son las mismas que las dos
primeras ventajas. Primero, el rendimiento puede ser peor para el procesamiento distribuido
que para el procesamiento centralizado. Depende de la naturaleza de la carga de trabajo, la
red, el DDBMS y las estrategias utilizadas de concurrencia y de falla, as como las ventajas
del acceso local a los datos y de los procesadores mltiples, ya que stos pueden ser
abrumados por las tareas de coordinacin y de control requeridas. Tal situacin es probable
cuando la carga de trabajo necesita un gran nmero de actualizaciones concurrentes sobre

datos duplicados, y que deben estar muy distribuidos.
Segundo, el procesamiento de base de datos distribuida puede resultar menos confiable que
el procesamiento centralizado. De nuevo, depende de la confiabilidad de las computadoras
de procesamiento, de la red, del DDBMS, de las transacciones y de las tasas de error en la
carga de trabajo. Un sistema distribuido puede estar menos disponible que uno centralizado.
Estas dos desventajas indican que un procesamiento distribuido no es ninguna panacea. A
pesar de que tiene la promesa de un mejor rendimiento y de una mayor confiabilidad, tal
promesa no est garantizada.
Una tercera desventaja es su mayor complejidad, a menudo se traduce en altos gastos de
construccin y mantenimiento. Ya que existen ms componentes de hardware, hay ms
cantidad de cosas por aprender y ms interfaces susceptibles de fallar. El control de
concurrencia y recuperacin de fallas puede convertirse en algo complicado y difcil de
implementar, puede empujar a una mayor carga sobre programadores y personal de
operaciones y quiz se requiera de personal ms experimentado y ms costoso.
El procesamiento de bases de datos distribuido es difcil de controlar. Una computadora
centralizada reside en un entorno controlado, con personal de operaciones que supervisa
muy de cerca, y las actividades de procesamiento pueden ser vigiladas, aunque a veces con
dificultad. En un sistema distribuido, las computadoras de proceso, residen muchas veces
en las reas de trabajo de los usuarios. En ocasiones el acceso fsico no est controlado, y
los procedimientos operativos son demasiado suaves y efectuados por personas que tienen
escasa apreciacin o comprensin sobre su importancia. En sistemas centralizados, en caso
de un desastre o catstrofe, la recuperacin puede ser ms difcil de sincronizar. Las
ventajas y desventajas del procesamiento de datos distribuidos se resumen en la Figura 3.
COMPONENTES
DISTRIBUIDAS
DE
LOS
SISTEMAS
DE
BASES
DE
DATOS
A veces, los componentes de los sistemas de base de datos distribuidos son confusos, ya
que mltiples tipos distintos de procesamiento entran dentro del trmino procesamiento de
base de datos distribuidas y pueden encajar en la arquitectura general de la Figura 1.
Considere, por ejemplo, el sistema de la Figura 4(a). Cumple con la arquitectura mostrada
en la Figura 1 en la cual los nodos estn especificados como macrocomputadoras, Es muy
probable que para este sistema, el procesamiento est basado en la igualdad de colegas
cooperando. Cada nodo de la base de datos (W, X e Y), posee autoridad para insertar,
modificar, suprimir, o bien leer cualquier dato a todo lo largo de la red. Los datos tambin
se coordinan entre computadoras en tiempo real 0 algo tan cercano como sea posible.
Ahora vayamos a la Figura 4(b), en la cual el Nodo W es una macrocomputadora, los
Nodos X e Y son minicomputadoras, y el Nodo Z es una microcomputadora. En tal caso,
las reglas del procesamiento podran ser las siguientes: slo el Nodo W puede modificar la
base de datos; los Nodos X e Y, que tienen copia de los datos del Nodo W, slo estn
autorizados para lectura, y el Nodo Z puede obtener datos nada ms del Nodo Y. No se ha
hecho ningn intento por conservar los datos actualizados en tiempo real. En lugar de ello,
todos los das los Nodos X e Y son actualizados por el Nodo W, y una vez por semana el
Nodo Y actualiza al Nodo Z. La Figura 4(c) muestra un tercer ejemplo de la arquitectura de
la Figura 1, en el cual el Nodo W es una macrocomputadora , y los Nodos X, Y y Z son
microcomputadoras conectadas a una red de rea local. El Nodo X es un acceso a la
macrocomputadora y obtiene de W todos los datos de la base de datos que necesitan X, Y y
Z y los almacena en su propia base de datos. Suponga que el Nodo Y requiere de un acceso
frecuente a una parte de los datos, pero lo procesa slo en base de lectura. Cuando el Nodo
X o el Nodo Z efectan modificaciones a los datos, las efectan sobre una copia de W. En
forma peridica, W actualiza la base de datos de X con aquellos datos que hayan sido
modificados.
Estos tres ejemplos cumplen con la arquitectura general de la Figura 1, pero son del todo
distintos. Tienen sus propios conjuntos de capacidades, as como su propio conjunto de
problemas. Para poner orden en tal complejidad, consideraremos los siguientes cinco
componentes de un sistema de base de datos distribuida: hardware, programas, datos,
procedimientos y personal.
Figura 4
Tres ocurrencias de arquitectura de la Figura 1: (a) Sistema distribuido con cuatro
macrocomputadoras, (b) Sistema distribuido utilizando una macrocomputadora, dos
minicomputadoras y una microcomputadora, y (c) Sistema distribuido utilizando una
macrocomputadora, una LAN y tres microcomputadoras
Nodo W
Macrocomputadora
Nodo X
Macrocomputadora
Nodo Y
Macrocomputadora
Macrocomputadora
Nodo Z
(a)
Nodo W
Macrocomputadora
Nodo X
Minicomputadora
Nodo Y
Minicomputadora
Nodo Z
Microcomputadora
Nodo W
Macrocomputadora
tu
Ac
ar
liz
(b)
t
Ac
ar
liz
a
u
Microcomputadora
Microcomputadora
Nodo X
LAN
Microcomputadora
Nodo Z
(c)
Replica
El sistema conserva varias copias o rplicas idnticas de una tabla. Cada rplica se almacena en un
nodo diferente.
Ventajas:
Disponibilidad: el sistema sigue funcionando an en caso de cada de uno de los nodos.
Aumento del paralelismo: Varios nodos pueden realizar consultas en paralelo sobre la
misma tabla. Cuantas ms rplicas existan de la tabla, mayor ser la posibilidad de que el
dato buscado se encuentre en el nodo desde el que se realiza la consulta, minimizando con
ello el trfico de datos entre nodos.
REPLICA
Inconveniente:
Aumento de la sobrecarga en las actualizaciones: El sistema debe asegurar que todas las rplicas de
la tabla sean consistentes. Cuando se realiza una actualizacin sobre una de las rplicas, los cambios deben
propagarse a todas las rplicas de dicha tabla a lo largo del sistema distribuido.

Bases de Datos Distribuidos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bases de Datos Distribuidos

Uploaded by

Copyright:

Available Formats

http://www.scribd.

BASES DE DATOS DISTRIBUIDOS

VENTAJAS DEL PROCESAMIENTO DISTRIBUIDO

cuando la carga de trabajo necesita un gran nmero de actualizaciones concurrentes sobre

You might also like