Professional Documents
Culture Documents
BDD: Introduccin
Bases de Datos Distribuidas mezcla de dos tecnologas:
BDD: Introduccin
Esta ltima tecnologa ha avanzado mucho en los ltimos aos gracias al desarrollo de las comunicaciones celulares y por satlite, Redes de rea Metropolitana (MAN), estandarizacin de protocolos como TCP/IP; y por sobre todo, gracias a la explosin de Internet.
BDD: Introduccin
Las organizaciones ya no estn interesadas, como en los 80s, en bases de datos centralizadas gigantes. Hoy se tiende a la descentralizacin de procesos, a nivel del sistema, mientras que, a nivel lgico, se consigue una integracin de las fuentes de informacin dentro de BDs geogrficamente distribuidas
BDD: Definicin
Base de Datos Distribuida (BDD): coleccin de mltiples bases de datos interrelacionadas lgicamente, las cuales se encuentran distribuidas en diferentes espacios lgicos a travs de una red de computadores Cada sitio corre un SGBD que es independiente de los dems.
BDD: Tipos
Segn el Software SGBD utilizado para la implementacin de una BDD se tienen dos tipos de BDDs. BDD Homogneas BDD Heterogneas
BDD: Tipos
BDD Homogneas: Todos los sitios utilizan el mismo SW SGBD. Todos los sitios estn comprometidos unos con otros en cooperar para procesar las peticiones de usuario Cada sitio sacrifica parte de su autonoma en trminos de modificacin del esquema o del SW SGBD Aparecen frente al usuario como un sistema nico
BDD: Tipos
BDD Heterogneas Los sitios pueden usar diferentes SW y Esquemas La diferencia de esquemas es el problema principal en el procesamiento de consultas La diferencia de SW es el problema principal en el procesamiento de transacciones Los sitios por lo general solo ofrecen caractersticas limitadas para el procesamiento de las transacciones en cooperacin.
Nuevo alumno en la secretara del E1: transaccin local. Nuevo alumno en el rectorado: transaccin global
BDD: Conceptos
Los datos deben estar fsicamente en ms de una sede. Cada sede o computadora es un nodo de la red. Cada nodo proporciona un entorno de ejecucin de transacciones, tanto local, como global.
BDD: Conceptos
Esquema lgico global nico Los datos han de estar lgicamente integrados, para realizar recuperacin y actualizacin tanto en forma local como remota. En una nica operacin se puede acceder (recuperar o actualizar) datos que se encuentran en ms de una sede.
BDD: Conceptos
Tipos de transacciones:
Locales: cuando se accede a los datos de la sede que inici la transaccin. Globales: se accede a datos de sedes distintas al nodo que inici la transaccin.
BDD: Ventajas
Autonoma local Mejora de rendimiento Mejora de la seguridad y la disponibilidad Economa Capacidad de expansin Capacidad de comparticin
BDD: Desventajas
Falta de experiencia Complejidad (Diseo, implementacin, administracin) Coste Control de distribucin Seguridad Dificultades para cambiar Carencia de estndares (an no existen herramientas o metodologas que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.
Sistemas Distribuidos
Los departamentos de sistemas retienen el control de toda la organizacin. La centralizacin de datos da ms poder a la gerencia. La planeacin central refleja la economa de la organizacin
Los Dptos de sistemas requieren mayor autonoma local. En los Dptos de usuarios se fomenta la responsabilidad local. Los usuarios aprenden a apreciar los costos de procesamiento. La descentralizacin evita poner el poder en pocas manos. Las estructuras son ms flexibles.
Sistemas Distribuidos
Tienen mejores interfaces de usuario,
Los sistemas centralizados requieren un mantenimiento central de datos. Requieren un procesamiento total de datos. No requieren replicacin alguna. Generalmente necesitan un control profesional de seguridad
Ej. Sist. Sliente-Servidor. Presentan cierto grado de disponibilidad an en caso de falla. Tienen un mejor tiempo de respuesta. Las aplicaciones son ms adaptadas a las necesidades locales. Los volmenes de procesamiento deben ser relativamente grandes a nivel local. Los usuarios comprenden mejor sus problemas. Un grupo de soporte local reacciona ms rpido a las demandas locales. Aprovechan la proliferacin de equipos.
Sistemas Distribuidos
Hay un alto grado de autonoma por parte de los administradores locales. En BDD es posible identificar una estructura de control jerrquica basada en el administrador de la bases de datos global y en los administradores de las bases de datos locales. Estos pueden llegar a tener mucha autonoma (a tal punto que el ABD pueda desaparecer) o todo lo contrario (un control casi completamente centralizado).
Existe un control total por parte del administrador de la base de datos global. Por razones de seguridad, hay gran nfasis en el control y este debe centralizarse
Sistemas Distribuidos
La independencia de los datos: La independencia de los datos La organizacin real de los revista igual importancia para las datos es transparente al BDDs. programador de aplicaciones, La transparencia de distribucin es es decir, los programas son un aspecto adicional en las BDDs. escritos o construidos teniendo Los programas se deben poder en cuenta el esquema construir como si la base de datos conceptual de los datos. En este no fuera distribuida. En este caso, caso, los programas no son los programas no son afectados afectados por los cambios en la por el movimiento de los datos de organizacin fsica de la base de un sitio a otro (aunque el datos rendimiento s cambie
Sistemas Distribuidos
Estructuras como los ndices secundarios y los clusters interarchivo (o intertabla) no son las apropiadas para lograr un acceso eficiente, ya que es difcil construirlas y mantenerlas. Pues no son una respuesta tecnolgica. No son la solucin. Los accesos se logran a travs de un plan de acceso distribuido, de tal manera que los programas tengan la mayor localidad posible y los resultados intermedios o las tablas sean transmitidos entre sitios
Los ndices secundarios y las cadenas interarchivo (clusters) constituyen el aspecto ms importante de los sistemas manejadores de bases de datos tradicionales, ya que su objetivo es lograr un acceso eficiente
Las fallas, en la mitad de una transaccin La concurrencia, cuando una transaccin ve el estado inconsistente (intermedio) de otra
Que la transaccin sea abortada Que haya un sistema inteligente que termine la transaccin correctamente aunque los dos sitios no estn operando simultneamente
Sistemas Distribuidos
Deben preservar la atomicidad
deben preservar la de las transacciones aun en atomicidad de las casos de fallas en algunos sitios transacciones en presencia de involucrados. fallas. La recuperacin debe hacerse La recuperacin debe hacerse basado en protocolos complejos hacia atrs o hacia delante, de compromiso en dos o en tres dependiendo de si la fases transaccin se ha comprometido o no
Sistemas Distribuidos
Asegurar la atomicidad de las
transacciones en la presencia de ejecucin concurrente de transacciones. Trabajar adecuadamente los tipos de bloqueos
transacciones distribuidas a travs de la red. Trabajar adecuadamente los bloqueos en cada uno de los sitios
Sistemas Distribuidos
Los administradores locales tienen
violaciones de seguridad y privacidad que en archivos separados, desde el punto de vista de la globalidad de la informacin.
propietarios de los datos tienen sus propias protecciones, a veces buenas, a veces no tanto.
Las BDDs presentan los problemas
intrnsecos a los sistemas distribuidos ya que las redes representan un punto dbil en proteccin
BDD: Diseo
Diseo del "esquema 3. Diseo de la conceptual" el cual describe fragmentacin: determinar la base de datos integrada la forma en que las (esto es, todos los datos que relaciones globales se son utilizados por las subdividen en fragmentos aplicaciones que tienen horizontales, verticales o acceso a las bases de datos). mixtos. 2. Diseo "fsico" de la base de 4. Diseo de la asignacin de datos: mapear el esquema los fragmentos: determinar conceptual a las reas de la forma en que los almacenamiento y fragmentos se mapean a determinar los mtodos de las imgenes fsicas. acceso.
1.
Tiene su propio DBMS El DBMS controla todos los aspectos del nodo Las operaciones de acceso a datos locales utilizan slo recursos locales Hay cooperacin entre los nodos para el acceso distribuido de datos
De existir un sitio central, habra un cuello de botella De existir un sitio central, el sistema sera vulnerable, porque una falla hara fallar a todo el sistema El sitio central es necesario slo durante la ejecucin de una transaccin considerando un nodo origen y destino
Sin transparencia local deberan distinguirse los datos locales de los datos remotos. Usuarios y aplicaciones se refieren a los datos mediante alias Simplifica los programas de usuario. Punto crtico: el Diccionario de Datos El DD debe mantener una tabla con los elementos de datos, sus alias y sus ubicaciones El DD debe estar replicado en las localidades y las rplicas deben mantenerse actualizadas.
Los datos pueden estar almacenados en la ubicacin donde son usados con mayor frecuencia para que la mayora de las operaciones sean locales y se reduzca el trfico de la Red.
Debe permitirse la El Sistema Distribuido debe heterogeneidad, es decir, que poder operar con diferentes cada sitio pueda funcionar con un SGBD diferente, incluso redes de comunicaciones basado en un modelo de datos diferente, siempre y cuando compartan una interface comn.
AP1
Usuario1 DDBMS
AP2
Computadora 1
Usuario2
AP2
DDBMS
OSnet OSdm
BdD
Computadora 2
DDBMS
Computadora 3
Usuarion
AP2
DDBMS
AP3
Computadora N
W X Y Z
Lnea de comunicacin
AP1
DDBMS/ OS
Computadora 1
W X
BdD1
AP2
DDBMS/ OS
Computadora 2
Y Z
BdD2 BdD
W X Y Z AP1 AP2
DDBMS/ OS
Lnea de comunicacin
W X Y Z
BdD (Copia 1)
Computadora 1
AP1 AP2
DDBMS/ OS
Computadora 2
W X Y Z
BdD (Copia 2)
W X Y Z
Lnea de comunicacin
AP1
DDBMS/ OS
Computadora 1
W X Y
BdD1
AP2
DDBMS/ OS
Computadora 2
Y Z
BdD2 BdD