You are on page 1of 43

Ing.

Joel Reynaldo Alnez Durn

BDD: Introduccin
Bases de Datos Distribuidas mezcla de dos tecnologas:

La tecnologa de base de datos. La tecnologa de redes y comunicacin de datos.

BDD: Introduccin
Esta ltima tecnologa ha avanzado mucho en los ltimos aos gracias al desarrollo de las comunicaciones celulares y por satlite, Redes de rea Metropolitana (MAN), estandarizacin de protocolos como TCP/IP; y por sobre todo, gracias a la explosin de Internet.

BDD: Introduccin
Las organizaciones ya no estn interesadas, como en los 80s, en bases de datos centralizadas gigantes. Hoy se tiende a la descentralizacin de procesos, a nivel del sistema, mientras que, a nivel lgico, se consigue una integracin de las fuentes de informacin dentro de BDs geogrficamente distribuidas

BDD: Definicin

Base de Datos Distribuida (BDD): coleccin de mltiples bases de datos interrelacionadas lgicamente, las cuales se encuentran distribuidas en diferentes espacios lgicos a travs de una red de computadores Cada sitio corre un SGBD que es independiente de los dems.

BDD: Tipos
Segn el Software SGBD utilizado para la implementacin de una BDD se tienen dos tipos de BDDs. BDD Homogneas BDD Heterogneas

BDD: Tipos
BDD Homogneas: Todos los sitios utilizan el mismo SW SGBD. Todos los sitios estn comprometidos unos con otros en cooperar para procesar las peticiones de usuario Cada sitio sacrifica parte de su autonoma en trminos de modificacin del esquema o del SW SGBD Aparecen frente al usuario como un sistema nico

BDD: Tipos
BDD Heterogneas Los sitios pueden usar diferentes SW y Esquemas La diferencia de esquemas es el problema principal en el procesamiento de consultas La diferencia de SW es el problema principal en el procesamiento de transacciones Los sitios por lo general solo ofrecen caractersticas limitadas para el procesamiento de las transacciones en cooperacin.

BDD: Ejemplo Bsico


Nodo E1 Alumnos RED Nodo E2 Alumnos

Comunicacin a travs de la red Nodo Rectorado Escuelas

BDD: Ejemplo Bsico


Nodos de las Escuelas:
DNI Escuela Nombre Nota ingreso Beca

Nodo del Rectorado:


Escuela Ubicacin Nmero alumnos

Nuevo alumno en la secretara del E1: transaccin local. Nuevo alumno en el rectorado: transaccin global

BDD: Conceptos

Los datos deben estar fsicamente en ms de una sede. Cada sede o computadora es un nodo de la red. Cada nodo proporciona un entorno de ejecucin de transacciones, tanto local, como global.

BDD: Conceptos

Esquema lgico global nico Los datos han de estar lgicamente integrados, para realizar recuperacin y actualizacin tanto en forma local como remota. En una nica operacin se puede acceder (recuperar o actualizar) datos que se encuentran en ms de una sede.

BDD: Conceptos
Tipos de transacciones:

Locales: cuando se accede a los datos de la sede que inici la transaccin. Globales: se accede a datos de sedes distintas al nodo que inici la transaccin.

BDD: Ventajas

Autonoma local Mejora de rendimiento Mejora de la seguridad y la disponibilidad Economa Capacidad de expansin Capacidad de comparticin

BDD: Desventajas

Falta de experiencia Complejidad (Diseo, implementacin, administracin) Coste Control de distribucin Seguridad Dificultades para cambiar Carencia de estndares (an no existen herramientas o metodologas que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.

BDD Vs. BdDCentralizadas: Costos


Sistemas Centralizados Sistemas Distribuidos Por razones de economa de Los sistemas distribuidos tienen un escala, son propios de aplicaciones menor costo en las comunicaciones. de mucha memoria. Son bases de datos que requieren Hay un mejor uso de los recursos mnima redundancia de datos. tecnolgicos, por el aprovechamiento de los equipos Se requieren cuando hay que invertir menos en recursos existentes en los sitios. humanos. La planeacin centralizada minimiza los costos. Al hacer un mejor uso de los recursos, por el hecho de estar en un sitio, los costos tienden a ser menores que en los sistemas distribuidos.

BDD Vs. BdDCentralizadas: Poltica Org.


Sistemas Centralizados

Sistemas Distribuidos

Los departamentos de sistemas retienen el control de toda la organizacin. La centralizacin de datos da ms poder a la gerencia. La planeacin central refleja la economa de la organizacin

Los Dptos de sistemas requieren mayor autonoma local. En los Dptos de usuarios se fomenta la responsabilidad local. Los usuarios aprenden a apreciar los costos de procesamiento. La descentralizacin evita poner el poder en pocas manos. Las estructuras son ms flexibles.

BDD Vs. BdDCentralizadas: Asp. Tcnicos


Sistemas Centralizados

Sistemas Distribuidos
Tienen mejores interfaces de usuario,

Los sistemas centralizados requieren un mantenimiento central de datos. Requieren un procesamiento total de datos. No requieren replicacin alguna. Generalmente necesitan un control profesional de seguridad

Ej. Sist. Sliente-Servidor. Presentan cierto grado de disponibilidad an en caso de falla. Tienen un mejor tiempo de respuesta. Las aplicaciones son ms adaptadas a las necesidades locales. Los volmenes de procesamiento deben ser relativamente grandes a nivel local. Los usuarios comprenden mejor sus problemas. Un grupo de soporte local reacciona ms rpido a las demandas locales. Aprovechan la proliferacin de equipos.

BDD Vs. BdDCentralizadas: Administracin


Sistemas Centralizados

Sistemas Distribuidos
Hay un alto grado de autonoma por parte de los administradores locales. En BDD es posible identificar una estructura de control jerrquica basada en el administrador de la bases de datos global y en los administradores de las bases de datos locales. Estos pueden llegar a tener mucha autonoma (a tal punto que el ABD pueda desaparecer) o todo lo contrario (un control casi completamente centralizado).

Existe un control total por parte del administrador de la base de datos global. Por razones de seguridad, hay gran nfasis en el control y este debe centralizarse

BDD Vs. BdDCentralizadas: Organizacin de Datos


Sistemas Centralizados

Sistemas Distribuidos

La independencia de los datos: La independencia de los datos La organizacin real de los revista igual importancia para las datos es transparente al BDDs. programador de aplicaciones, La transparencia de distribucin es es decir, los programas son un aspecto adicional en las BDDs. escritos o construidos teniendo Los programas se deben poder en cuenta el esquema construir como si la base de datos conceptual de los datos. En este no fuera distribuida. En este caso, caso, los programas no son los programas no son afectados afectados por los cambios en la por el movimiento de los datos de organizacin fsica de la base de un sitio a otro (aunque el datos rendimiento s cambie

BDD Vs. BdDCentralizadas: Redundancia


Sistemas Centralizados Sistemas Distribuidos Se reduce lo ms que se Es una caracterstica deseable pueda debido a la posibilidad ya que lo que se pretende es de inconsistencias y al que haya localidad de desperdicio de espacio aplicaciones (la cual se incrementa si los datos se replican en los sitios donde se necesitan) y disponibilidad de la base de datos (an en cadas de sitios). La disponibilidad de la base de datos depende de la relacin consultas/actualizaciones

BDD Vs. BdDCentralizadas: Estructuras de acceso


Sistemas Centralizados

Sistemas Distribuidos
Estructuras como los ndices secundarios y los clusters interarchivo (o intertabla) no son las apropiadas para lograr un acceso eficiente, ya que es difcil construirlas y mantenerlas. Pues no son una respuesta tecnolgica. No son la solucin. Los accesos se logran a travs de un plan de acceso distribuido, de tal manera que los programas tengan la mayor localidad posible y los resultados intermedios o las tablas sean transmitidos entre sitios

Los ndices secundarios y las cadenas interarchivo (clusters) constituyen el aspecto ms importante de los sistemas manejadores de bases de datos tradicionales, ya que su objetivo es lograr un acceso eficiente

BDD Vs. BdDCentralizadas: Integridad


Sistemas Centralizados Sistemas Distribuidos
Deben proveer el concepto de La aplicacin del concepto de transaccin transacciones como unidades atmicas se mantiene pero involucra un trabajo de ejecucin. ms complejo. Si hay dos sitios Las amenazas a la atomicidad pueden involucrados en una transaccin y uno de ellos falla, hay dos posibilidades: ser:

Las fallas, en la mitad de una transaccin La concurrencia, cuando una transaccin ve el estado inconsistente (intermedio) de otra

Que la transaccin sea abortada Que haya un sistema inteligente que termine la transaccin correctamente aunque los dos sitios no estn operando simultneamente

BDD Vs. BdDCentralizadas: Recuperacin


Sistemas Centralizados
Los sistemas encargados

Sistemas Distribuidos
Deben preservar la atomicidad

deben preservar la de las transacciones aun en atomicidad de las casos de fallas en algunos sitios transacciones en presencia de involucrados. fallas. La recuperacin debe hacerse La recuperacin debe hacerse basado en protocolos complejos hacia atrs o hacia delante, de compromiso en dos o en tres dependiendo de si la fases transaccin se ha comprometido o no

BDD Vs. BdDCentralizadas: Concurrencia


Sistemas Centralizados
Asegurar la atomicidad de las

Sistemas Distribuidos
Asegurar la atomicidad de las

transacciones en la presencia de ejecucin concurrente de transacciones. Trabajar adecuadamente los tipos de bloqueos

transacciones distribuidas a travs de la red. Trabajar adecuadamente los bloqueos en cada uno de los sitios

BDD Vs. BdDCentralizadas: Privacidad y Seguridad


Sistemas Centralizados
El DBA tiene un control

Sistemas Distribuidos
Los administradores locales tienen

centralizado a travs del acceso autorizado a los datos.


Es ms vulnerable a las

el mismo problema de vulnerabilidad y privacidad de los administradores globales.


Por la autonoma de cada sitio, los

violaciones de seguridad y privacidad que en archivos separados, desde el punto de vista de la globalidad de la informacin.

propietarios de los datos tienen sus propias protecciones, a veces buenas, a veces no tanto.
Las BDDs presentan los problemas

intrnsecos a los sistemas distribuidos ya que las redes representan un punto dbil en proteccin

BDD: Diseo
Diseo del "esquema 3. Diseo de la conceptual" el cual describe fragmentacin: determinar la base de datos integrada la forma en que las (esto es, todos los datos que relaciones globales se son utilizados por las subdividen en fragmentos aplicaciones que tienen horizontales, verticales o acceso a las bases de datos). mixtos. 2. Diseo "fsico" de la base de 4. Diseo de la asignacin de datos: mapear el esquema los fragmentos: determinar conceptual a las reas de la forma en que los almacenamiento y fragmentos se mapean a determinar los mtodos de las imgenes fsicas. acceso.
1.

BDD: Reglas a considerar


Regla 1: Autonoma local Los nodos o localidades de un SD deben ser independientes entre si en el mayor grado posible.
Caractersticas de cada nodo

Tiene su propio DBMS El DBMS controla todos los aspectos del nodo Las operaciones de acceso a datos locales utilizan slo recursos locales Hay cooperacin entre los nodos para el acceso distribuido de datos

BDD: Reglas a considerar


Regla 2: No es necesario un sitio central Todos los sitios/nodos deben ser tratados como iguales.

De existir un sitio central, habra un cuello de botella De existir un sitio central, el sistema sera vulnerable, porque una falla hara fallar a todo el sistema El sitio central es necesario slo durante la ejecucin de una transaccin considerando un nodo origen y destino

BDD: Reglas a considerar


Para proporcionar mayor confiabilidad y mayor disponibilidad se requiere: Soporte para backups on Un sistema BDD no debera line, total o incremental estar nunca fuera de Soporte para servicio recuperaciones rpidas de BD. DBMS tolerante a fallos (con hardware acorde) Regla 3: Operacin continua

BDD: Reglas a considerar


Regla 4: Independencia de localizacin Los usuarios y las aplicaciones no necesitan conocer la ubicacin fsica de los datos. Actan como si fuesen locales a ellos

Sin transparencia local deberan distinguirse los datos locales de los datos remotos. Usuarios y aplicaciones se refieren a los datos mediante alias Simplifica los programas de usuario. Punto crtico: el Diccionario de Datos El DD debe mantener una tabla con los elementos de datos, sus alias y sus ubicaciones El DD debe estar replicado en las localidades y las rplicas deben mantenerse actualizadas.

BDD: Reglas a considerar


Regla 5: Independencia de La fragmentacin es necesaria por razones de Fragmentacin de datos
rendimiento.

Los usuarios pueden comportarse como si los datos no estuvieran fragmentados

Los datos pueden estar almacenados en la ubicacin donde son usados con mayor frecuencia para que la mayora de las operaciones sean locales y se reduzca el trfico de la Red.

BDD: Reglas a considerar


Regla 6: Independencia de Esto significa: Mejor rendimiento: las Replicacin de datos Los usuarios deben comportarse como si los datos no estuvieran replicados
aplicaciones operan sobre copias locales en vez de comunicarse con sitios remotos. Mejor disponibilidad: un objeto replicado est disponible mientras haya al menos una copia. Desventaja: propagar las actualizaciones

BDD: Reglas a considerar


Regla 7: Procesamiento de Esto significa: consultas distribuidas El Sistema Distribuido debe disponer de mecanismos para La performance de una optimizar las consultas y consulta debe ser en especial para reducir la independiente del sitio carga de trfico donde se realiza la consulta necesaria.

BDD: Reglas a considerar


Debe mantenerse la Regla 8: Gestin de atomicidad de las transacciones distribuidas transacciones. Control de recuperacin El Sistema Distribuido debe de informacin. disponer de mecanismos Control de concurrencia. adecuados para el control Protocolos utilizado para de concurrencia y la preservar la atomicidad: recuperacin de dos fases o tres fases los transacciones distribuidas ms conocidos.

BDD: Reglas a considerar


Regla 9: Independencia de Regla 10: Independencia del Hardware SO Es necesario tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de Hardware Es necesario tener la posibilidad de ejecutar el mismo DBMS en sitios con diferentes sistemas operativos.

BDD: Reglas a considerar


Regla 11: Independencia de Red
Regla 12: Independencia del DBMS

Debe permitirse la El Sistema Distribuido debe heterogeneidad, es decir, que poder operar con diferentes cada sitio pueda funcionar con un SGBD diferente, incluso redes de comunicaciones basado en un modelo de datos diferente, siempre y cuando compartan una interface comn.

BdD Distribuidas: Caractersticas


Red

AP1
Usuario1 DDBMS

OSnet OSdm BdD

AP2
Computadora 1

Usuario2

AP2

DDBMS

OSnet OSdm

BdD

Computadora 2

DDBMS

OSnet OSdm BdD

Computadora 3

Usuarion

AP2
DDBMS

OSnet OSdm BdD

AP3
Computadora N

BdD Distribuidas: Caractersticas


AP1 AP2
DDBMS/ OS

W X Y Z

nica Computadora de proceso

Lnea de comunicacin

AP1
DDBMS/ OS
Computadora 1

W X
BdD1

AP2
DDBMS/ OS
Computadora 2

Y Z
BdD2 BdD

BdD Distribuidas: Caractersticas


AP1 AP2
DDBMS/ OS

W X Y Z AP1 AP2
DDBMS/ OS
Lnea de comunicacin

nica Computadora de proceso

W X Y Z
BdD (Copia 1)

Computadora 1

AP1 AP2
DDBMS/ OS
Computadora 2

W X Y Z
BdD (Copia 2)

BdD Distribuidas: Caractersticas


AP1 AP2
DDBMS/ OS

W X Y Z

nica Computadora de proceso

Lnea de comunicacin

AP1
DDBMS/ OS
Computadora 1

W X Y
BdD1

AP2
DDBMS/ OS
Computadora 2

Y Z
BdD2 BdD

You might also like