Professional Documents
Culture Documents
Alumnos:
• Jorge M. Carvallo G.
• José Morínigo
Introducción
Una de las principales motivaciones para el desarrollo de sistemas de bases de datos es
el deseo de integrar los datos operacionales de una organización y proporcionar un
acceso controlado a esos datos. Aunque la integración y el acceso controlado pueden
implicar la necesidad de utilizar mecanismos de descentralización, el objetivo en
realidad no es ese. De hecho, el desarrollo de redes informáticas promueve el modo
descentralizado de trabajo. Esta técnica descentralizada imita la estructura
organizativa de muchas empresas, que están distribuidas de modo lógico en divisiones,
departamentos, proyectos, etc., y están distribuidas de modo físico en oficinas,
fábricas e instalaciones, manteniendo cada unidad sus propios datos operacionales. La
posibilidad de compartir los datos y la eficiencia del acceso a los mismos puede
mejorarse mediante el desarrollo de sistemas de bases de datos distribuidas que
reflejen esta estructura organizativa, que hagan que los datos de todas las unidades
sean accesibles y que almacenen esos datos en algún lugar próximo a aquel donde más
frecuentemente se utilice.
1- Concepto
Una base de datos distribuida es un conjunto de múltiples bases de datos
lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios
interconectados por una red de comunicaciones, los cuales tienen la capacidad de
procesamiento autónomo lo cual indica que puede realizar operaciones locales o
distribuidas. Un sistema de Bases de Datos Distribuida es un sistema en el cual
múltiples sitios de bases de datos están ligados por un sistema de comunicaciones de
tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte
de la red exactamente como si los datos estuvieran siendo accedidos de forma local.
Arquitecturas
En un sistema de bases de datos distribuidas, existen varios factores que deben tomar
en consideración que definen la arquitectura del sistema:
Distribución: Los componentes del sistema están localizados en la misma computadora
o no.
Heterogeneidad: Un sistema es heterogéneo cuando existen en él componentes que
se ejecutan en diversos sistemas operativos, de diferentes fuentes, etc.
Autonomía: Se puede presentar en diferentes niveles, los cuales se describen a
continuación:
Autonomía de diseño: Habilidad de un componente del para decidir cuestiones
relacionadas a su propio diseño.
Autonomía de comunicación: Habilidad de un componente del para decidir como y
cuando comunicarse con otros SMBD.
Autonomía de ejecución: Habilidad de un componente del para ejecutar operaciones
locales como quiera.
La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobre
una red de computadoras, sin embargo, las aplicaciones no deben notar su existencia.
La transparencia al nivel de red conlleva a dos cosas:
a. Transparencia sobre la localización de datos. el comando que se usa es
independiente de la ubicación de los datos en la red y del lugar en donde la operación
se lleve a cabo. Por ejemplo, en Unix existen dos comandos para hacer una copia de
archivo. Cp se utiliza para copias locales y rcp se utiliza para copias remotas. En este
caso no existe transparencia sobre la localización.
b. Transparencia sobre el esquema de nombramiento. Lo anterior se logra
proporcionando un nombre único a cada objeto en el sistema distribuido. Así, no se
debe mezclar la información de la localización con en el nombre de un objeto.
La transparencia sobre replicación de datos se refiere a que si existen réplicas de
objetos de la base de datos, su existencia debe ser controlada por el sistema no por el
usuario. Se debe tener en cuenta que cuando el usuario se encarga de manejar las
réplicas en un sistema, el trabajo de éste es mínimo por lo que se puede obtener una
eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia
de las réplicas teniendo así datos diferentes.
La transparencia a nivel de fragmentación de datos permite que cuando los objetos de
la bases de datos están fragmentados, el sistema tiene que manejar la conversión de
consultas de usuario definidas sobre relaciones globales a consultas definidas sobre
fragmentos. Así también, será necesario mezclar las respuestas a consultas
fragmentadas para obtener una sola respuesta a una consulta global. El acceso a una
base de datos distribuida debe hacerse en forma transparente.
En resumen, la transparencia tiene como punto central la independencia de datos.
La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por
el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a
la base de datos distribuida. Entre estos tres módulos se deben resolver los aspectos
sobre el procesamiento distribuido de consultas y sobre el manejo de nombres de
objetos distribuidos.
Desde hace ya varios años las bases de datos son ampliamente utilizadas en
departamentos de gobiernos, empresas comerciales, bancos, hospitales, etc.
Actualmente se está cambiando el esquema bajo el cuál se utilizan las bases de datos,
ya no son utilizadas únicamente de forma interna, sino que se tiene muchos accesos
externos de tipos distintos. Estos cambios que se han introducido en el uso de las
bases de datos ha creado la necesidad mejorar las prácticas de seguridad ya que el
ambiente ya no es tan controlado como el esquema antiguo.
Conceptos
Los problemas de mayor importancia en seguridad son autenticación, identificación,
y refuerzo de los controles de acceso apropiados. El sistema de seguridad de niveles
múltiples. Éste consiste en muchos usuarios con distintos niveles de permisos para una
misma base de datos con información de distintos niveles. En las bases de datos
distribuidas se han investigado dos acercamientos a este modelo: data distribuida y
control centralizado, y data y control distribuidos.
En el acercamiento de data distribuida y control centralizado se divide en dos
soluciones: particionado y replicado. En el primero de estos lo que se tiene es un
conjunto de nodos y cada uno de ellos opera a cierto nivel de seguridad, así el usuario
con nivel de permisos X accede al servidor que maneja la data para X. El replicado
surgió debido a que si alguien con altos derechos de seguridad deseaba consultar data
con de bajo nivel de seguridad debía enviar su petición a un servidor de bajo nivel de
seguridad por lo cual se podría divulgar información sensible. En el esquema replicado
entonces la data se repite en cascada de tal forma que el nivel más alto tiene una copia
entera de la base de datos, y el más bajo solamente la información de más bajo nivel.
El otro acercamiento de data y control distribuido cada nodo contiene información de
distintos niveles y está diseñado para aceptar peticiones de cualquier nivel de usuario.
8 - Diccionario de datos
El DBMS debiera incluir una función de diccionarios de datos (Meta _ datos), se
puede decir que es una base de Datos del sistema y no del usuario cuyo contenido
puede considerarse como “Datos acerca de los Datos” que en el fondo son definiciones
de objetos de datos y otros objetos del sistema.
http://www.mitecnologico.com/Main/DiccionarioDeDatos
Universidad de Castilla-La Mancha – Bases de datos distribuidas
http://www.abcdatos.com/tutoriales/tutorial/l3724.html