Professional Documents
Culture Documents
ÍNDICE
INTRODUCCIÓN .................................................................................................... iv
OBJETIVOS ............................................................................................................ v
Características: .................................................................................................... 1
Estructura: ........................................................................................................... 1
Arquitectura: ........................................................................................................ 2
Operaciones. ....................................................................................................... 2
Gestión. ............................................................................................................... 3
Localización de ficheros....................................................................................... 6
Diferencias: .................................................................................................... 24
Operaciones no contiguas.............................................................................. 26
Arquitectura .................................................................................................... 29
Arquitectura: ................................................................................................... 29
CONCLUSIONES ................................................................................................. 31
RECOMENDACIONES ......................................................................................... 32
E grafía ................................................................................................................. 33
iv
INTRODUCCIÓN
OBJETIVOS
Objetivos Generales
Objetivos Específicos
Conceptos básicos.
Características:
- Casi todos los ficheros son de un tamaño pequeño esto quiere decir que un
fichero puede ser la unidad de recuperación.
- La mayoría de los ficheros se acceden por un lector y/o un escritor.
- La escritura no es muy frecuente.
- El acceso suele ser secuencial y existe un alto grado de localidad.
- La mayoría son temporales y no duran mucho.
- Existe clases de ficheros.
Estructura:
Arquitectura:
La arquitectura de AFS consta de dos componentes, uno en el servidor y otro en el
cliente:
- Vice: Código de los servidores. Desde el punto de vista del cliente, Vice es
un conjunto de servidores de ficheros interconectados en red.
- Venus: Código cliente que se ejecuta sobre el sistema operativo en los nodos
conectados a Vice.
Operaciones.
Algunas de las operaciones sobre ficheros son crear, abrir, leer, escribir, posicionar,
cerrar, borrar, ejecutar. Otras de las operaciones son apertura del fichero:
Lecturas/escrituras sobre el fichero y establecimiento de cerrojos sobre el fichero.
3
Gestión.
Es un objeto que relaciona de forma univoca el nombre de usuario de un archivo y
el descriptor interno del mismo usado por el S.O. los directorios sirven para
organizar y proporcionar información acerca de la estructuración de los archivos en
los sistemas de archivos.
Organización de directorio
• Eficiencia: localizar un archivo rápidamente.
• Nombrado: conveniente y sencillo para los usuarios.
- Dos usuarios pueden tener el mismo nombre para archivos distintos.
- Los mismos archivos pueden tener nombres distintos
- Nombres de longitud variable
Nombre absoluto:
De un archivo proporciona todo camino a través del árbol de directorios desde la
raíz hasta el archivo.
Nombre relativo:
Estos no pueden interpretar si no se conoce el directorio del árbol a partir del que
empiezan, para ello existe un directorio de trabajo o actual, a partir del cual se
interpretan siempre los nombres relativos.
4
3. Borrarlo de modo que puedes liberar el espacio que ocupa este archivo.
El sistema de gestión de archivos debe ocultar a los usuarios todos los aspectos
específicos de dispositivos necesarios para la manipulación de archivos y
proporcionarles una abstracción de un espacio simple y uniforme de archivos con
nombre.
Espacio de nombres.
Se encuentra como servicio de Windows Server, agrupa las carpetas de diferentes
servidores en uno o varios espacios de nombres estructurados lógicamente, esto
permite que cuando se busca un archivo el usuario tenga los datos guardados en
diferentes servidores de una manera ordenada.
5
Los servidores que ejecutan los siguientes sistemas operativos pueden alojar un
único espacio de nombres independiente:
Resolución de nombres.
En una red pequeña no resultaría difícil mantener una tabla de resolución de
nombres almacenada en el fichero etc./hosts de cada máquina que asociara a cada
dirección IP el nombre de esa máquina, sin embargo en toda Internet, fácilmente se
comprende que no sería una buena solución, por ello en 1984 se diseñó y adoptó
un sistema nuevo también llamado DNS que consiste básicamente en dividir los
nombres de máquina en zonas o dominios y delegar en unos servidores de nombres
que mantengan toda la información acerca de una zona.
Todos nuestros equipos van a necesitar resolver nombres de máquinas, tanto para
navegar por internet como, tal vez, localmente en nuestra propia red para algunos
servicios que tengamos implementados en las máquinas locales.
Localización de ficheros.
Utilizamos el comando find para la localización de un fichero, se buscan
características de un fichero, como el tamaño, nombre, última fecha de modificación.
FIND: Este comando tiene muchas formas de utilización para la búsqueda de algún
fichero, que se basa en algunos criterios de búsqueda, como temporales, cuando
se encuentra muestra el nombre completo, datos internos, o simplemente ejecutarlo
para utilizarlo.
7
Opciones de FIND:
Por criterio:
También hay otros comandos con los que se pueden hacer búsquedas de ficheros:
8
Acceso de datos.
Una vez que abrimos el fichero se tiene información para acceder al mismo.
Procesador de Entrada/Salida:
9
Semántica de UNIX:
Las modificaciones a un archivo abierto son visibles de inmediato por los demás
usuarios.
10
El archivo tiene una sola imagen que intercala todos los accesos, sea cual sea su
origen.
Semántica de sesión:
Modelo de acceso
El modelo de acceso sirve como plantilla para los usuarios y grupos que cree y
ofrece también un mapa de necesidades de permisos de acceso. Si crea grupos de
bases de datos de Netezza para representar estos roles o conjuntos de permisos,
podrá asignar de forma fácil usuarios a los grupos para que hereden los distintos
permisos, y podrá cambiar todos los usuarios con un rol cambiando únicamente los
permisos de grupo o mover usuarios de un rol a otro cambiando sus grupos y
añadiéndolos a los grupos que controlan esos permisos.
11
El modelo de acceso sirve como plantilla para los usuarios y grupos que cree y
ofrece también un mapa de necesidades de permisos de acceso. Si crea grupos de
bases de datos de Netezza para representar estos roles o conjuntos de permisos,
podrá asignar de forma fácil usuarios a los grupos para que hereden los distintos
permisos, y podrá cambiar todos los usuarios con un rol cambiando únicamente los
permisos de grupo o mover usuarios de un rol a otro cambiando sus grupos y
añadiéndolos a los grupos que controlan esos permisos.
Modelo carga/descarga
Realiza las operaciones de lectura y escritura; la lectura consiste en transferir un
archivo de uno de los servidores de archivos al cliente y la escritura consiste en una
transferencia como la lectura, pero en sentido contrario.
READ/WRITE/SEEK:
CLOSE:
Este modelo es capaz de tolerar los fallos ante rearranque del servidor,
posiblemente muestre menos mensajes, no requiere de gastos de recursos en el
servidor por cada cliente.
Gestión de cache
Es una herramienta que permite mejorar el rendimiento del software, por ende, los
Caches de niveles múltiples de un SD cuentan con dos divisiones las cuales son en
los servidores que ayudan a reducir los accesos al disco y los clientes que reducen
el tráfico en la red, la carga en los servidores puede situarse en discos locales con
más capacidad pero con más lentitud con un tamaño que va desde 256 kb a 8 Mb
o bien puede situarse en memoria principal con menor capacidad pero más rapidez
el tamaño de esta puede ser de 32 o 64 kb.
Los metadatos se definen como datos que describen de forma global la información,
el contenido y otras características de los datos, es decir, es información sobre
información o datos sobre datos. Puede almacenarse en memoria principal para
tener accesos más rápidos e incrementar así el rendimiento en los sistemas de
ficheros también puede haber cache de metadatos tanto en los clientes como en los
servidores de entrada y salida.
Política de actualización.
Para que una implementación de cache tenga un alto rendimiento y fiabilidad es
necesario saber cómo y cuándo se deben actualizar los datos y modificarlos a los
dispositivos de almacenamiento. Algunas políticas de Actualización son:
Coherencia de cache.
La coherencia del cache significa que cualquier lectura debe retornar el valor de la
escritura más reciente, mientras más estricta sea esta idea, más difícil de
implementar será, la coherencia se logra cuando cualquier escritura debe ser vista
por una lectura y todas las escrituras son vistas en el orden apropiado.
Gestión de cerrojos.
Un cerrojo proporciona exclusión mutua en el acceso a datos compartidos. El cerrojo
es una variable de dos estados (libre y ocupado) y tiene dos operaciones públicas:
Requiere un servicio con estado, también un servidor que almacene qué cliente(s)
tienen un cerrojo de un fichero y cuáles están en espera.
Lock cerrojo;
InsertaEnCola() {
cerrojo.Acquire();
cerrojo.Release();
ExtraeDeCola() {
cerrojo.Acquire();
if (algo en la cola)
extrae(cosa);
cerrojo.Release();
return cosa;
Protocolo montaje.
Establece una conexión lógica entre el servidor y el cliente, cada máquina incluye
una “lista de exportación”, qué “árboles” exporta y quién puede montarlos.
19
Con la orden man mount se puede encontrar más información acerca de mount.
Acceso a ficheros.
La forma de usar los ficheros influye en el diseño de los SFD según estadísticas de
uso en entornos UNIX de propósito general:
Modelo carga/descarga
- Transferencias completas del fichero
- Localmente se almacena en memoria o discos locales
- Normalmente utiliza semántica de sesión
- Eficiencia en las transferencias
- Llamada open con mucha latencia
20
Método de acceso
- SECUENCIAL: La información es accedida en orden, registro a registro. El
registro depende del tipo de archivo (texto plano sería byte). Las operaciones
de lectura accederán a la información en forma secuencial e incrementando el
puntero de archivo (file pointer). El acceso secuencial es basado en el modelo
de cinta (tape), en donde los archivos son accedidos de a uno a la vez y en
forma secuencial.
Coda
En computación para CODA nos referimos a una estructura de datos del tipo FIFO,
First In First Out (la primera entrada es la primera en salir).
Un ejemplo práctico son las colas que se hacen para obtener un servicio, cómo
pagar en el supermercado o cómo cortar el cabello de la peluquería: lo ideal es que
te atiendan en el mismo orden en que te presentas. Así es exactamente cómo
funciona un CODA FIFO.
Coda utiliza una caché local para proporcionar acceso a los datos del servidor
cuando ocurren desconexiones en la red. Durante el funcionamiento normal, un
usuario lee y escribe al sistema de archivos con normalidad, mientras el cliente
obtiene todos los datos que ha marcado como importantes en el caso de una
desconexión de red. Cuando se pierde la conexión de red, el cliente Coda sirve los
datos desde su caché local y registra cualquier actualización. A este estado se le
llama funcionamiento sin conexión. Al restablecerse la conexión, el cliente Coda
pasa del funcionamiento sin conexión hacia un estado transitorio de "reintegración"
donde las actualizaciones registradas se envían a los servidores. Cuando todas las
actualizaciones se han reintegrado, el cliente vuelve al estado normal de
funcionamiento con conexión.
Conexión de dispositivos
En el modelo de un periférico se distinguen dos elementos:
ordenador. Algunos ejemplos de interfaces de este tipo son los buses PCI,
PCMCIA, USB, PCI-express o SATA entre muchos otros.
1. El SFP cuenta con memoria compartida a nivel del hardware mientras que el
SFD no.
2. El SFD lleva a cabo la realización de procesos descomponiéndose estos en
tareas que son ejecutadas en diferentes ubicaciones utilizando diferentes
recursos a su contra parte del SFP divide un proceso en tareas que son
ejecutadas al mismo tiempo.
3. El SFD se enfoca en la implementación de software ya sea de forma paralela
a secuencial, en cambio el SFP se enfoca en implementación de hardware
para su desarrollo.
Ventajas de SFD
• Muestra mayor flexibilidad y presentaciones de escalabilidad.
• Mayor confiabilidad ya que una falla en nodo dependiente no tiene que
presentar una falla en todo el sistema como tal.
• El SFD es más barato su implementación.
Desventajas de SFD
• Almacena cada fichero en un solo servidor.
• No hay paralelismo en accesos a ficheros Cuenta con demasiadas capas de
software entre el cliente y el servidor
• No aprovechan adecuadamente el paralelismo de la SAN.
25
Ventajas de SFP
• Mejora el tiempo de ejecución de las Aplicaciones disminuyendo el tiempo de
acceso a los datos.
• Permite además de accesos secuenciales accesos paralelos a los ficheros.
• Es altamente escalable es decir cuando mayor sea el número de servidores
de entrada y salidas mejores son las presentaciones del sistema.
• Operaciones de un proceso
• Operaciones independientes de varios procesos
• Operaciones colectivas
Para esto se implementan varias técnicas oportunas de las cuales resaltan las
siguientes
Operaciones no contiguas
E/S implica dos zonas de almacenamiento: Buffer de usuario y zona del fichero
afectada, ambas pueden ser no contiguas lo que significa que pueden ser no
adyacentes como se muestra en la siguiente imagen:
En conclusión, se puede decir que si el Sistema de ficheros tiene soporte para esto
contara con mayor rendimiento del sistema.
Operaciones Colectivas
Invocadas simultáneamente por todos los procesos similares a operaciones
colectivas de paso de mensajes (MPI) todos los procesos especifican misma
operación. Lectura/escritura colectiva
27
1ª fase: Cada NC (Nodo Computo) se ocupa de una parte contigua (data sieving )
2ª fase: NC se redistribuyen los datos
28
SDIO más eficiente, pero requiere NES (Nodos de E/S) más inteligentes.
Existen versiones de GPFS para sistemas operativos AIX (desde 1998) y Linux
(desde 2001). Se incluye como parte de IBM System Cluster 1350.
Arquitectura
EL sistema de ficheros GPFS está compuesto de un conjunto de ordenadores que
forman un cluster GPFS. Algunos de los miembros del cluster proporcionan los
discos físicos accesibles por todos los nodos del sistema. La inclusión y exclusión
de miembros del cluster puede realizarse en funcionamiento.
Cuando un nodo realiza una operación sobre el sistema de ficheros los datos se
distribuyen en tiras ("striping") y son almacenadas en varias de las máquinas que
sirven de discos. De esta forma se obtiene un mayor rendimiento al acceder a los
distintos bloques en paralelo, alta disponibilidad (la información puede almacenarse
en discos de dos o más servidores), recuperación en caso de fallo, seguridad,
DMAPI, gestión jerárquica del almacenamiento HSM y gestión del ciclo de vida de
la información ILM.
Arquitectura:
GooFS es un sistema de archivos que está optimizado por Google para el
almacenamiento de datos básicos y sus necesidades de uso (sobre todo el motor
de búsqueda), y puede generar enormes cantidades de datos que deben ser
mantenidas para optimizar la siguiente respuesta;3 El actual sistema de archivos
surgió como una mejora a su BigFiles, desarrollado por Larry Page y Sergey Brin
30
Los programas acceden a las porciones mediante consultas al nodo Maestro, para
localizar la ubicación de los bloques deseados, si las porciones no se encuentran
activas (por ejemplo, si no poseen accesos pendientes al almacenamiento), el nodo
Maestro responde donde están ubicados, la aplicación contacta y recibe los datos
desde el nodo de alojamiento directamente (es como el funcionamiento de las redes
Kazaa, Skype y otros tipos de supernodos). La principal diferencia entre los demás
sistemas de archivos, es que el GooFS no está implementado en el kernel del
sistema operativo, sino que funciona como una librería (biblioteca) en el espacio de
usuario (userspace).
31
CONCLUSIONES
RECOMENDACIONES
E grafía
• http://www.sc.ehu.es/acwlaroa/SDI/Apuntes/Cap4.pdf
• https://es.wikipedia.org/wiki/General_Parallel_File_System
• https://es.wikipedia.org/wiki/Google_File_System
• http://www.lgblog.cl/tecnologia/que-es-el-cache/
• http://www.fdi.ucm.es/profesor/mendias/512/docs/tema13.pdf
• file:///C:/Users/Dell/Downloads/material%20de%20la%20expo%20genial%2
0para%20expositores.pdf
• https://www.tamps.cinvestav.mx/~vjsosa/clases/tssd/05_DistributedFileSyst
ems_short.pdf
• https://www.fdi.ucm.es/profesor/jjruz/WEB2/Temas/EC6.pdf
• http://www.scielo.org.ve/scielo.php?script=sci_arttext&pid=S0254-
07702007000200008
• https://www.google.com/url?q=http://laurel.datsi.fi.upm.es/_media/docencia/
asignaturas/sod/sod-introduccion-4pp.pdf&sa=U&ved=2ahUKEwigk-
PQkJ7eAhVSpFkKHT4pCzEQFjAHegQICBAB&usg=AOvVaw3LwyoT1XHC
51olbG7Y2yeo
• https://www.google.com/url?q=http://lsi.ugr.es/~jlgarrid/so2/pdf/tema5.pdf&s
a=U&ved=2ahUKEwigk-
PQkJ7eAhVSpFkKHT4pCzEQFjAKegQIBBAB&usg=AOvVaw3bnE9hCMDA
6xxhEgVFhUZJ