You are on page 1of 17

UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA

FACULTAD DE INGENIERÍA

Ingeniería en Software
Sistema de Información Empresarial

“Sistemas de Manejos de Datos”

Profesor: Jesús Mario Espadas Roque


Alumno: José David Armendáriz Escobar
Matrícula: 47897
05/03/2018
Modelo de desempeño IT
• Fortalecer la lealtad del cliente
• Destacar de los competidores
• Mejorar la precisión y la velocidad de las previsiones
• Cumplir requerimientos regulatorios
¿Hacia dónde • Aumentar el retorno de la inversión en infraestructura de datos
vamos? Metas, • Sistemas de manejo de bases de datos
Objetivos, Misión • Almacenes de datos empresariales (data marts, data warehouses,
minería de datos
• Centros de datos; redes cliente/servidor
• Tableros y cuadros de mando
• Sistemas de gestión del contenido de la empresa

¿Cómo mejorar Tecnologías


nuestro desempeño? de la ¿Cómo lo logramos?
Soluciones, Información Estrategias, Planes
Respuestas Críticas
(IT) • Manejo de documentos y contenido
estructurado para soportar operaciones
• sincronizar datos para obtener una visión
empresarial precisa
• integrar grandes cantidades de datos de • Mejorar la calidad de los datos y la gestión de
una manera que cree inteligencia y valor documentos
• desarrollar la capacidad de predecir en ¿Qué tan bien lo • Diseñar procesos para manejar grandes
tiempo casi real estamos haciendo? cantidades de datos de una manera eficiente
• implementar infraestructura de datos Comparando
para permitir una respuesta rápida y rendimiento
minimizar la incertidumbre • Uso de tableros y cuadros de mando
para mantenerse informado
• Seguimiento de errores y pérdida de
oportunidades por mal manejo de los
datos
La importancia de los datos

• Comprensibles • Incompletos
• Correctos Vs. • Obsoletos
• Consistentes • Fuera de contexto
• Erróneos
• Inaccesibles
Es importante una recopilación de datos oportuna y detallada, adquirir grandes cantidades de datos, organizarlos y
almacenarlos adecuadamente para su posterior análisis y poder tomar mejores decisiones.

Se recogen datos,
procesan y almacenan

Almacén
de datos de la
Un menú de ofertas Empresa Los datos se procesan usando
herramientas de análisis como
y estrategias minería de datos y modelos de
revisado y mejorado decisión

El conocimiento adquirido del


análisis de datos, reduce la
incertidumbre y guía las
decisiones
El manejo de los datos requiere del diseño de una infraestructura adecuada. La gestión de datos es un
acercamiento estructurado para capturar, almacenar, procesar, integrar, distribuir, asegurar y archivar datos
efectivamente a través de su ciclo de vida:

Fuente de datos y Almacenamiento Análisis de Resultados Soluciones


Bases de datos de datos Datos
Visualización Cadena de
Datos de los datos suministro
Internos Data OLAP,
Marts Relaciones
Consultas, con los
EIS, DSS clientes
Datos Almacén de
Externos datos Apoyo a las
decisiones Comercio
electrónico
Data
Marts
Minería de
Datos Metadatos Estrategias
Personales
datos
Conocimiento
y su gestión
Otros
Gestión de datos maestros
Cada organización tiene una parte de su negocio que es común entre los diferentes sistemas. Esa
parte de los datos se pueden gestionar y mantener como datos maestros.

Master Data Management (MDM) es el proceso de mantener la versión única de la verdad para
entidades de datos maestros a través de múltiples sistemas.

Características

• Integración de los datos para lograr una vista más unificada.


• Consolida datos de varias fuentes en un archivo maestro, que retroalimenta a las aplicaciones.
• Entidades de datos maestros. Corresponden a las principales áreas de una compañía, recursos
humanos, ventas, clientes, productos, proveedores.
• Estos sistemas de datos incluyen herramientas que permiten su auditoría y limpieza, integrando y
sincronizando datos para hacerlos más accesibles.
Transformando datos en conocimiento
Data Warehouse
El almacén de datos
El depósito de datos es el núcleo del sistema BI. Un data warehouse es una base de datos construida
para el propósito del análisis e informe de datos. Es una base de datos en la que el único punto de
entrada de datos es a través de ETL, y su principal propósito es cubrir los requisitos de informes y
análisis de datos. Este propósito cambia el diseño de esta base de datos también.

Data Marts
Subconjunto temático de datos, orientado a un proceso o un área de negocio específica.

Extract Transform Load


Extraer, transformar, cargar

Es muy probable que más de un sistema actúe como la fuente de datos requerida para el sistema BI.
Entonces, existe un requisito para la consolidación de datos que permita extraer datos de diferentes
fuentes y transformarlos para adecuarlos al almacén de datos y, finalmente, los carga en dicho
almacén; este proceso se llama Extraer, transformar, cargar (ETL).
Modelo de un almacén de datos
Ventas Ventas
Ventas
semanales por semanales por
mensuales
vendedor producto

app de finanzas Ventas Mercadeo


facturación Relaciones
con los
clientes

app de
Proceso ETL

nómina
Data Warehouse
(detalla transacciones Minería de
históricas) datos
apps
heredadas

Sistemas de
Tiendas de apoyo a las
otras datos en Registros
Web decisiones
línea
Principales características de un Data
Warehouse
1. Orientado a temas. los datos están organizados por temas para facilitar el
entendimiento por parte de los usuarios, de forma que todos los datos relativos a un
mismo elemento de la vida real queden unidos entre sí.
2. Integrado. los datos se deben integrar en una estructura consistente, debiendo
eliminarse las inconsistencias existentes entre los diversos sistemas operacionales.
Histórico (variante en el tiempo). los datos, que pueden ir variando a lo largo del
tiempo, deben quedar reflejados de forma que al ser consultados reflejen estos
cambios y no se altere la realidad que había en el momento en que se almacenaron.
3. No volátil. la información de un Data Warehouse, una vez introducida, debe ser de
sólo lectura, nunca se modifica ni se elimina, y ha de ser permanente y mantenerse
para futuras consultas.
4. Contienen metadatos (datos sobre los datos), que aportan un valor adicional,
permitiendo tener información sobre su procedencia (sobre todo cuando tenemos
múltiples fuentes), la periodicidad con la que han sido introducidos, la fiabilidad que
nos ofrecen, etc.
Funciones de un Sistema de Manejo de
Base de Datos (DBMS)

• Filtrado y perfilado de datos. Busca errores, inconsistencias,


redundancias e información incompleta.
• Calidad de los datos. Corrige, estandariza y verifica su integridad.
• Sincronización de los datos. integra, combina, vincula datos de
diferentes fuentes.
• Enriquecer los datos. Mejorar los datos con fuentes internas y externas.
• Mantenimiento de los datos. Checar y controlar su integridad en el
tiempo.
Ventajas de un Sistema de Manejo de Base de
Datos (DBMS)
Compartición de datos. La base de datos pertenece a la empresa y puede ser compartida por todos
los usuarios que estén autorizados.

Control de redundancia. En los sistemas de bases de datos todos estos ficheros están integrados,
por lo que no se almacenan varias copias de los mismos datos.

Consistencia de datos. Si un dato está almacenado una sola vez, cualquier actualización se debe
realizar sólo una vez, y está disponible para todos los usuarios inmediatamente.

Mejora en estándares de datos. Gracias a la integración es más fácil respetar los estándares
necesarios, tanto los establecidos a nivel de la empresa como los nacionales e internacionales.

Mejora en la accesibilidad a los datos.

Integridad de datos mejorada. Normalmente, la integridad se expresa mediante restricciones o reglas


que no se pueden violar. Estas restricciones se pueden aplicar tanto a los datos, como a sus
relaciones, y es el SGBD quien se debe encargar de mantenerlas.
Capacidades de un DBMS
Integración de datos
La meta de la integración de datos es reunir datos de diferentes fuentes, combinarlas y presentarlas
de tal manera que parezcan una sola unidad.

Concurrencia
El término concurrencia se refiere al hecho de que los DBMS (SISTEMAS DE ADMINISTRACION DE
BASES DE DATOS) permiten que muchas transacciones puedan acceder a una misma base de
datos a la vez. En un sistema de estos se necesitan algún tipo de mecanismos de control de
concurrencia para asegurar que las transacciones concurrentes no interfieran entre sí.

Lenguaje de consulta
Es un lenguaje declarativo de acceso a bases de datos relacionales que permite especificar diversos
tipos de operaciones en estas. Una de sus características es el manejo del álgebra y el cálculo
relacional permitiendo efectuar consultas con el fin de recuperar de una forma sencilla información de
interés de una base de datos, así como también hacer cambios sobre ella.

En bases de datos, una consulta es el método para acceder a los datos en las bases de datos. Con
las consultas se puede modificar, borrar, mostrar y agregar datos en una base de datos. Para esto se
utiliza un lenguaje de consultas. El lenguaje de consultas a base de datos más utilizado es el SQL.
Consistencia de datos
Es el estado coherente en la información o datos que contiene y que relaciona, en el cual la información
cumple las necesidades o expectativas de quien la requiera. La propiedad de consistencia sostiene que
cualquier transacción llevará a la base de datos desde un estado válido a otro también válido.

Restricción de integridad
Reglas de consistencia que la base de datos debe obedecer.

Tipos de restricciones de integridad:

Datos Requeridos. Establece que una columna tenga un valor no NULL.

Chequeo de Validez. El DBMS asegura que solamente los datos del tipo especificado sean ingresados en
la tabla.

Integridad de entidad. Establece que la clave primaria de una tabla debe tener un valor único para cada
fila de la tabla; si no, la base de datos perderá su integridad.

Integridad referencial. Asegura la integridad entre las llaves foráneas y primarias (relaciones padre/hijo).
Encriptado de datos
La seguridad de los datos implica protegerlos de operaciones indebidas que pongan en peligro su definición,
existencia, consistencia e integridad independientemente de la persona que los accede. Para eliminar la
posibilidad de que un usuario pase por un lado del DBMS y obtenga acceso a los datos en forma ilegal, el
DBMS puede encriptar los datos antes de almacenarlos. Cuando un usuario autorizado desee recuperar
datos, se desencriptarán automáticamente.

Economía de escala
Cuando todos los requisitos de datos de la organización se satisfacen mediante una base de datos en lugar
de muchos archivos separados, el tamaño de la operación combinada proporciona muchas ventajas. La
porción del presupuesto que de ordinario se asignaría a varios departamentos para sus costos de diseño,
almacenamiento y costos de datos, se puede combinar, lo que posiblemente resulte en un costo total más
bajo.

Log (bitácora) de recuperación

La recuperación en un SBD consiste en (volver a) dejar la información almacenada en la base de datos en


un estado consistente (correcto), después de un fallo (o caída) del sistema que ha llevado la BD a un estado
inconsistente, o por lo menos “sospechoso” de serlo.
Vista de usuario
A cada usuario se le proporciona una vista de una porción predefinida de la base de datos.
En la vista se incluyen descripciones de los ítems de datos a los que se permite el acceso del usuario, y el
tipo de acceso permitido, ya sea sólo recuperación, actualización o borrado de registros existentes, o
inserción de nuevos registros.

Log de seguridad
Si un usuario intenta acceder a un ítem que no está incluido en su vista, o intenta una operación no
autorizada, el DBMS automáticamente registra la ID del usuario en una bitácora (log) de seguridad que está
disponible al ABD.
OLAP (Online Analytical Processing)
Procesamiento analítico en línea
Las bases de datos son sistemas de procesamiento analítico en línea.

El Procesamiento analítico en línea (OLAP) tiene como objetivo agilizar la


consulta de grandes volúmenes de información. Para ello utiliza estructuras
multidimensionales, conocidas como cubos OLAP, que contienen datos pre-
calculados y agregados. Una base de datos multidimensional puede
contener varios de estos cubos OLAP.

Un cubo OLAP está estructurado en dimensiones, que son las diferentes


perspectivas desde las que queremos analizar la información, y en
medidas, que son los diferentes hechos con valores concretos que solicita
el usuario.
Servicios de
servicios de datos de
Calidad de Datos referencia
Correcto

Corregido
Servidor SQL
Servidor de Servicios de
Calidad de Datos
Sugerido

Base de Conocimientos
Nuevo
Valores / Reglas

Definición de datos de
Referencia No válido
Fuentes de los
Datos Cumpla con las Políticas

You might also like