Professional Documents
Culture Documents
FACULTAD DE INGENIERÍA
Ingeniería en Software
Sistema de Información Empresarial
• Comprensibles • Incompletos
• Correctos Vs. • Obsoletos
• Consistentes • Fuera de contexto
• Erróneos
• Inaccesibles
Es importante una recopilación de datos oportuna y detallada, adquirir grandes cantidades de datos, organizarlos y
almacenarlos adecuadamente para su posterior análisis y poder tomar mejores decisiones.
Se recogen datos,
procesan y almacenan
Almacén
de datos de la
Un menú de ofertas Empresa Los datos se procesan usando
herramientas de análisis como
y estrategias minería de datos y modelos de
revisado y mejorado decisión
Master Data Management (MDM) es el proceso de mantener la versión única de la verdad para
entidades de datos maestros a través de múltiples sistemas.
Características
Data Marts
Subconjunto temático de datos, orientado a un proceso o un área de negocio específica.
Es muy probable que más de un sistema actúe como la fuente de datos requerida para el sistema BI.
Entonces, existe un requisito para la consolidación de datos que permita extraer datos de diferentes
fuentes y transformarlos para adecuarlos al almacén de datos y, finalmente, los carga en dicho
almacén; este proceso se llama Extraer, transformar, cargar (ETL).
Modelo de un almacén de datos
Ventas Ventas
Ventas
semanales por semanales por
mensuales
vendedor producto
app de
Proceso ETL
nómina
Data Warehouse
(detalla transacciones Minería de
históricas) datos
apps
heredadas
Sistemas de
Tiendas de apoyo a las
otras datos en Registros
Web decisiones
línea
Principales características de un Data
Warehouse
1. Orientado a temas. los datos están organizados por temas para facilitar el
entendimiento por parte de los usuarios, de forma que todos los datos relativos a un
mismo elemento de la vida real queden unidos entre sí.
2. Integrado. los datos se deben integrar en una estructura consistente, debiendo
eliminarse las inconsistencias existentes entre los diversos sistemas operacionales.
Histórico (variante en el tiempo). los datos, que pueden ir variando a lo largo del
tiempo, deben quedar reflejados de forma que al ser consultados reflejen estos
cambios y no se altere la realidad que había en el momento en que se almacenaron.
3. No volátil. la información de un Data Warehouse, una vez introducida, debe ser de
sólo lectura, nunca se modifica ni se elimina, y ha de ser permanente y mantenerse
para futuras consultas.
4. Contienen metadatos (datos sobre los datos), que aportan un valor adicional,
permitiendo tener información sobre su procedencia (sobre todo cuando tenemos
múltiples fuentes), la periodicidad con la que han sido introducidos, la fiabilidad que
nos ofrecen, etc.
Funciones de un Sistema de Manejo de
Base de Datos (DBMS)
Control de redundancia. En los sistemas de bases de datos todos estos ficheros están integrados,
por lo que no se almacenan varias copias de los mismos datos.
Consistencia de datos. Si un dato está almacenado una sola vez, cualquier actualización se debe
realizar sólo una vez, y está disponible para todos los usuarios inmediatamente.
Mejora en estándares de datos. Gracias a la integración es más fácil respetar los estándares
necesarios, tanto los establecidos a nivel de la empresa como los nacionales e internacionales.
Concurrencia
El término concurrencia se refiere al hecho de que los DBMS (SISTEMAS DE ADMINISTRACION DE
BASES DE DATOS) permiten que muchas transacciones puedan acceder a una misma base de
datos a la vez. En un sistema de estos se necesitan algún tipo de mecanismos de control de
concurrencia para asegurar que las transacciones concurrentes no interfieran entre sí.
Lenguaje de consulta
Es un lenguaje declarativo de acceso a bases de datos relacionales que permite especificar diversos
tipos de operaciones en estas. Una de sus características es el manejo del álgebra y el cálculo
relacional permitiendo efectuar consultas con el fin de recuperar de una forma sencilla información de
interés de una base de datos, así como también hacer cambios sobre ella.
En bases de datos, una consulta es el método para acceder a los datos en las bases de datos. Con
las consultas se puede modificar, borrar, mostrar y agregar datos en una base de datos. Para esto se
utiliza un lenguaje de consultas. El lenguaje de consultas a base de datos más utilizado es el SQL.
Consistencia de datos
Es el estado coherente en la información o datos que contiene y que relaciona, en el cual la información
cumple las necesidades o expectativas de quien la requiera. La propiedad de consistencia sostiene que
cualquier transacción llevará a la base de datos desde un estado válido a otro también válido.
Restricción de integridad
Reglas de consistencia que la base de datos debe obedecer.
Chequeo de Validez. El DBMS asegura que solamente los datos del tipo especificado sean ingresados en
la tabla.
Integridad de entidad. Establece que la clave primaria de una tabla debe tener un valor único para cada
fila de la tabla; si no, la base de datos perderá su integridad.
Integridad referencial. Asegura la integridad entre las llaves foráneas y primarias (relaciones padre/hijo).
Encriptado de datos
La seguridad de los datos implica protegerlos de operaciones indebidas que pongan en peligro su definición,
existencia, consistencia e integridad independientemente de la persona que los accede. Para eliminar la
posibilidad de que un usuario pase por un lado del DBMS y obtenga acceso a los datos en forma ilegal, el
DBMS puede encriptar los datos antes de almacenarlos. Cuando un usuario autorizado desee recuperar
datos, se desencriptarán automáticamente.
Economía de escala
Cuando todos los requisitos de datos de la organización se satisfacen mediante una base de datos en lugar
de muchos archivos separados, el tamaño de la operación combinada proporciona muchas ventajas. La
porción del presupuesto que de ordinario se asignaría a varios departamentos para sus costos de diseño,
almacenamiento y costos de datos, se puede combinar, lo que posiblemente resulte en un costo total más
bajo.
Log de seguridad
Si un usuario intenta acceder a un ítem que no está incluido en su vista, o intenta una operación no
autorizada, el DBMS automáticamente registra la ID del usuario en una bitácora (log) de seguridad que está
disponible al ABD.
OLAP (Online Analytical Processing)
Procesamiento analítico en línea
Las bases de datos son sistemas de procesamiento analítico en línea.
Corregido
Servidor SQL
Servidor de Servicios de
Calidad de Datos
Sugerido
Base de Conocimientos
Nuevo
Valores / Reglas
Definición de datos de
Referencia No válido
Fuentes de los
Datos Cumpla con las Políticas