You are on page 1of 37

Introduccin al Big Data y su aplicacin en

la educacin
[1.1] Cmo estudiar este tema?

[1.2] Introduccin

[1.3] Qu es Big Data?

[1.4] Tratamiento de la informacin

[1.5] Tecnologas de Big Data

[1.6] Infraestructura del Big Data

[1.7] Herramientas de Big Data

[1.8] Big data en la educacin

[1.9] Caractersticas de Big Data en la educacin


1
[1.10] Referencias bibliogrficas
TEMA
Esquema

Introduccin al Big Data y su aplicacin en la educacin

TEMA 1 Esquema
Big Data Big Data-
Educacin

Tratamiento Minera de datos


Definicin de la Tecnologas Infraestructura Herramientas
informacin - Hadoop
Anlisis de
aprendizaje

2
Bases de datos
Volumen Captura Operacionales Componentes
operacionales
Caractersticas
del Big Data en
Herramientas de Proyectos educacin
Variedad Almacenamiento Analticas
organizacin relacionados

Velocidad Bsqueda Data warehouse

Herramientas
Compartir
analticas

Herramientas de
Visualizacin
visualizacin
Del Dato (Big Data) a la Informacin (Internet)

Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Ideas clave

1.1. Cmo estudiar este tema?

Para estudiar este tema lee y estudia las ideas clave desarrolladas en estos apuntes.

En este tema se va a plantear el concepto de Big Data, atendiendo a:

La definicin de los conceptos asociados a Big Data.


Estructura de Big Data genrico.
Aplicacin del Big Data a la educacin.
Las tecnologas existentes que implementan Big
Data.

1.2. Introduccin

En la actualidad nos vemos inmersos en una gran cantidad de datos que proceden de
muy diversos lugares: correos electrnicos, noticias de televisin y de prensa,
calificaciones de exmenes, etc., y ninguno de nosotros estamos exentos de tener que
manejarlos, ni siquiera los ms pequeos.

Dichas fuentes pueden ser ms o menos fiables y hay que saber cmo discriminarlas,
tratarlas y organizarlas. Para ello es necesario que se utilicen herramientas y
conocimientos para que los datos puedan ser discriminados y procesados correctamente.

Podemos analizarlo desde el punto de vista humano, y si hay casos en los que para los
profesores no les es sencillo su manejo, tampoco lo es para aquellos estudiantes que o no
se les ha dado a conocer los instrumentos o no han adquirido las habilidades necesarias
para poder manejarlas. Si se traslada este problema a grandes organizaciones, en las que
la informacin es un factor decisivo para el xito o fracaso de sus proyectos, puede llegar
a ser el factor clave que haga que los proyectos sean o no realizables. Y es en estas
organizaciones donde surge el concepto de grandes volmenes de datos, tambin
conocido como Big Data.

TEMA 1 Ideas clave 3 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

En este tema vamos a tratar y exponer cules son los conceptos bsicos del tratamiento
de informacin, los datos masivos y dnde podemos encontrar esos datos en la
actualidad.

1.3. Qu es Big Data?

Para entender qu es Big Data es necesario comprender qu es un dato. Un dato puede


definirse como: Antecedente necesario para llegar al conocimiento exacto de algo o para
deducir las consecuencias legtimas de un hecho (RAE, 2012). Definicin que remarca
el hecho de que un dato es aquello que nos facilitar el llegar al conocimiento. Pero el
mismo diccionario incorpora una referencia al trmino dato pero relacionado con las
tecnologas de la informacin: Informacin dispuesta de manera adecuada para su
tratamiento por un ordenador. Es decir, que si unificamos las dos definiciones, se puede
decir que los datos incorporados en un sistema informtico nos facilitan herramientas
para que la manipulacin de los mismos nos permita llegar a un conocimiento exacto.

Por otro lado, tenemos el concepto big, que hace referencia a una gran cantidad. Pero,
como veremos en los prximos puntos, no solo va a hacer referencia a la cantidad de
datos sino que ha ido incorporando ms trminos a lo largo del tiempo.

El concepto de Big Data fue introducido por primera vez por Roger Magoulas de OReilly
en 2005, y lo hizo para definir aquella gran cantidad de datos que no poda
gestionarse por medio de tcnicas y procesos tradicionales debido a su
complejidad y tamao. A partir de esa definicin, el concepto de Big Data se estudi
desde distintos puntos de vista, ya que permiti indagar en las implicaciones que existan
desde los distintos campos involucrados. As se observ que Big Data constaba de tres
facetas diferentes, denominadas las tres V de Big Data:

Volumen

Variedad Velocidad

TEMA 1 Ideas clave 4 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Volumen: se refiere a que Big Data implica el manejo de una gran cantidad de datos
que servir para generar informacin, que a su vez, se utilizar para generar
conocimiento. Los datos informticos se miden en bit, que es la unidad mnima de
informacin. Un bit almacena un cero o un uno. La siguiente unidad de medida es el
byte que corresponden a 8 bits. Es la unidad que en un primer momento se utiliz
para el almacenamiento de caracteres, un carcter para poder ser almacenado en una
memoria de ordenador se tuvo que traducir a ceros y unos con lo que se utilizaron 8
bits. Por ejemplo, para representar el carcter A en binario utilizara un byte,
representado en binario por 0100 0001 y, su correspondiente representacin en
decimal, 65. De estas dos unidades surgen las dems unidades que corresponden con:

Unidades de medidas de informacin


Unidad de medida Tamao
Bit Un dgito binario. Es un uno o un cero
Byte 8 bits
Kilobyte (KB) 1024 bytes
Megabyte (MB) 1024 kilobytes
Gigabyte (GB) 1024 megabytes
Terabyte (TB) 1024 gigabytes
Petabyte (PB) 1024 terabytes
Exabyte (EB) 1024 petabytes
Zettabyte (ZB) 1024 exabyte
Yottabyte 1024 zettabyte
Brontobyte 1024 yottabyte

Una vez vistas las unidades que pueden utilizarse para medir la informacin se puede
describir con precisin las expectativas de utilizacin de datos en la red. El volumen de
informacin que est previsto que exista en la red es de exabytes al mes, ms exactamente
24,3 exabytes, como indica CISCO VIN Mobile en la previsin del ao 2015:

TEMA 1 Ideas clave 5 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Cisco Visual Networking Index: Global Mobile Data Traffic Forecast Update 20142019
White Paper (3 de Febrero de 2015). Fuente:
http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-
index-vni/white_paper_c11-520862.html

Velocidad: todo tratamiento de datos Big Data va a implicar un tiempo de


tratamiento, por lo que la velocidad de ese tratamiento debe ser la ms pequea
posible ya que esa informacin tiene validez nicamente si se trata en tiempo real.
Un ejemplo se puede encontrar en el caso de entornos de la bolsa: si se quisiese
realizar una compra o venta de acciones en respuesta a un movimiento de otras
acciones tambin disponibles en bolsa, no tendra sentido si los datos de compra o
venta se obtuviesen un da despus de haber obtenido la informacin de partida. El
sistema utilizado para obtener la respuesta no sera eficiente. En este caso cuanta
mayor velocidad mayor eficiencia.

Variedad: los datos que se incluyen en Big Data son muy diversos y heterogneos,
pueden incluir tanto datos denominados estructurados, como no estructurados.
Los datos estructurados son aquellos que estn encorsetados en una estructura
definida, como pueden ser los utilizados en las bases de datos (nmero decimal,
carcter, bit, etc.); otro caso de datos estructurados, son los definidos a travs de una
estructura concreta, como son ficheros en los que los datos estn separados por comas
(CSV) pero siempre referidos a los mismos trminos. Por ejemplo, si se tuviese un
CSV con los datos de los empleados de una empresa, cada lnea del archivo tendra
cada uno de los datos de cada empleado en un orden. Este orden sera el que
permitira identificar cada uno de los datos de cada empleado, ya que siempre
aparecera, por ejemplo, primero el nombre, luego la direccin, y siempre en el mismo
orden.

TEMA 1 Ideas clave 6 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Los datos no estructurados son aquellos que no tienen una estructura definida,
como pueden ser imgenes, vdeos o ficheros de sonido.

Los datos que pueden aparecer en un almacenamiento masivo son variables y podran
ser desde imgenes, registros de actividad de usuarios, hasta informes estadsticos,
pasando por vdeos, textos o cualquier otro tipo de formato.

A estas tres caractersticas bsicas se han aadido a lo largo del tiempo y sucesivamente
otras facetas o aspectos, como se observa en la siguiente figura:

Volumen

Valor Velocidad

Veracidad Variedad

Los trminos de veracidad y valor se refieren a:

Veracidad: est relacionada con el grado de confianza que se tiene en los datos
almacenados para poder llevar a cabo una decisin. Si los datos de entrada son
errneos se hace complicado que los resultados obtenidos respecto a los mismos sean
veraces.

Valor: es el trmino asociado a cada dato para darle especficamente una


significacin, prioridad o magnitud.

Como conclusin, podramos decir que una fuente de datos ser Big Data no tanto por
la cantidad de informacin que vaya a contener, es decir, si tiene ms o menos teras de
datos, sino que se observarn otros aspectos como la variedad de datos que almacenar,
el tiempo con el que se contar para su tratamiento, por lo que ser necesario que sean

TEMA 1 Ideas clave 7 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

tratados y transformados por ciertas herramientas para conseguir extraer informacin


de los mismos.

Esta caracterstica hace que las definiciones de Big Data sean diferentes si se aplican a
diversos sectores. As, por ejemplo, en el mundo econmico, un Big Data ser cualquier
almacenamiento que pueda dar un valor significativo a los datos que hagan que la
productividad y la competitividad de la compaa permitan crear una venta competitiva
ante sus clientes. Por el contrario, en el sector educativo, un Big Data ser un
almacenamiento de datos que permitan enfocar de manera individual el aprendizaje
autnomo de los estudiantes.

1.4. Tratamiento de la informacin

Big Data no trata solo el trmino de dato, sino que tambin est relacionada con las
alternativas existentes en las tcnicas que pueden mejorar el manejo de las tres/cinco V
para que incrementen su valor. Por lo que estas V implican que exista un tratamiento
de los datos enfocndose en distintos aspectos:

El modo en el que se capturan los datos junto con la seleccin de los datos que se
capturan.
El modo de almacenamiento de los datos que han sido capturados.
Una vez almacenados debern existir herramientas que permitan una bsqueda
adecuada de los datos.
En el caso de que sea necesario, esos datos han de ser compartidos entre distintos
entornos.
El ltimo aspecto a tener en cuenta cuando se tiene esa gran cantidad de datos es el
modo en el que van a ser visualizados.

Captura Almacenamiento Bsqueda Compartir Visualizacin

TEMA 1 Ideas clave 8 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Es decir, cada vez que se hace necesaria la extraccin de resultados en base a los datos
bsicos, se hace necesaria una transformacin que permita obtener conclusiones. El
proceso bsico de esa transformacin es el siguiente:

Partiendo de los datos sin tratar, lo que se hace es un preprocesado, para llevar a cabo
una concrecin de los mismos para que luego se pueda realizar un anlisis de correlacin
que permita una extraccin exhaustiva de informacin, y este ltimo proporcionar una
serie de resultados.

El esquema bsico est representado en el siguiente diagrama:

Datos sin
Captura
procesar

Organizacin

Integracin

Resultados
Anlisis
del anlisis

Retos en el anlisis

Para que el proceso llegue a buen fin es necesario abordar una serie de retos. En cuanto
a la captura, se hace necesario un control dependiendo del tipo de datos ya que las
transformaciones que se tienen que aplicar en cada caso no son las mismas. Por ejemplo,
la informacin que se debe tratar en una imagen y en un PDF es distinta. En un PDF se
puede tener que realizar un anlisis del tamao segn el nmero de pginas que
contiene, que en una imagen nunca se podra realizar dado que no contiene nmero de
pginas, pero por el contrario s que existe un tamao que ser su dimensin, alto y
ancho.

TEMA 1 Ideas clave 9 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Cuando los datos preprocesados necesitan organizacin, en el proceso de anlisis nos


encontramos en muchos casos con que este proceso se debe realizar secuencialmente y
que se hace necesaria una mquina con gran potencia de clculo y gran cantidad de
memoria que pueda soportarlo.

En el sistema de integracin de los datos tienen que tener las conexiones suficientes
como para que se puedan enlazar y se puede hacer muy complejo si adems los datos que
se quieren enlazar son de formatos muy heterogneos. Tambin hay que tener en cuenta
que cuando se realiza la correlacin de los datos puede ocurrir que el tiempo para realizar
la sincronizacin puede ser crtico en el procesamiento.

En el proceso de anlisis, tambin denominado data mining, hay que tener en cuenta
que para la extraccin de los resultados de informacin es necesario el uso modelos o
patrones que hagan la extraccin de informacin de esos datos, ya sea por su propia
estructura o por sus conexiones.

1.5. Tecnologas de Big Data

Las tecnologas de Big Data abarcan dos grandes tipos de campos: el campo operacional
y el campo analtico, en ciertos mbitos tambin denominados: tecnologas
operacionales y tecnologas de la informacin.

Las tcnicas operacionales se centran en la carga en tiempo real e interactivo de datos


capturndolos y almacenndolos. Y, por otro lado, las tcnicas analticas permiten el
anlisis en retrospectiva de datos complejos. Aunque estas dos tecnologas son dispares,
se complementan para integrarse en herramientas que permiten el tratamiento masivo
de datos, formando as lo que se conoce como arquitectura de las tecnologas Big
Data.

Tcnicas Tcnicas
operacionales analticas

TEMA 1 Ideas clave 10 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Las exigencias que demandan cada una de estas herramientas son contrapuestas. En el
caso de las herramientas operacionales es necesario que tengan un gran rendimiento,
que permitan peticiones concurrentemente y que sean escalables, es decir, que puedan
adaptarse a la cantidad de informacin demandada aunque sean varias las peticiones
realizadas. En cambio, en las herramientas analticas lo que se demanda es que sean
capaces de gestionar consultas complejas con un rendimiento muy alto en su salida,
dando sus resultados en tiempos mnimos.

1.6. Infraestructura del Big Data

Para dar soporte al procesamiento de Big Data es necesario crear una infraestructura
de componentes que permita su tratamiento. El esquema bsico de esta
infraestructura est expuesto a continuacin:

Dispositivos hardware (ordenadores, telfonos mviles,


porttiles, tabletas, etc.)

Aplicaciones Big Data


Herramientas de redundancia de
Herramientas de seguridad

Herramientas de creacin de informes y de


visualizacin

Anlisis (tradicional y avanzado)


datos

Data warehouses y herramientas analticas

Bases de datos y herramientas para la


organizacin
Datos estructurados y no estructurados en bases
de datos operacionales

TEMA 1 Ideas clave 11 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Datos estructurados y no estructurados en bases de datos operacionales

Toda buena infraestructura de Big Data comienza con lo que se denominan las bases
de datos operacionales. Estas son aquellas que van a contener toda la coleccin de
datos que van a ser tratados posteriormente.

Las caractersticas bsicas de estas colecciones de datos es que deben ser:

Rpidas: A una mayor rapidez en la gestin de los datos, el resto de herramientas


dentro de la infraestructura trabajarn mejor y con resultados ptimos.

Escalables: El tipo de informacin que puede aparecer en un Big Data es muy


variable y puede variar con el tiempo, por lo que un sistema que permita adaptarse al
tipo y cantidad de informacin ser ms verstil.

Robustas: El tipo de entornos que se tiene que encontrar un almacenamiento masivo


de informacin tiene que ser capaz de responder de manera eficiente a los posibles
cambios que puedan surgir, incluso a los procesos de incertidumbre que se puedan
encontrar. Permitiendo que la respuesta de informacin siga respondiendo a las
peticiones aunque se produzcan fallos en el sistema.

Dentro de las bases de datos operacionales se pueden encontrar aquellas que utilizan
datos estructurados o datos no estructurados:

Bases de datos operacionales con datos estructurados: son aquellas en las


que los datos estn organizados de manera que pueden accederse mediante un
lenguaje estndar como puede ser SQL. La estructura ms usual de estructuracin es
la utilizacin de tablas, denominndose bases de datos relacionales.

Bases de datos operacionales con datos no estructurados: son aquellos


almacenes de informacin que permiten guardar informacin sin una estructura
estndar, como pueden ser documentos, ficheros, imgenes, vdeos, y permiten su
acceso a travs de lenguajes propios de acceso. Estas bases de datos a veces se
denominan bases de datos no SQL.

TEMA 1 Ideas clave 12 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Herramientas y servicios que permiten la organizacin de datos

Las herramientas de organizacin permiten la validacin y la estructuracin de grandes


cantidades de datos en agrupaciones de datos, denominadas colecciones. Al
caracterizarse los Big Data por el volumen de datos que contienen, este tipo de
herramientas deben poseer una serie de caractersticas en concreto. Estas caractersticas
son:

Sin errores: la clasificacin y organizacin de informacin debe ser lo ms exacta y


correcta para que luego permita su extraccin o bsqueda.
Debe realizarse de la manera ms eficiente para que se optimice la gestin de los
datos masivos.

Dentro de estas herramientas se encuentran: las herramientas ETL (Extraction


Transformation Load) o herramientas de extraccin, trasformacin y carga de
informacin, servicios de flujo de datos, servicios de serializacin, sistemas de archivos
distribuidos y servicios de coordinacin; estos dos ltimos utilizados para desarrollar
sistemas que no se encuentran directamente en una mquina sino que se utilizan un
conjunto de mquinas interconectadas que funcionan como una unidad.

Data warehouses y herramientas de anlisis

Antes de que apareciese el concepto de Big Data para definir los grandes almacenes de
informacin que tuviesen distintos orgenes de datos se utilizaba el concepto de data
warehouse. Este concepto fue acuado por Will Inmon, a principios de los aos 90 y
plasmado en su libro Building the Data Warehouse.

Los data warehouse surgen para dar cabida a la informacin existente en los entornos
corporativos, que necesitaban estructurar la informacin existente en sus centros de
proceso de datos. Un data warehouse almacena la informacin con una estructura
homognea y permite dar una fiabilidad en las consultas y tratamientos posteriores a su
incorporacin.

Las caractersticas propias de un data warehouse son:

Normalizacin: Los datos normalizados se refieren a que estn estructurados


respecto a unas normas muy concretas.

TEMA 1 Ideas clave 13 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Integracin: Los datos almacenados dentro del data warehouse tienen la


posibilidad de proceder de orgenes de datos distintos que se integran como si fuesen
una unidad.
Datos histricos: Suelen almacenar datos que evolucionan a lo largo del tiempo y
permiten analizar el progreso de los mismos.
No voltil: La carga de datos se realizar en un cierto momento y no se realizarn
modificaciones, actualizaciones o borrados de la informacin contenida en el sistema.
Consultas planificadas: aunque pueden realizarse consultas en un cierto
momento, los data warehouse estn diseados para que puedan ejecutarse consultas
planificadas.

Un concepto asociado a los data warehouse es el de data mart. Las caractersticas de


uno y otro son muy similares, tan solo se diferencian en que un data warehouse engloba
la informacin de todo un sistema de informacin, y un data mart solo recoge parte de
esta informacin. Si se aplican estos conceptos a una organizacin, un data warehouse
sera la informacin relativa a toda la organizacin y en cambio un data mart podra ser
solo la correspondiente a un solo departamento.

Datos Datos de Datos


clientes operacin histricos

Nivel organizacin

Data warehouse
departamental
Nivel

Data mart Data mart Data mart

TEMA 1 Ideas clave 14 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

La creacin de un data mart puede estar motivada por una cuestin de seguridad;
no se quiere que los empleados de un departamento puedan acceder a la informacin
general de la empresa sino solo a la informacin relativa a su departamento. Para
mejorar el acceso y eficiencia a los datos haciendo que sea una mquina diferente la
que gestione los datos del data mart que la que gestiona la del data warehouse. O puede
darse por razones coyunturales, por el esquema de la base de datos que se va a utilizar o
porque es ms adecuado para establecer los accesos de los usuarios.

Otro concepto importante relacionado con los data warehouse son los metadatos. Un
metadato es la estructura que pueden tener los datos. Va a ser el molde por el cual los
datos van a organizarse y almacenarse dentro del data warehouse. De la definicin de
esos datos va a depender en gran medida la eficiencia posterior de la extraccin de los
datos. Adems, esos metadatos van a proporcionar la normalizacin de los distintos
orgenes de datos que el data warehouse necesita.

Los data warehouses se asemejan a los Big Data por tratar grandes cantidades de
informacin pero no son exactamente lo mismo. Las diferencias primordiales son
las siguientes:

Los datos que manejan los data warehouses son estructurados y almacenados para
su posterior consulta. En el caso de los Big Data los datos son de orgenes dispares
que van a necesitar un procesamiento previo para poder ser almacenados.

El origen de los datos de un data warehouse proviene de la propia organizacin,


en cambio en Big Data provienen tanto de fuera como de dentro de las organizaciones.
Adems, en este ltimo suele drsele un carcter distribuido.

En los data warehouse los datos se aaden de manera peridica al sistema, ya sea
semanal o mensualmente. En cambio en Big Data los datos se suelen regenerar de
manera ntegra en el sistema cada cierto tiempo.

El anlisis de los datos en un data warehouse se realiza sobre un entorno de datos


estable. Pero en Big Data la estructura de los datos no est estandarizada por lo que
el anlisis de los modelos de informacin tiene que modificarse a lo largo del tiempo
y conseguir cada vez una mejor adaptacin a los mismos. Por este motivo, en Big Data
se necesita un proceso de anlisis con una mayor exigencia de memoria del sistema
que en los sistemas de data warehouse.

TEMA 1 Ideas clave 15 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Anlisis de Big Data

Tras haber depositado los datos dentro de un almacenamiento se hace necesario utilizar
herramientas y tcnicas que hagan que los datos tomen un sentido, adquieran un valor y
se transformen en informacin. Son diversas las herramientas existentes y se pueden
englobar en las siguientes:

Herramientas de anlisis y anlisis avanzado: son herramientas que permiten


extraer la informacin de los almacenes y hacer que sea comprensible al ser humano.
Dentro de las herramientas de anlisis existen las herramientas de anlisis
predictivo, que son aquellas que permiten tras el estudio de datos que han sucedido
en un tiempo determinado predecir acontecimientos futuros. Se utiliza por ejemplo
para la prediccin de la evolucin del mercado.

Predictive analytics | Forecasting in businessq. Autor: Hrvoje Smolic. Fuente:


http://www.qualia.hr/predictive-analytics-forecasting-in-businessq/

Por otro lado, estn las herramientas anlisis de sentimiento o de opinin, que
permiten extraer el contenido de un texto indicando realmente su sentido de la opinin
o la subjetividad que quiere reflejar. Este tipo de herramientas permiten extraer de frases
textuales como: El acto principal fue esplndido, la positividad del mismo. Aunque
tienen sus retos con frases como El acto principal fue como se esperaba, en la que la
opinin no queda realmente reflejada.

TEMA 1 Ideas clave 16 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Sentiment Analysis: Blogmeter e Celi al Sentiment Symposium di New York. Autor: Laura Caldarella.
Fuente: http://www.blogmeter.it/blog/eventi/2014/03/07/sentiment-analysis-speech-di-blogmeter-e-
celi-al-simposio-di-new-york/

Herramientas de generacin de informes y paneles. Herramientas utilizadas


para representar la informacin de manera que pueda ser fcilmente interpretada.
Estas herramientas siempre se han utilizado cuando se han tenido que representar
datos, pero se hace especialmente complejo cuando el nmero de datos a representar
es excesivo, como es el caso de Big Data.

Sales dashboard II - Microsoft Dynamics NAV.


Fuente: http://jetreports.com/es/bi-solutions/microsoft-dynamics-nav-dashboards-and-reports.php

TEMA 1 Ideas clave 17 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Herramientas de visualizacin: estas herramientas son parecidas a los informes


que permiten mostrar los datos de manera visual, pero su gran diferencia es que
permiten actuar interactivamente con los datos y que esa visualizacin se pueda
modificar de forma dinmica.

Microsoft Releases Geoflow For Excel, A 3D Big Data Visualization Tool Built On Bing Maps. Autor:
Pradeep. Fuente: http://microsoft-news.com/microsoft-releases-geoflow-for-excel-a-3d-big-data-
visualization-tool-built-on-bing-maps/

Aplicaciones Big Data

Son aplicaciones que, basndose en la arquitectura que se est describiendo, se crean


para dar soporte a caractersticas que no son soportadas por las aplicaciones anteriores.
En este caso, son aplicaciones que se adaptan a entornos concretos de la industria para
dar soporte a problemas especficos.

Herramientas de redundancia

Las herramientas de redundancia permiten que el sistema pueda proporcionar el mismo


sistema de respuesta aunque parte del sistema haya cado o se haya producido algn tipo
de error. Consiste en duplicar parte o la totalidad del sistema con sistemas paralelos que
den soporte ante el fallo.

TEMA 1 Ideas clave 18 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Esto no siempre es fcil de implementar, ya que supone que el sistema tenga que realizar
una inversin superior para la adquisicin de los equipos del sistema. Pero, dada la
criticidad de este tipo de infraestructuras, supone una inversin menor que la inversin
que supondra el dao producido por la prdida de informacin. Por lo que estas
inversiones siempre son muy recomendables.

Normalmente se opta por solo duplicar aquellas partes que son ms crticas, que al
producirse cierto error provocar un fallo mayor en el sistema.

Herramientas de seguridad

Las herramientas de seguridad que se aplican a un sistema de Big Data no difieren


mucho de los sistemas tradicionales. Es necesario por tanto establecer puntos de control
de seguridad dependiendo de las necesidades de implantacin del Big Data y totalmente
dependientes de la arquitectura del mismo. Los puntos ms crticos de actuacin en
cuanto a la seguridad son:

A nivel de las bases de datos operaciones se tendr en cuenta la encriptacin y


cifrado de la informacin siempre que sea sensible.

En cuanto a las herramientas analticas se tendrn que configurar los accesos a los
datos respecto a niveles de acceso y permisos de usuario.

Las aplicaciones desarrolladas tendrn que predecir los accesos que se realizarn
al sistema Big Data.

Si a los sistemas de Big Data se accede a travs de distintos dispositivos, sern


necesarios sistemas de encriptacin de comunicaciones y controles de acceso
desde sistemas externos al que se encuentra el sistema Big Data (por ejemplo,
con el uso de firewalls).

Cuando se quiere crear una infraestructura Big Data es necesaria la utilizacin de una
serie de herramientas y tcnicas. Estas tcnicas tienen que ser las ms adecuadas para
cubrir cada uno de los pasos necesarios para el tratamiento de informacin. Por eso lo
ms adecuado es colocar en paralelo las herramientas con la etapa en la que se debe
utilizar:

TEMA 1 Ideas clave 19 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Bases de datos
Bases de datos
operacionales
Captura operacionales
no
estructuradas
estructuradas

Herramientas
Bases de datos de
Organizacin para la organizacin y
organizacin estructuracin
de datos

Data marts -
Data
Integracin warehouses
Mercados de
datos

Herramientas Herramientas
Informes de
Anlisis de anlisis de anlisis
resultados
Visualizacin
tradicionales avanzadas

Infraestructura
Herramientas Infraesructura para la
de soporte de seguridad redundancia
fsica de datos

1.7. Herramientas de Big Data

Dentro de cada una de las tecnologas asociadas a Big Data existen distintas
herramientas que proveen las caractersticas descritas; algunas se restringen al campo
operacional, otras al campo analtico, y otras combinan herramientas de los dos tipos:

Arquitectura integrada:

o Hadoop desarrollado por Apache, es un conjunto de herramientas utilizadas


para gestionar grandes volmenes de informacin dentro de clusters (o
agrupaciones de mquinas).

Operacionales:

o RDBMS: gestores de bases de datos relacionales tradicionales basados en tablas.


o Bases de datos NoSQL: son bases de datos que permiten gestionar datos no
estructurados (tablas), datos como archivos de texto, imgenes o vdeos. Dentro de
este tipo de bases de datos se encuentran MongoDB, Cassandra o CouchDB.

TEMA 1 Ideas clave 20 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Analticas:

o MapReduce: aunque originario de Google, se integr como herramienta para el


tratamiento de datos en paralelo dentro de Hadoop.
o Lenguaje R: es un lenguaje desarrollado por los laboratorios Bell, para el
tratamiento estadstico de datos, cuyo entorno incluye un conjunto de
herramientas que permiten la manipulacin de grandes volmenes de datos y la
visualizacin de informacin por medio de grficos y diagramas.

Big data landscape v 3.0 - Matt Turck (FirstMark). Autor: Matt Turck. Fuente:
http://www.slideshare.net/mjft01/big-data-landscape-matt-turck-may-2014

En cuanto a las herramientas citadas anteriormente, haremos un estudio ms exhaustivo


de la herramienta Hadoop, una de las ms extendidas y utilizadas por tratarse de una
herramienta abierta.

TEMA 1 Ideas clave 21 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Hadoop

Es un marco software que incluye una serie de


componentes diseados para cubrir todas las
necesidades asociadas a un sistema Big Data: el
almacenamiento distribuido, el almacenamiento de informacin y el anlisis de datos.
Tiene un diseo que permite escalar el sistema de gestin de datos desde una nica
mquina hasta un compendio de mquinas denominadas cluster.

Los componentes bsicos de Hadoop son los siguientes:

HDFS
(Almacenamiento redundante).

Hadoop YARN
Common (Gestin de recursos del cluster).

MapReduce
(Procesamiento de datos).

Hadoop Common: es el ncleo central de Hadoop y se encarga de que el resto de


mdulos puedan funcionar de manera conjunta.
HDFS (Hadoop Distributed File System).
Hadoop YARN: es un marco que permite la planificacin de los procesos y la gestin
de los recursos dentro del cluster.
Hadoop MapReduce: es el sistema basado en YARN que permite el procesamiento en
paralelo de grandes conjuntos de datos.

A parte de los mdulos principales, existen una serie de proyectos anexos que
proporcionan caractersticas auxiliares al marco. A los mdulos base junto con estos
proyectos es lo que se denomina ecosistema Hadoop.

TEMA 1 Ideas clave 22 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Future of Data - Big Data. Autor: Shankar R. Fuente: http://es.slideshare.net/cosmokramer5/future-of-


data-big-data

Ambari: es una herramienta para el aprovisionamiento, gestin y monitorizacin


de los clusters de Hadoop con soporte para Hadoop HDFS, Hadoop MapReduce,
Hive, HCatalog, HBase, ZooKeeper, Oozie, Pig y Sqoop.
Avro: es un sistema de serializacin de datos.
Cassandra: es una base de datos escalabre multimaestra sin puntos simples de
fallo.
Chukwa: es un sistema de recoleccin de datos para la gestin de grandes sistemas
distribuidos.
HBase: es una base de datos escalable y distribuida que soporta el almacenamiento
de datos estructurados en grandes tablas.
Hive: es una infraestructura de data warehouse que proporciona agrupaciones de
datos y consultas ad hoc.
Mahout: es una biblioteca de minera de datos y una mquina de aprendizaje
escalable.
Pig: se utiliza en la programacin en paralelo como un marco de ejecucin y un
lenguaje de flujo de datos a alto nivel.
Spark: es una mquina de clculo general que soporta aplicaciones como ETL,
mquinas de aprendizaje, procesamiento de flujos y calculo grfico.

TEMA 1 Ideas clave 23 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Tez: un marco de programacin de flujo de datos.


ZooKeeper: es un servicio para la coordinacin de aplicaciones distribuidas de
alto rendimiento.

1.8. Big Data en la educacin

Dentro del campo de la educacin, los sistemas de Big Data son herramientas muy
valiosas. Dan soporte al profesorado para llevar un mejor seguimiento del alumnado
y, por otro lado, ayudan promover el aprendizaje del alumno.

Como se ha visto en apartados anteriores existen herramientas de muy diversos tipos


relacionadas con los Big Data: de visualizacin, analticas, de creacin de informes.
Cuando se aplican cada una de ellas al campo de la educacin aparecen herramientas
especficas como son la minera de datos educativos o el anlisis del aprendizaje.

Cada una de ellas tiene unos objetivos especficos que se exponen a continuacin.

Los objetivos de la minera de datos (anlisis de datos) educativos son:

El desarrollo de algoritmos para encontrar patrones en los datos, es decir, poder


dilucidar cules son los trminos especficos para que cada alumno pueda realizar un
proceso de aprendizaje ms eficiente.

Poder realizar valoraciones de satisfaccin del alumno.

Personalizar la experiencia de cada alumno ayudando en la eficacia de su aprendizaje.

En cuanto a las herramientas de anlisis de aprendizaje, los objetivos son:

Analizar la situacin de aprendizaje de cada alumno, permitiendo crear rutas de


aprendizaje propias para cada alumno.

Comprobar si el alumno ha conseguido alcanzar las competencias necesarias para


superar o no un temario.

TEMA 1 Ideas clave 24 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Si es necesario o no dar soporte a un alumno en alguna de las competencias para la


superacin de las asignaturas.

La aplicacin de Big Data a la educacin proporciona una gestin de la informacin


propia y exclusiva:

Primero se debe instalar un sistema de aprendizaje online.

En el primer acceso del alumno no se tiene informacin suficiente acerca del


contenido en el que est interesado, pero en sucesivos accesos se va a recolectar la
informacin suficiente para proporcionarle contenidos individualizados y
configurados segn sus tendencias y deseos.

Una vez se estudie su actividad se podrn realizar previsiones de progreso y de qu


rendimiento conseguir en un futuro. Para mostrar dicho progreso se utilizarn
herramientas de visualizacin (informes, paneles).

Por cada entrada que el alumno haga se adaptarn los contenidos a su seguimiento y
sus intereses.

Y en el caso de que sea necesario se podr contar con la intervencin de profesores


que puedan apoyar las deficiencias que pueda tener el alumno.

Instalacin y preparacn
del sistema de
aprendizaje

Intervencin de Interaccin del alumno


profesores con el sistema

Adaptacin de Previsioes de progreso


contenidos al alumno (informes, paneles...)

TEMA 1 Ideas clave 25 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

1.9. Caractersticas de Big Data en la educacin

Para que este sistema entre en funcionamiento de manera correcta es necesario tener un
control exhaustivo del sistema de aprendizaje. No cualquier sistema se va a
adaptar al entorno educativo que se quiere implementar, por lo que se hace necesario
estudiar profundamente las necesidades que se quieren cubrir y cules han sido los
antecedentes del sistema.

Por otro lado, es necesario estudiar y conocer cules son los sistemas software que se
adaptan mejor a esas necesidades, por lo que se hace necesario hacer un estudio de los
sistemas existentes. Adems, hay que contar con el sistema hardware necesario para su
instalacin.

Otro punto a tener en cuenta es las caractersticas de la informacin que se va a tener que
almacenar y carcter de la misma, ya que la cuestin de privacidad va a ser un factor
crtico. Dado que se estn registrando datos del alumno no todo el personal debera tener
acceso a los mismos.

Por estas razones se propone que los sistemas de Big Data para la educacin deben
tener como mnimo estas caractersticas:

Respecto a los estudiantes:

o Deben proporcionar un acceso sencillo a la informacin del sistema.


o Debe ser capaz de registrar el acceso a los contenidos del alumno y evaluar su
seguimiento.
o Debe incluir herramientas que permitan nivelar correctamente las
competencias del alumno.
o Debe incluir modos atractivos y diversos para que el alumno se encuentre
motivado ante el estudio.

Respecto al profesorado:

o Debe proveer un sistema sencillo para preparar e incluir el material al que va a


tener acceso el alumno.

TEMA 1 Ideas clave 26 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

o Debe proporcionar herramientas que puedan configurar los profesores para


hacer las evaluaciones del alumnado.
o Los informes del seguimiento de los alumnos deberan poder ser configurables
y dinmicos para que sea ms rpido su anlisis.
o Debe permitir que los profesores puedan crear distintos escenarios para que los
alumnos con distintas necesidades puedan acceder a los mismos.

Respecto a los administradores del sistema:

o Debe proveer herramientas de encriptacin.


o Debe incluir herramientas para la realizacin de copias de seguridad de los
datos y redundancia de informacin para responder a las cadas del sistema.
o Debe incluir herramientas para facilitar la configuracin y puesta en marcha
del sistema.

Tiene que quedar claro que la tecnologa tiene que ser una herramienta para que los datos
almacenados en los grandes volmenes de informacin puedan ser tratados o
manipulados, pero el esfuerzo de convertir los datos en conocimiento, hasta el momento
solo lo ha podido realizar el hombre.

1.10. Referencias bibliogrficas

CISCO (3 de febrero de 2015). Cisco Visual Networking Index: Global Mobile Data Traffic
Forecast Update 20142019 White Paper. Recuperado de
http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-
networking-index-vni/white_paper_c11-520862.html

Inmon, W. H. (octubre, 2005). Building the Data Warehouse (4 ed.). Nueva York
(EE. UU.): Wiley.

RAE (2012). Diccionario de la lengua espaola (22 ed.) [Versin web]. Recuperado de
http://www.rae.es/

TEMA 1 Ideas clave 27 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Lo + recomendado

Lecciones magistrales

Las herramientas de visualizacin de datos

En esta leccin magistral haremos un recorrido por las distintas herramientas existentes
para la visualizacin de grandes volmenes de datos y cmo se puede hacer uso de ellas.

La leccin magistral est disponible en el aula virtual

No dejes de leer

Definiciones de Big Data

Stuart, J. y Barker, A. (20 de septiembre de 2013). Undefined By Data: A Survey of Big


Data Definitions.

Este artculo ofrece la evolucin del trmino de Big Data desde el punto de vista de las
empresas que en la actualidad ofrecen herramientas para el tratamiento masivo de
informacin (Intel, Oracle, etc.).

Accede al artculo a travs del aula virtual o desde la siguiente direccin web:
http://arxiv.org/pdf/1309.5821.pdf

TEMA 1 Lo + recomendado 28 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

No dejes de ver

La aventura del saber. Big Bang Data

Qu son los datos masivos? Big Bang Data es una exposicin itinerante que arranca en
el CCCB, el Centro de Cultura Contempornea de Barcelona. Nos acerca, por primera vez
en Espaa, al fenmeno de la explosin de datos, desde las artes, la poltica, la
investigacin y la participacin ciudadana.

Accede al vdeo a travs del aula virtual o desde la siguiente direccin web:
http://www.rtve.es/alacarta/videos/la-aventura-del-saber/aventura-del-saber-big-
bang-data/2822809/

No dejes de escuchar

La Biblioteca Nacional pondr el Big Data cultural a disposicin del pblico


espaol

Programa de Sostenible y renovable de Radio 5, que expone las actuaciones que est
llevando a cabo la Biblioteca Nacional para poner a disposicin del pblico el Big Data
cultural.

Accede al audio a travs del aula virtual o desde la siguiente direccin web:
http://www.rtve.es/radio/20150421/biblioteca-nacional-pondra-big-data-cultural-
disposicion-del-publico-espanol/1133641.shtml

TEMA 1 Lo + recomendado 29 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

+ Informacin

A fondo

The Mobile Learning Phenomenon in Education

En este informe, elaborado por CISCO, se hace un estudio del fenmeno de la utilizacin
de dispositivos mviles en la educacin.

Accede al informe a travs del aula virtual o desde la siguiente direccin web:
http://www.cisco.com/web/KR/events/smart_education/pdf/CiscoMobileLearningPh
enomenonWP_V2.pdf

Architecture Framework and Components for the Big Data Ecosystem

Demchenko, Y., Ngo, C. y Membrey, P. (12 de septiembre de 2013). Architecture


Framework and Components for the Big Data Ecosystem. System and Network
Engineering Group y Universiteit van Amsterdam.

Este informe explica la arquitectura bsica de un Big Data, sus necesidades y los
entornos en los que se aplica. Expone con claridad las necesidades de seguridad de estos
sistemas.

Accede al informe a travs del aula virtual o desde la siguiente direccin web:
http://www.uazone.org/demch/worksinprogress/sne-2013-02-techreport-bdaf-
draft02.pdf

TEMA 1 + Informacin 30 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Webgrafa

Inspiring Science Education

Pgina web que provee herramientas y recursos para promover e inspirar a los alumnos
la utilizacin de herramientas online.

Accede a la pgina web a travs del aula virtual o desde la siguiente direccin:
http://www.inspiring-science-education.net/home

Welcome to Apache Hadoop!

Web y Wiki centrada en el proyecto Hadoop y los proyectos relacionados con las
herramientas que pueden ser integradas en l.

Accede a la pgina web a travs del aula virtual o desde la siguiente direccin:
http://hadoop.apache.org/

TEMA 1 + Informacin 31 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Bibliografa

Ackoff, R. L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 15,
3-9.

Bates, T. (6 de febrero de 2012). Will big data answer our questions about online
learning? [Artculo en un blog]. Online learning and distance education resources.
Recuperado de http://www.tonybates.ca/2012/02/06/will-big-data-answer-our-
questions-about-online-learning/

Davis, B. G. (2009). Tools for Teaching. Nueva York (EE. UU.): Jossey-Bass (Wiley).

Kodali, P. Z. (2013). Big Data Analytics Using Splunk: Deriving Operational Intelligence
from Social Media, Machine Data, Existing Data Warehouses, and Other Real-Time
Streaming Sources (Expert's Voice in Big Data). Nueva York (EE. UU.): Apress.

Lam, C. (2010). Hadoop in Action. Nueva York (EE. UU.): Manning Publications.

Machlup, F. (1980). Knowledge and knowledge production. Nueva Jersey (EE. UU.):
Princeton University Press.

Mitchell, R. L. (23 de octubre de 2014). 8 big trends in big data analytics. [Artculo en un
blog]. Computer World. Recuperado de
http://www.computerworld.com/article/2690856/big-data/8-big-trends-in-big-data-
analytics.html

Reimann, M. J. (2010). Designs for Learning Environments of the Future: International


Perspectives from the Learning Sciences. Nueva York (EE. UU.): Springer.

Sawant, N. y Shah, H. (2013). Big Data Application Architecture Q and A. Nueva York
(EE. UU.): Apress.

Sharma, N. (4 de febrero de 2008). The origin of the data information knowledge


wisdom hierarchy [Artculo en un blog]. e-Reality. Recuperado de
https://erealityhome.wordpress.com/2008/03/09/the-origin-of-dikw-hierarchy/

TEMA 1 + Informacin 32 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Soergel, D. (1985). Organizing information: Principles of data base andretrieval systems.


Orlando (EE. UU.): Academic Press.

Zhao, J. y Pjesivac-Grbovic, J. (19 de junio de 2009). MapReduce: The programming


model and practice. Sigmetrics/Performance 2009. Recuperado de
http://research.google.com/pubs/archive/36249.pdf

Zins, C. (2007). Conceptual approaches for defining data, information, and knowledge.
Journal of the American Society for Information Science and Technology, 58, 479-493.

TEMA 1 + Informacin 33 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Actividades

Las herramientas de visualizacin de datos en la educacin

Descripcin de la actividad

En esta actividad debers desarrollar un trabajo en el que, como indica el ttulo, ser
necesario realizar un estudio de las herramientas existentes de visualizacin que pueden
aplicarse a entornos educativos con Big Data. Podrs elegir una de estas tres
orientaciones:

Herramientas para la visualizacin para el apoyo al profesorado para el desarrollo de


su actividad con Big Data.
Herramientas de visualizacin para la ayuda del aprendizaje por parte del alumno
mediante Big Data.

Pautas de elaboracin

La estructura del trabajo deber tener como mnimo estos apartados:

Introduccin.
Estudio de la materia.
Conclusiones.

Objetivos

Conocer las utilidades y herramientas de visualizacin en Big Data.


Aplicar las herramientas de visualizacin de Big Data al entorno de la educacin.

TEMA 1 Actividades 34 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Criterios de evaluacin

Se valorar la adecuacin de las herramientas a la educacin.


Se valorar la justificacin.
Se valorar la inclusin de ventajas e inconvenientes de cada herramienta a la hora de
utilizarlas en Big Data.
Se valorar el nmero de herramientas analizadas.

Extensin mxima de la actividad: 5 pginas, fuente Georgia 11 e interlineado 1,5.

TEMA 1 Actividades 35 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

Test

1. El concepto de Big Data segn su definicin solo tiene los siguientes datos asociados:
velocidad, valor y veracidad.
A. Verdadero.
B. Falso.

2. La unidad ms pequea de informacin es:


A. El byte.
B. El bit.
C. El zettabyte.
D. El zettabit.

3. Los pasos para el tratamiento de la informacin son:


A. Captura, anlisis, ordenacin, bsqueda y visualizacin.
B. Captura, anlisis, comparticin, bsqueda y visualizacin.
C. Captura, anlisis, comparticin, bsqueda y visualizacin.
D. Captura, almacenamiento, bsqueda, comparticin y visualizacin.

4. Las tcnicas que estn combinadas para la gestin de Big Data son:
A. Operacionales.
B. Analticas.
C. Constructivas.
D. Seguimiento.

5. Las caractersticas bsicas de las bases de datos operacionales son:


A. Rapidez.
B. Criticidad.
C. Escalabilidad.
D. Robustez.

6. Los data warehouses se diferencian de los data mart en:


A. El almacenamiento de los datos.
B. Que tienen un mbito global.
C. Que son de un solo departamento.
D. Los datos no estn normalizados.

TEMA 1 Test 36 Universidad Internacional de La Rioja (UNIR)


Del Dato (Big Data) a la Informacin (Internet)

7. Los datos contenidos en un data warehouse:


A. Tienen que ser normalizados.
B. Solo pueden ser de un tipo determinado.
C. Se almacenan de manera histrica.
D. Solo pueden proceder de un origen de datos.

8. Las herramientas de anlisis de sentimiento o de opinin se pueden utilizar para


estudiar el impacto de un producto nuevo en el mercado.
A. Verdadero.
B. Falso.

9. Las herramientas utilizadas para mantener la seguridad de un sistema Big Data


pueden ser de los siguientes tipos:
A. Cifrado.
B. Encriptacin.
C. Establecimiento de permisos de nivel de acceso.
D. De visualizacin para conocer los usuarios conectados.

10. Indica cules de los siguientes forman parte de los componentes bsicos de Hadoop:
A. MapReduce.
B. Fix.
C. YARN.
D. Hive.

TEMA 1 Test 37 Universidad Internacional de La Rioja (UNIR)