You are on page 1of 18

RAPIDMINER es un programa informtico para el anlisis y minera de datos.

Permite el
desarrollo de procesos de anlisis de datos mediante el encadenamiento de operadores a travs
de un entorno grfico. Se usa en investigacin, educacin, capacitacin, creacin rpida de
prototipos y en aplicaciones empresariales.

RapidMiner utiliza un modelo de cliente / servidor con el servidor ofrecido como premisa o en
infraestructuras de nube pblica o privada

El programa se puede descargar en la siguiente ruta:

http://sourceforge.net/projects/rapidminer/

El software usado es el RapidMiner Studio

INSTALACION

Descargue el paquete de instalacin adecuado para su sistema operativo y


instale RapidMiner Studio de acuerdo con las instrucciones en el sitio web.
Las versiones de Windows son compatibles con sistemas Macintosh, Linux o Unix.
Tenga en cuenta que se necesita un Java Runtime actualizado (al menos la versin 7)
el ltimo.

Si est iniciando RapidMiner Studio por primera vez, se le pedir que


crear un nuevo repositorio. Nos limitaremos a un repositorio local
en su computadora en primer lugar - ms adelante usted puede entonces definir repositorios
en la red, que tambin podr compartir con otros:

Para un repositorio local basta con especificar un nombre (alias) y definir cualquier en su disco
duro. Puede seleccionar el directorio directamente haciendo clic en el icono de la carpeta a la
derecha. Es aconsejable crear un nuevo directorio en un lugar conveniente dentro del cuadro
de dilogo del archivo que luego aparece y luego usar este nuevo directorio como base para su
repositorio local. Este repositorio sirve como central de almacenamiento para sus datos y
procesos de anlisis y acompaar en el futuro cercano.
PERSPECTIVAS Y VISTAS

Despus de elegir el repositorio se le dar la bienvenida en la perspectiva principal. La seccin


derecha muestra las noticias actuales sobre RapidMiner, si conectado a Internet. La lista en el
centro muestra las acciones tpicas, que se realizar con frecuencia despus de iniciar
RapidMiner Studio. Aqu estn los detalles de aquellos:

1. Nuevo Proceso: Abre la perspectiva del diseo y crea un nuevo anlisis proceso.

2. Abrir: Abre un navegador de repositorio, si hace clic en el botn. Usted puede elegir y abrir
un proceso existente en la perspectiva del diseo. Si hace clic en el botn de flecha en el lado
derecho, una lista de procesos recientemente abiertos aparece. Puede seleccionar uno y se
abrir en la perspectiva del diseo.

3. Asistente para aplicaciones: puede utilizar el Asistente para aplicaciones para resolver
problemas de minera de datos con sus datos en tres pasos. El Marketing Directo Asistente le
permite encontrar acciones de marketing con la mayor conversin tarifas El Asistente de
mantenimiento predictivo predice el mantenimiento necesario ocupaciones. El Asistente para
Anlisis de Churn le permite identificar qu clientes son ms propensos a churn y por qu. El
Asistente para Anlisis de Sentimientos analiza una corriente de los medios sociales y le da una
penetracin en clientes pensando.

4. Tutoriales: Inicia una ventana de tutorial que muestra varios tutoriales disponibles desde la
creacin del primer proceso de anlisis hasta la transformacin de datos. Cada tutorial se puede
utilizar directamente en RapidMiner Studio y ofrece una introduccin a algunos conceptos de
minera de datos utilizando una seleccin de procesos de anlisis.

En el lado derecho de la barra de herramientas dentro de la seccin superior de RapidMiner


Studio encontrars cuatro iconos, que alternarn entre el RapidMiner individual Perspectivas
del estudio. Una perspectiva consiste en una seleccin libremente configurable de elementos
de interfaz de usuario individuales, las denominadas vistas. Se pueden arreglar como sea que
te guste.

En la Perspectiva del Hogar slo hay una visin, una preestablecida al menos, pantalla de
inicio, que est viendo ahora. Puede activar otras vistas acceder al men "Ver":
En el subitem "Mostrar vista" encontrar todas las vistas disponibles de RapidMiner Estudio.
Las vistas, que ahora son visibles en la perspectiva actual, estn marcadas con un visto. Active
otra vista haciendo una seleccin, por ejemplo la vista con el nombre "Registro". Ahora ver en
que una segunda vista con este nombre ha sido aadida en la Perspectiva del Hogar.

PERSPECTIVA DEL DISEO


Como ya se mencion al principio, encontrar un icono para cada uno (predefinido) dentro del
rea de la derecha de la barra de herramientas:

Los iconos mostrados aqu te llevan a las siguientes perspectivas:

Home Perspective: La perspectiva de bienvenida ya descrita anteriormente, que RapidMiner le


da la bienvenida despus de iniciar el programa.

Perspectiva del diseo: sta es la perspectiva central de RapidMiner Studio donde todos los
procesos de anlisis son creados, editados y administrados.

Perspectiva de resultado: Si un proceso proporciona resultados en forma de datos, modelos o


el gusto, entonces RapidMiner Studio te lleva a esta perspectiva. Proporciona estadsticas,
grficos, grficos avanzados y ms.

Wizard Perspective: Esta es la perspectiva, que muestra la aplicacin Asistente para aplicar
problemas tpicos de minera de datos en sus datos.

Puede cambiar a la perspectiva deseada haciendo clic dentro de la barra de herramientas o


alternativamente a travs de la entrada de men "Ver" - "Perspectivas" seguida de la seleccin
de la perspectiva objetivo. RapidMiner Studio eventualmente cambiar a otro perspectiva, si
parece una buena idea, p. a la Perspectiva de Resultados al completar un proceso de anlisis.

Ahora cambie a la Perspectiva de Diseo haciendo clic en la barra de herramientas. Ser


tratado con detalle en esta seccin. Ahora debera ver la pantalla en la Figura 2.9.

Dado que la Perspectiva de Diseo es el ambiente central de trabajo de RapidMiner Studio,


vamos a discutir todas las partes de la Perspectiva de Diseo por separado en lo que sigue y
discutir las funcionalidades fundamentales de las vistas asociadas.
Vista de Operadores y Repositorios

Hay dos puntos de vista muy significativos en esta rea, por lo menos en el estndar, que se
describen a continuacin.

Vista de Operadores

Todos los pasos de trabajo (operadores) disponibles en RapidMiner Studio se presentan en


grupos aqu y por lo tanto pueden ser incluidos en el proceso actual. Puedes navegar dentro de
los grupos de una manera sencilla y navegar por los operadores como desees. Si RapidMiner
Studio se ha ampliado con uno de las extensiones disponibles, los operadores adicionales
tambin se pueden encontrar aqu.

Sin extensiones encontrar al menos los siguientes grupos de operadores en la estructura de


rbol.

Control de Procesos: Operadores tales como bucles o ramas condicionales que controlar el
flujo del proceso.

Utilidad: Operadores auxiliares que, junto al operador "Subproceso" para la agrupacin


subprocesos, tambin contienen los macro-operadores importantes, as como operadores para
la exploracin.

Acceso al repositorio: contiene operadores para acceso de lectura y escritura en repositorios.

Importar: Contiene un gran nmero de operadores para leer datos y objetos desde formatos
externos como archivos, bases de datos, etc.
Exportar: Contiene un gran nmero de operadores para escribir datos y objetos en formatos
externos como archivos, bases de datos, etc.

Transformacin de datos: Probablemente el grupo ms importante en el anlisis en trminos


de tamao y relevancia. Todos los operadores se encuentran aqu para transformar tanto
datos como metadatos.

Modelado: Contiene el proceso real de minera de datos como mtodos de clasificacin,


mtodos de regresin, clustering, ponderaciones, mtodos de asociacin anlisis de
correlaciones y similitudes, as como a los operadores, a fin de aplicar los modelos generados a
nuevos conjuntos de datos.

Evaluacin: Los operadores que pueden calcular la calidad de un modelo y por nuevos datos,
p. validaciones cruzadas, bootstrapping, etc.

Puede seleccionar operadores dentro de la vista de operadores y agregarlos en el lugar en el


proceso por arrastrar y soltar. Conecta a los operadores dibujando una lnea entre los puertos
de salida y de entrada de los operadores. Tienes la opcin si desea que los operadores se
conecten automticamente, cuando se inserta. Seleccione el smbolo del enchufe en el lado
izquierdo de la barra de herramientas de la vista y definir si se van a crear conexiones salientes
y / o entrantes automticamente.

Con el fin de hacer el trabajo tan fcil para usted como sea posible, la vista de Operadores
tambin soporta filtro adems, que se puede utilizar para buscar partes del nombre del
operador o el nombre completo del operador. Simplemente introduzca la palabra de bsqueda
en el campo de filtro.

Tan pronto como hay menos de 10 resultados de bsqueda en conjunto, el rbol se abre para
revelar todos los resultados de bsqueda. Esto significa que no es necesario navegar por el
jerarqua completa cada vez. Haciendo clic en la cruz roja junto al campo de bsqueda borra lo
que est entrando actualmente y cierra de nuevo el rbol.

Los iconos junto al campo de bsqueda pueden filtrar operadores obsoletos y clasificar los
operadores de acuerdo con los operadores ms utilizados.

PRIMEROS PASOS

Operadores y Procesos

Trabajar con RapidMiner Studio consiste fundamentalmente en definir procesos de anlisis


indicando una sucesin de pasos de trabajo individuales. En RapidMiner Studio, estos
componentes del proceso se llaman operadores. Un operador es definido por varias cosas:

La descripcin de los insumos previstos,

La descripcin de las salidas suministradas,

La accin realizada por el operador en las entradas, que en ltima instancia al suministro de
las salidas,

Una serie de parmetros que pueden controlar la accin realizada.


Las entradas y salidas de los operadores se generan o consumen a travs de puertos. Un
puerto espera un tipo especfico de entrada. Veremos que un operador en RapidMiner Studio
est representado por un mdulo en la siguiente forma, donde los puertos de entrada son
colocados en el lado izquierdo y los puertos de salida se colocan en el lado derecho:

Dicho operador puede, por ejemplo, importar datos del repositorio, una base de datos o de
archivos. En este caso no tendra puertos de entrada, aunque tendra un parmetro al menos
especificar la ubicacin de los datos. Otros operadores transforman sus entradas y devolver un
objeto del mismo tipo. Operadores que transforman los datos pertenecen a este grupo. Y otros
operadores siguen consumiendo sus convertirlo en un objeto completamente nuevo: muchos
mtodos de minera de datos vienen bajo esta categora y suministrar un modelo para los
datos de entrada dados por ejemplo.

El color de los puertos indica el tipo de entrada con el que se debe suministrar un puerto. Por
ejemplo, un color azulado indica que se requiere un conjunto de ejemplo. Si la mitad superior
del puerto y el nombre del puerto son rojos, entonces esto indica un problema. Este problema
es fcil de ver para el operador en la figura no se encuentra conectado y los puertos de
entrada todava necesitan una conexin a una fuente adecuada.

Los puertos de salida son blancos si el resultado no est claro o no se puede (an) suministrar
en la configuracin actual. Tan pronto como todas las configuraciones necesarias estn
completas, es decir, se definen todos los parmetros necesarios y todos los puertos de entrada
necesarios conectados, entonces los puertos de salida se colorean de acuerdo con su tipo.

Pero no slo los puertos pueden visualizar su estado mediante diferentes estados indicadores,
sino tambin el operador completo. Estos se dan a partir de la izquierda a la derecha por:

Luz de estado: Indica si hay un problema como los parmetros que no tienen puertos de
entrada conectados o no conectados (rojo), si la configuracin est prcticamente completa,
pero el operador todava no se ha puesto en prctica entonces (amarillo) o si todo est bien y
el operador tambin ha implementado correctamente (verde).

Tringulo de advertencia: Indica cundo hay mensajes de estado para este operador.

Punto de interrupcin: Indica si se debe detener la ejecucin del proceso antes o despus este
operador con el fin de dar al analista la oportunidad de examinar resultados intermedios.

Comentario: Si se ha introducido un comentario para este operador, se indica por este icono.

Subproceso: Esta es una indicacin muy importante, ya que algunos operadores tienen una o
ms subprocesos. Se demuestra por esta indicacin si existe tal un subproceso. Puede hacer
doble clic en el operador en cuestin para bajar en los subprocesos.
Si varios operadores estn interconectados, entonces hablamos de un proceso de anlisis o
proceso para abreviar. Dicha sucesin de pasos puede por ejemplo cargar un conjunto de
datos, transformar los datos, calcular un modelo y aplicar el modelo a otro conjunto de datos.

Tales procesos pueden crecer fcilmente a varios cientos de operadores en tamao en


RapidMiner Studio y se extiende por varios niveles o subprocesos. Las inspecciones de proceso
continuamente realizado en segundo plano, as como las ayudas de navegacin de proceso
que se muestra a continuacin, asegrese de no perder la pista y de definir los procesos
correctos, incluso para tareas ms complejas.

Insertar operadores

Puede insertar nuevos operadores en el proceso de diferentes maneras. Aqu estn los detalles
de las diferentes maneras:

A travs de arrastrar y soltar desde la vista Operadores como se describe anteriormente,

Haciendo doble clic en un operador en la vista Operadores,

A travs del dilogo que se abre mediante la entrada de men "Editar" - "Nuevo operador. .
." (Ctrl - I),

A travs del men contextual en un rea libre del rea de proceso blanca y submen "Nuevo
Operador" y la seleccin de un operador.

En cada caso, los nuevos operadores son, dependiendo del ajuste en la vista de operadores,
conectados automticamente con los operadores adecuados, o las conexiones a realizar o
corregir manualmente por el usuario.

Operadores de conexin

Despus de haber insertado nuevos operadores, puede interconectar los operadores


insertados.

Hay bsicamente tres maneras disponibles para usted, que se describir en el siguiente.

Conexiones 1: Automticamente al insertar

Si ha activado la opcin de conexin automtica bajo el smbolo de enchufe en la vista de


operadores, RapidMiner intentar conectar al operador con puertos de salida adecuados
despus de insertar. Si, por ejemplo, el nuevo operador tiene puerto de entrada que requiere
un conjunto de ejemplo, RapidMiner intentar operador que ya podra producir dicho
conjunto de ejemplos. Si slo hay una opcin, entonces esta opcin es clara y el operador est
conectado. Si hay varios Sin embargo, RapidMiner intentar seleccionar la opcin que es la
ms la izquierda por encima de la posicin actual del ratn. El operador asociado est marcado
con un marco y una sombra como se muestra en la figura 2.16. De esta manera usted puede
establecer el rumbo para una conexin correcta temprano durante la insercin. Consejo: Se
recomienda activar la opcin de conexin automtica para los puertos de entrada al menos.
Incluso si el algoritmo de conexin basado en los metadatos de vez en cuando crea una
conexin incorrecta, usted todava ahorra mucho trabajo para todos los casos en los que se
reconoce automticamente la conexin correcta.

Conexiones 2: manualmente

Tambin puede interconectar los operadores manualmente y esto es incluso necesario para
procesos ms complejos. Para ello, haga clic en un puerto de salida. Ahora vas a dibuje una
hebra naranja como se muestra en la Figura 2.17. Haga clic en un puerto de entrada n para
conectar el puerto de salida seleccionado con este puerto de entrada. Para cancelar el
proceso, mantenga pulsado el ratn y haga clic con el botn derecho del ratn. La hebra de
color naranja desaparecer y usted puede continuar trabajando normalmente.

Conexiones 3: totalmente automtico

A veces, numerosos operadores ya estn en un (sub) proceso y an no estn conectado. En


este caso, las opciones "Auto-Wire" y "Re-Wire" pueden servirle as, que estn ocultos detrs
del smbolo del enchufe en la vista de proceso. Esto funciona especialmente si se adopt un
enfoque relativamente secuencial cuando el proceso se cre y los operadores se alinearon
adecuadamente uno detrs del otro, es decir.

El operador anterior siempre estaba marcado por un marco y una sombra durante la insercin.

Sin embargo, siempre es aconsejable realizar un examen manual siguiendo conexiones


automticas, ya que pueden producirse conexiones no deseadas, caso de procesos ms
complejos

Seleccin de operadores

Para modificar los parmetros, debe seleccionar un operador individual. Vas a reconocer el
operador seleccionado actualmente por su marco naranja as como su sombra.

Si desea realizar una accin para varios operadores al mismo tiempo, ejemplo, mover o borrar,
seleccione los operadores relevantes arrastrando un marco alrededor de stos.
Con el fin de agregar operadores individuales a la seleccin actual o excluir operadores de la
seleccin actual, mantenga presionada la tecla CTRL mientras haga clic en los operadores
relevantes o agregue operadores adicionales arrastrando un marco.

Operadores mviles

Seleccione uno o ms operadores como se describe arriba. Ahora mueva el cursor sobre uno
de los operadores seleccionados y arrastre el ratn mientras mantiene pulsado el botn. Todos
los operadores seleccionados se movern ahora a un nuevo lugar en funcin de mover el
ratn. Si, en el transcurso de este movimiento, llegas al borde del rea blanca, entonces esto
se ampliar automticamente en consecuencia. Si usted debe alcanzar el borde del rea
visible, entonces esto tambin se mover automticamente.

Operadores de Copia

Seleccione uno o ms operadores como se describe arriba. Ahora presione Ctrl + C para copiar
el seleccione los operadores y pulse Ctrl + V para pegarlos. Todos los operadores seleccionados
ahora a un nuevo lugar junto a los operadores originales, donde se puede mover ms
adelante.

Eliminacin de operadores

Seleccione uno o ms operadores como se describe arriba. Ahora puede borrar la operadores
por

Pulsando la tecla DELETE,

Seleccionando la accin "Borrar" en el men contextual de uno de los operadores,

Mediante la entrada de men "Editar" - "Borrar".

Eliminacin de conexiones

Las conexiones se pueden eliminar haciendo clic en uno de los dos puertos mientras ALT al
mismo tiempo. Alternativamente, tambin puede eliminar una conexin a travs del men
contextual de los puertos afectados.

Navegando dentro del proceso

Si miramos la barra de herramientas de la vista de proceso, entonces podemos ver que


tenemos slo hizo uso de una accin hasta el momento. En esta seccin discutiremos lo
siguiente cuatro elementos en el lado izquierdo de la barra de herramientas: la flecha que
apunta a la izquierda, la flecha apuntando hacia la derecha, la flecha apuntando hacia arriba y
la barra de navegacin (breadcrumb).

Las acciones individuales:

Flecha que apunta a la izquierda: Regresa al ltimo lugar de edicin de manera similar a la
navegacin que es familiar de los navegadores de Internet. Pasos individuales pueden tambin
se saltan a travs del men emergente.
Flecha hacia la derecha: vuelve a los lugares de edicin ms recientes de la historia de una
manera similar a la navegacin que es familiar de los navegadores de Internet.

Tambin se pueden omitir pasos individuales a travs del men emergente.

Flecha apuntando hacia arriba: Dejar el subproceso actual y volver al mayor proceso.

Barra de navegacin: La barra de navegacin muestra el camino desde el proceso principal


hasta el subproceso actual a travs de todos los niveles pasados. Haciendo clic una vez en uno
de los operadores mostrarn el proceso en cuestin. Puede navegar ms lejos hacia abajo
utilizando las pequeas flechas apuntando a la derecha.

Con el fin de descender en un subproceso, es necesario hacer doble clic en un operador con el
subproceso icono en la parte inferior de la derecha. Para poder ir un nivel de nuevo, puede
navegar hacia arriba con la flecha. El camino actual se muestra mediante la barra de
navegacin (Fig. 2.19), que puede alternativamente utilizarse para navegue en ambas
direcciones.

Definicin de la orden de ejecucin

En casi todos los casos, RapidMiner logra determinar automticamente la orden de ejecucin
de los operadores. Para ello, RapidMiner utiliza la informacin de conexin y el hecho de que
un operador, cuyo resultado es ser utilizado por otro operador, debe obviamente ser
ejecutado antes de este ltimo.

Sin embargo, hay casos en los que la orden no puede definirse como subprocesos
completamente paralelos o donde el orden automtico no es correcto, por ejemplo, porque
primero se debe calcular una macro antes de poder usarla como una en un operador posterior.
Pero tambin hay otras razones que a menudo juegan una parte importante, como un manejo
ms eficiente de los datos o un orden exacto ejecucin (para informes, por ejemplo).

Para ello, RapidMiner ofrece un mtodo elegante para indicar el pedido de los operadores e
incluso para editar el orden de ejecucin cmodamente. Por favor haga clic en el icono con la
doble flecha apuntando hacia arriba y hacia abajo punto de interrogacin en la barra de
herramientas de la vista de proceso (Fig. 2.18) y la vista de proceso muestra la definicin de
orden de los operadores. En lugar del icono para cada operador, ahora se mostrar el nmero
de su ejecucin. La lnea naranja transparente conecta los operadores en este orden, como se
muestra en la Figura 2.20.

Para cambiar tal orden de ejecucin, puede hacer clic en cualquier lugar del operador para
seleccinelo. El camino que conduce a este operador ahora no se puede cambiar, pero
haciendo clic otra vez en otro operador intentar cambiar el orden de tal manera que el
segundo operador se ejecuta tan pronto como sea posible despus de la primera. Mientras tu
mover el ratn sobre los operadores restantes, ver la opcin actual en naranja hasta este
operador y en gris a partir de este operador. Una opcin que no es posible se simboliza por un
nmero rojo. Puede cancelar una seleccin actual haciendo clic con el botn derecho del
ratn. De esta manera puede, como se muestra en la figura 2.21, cambiar el orden del proceso
descrito anteriormente a lo siguiente con slo unos pocos clics.

Otras opciones de la vista de proceso

Despus de haber discutido casi todas las opciones de este elemento central del RapidMiner
Design Perspective, ahora describiremos las acciones restantes en la barra de herramientas,
que puede verse en la Figura 2.18, as como otras posibilidades del Proceso Ver.

Los cinco iconos en el lado derecho de la barra de herramientas Vista de proceso siguientes
acciones:

Conexiones de cable automtico y Re-wire El smbolo de enchufe permite auto-wire y vuelva


a conectar las conexiones entre los operadores.

Disposicin automtica: Reorganiza todos los operadores del proceso actual segn a las
conexiones y al orden de ejecucin actual.

Mostrar y modificar el orden de ejecucin Esta accin le permite ver la ejecucin de las
rdenes de los operadores y cambiarla.

Tamao automtico: Cambia el tamao del rea de trabajo blanca de tal manera que todos los
operadores actualmente posicionados tienen suficiente espacio. Esto es

VISION DE PARAMETROS

RapidMiner. Numerosos operadores requieren uno o varios parmetros para ser indicados
para una funcionalidad correcta. Por Por ejemplo, los operadores que leen datos de archivos
requieren que se indique la ruta del archivo.

Mucho ms frecuentemente sin embargo, los parmetros no son absolutamente necesarios,


aunque la ejecucin del operador puede ser controlada indicando ciertos parmetros valores
y, en el caso del modelado, tambin con frecuencia se optimizan.
Despus de que se haya seleccionado un operador que ofrezca parmetros en la vista de
proceso, su los parmetros se muestran en la vista de parmetros. Al igual que las otras
opiniones, esta visin tambin tiene su propia barra de herramientas que se describe a
continuacin. Bajo la barra de herramientas usted encontrar el icono y el nombre del
operador seleccionado actualmente seguido por los parmetros reales. La fuente en negrita
significa que el parmetro debe definido y no tiene valor predeterminado. La fuente cursiva
significa que el parmetro est clasificado como un parmetro experto y no debe ser cambiado
necesariamente por principiantes a anlisis de los datos.

Las acciones de la barra de herramientas se refieren, al igual que los parmetros, al operador
actual seleccionado.

Modo experto: El icono de la izquierda cambia entre el modo experto y el modo principiante.
Slo en el modo experto se muestran todos los parmetros; en el principiante no se muestran
los parmetros clasificados como parmetros expertos.

Operador Info: Visualizacin de alguna informacin fundamental sobre este operador tales
como entradas esperadas o una descripcin. Este dilogo tambin se muestra presionando F1
despus de la seleccin, a travs del men contextual de la as como a travs de la entrada de
men "Editar" - "Mostrar informacin del operador. . . ".

Activar / Desactivar: Los operadores pueden desactivarse (temporalmente). Sus conexiones se


desprenden y ya no se ejecutan. Los operadores desactivados son mostrados en gris. Los
operadores tambin pueden ser (de) activados dentro de su contexto en la vista de proceso,
as como a travs de la entrada de men "Editar" - "Activar Operador".

Renombrar: Una de las maneras de cambiar el nombre de un operador. Otras maneras estn
presionando F2 despus de seleccionar, seleccionando "Cambiar nombre" en el men
contextual del operador en la vista de proceso, as como la entrada de men "Editar" -
Renombrar".

Eliminar: Una de las maneras de eliminar un operador. Otras maneras estn presionando
Borrar despus de seleccionar, seleccionando "Borrar" en el men contextual operador en la
vista de proceso, as como la entrada de men "Editar" - "Eliminar".

Toggle Breakpoints: Pueden establecerse puntos de interrupcin tanto antes como despus
de la ejecucin del operador, donde la ejecucin del proceso se detiene e intermedia los
resultados pueden ser examinados. Tambin existe esta posibilidad en el men contextual del
operador en la vista de proceso, as como en el men "Editar". Un punto de interrupcin
despus de que la ejecucin del operador tambin se puede activar y desactivar con F7.
El primer proceso de anlisis

Despus de la creacin del proceso, RapidMiner Studio cambia automticamente a la


perspectiva del diseo y usted puede comenzar con el diseo del proceso. En los captulos
posteriores hablaremos en detalle sobre cmo cargar datos en RapidMiner Studio y almacenar
en su repositorio. En esta seccin, sin embargo, la ejecucin bsica de los procesos es ms
importante para nosotros y por lo tanto esperaremos un poco antes de analizar datos reales.

Siempre y cuando no haya cambiado la seleccin y las posiciones del individuo vistas para la
Perspectiva de Diseo, su pantalla debera verse ms o menos como uno en la figura 3.3.

Comenzaremos ahora nuestro nuevo proceso a partir de la generacin de datos que puede
trabajar en.

Expanda el grupo "Utilidad" en la vista de operadores y luego el grupo "Generacin de datos".


Los nmeros entre corchetes junto a los grupos indicando el nmero de operadores para este
grupo. Ahora debe ver varios operadores que puede usarse para generar un conjunto de datos
artificiales. Esto incluye al operador "Generar datos de ventas". Ahora arrastre este operador
al rea blanca mientras sostiene hacia abajo del botn del ratn y liberarlo all. El operador se
insertar conectado directamente en funcin del ajuste automtico de la conexin en la

Vista Operadores. Si esto no sucede, puede conectar manualmente la salida puerto del nuevo
operador con el primer puerto de resultado de todo el proceso en el lado derecho del rea de
trabajo blanca. Alternativamente, tendra Tambin se ha podido insertar el operador mediante
el dilogo Nuevo Operador, descrito en el captulo anterior. Como seguramente ha notado, el
nombre completo de este operador, "Generar Datos de Ventas", es demasiado largo y se corta
despus de las primeras letras. Mueva el mouse sobre este operador y estancia all por unos
momentos. El nombre se mostrar ahora en su totalidad en una pequea animacin. Por
supuesto, tambin podra cambiar el nombre del operador y darle un nombre ms corto.

Como puede ver, el indicador de estado del operador en la parte inferior izquierda Es amarillo.
Esto significa que el operador no ha producido errores, pero ha tambin no se ha ejecutado
con xito. As que slo ha configurado completamente el hasta ahora, pero esto no quiere
decir que haya sido ejecutado directamente. Se puede ver fcilmente que el indicador de
estado se vuelve verde. Esta configuracin era muy simple en este caso especfico: no era
necesario establecer cualquier parmetro del operador. Un indicador de estado rojo y las
entradas en los Vista habra indicado una necesidad de configuracin.
TRANSFORMACIN DE LOS METADATOS

Ahora vamos a tratar con uno de los aspectos ms fascinantes de RapidMiner Studio, la
capacidad de calcular la salida de un operador o proceso de antemano e incluso hacer esto
durante el tiempo de diseo, por lo que sin tener que cargar el real datos o incluso realizar el
proceso. Esto es posible gracias a la llamada meta transformacin de datos de RapidMiner
Studio. Por supuesto, cada operador define la forma en que los datos de entrada recibidos son
transformado Esta es su tarea al final del da. Lo especial de RapidMiner Studio sin embargo es
que esto no slo se puede hacer para los datos reales, pero tambin para los metadatos sobre
estos datos. Esto suele ser mucho menos voluminoso que los propios datos y da una idea
excelente de cules son las caractersticas conjunto de datos. Los metadatos en RapidMiner
Studio se equiparan esencialmente a las descripciones de conceptos que hemos discutido
anteriormente. Contiene los nombres de atributos del ejemplo establecido, as como los tipos
de valores y las funciones de los atributos e incluso algunas estadsticas fundamentales.

Tanto para la teora, pero cmo se ven los metadatos en la prctica, es decir, en RapidMiner
Studio? En RapidMiner Studio los metadatos se proporcionan en los puertos Simplemente
pase por el puerto de salida del operador recin insertado con el cursor lo que sucede.
Aparecer una descripcin de herramientas que describe la salida esperada del puerto.
Primero el nombre del operador y del puerto seguido por el tipo de metadatos. En esto en este
caso estamos tratando con los metadatos de un conjunto de ejemplos. El nmero de tambin
se pueden inferir ejemplos as como el nmero de atributos.

Entonces viene una descripcin de la trayectoria que el objeto habra tomado a travs el
proceso durante una ejecucin. En este caso, la trayectoria tiene slo una estacin, es decir, el
puerto del operador generador. Sin embargo, la parte ms importante de la meta datos (al
menos para un conjunto de ejemplo) es la tabla que describe la meta datos de los atributos
individuales. Las columnas individuales son:

ROL: El papel del atributo. Si no se indica nada, entonces es un atributo regular

Nombre: El nombre del atributo

Tipo: El tipo de valor del atributo

Intervalo: El rango de valores del atributo, por lo que el mnimo y el mximo en el caso de
atributos numricos y un extracto de valores posibles en el caso de atributos nominales

Faltas: El nmero de ejemplos donde el valor de este atributo es desconocido

Comentario: un comentario dependiendo del atributo


Incluso si este proceso funcionara ahora, que es visible desde el estado amarillo y la vista de
problemas vaca, entonces el segundo operador no calcular nada sin una configuracin
adicional y el resultado final slo ser el mismo que despus del primer operador. Por lo tanto,
elegir el nuevo operador

"Generar atributos" y seleccinelo de esta manera. La visualizacin en el parmetro ver los


cambios en consecuencia y los parmetros de este operador se muestran. Los parmetros
sustanciales tienen el nombre "descripciones de funciones" y est configurado en el botn
asociado con un solo clic.

Despus de pulsar el botn con el nombre "Editar lista (0)", abierto, dndole la oportunidad de
introducir el clculo deseado.

Puede agregar ms entradas en dichas listas de parmetros individuales con las dos acciones
"Agregar entrada" y "Eliminar entrada" y tambin eliminar entradas seleccionadas. Los
nombres de los parmetros deseados se encuentran en el encabezado de la tabla. Aadir una
fila, nombre del nuevo atributo a la izquierda e ingrese la funcin de la derecha que calcula
este nuevo atributo. En este caso es simplemente el producto de otros dos atributos Confirme
su entrada con "Aplicar" y el dilogo se cerrar. El botn que dice "Editar lista" debe mostrar
un "1" entre parntesis, lo que significa que usted puede ver cuntas entradas tiene la lista de
parmetros y por lo tanto en este caso cmo muchos nuevos atributos se generan. Ahora
podemos observar qu efecto tiene la adicin del operador "Generar Atributos" en los
metadatos. RapidMiner tiene ya transformado los metadatos en segundo plano y se puede ver
el nuevo meta datos como una informacin de herramientas a travs del puerto de salida del
operador.

Es fcil ver en la lnea "Generado por" que la ltima cosa que el objeto provino a partir de
ahora es el operador "Generar Atributos" y fue anteriormente el operador "Generar datos de
ventas". Adems, casi nada ha cambiado tanto el nmero de los ejemplos y los ocho
atributos originales se han mantenido mismo. Sin embargo, se ha aadido un noveno atributo:
Nuestro atributo recientemente definido "Precio total" tambin se puede encontrar ahora en
la tabla. Y nuestro proceso todava no se ha ejecutado, como se puede ver simplemente
mirando los indicadores de estado que siguen siendo amarillos. Ahora puede preguntarse:
"Y? As que s el resultado de antemano y sin la ejecucin del proceso. Qu obtengo a partir
de ese?". Bueno, ms bien. Ahora puede ver de un vistazo qu operador o (sub) proceso est
haciendo con los datos de entrada. Dado que los metadatos tambin son considerablemente
menores que los conjuntos de datos completos, este examen tambin realizado mucho ms
rpido que en los datos completos. De esta manera obtendr retroalimentacin en el tiempo
ms corto en cuanto a si hay un problema que puede hacer ms datos transformacin
necesaria y no slo despus de un proceso de anlisis de varios horas ha abortado con un
error. Y por ltimo, pero no menos importante, RapidMiner Studio puede continuar
procesando la informacin de los metadatos y continuar usted en el diseo del proceso, p. slo
a travs de todos los atributos disponible (y recin generado) que se muestra en la interfaz
grfica de usuario mientras que los atributos se filtran. Ahora intente lo siguiente, por ejemplo:
Abra el grupo "Transformacin de datos" - "Atributo Ajuste Reduccin y Transformacin "-"
Seleccin "y arrastre el operador denominados "Select Attributes" en el proceso - idealmente
directamente en la conexin despus del ltimo operador. Recuerde que la conexin debe
resaltarse antes usted deja el operador, entonces se reconectar correctamente
inmediatamente.
PROCESOS DE EJECUCIN

Ahora estamos listos y queremos ejecutar el proceso recin creado por primera vez.

Los indicadores de estado de todos los operadores deberan ser ahora de color amarillo y
debera haber no hay entradas en la vista de problemas. En tal caso, debera ser posible
ejecutar nuestro proceso consistente en los tres operadores (para generar datos, calcular el
volumen de negocios total para cada transaccin y atributos de filtrado) sin ningn problema.

Tiene las siguientes opciones para iniciar el proceso:

1. Presione el botn de reproduccin grande en la barra de herramientas de RapidMiner,

2. Seleccione la entrada de men "Proceso" - "Ejecutar",

3. Presione F11.

Mientras se est ejecutando un proceso, el indicador de estado del operador que se ejecuta en
cada caso se transforma en un pequeo icono de juego verde. De esta manera usted puede ver
qu punto el proceso se encuentra actualmente en. Despus de que un operador haya sido
ejecutado el indicador de estado cambia y permanece verde - hasta que, por ejemplo,
parmetro para este operador: A continuacin, el indicador de estado ser de color amarillo.
Lo mismo se aplica a todos los operadores que siguen. Esto significa que usted puede ver muy
rpidamente en qu operadores un cambio podra tener un efecto.

El proceso definido anteriormente slo tiene un tiempo de ejecucin corto y por lo la


oportunidad de pausar el proceso en ejecucin. En principio, sin embargo, puede detener
brevemente un proceso en ejecucin con el smbolo de pausa, p. para ver un resultado
intermedio. El operador que se est ejecutando actualmente se termina y el proceso se
detiene. Puede reconocer un proceso que todava est en ejecucin pero actualmente
pausado por el hecho de que el color del icono de reproduccin cambia de azul a verde Pulse
de nuevo el botn de reproduccin para seguir ejecutando el proceso.
Si no desea simplemente pausar el proceso sino abortarlo completamente, entonces puede
presionar el botn de parada. Al igual que cuando se detiene, el operador ejecutndose se
termina y el proceso se aborta completamente inmediatamente despus. Por favor tenga en
cuenta que puede cambiar a la Perspectiva de diseo inmediatamente despus de abortar
proceso y hacer cambios en los procesos, incluso si la ejecucin de la operador se est
terminando en segundo plano. Incluso puede iniciar procesos adicionales y no es necesario
esperar a que se complete el primer proceso.

Mirando los Resultados

Una vez finalizado el proceso, RapidMiner Studio debera haber cambiado a la perspectiva de
resultados (Fig. 3.14). Si este no fuera el caso, probablemente no conect el puerto de salida
del ltimo operador con uno de los puertos de resultado del proceso en el lado derecho.
Compruebe esto y compruebe tambin otros posibles errores, teniendo en cuenta las notas en
la vista de problemas. Sintase libre de pasar un poco de tiempo con los resultados. Dado que
el proceso anterior no realiz cualquier modelado, pero slo transform los datos, el resultado
slo consiste en de un conjunto de ejemplos. Puede ver los metadatos de este conjunto de
datos y probar las tabla ms algunas de las visualizaciones en Grficos o Grficos Avanzados.

You might also like