#WordCloud /* Tus Tweets en una nube de palabras */
"Es una separacin entre dos modos
totalmente distintos de pensar. El fundamento tecnolgico de la sociedad actual est en pensar en trminos de nmeros. Por otra parte, en cuanto a su organizacin social est basada en pensar en trminos de palabras." La nube Negra, Fred Hoyle Hoy en dia tenemos informacion por todos lados; y asi como hay informacion, hay distintas formas de presentarla. A algunos les gusta verla resumida, con graficos, no muchas palabras y mas numeros; a otros les gusta todo lo contrario, mas elaborada, con un contexto de fondo. Lo que es cierto en cualquiera de los casos, es que la informacion nos ayuda a tomar desiciones. Es asi como atraves de este articulo abarcaremos temas de analisis de datos, de una forma simple y peculiar, con el objetivo de despertar el interes en el lector e investigar otras formas de analizar la informacion y de como poder presentarla. Qu vamos a analizar? Para este caso en particular extraeremos informacion de twitter, lo analizaremos con el lenguaje R y crearemos una imagen que contendra una nube de letras. Es cierto, ya existen servicios en la red que nos pueden hacer esto con una serie de clics, pero es mas divertido hacer tu propio codigo y personalizarlo a tu gusto; es asi como haras tu primer proyecto de mineria, si asi es; a esto se le llama mineria de datos o datamining en ingles. Para esto, les compartire breves descripciones de cada una de las herramientas a usar; asi como tambien las distintas ciencias que abarcan este pequeo analisis de informacion; no es necesario ser un experto programador para lograr un nube
de palabras, ni ser un estudiante de sistemas;
el ingrediente principal es la curiosidad, y agregado un conexin de internet, una computadora y una cuenta en twitter. Por qu debo ir a buscar mis apuntes de la escuela? No va ser necesario ir a buscarlos pero en un momento de la vida nos preguntamos porque tanta matematica, estadistica, sumas, multiplicaciones, expresiones regulares, ecuaciones, funciones, semantica, verbos, adverbios, articulos, etc. Yo siempre digo, en la vida llega un punto en el que converge todo. Y para este caso, asi lo es, todas las ciencias se relacionan; A continuacion un breve resumen de alguna de las areas que se relacionan con el analisis de datos en twitter: Matematica: nos servirar para hacer conteos, algunas sumas, hacer funciones. Estadistica: hacer promedios Idioma Espaol: identificar verbos, articulos, tildes. Analisis de Datos En el contexto de tecnologias de informacin, hay muchas formas de analizar la informacion, asi como el porque hacerlo y sobre todo con que tecnologia hacerlo. Comparto con ustedes 5 pasos escenciales para abarcar un proceso de analisis de datos: 5 pasos para emprender el analisis de datos 1. Responder a las preguntas: que quiero analizar y que tipo respuestas voy a obtener? 2. Origen de datos: Es importante tener claro de donde obtendremos la informacion y el formato de esta. En el mundo digital hay un sinfn de lugares y formatos en que econtramos la informacion, por ejemplo: texto
simple, pdf, word, html, xml, json, etc.
Los origenes puden ser paginas web, redes sociales, blogs, revistas entre otros. 3. ETL: en inteligencia de negocios estes siglas en ingles corresponden a Extract, Transform and Load. Extraer, transformar y cargar datos son pasos basicos para centralizar la informacion a analizar.
4. Almacenar informacion: una vez
tengamos la informacion como nosotros la queremos, debemos almacenarla, esto puede ser en base de datos relacionales o no relacionales, archivos csv, archivos de texto plano, archivos de excel. Dependera mucho al volumen de informacion, asi como a la velocidad de acceseso y la disponibilidad con que la deseamos.