Professional Documents
Culture Documents
La analítica es un proceso fundamental para la toma de decisiones en las empresas, requiere hoy en
día que los asuntos o relaciones entre empresarios y clientes sean de alguna forma sistematizados,
de modo que resulta de vital importancia conocer las características del comportamiento de las
personas frente a los negocios que con estos se entablan.
Los datos no son más que la forma o manera como las empresas conocen lo que hacen, dicen o
hacen sus clientes. Para hacer un registro de estos datos, regularmente se usan encuestas o
reportes de facturas que llevan a identificar un dato.
Dentro de toda organización, sin importar su tipo, siempre encontraremos datos de interés para
cada área funcional, y es por ello que se hace necesaria su clasificación, administración, gestión y
análisis. Observemos en el ejemplo algunos datos que nos permitirán el desarrollo de bases de
datos.
Encontramos varios datos importantes, en la figura anterior, estos son: • Cliente, de la cual
podemos determinar quién es el que compra los productos.
Las bases donde comúnmente se hacen reportes de datos, puede definirse como un compilado de
variables que permiten medir información que arrojan los clientes de las empresas, y se encargan
de organizar y darle estructura a la información de forma simplificada.
Fuentes de datos
Los datos pueden ser obtenidos de manera precisa si estos son propios y que se denominan fuente
primaria, o asumiendo cualquier falencia en la obtención de otras fuentes no propias o conocidas
como fuentes secundarias. La ventaja de la fuente de datos primaria con respecto a las fuentes
secundarias radica en el acceso y en lo que el administrador de la base de datos estipula que se
debe abordar dentro de este proceso. Las fuentes primarias regularmente la realizan las propias
empresas a partir de sus áreas de informática y/o estadísticas. En cambio, aquellas que provienen
de los datos del estado o gobierno e incluso instituciones de propiedad pública o privada (y que
son usadas por las empresas), son las catalogadas como secundarias.
Ejemplo:
Las fuente primarias pueden ser: entrevistas, reportes, sondeos de opinión de la empresa,
minutas, etc. Y las fuentes secundarias: datos del Departamento Administrativo Nacional de
Estadísticas (DANE), Departamento de Planeación Nacional (DNP), Ministerio de Hacienda y
crédito público (Minhacienda), encuestas de otras empresas privadas, etc.
Lo recomendable es siempre poseer información propia y que cada una de las empresas elabore
su propio reporte. Ya cuando es demasiado difícil obtener información, se puede contratar con
alguna empresa consultora especializada en la materia o cuando sea el caso de que resulta
costoso contratar u obtener datos, se recomienda usar información o datos de las instituciones
estatales, teniendo en cuenta que posiblemente algunas veces no tengan información que
requiera la empresa en cuestión de la necesidad del dato.
Tipo de datos
Por otro lado, más en el sentido de la programación los datos regularmente se clasifican en:
• Numérico.
• Carácter o texto.
• Lógicos.
• Nulos.
Los datos de tipo numérico suelen representarse tal como su nombre de clasificación así lo
identifica.}
Ejemplo
Enteros: 34560 o -34560. Puede ser también continuos o de forma decimal, es decir, 2.36; 4.78,
etc. Los primeros lenguajes de programación lo toman como “int (integer)” y los segundos como
“float”.
Debe tenerse en cuenta que los datos numéricos regularmente se usan para descripciones como
precios, ingresos, gastos, numero de contacto, edad, etc. Los de formato carácter o texto son
aquellos que vienen establecidos como cadenas de datos o simplemente estructura de escritos,
algunos programas los referencian como: “A”, hacen referencia a variables que describen
características de los individuos como: estado civil “casado”; “divorciado”; “soltero”. Siempre se
escriben entre comillas. En otros softwares simplemente los resaltan ya sea en negrilla o en color
azul. Los lógicos hacen referencia al lenguaje booleano, es decir, responden de forma binaria,
tienen como respuesta las opciones de verdadero o falso.
En las bases de datos se opera con ellos para formular referencias condicionantes o lo que un
analista hace o establece para hacer que una relación de un par de variables nos dé como
respuesta una secuencia lógica. Analicemos un caso en Excel de Microsoft: tenemos un par de
variables que son de tipo numérico, para este caso se usan números enteros y a partir de estos
queremos obtener una respuesta lógica:
El tipo de dato nulo o “NULL” hace referencia que para la observación específica no se manifiesta
ningún tipo de información en la base de datos. Regularmente no se tienen en cuenta porque no
aportan ningún dato o información.
Sistemas de información
Ejemplo Los elementos proveídos por los individuos generan información y con esta se establecen
recursos de operación.
Los sistemas pueden ser más complejos en la medida que se adhieran más fases o áreas dentro de
las organizaciones, como se observa en la figura 6.
Importancia de los datos en la empresa
Al usar información que puede ser recopilada de forma diaria, semanal, quincenal, mensual,
semestral o anual, se puede establecer una jerarquía de perfiles de los clientes o proveedores que
participan en el entorno de la empresa. El buen uso de la información genera una disciplina más
precisa en la compañía en lo que tiene que ver con una mejor oferta de servicios. Las áreas de
aplicación de los datos pueden ser:
El estado de pensamiento de las empresas no solo reposa en la parte más alta que asume la
jerarquía de la compañía, al contrario, parte de las bases que le brinda el área de analítica,
regularmente compuesta con personal con talento en lectura e interpretación de datos, a pesar de
la necesidad de poseer conocimientos de las matemáticas, algebra y estadística, la analítica
intenta hacer una lectura correcta de la información y usarla a favor de los desafíos del mercado.
El análisis de datos soporta el nivel de reputación que puede tener una empresa, cuando la
empresa se desenvuelve en el mercado es porque conoce de algo y eso sin duda provino de un
dato.
Una definición muy formal podría darse como el proceso de inspeccionar conjuntos de datos e
información que brindan los agentes del mercado con el único fin de sacar conclusiones que lleven
a mejorar la calidad de la oferta de servicios, hoy en día se hace con la ayuda de sistemas
especializados y de software (muchos de estos con licencia de pago y otros muy pocos de licencia
abierta o gratuita). Las tecnologías y técnicas de análisis de datos se utilizan ampliamente en las
industrias y empresas para permitir tomar decisiones más informadas, también suelen ser usadas
por científicos e investigadores para verificar o refutar modelos científicos, teorías e hipótesis
sobre condiciones que establecen los mercados. El simple análisis de datos parte desde el
conocimiento de las métricas, saber en qué forma o manera se mide la información es el punto de
partida para establecer conjeturas con la información disponible.
Regularmente en las bases de datos las variables se escriben con pocas letras, simplemente se
forman como una sola palabra, incluso a veces solo con iniciales, esto depende -claro está- del
administrador de la base de datos que se familiariza con la información que entra para la
digitación de esta. Hay un establecimiento de etiquetas, que es donde regularmente se hace la
descripción de todo tipo que puede tener la variable. En los organismos estatales incluso se crea
un Tabla 4. Información de variables en métricas Fuente: propia manual de etiquetas para cuando
la base de datos es gigante o usa demasiados datos como lo es la Gran encuesta manufacturera.
Todo lo anterior puede ser denominado como la caracterización de la base de datos y se considera
la primera etapa de la analítica. Muchas veces habrá que crear, codificar y sistematizar la
información que es obtenida a diario y a partir de esto armar el montaje en el software específico
de utilización, las bases de datos.
Hay muchos softwares más como R, Python, Tableau, SAS, que cada uno maneja a disposición de
su interfaz un gran grupo de variables e información. Cada uno tiene sus ventajas y desventajas
con respecto a otro, pero la analítica es la misma. Otra de las fases del análisis de datos viene de
los conceptos aplicados de la estadística, los primeros son de orden descriptivo y los segundos ya
de manera más formal como lo son los inferenciales.
Análisis descriptivo (forma de análisis cuantitativo)
Tal como lo manifiesta el título, hace referencia a la descripción como tal del dato. Tiene en cuenta
los estadísticos más usados o de origen, tal como el número de observaciones o tamaño de la
muestra, muchas veces toma el código de (N), el siguiente es el promedio (Ῡ), su desviación
estándar (SE), los valores máximos y mínimos que toma el dato y algunas veces la suma total de las
observaciones.
El análisis de datos es más directo y compacto y frente a las salidas de los programas y softwares
se puede obtener un análisis completo de forma automática. El trabajo del analista es interpretar
las estadísticas.
Las otras métricas tales como la varianza, curtosis, moda y coeficiente de asimetría, serán
explicadas más adelante en el desarrollo del curso, son complemento del análisis descriptivo
básico, pero de forma más avanzada.
En los datos cuantitativos se pueden establecer pruebas de hipótesis, un ejemplo de esto suele
pasar cuando queremos mirar si un parámetro es o no significativo con respecto a las
observaciones que se brindan. Ante esto, es bueno presentar una hipótesis nula y una hipótesis
alternativa.
Los datos cualitativos como no son usados de forma numérica, deben ser analizados de forma
distinta con el uso de las métricas descriptivas. Tal como son muchas veces caracteres o cadena de
textos se suelen codificar de forma binaria para poder ser tomados como números.
CARTILLA #2