You are on page 1of 63

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS ECONMICAS


ESCUELA DE ECONOMA

ANLISIS DE LOS DATOS CUANTITATIVOS


DOCENTE: Dra. Maria Cecilia Zavaleta Lpez
INTEGRANTES:
Alva Lazo, Simone
Anticona Ibaez, Rolan
Blas Ortega, Yescenia
Correa Lozada, Ana
Finochetti Romero, Julio
Florian Alvarez, Marli
Gutierrez Cruzado, Deivy

Qu procedimiento se sigue para analizar


cuantitativamente los datos?
Una vez que los datos se han codificado, transferido a una matriz, guardado
en un archivo y limpiado de errores, el investigador procede a analizarlos.
En la actualidad, el anlisis cuantitativo de los datos se lleva a cabo por
computadora u ordenador.

Pasos para el procedimiento para analizar


los datos:
1 Seleccionar un programa estadstico
2 Ejecutar el programa: SPSS, Minitab, Stats, SAS u otro
equivalente.
3 Explorar los datos:
4 Evaluar la confiabilidad y validez logradas por el o los
instrumentos de medicin.
5 Analizar mediante pruebas estadsticas las hiptesis planteadas
6 Realizar anlisis adicionales.
7 Preparar los resultados para presentarlos (tablas, grficas,
cuadros, etctera).

PASO 1: SELECCIONAR UN PROGRAMA


DE ANLISIS
Existen diversos programas para analizar datos.
Los programas ms importantes:
- SPSS: Statistical Package for the Social Sciences
- MINITAB: Es un paquete que goza de popularidad por su
relativamente bajo costo. Incluye un considerable nmero de
pruebas estadsticas, y cuenta con un tutorial para aprender a
utilizarlo y practicar; adems, es muy sencillo de manejar.
- SAS: Statistica Analysys Sistem- Sistema de Anlisis Estadstico
- Stacts: paquete estadstico

PASO 2: EJECUTAR EL PROGRAMA


En el caso de SPSS y Minitab, ambos paquetes son fciles de usar,
pues lo nico que hay que hacer es solicitar los anlisis
requeridos seleccionando las opciones apropiadas.

PASO 3: EXPLORAR LOS DATOS


En esta etapa, inmediata a la ejecucin del programa, se inicia el
anlisis. Cabe sealar que si hemos llevado a cabo la investigacin
reflexionando paso a paso, esta etapa es relativamente sencilla, porque:
formulamos la pregunta de investigacin que pretendemos contestar,
visualizamos un alcance (exploratorio, descriptivo, correlacional y/o
explicativo),
establecimos nuestras hiptesis (o estamos conscientes de que no las
tenemos),
definimos las variables,
elaboramos un instrumento (conocemos qu tems miden qu variables y
qu nivel de medicin tiene cada variable: nominal, ordinal, de
intervalos o razn) y
recolectamos los datos.

Apunte 2
El nivel de medicin de las variables.
La manera como se hayan formulado las hiptesis.
El inters del investigador.

Estadstica descriptiva para cada variable


La primera tarea es describir los datos, los valores o las
puntuaciones obtenidas para cada variable.
Esto se logra al describir la distribucin de las puntuaciones o
frecuencias de cada variable.

Qu es una distribucin de frecuencias?


Una distribucin de frecuencias es un conjunto de
puntuaciones ordenadas en sus respectivas categoras y
generalmente se presenta como una tabla.

Qu otros elementos contiene una


distribucin de frecuencias?
Las distribuciones de frecuencias pueden completarse
agregando los porcentajes de casos en cada categora, los
porcentajes vlidos y los porcentajes acumulados.

De qu otra manera pueden presentarse


las distribuciones de frecuencias?
Las distribuciones de frecuencias, especialmente cuando
utilizamos los porcentajes, pueden presentarse en forma de
histogramas o grficas de otro tipo.

Las distribuciones de frecuencias tambin se


pueden graficar como polgonos de frecuencias
Los polgonos de frecuencias relacionan las puntuaciones con
sus respectivas frecuencias.
Es ms bien propio de un nivel de medicin por intervalos o
razn.
Los polgonos se construyen sobre los puntos medios de los
intervalos.
Los polgonos de frecuencias representan curvas tiles para
describir los datos. Nos indican hacia dnde se concentran los
casos en la escala de la variable; ms adelante se hablar de
ello.

Cules son las medidas de tendencia


central?
Las medidas de tendencia central son puntos en una
distribucin obtenida, los valores medios o centrales de sta, y
nos ayudan a ubicarla dentro de la escala de medicin.
Las principales medidas de tendencia central son tres: moda,
mediana y media.
El nivel de medicin de la variable determina cul es la medida
de tendencia central apropiada para interpretar.

La moda es la categora o puntuacin que ocurre con mayor


frecuencia. Se utiliza con cualquier nivel de medicin.
La mediana es el valor que divide la distribucin por la mitad.
Esto es, la mitad de los casos caen por debajo de la mediana y
la otra mitad se ubica por encima de sta.
La media es la medida de tendencia central ms utilizada y
puede definirse como el promedio aritmtico de una
distribucin.

Cules son las medidas de la variabilidad?


Las medidas de la variabilidad indican la dispersin de los
datos en la escala de medicin y responden a la pregunta:
dnde estn diseminadas las puntuaciones o los valores
obtenidos?
Las medidas de tendencia central son valores en una
distribucin y las medidas de la variabilidad son intervalos que
designan distancias o un nmero de unidades en la escala de
medicin.
Las medidas de la variabilidad ms utilizadas son rango,
desviacin estndar y varianza.

La varianza
Desviacin estndar elevada al cuadrado y
se simboliza s2. Es un concepto
estadstico muy importante, ya que
muchas de las pruebas cuantitativas se
fundamentan en l.

La Asimetra
Es una estadstica necesaria para conocer
cunto se parece nuestra distribucin a una
distribucin terica llamada curva normal.
Si es cero (asimetra = 0), la curva o distribucin
es simtrica.
Cuando es positiva, quiere decir que hay ms
valores agrupados hacia la izquierda de la curva.
Cuando es negativa, significa que los valores
tienden a agruparse hacia la derecha de la
curva.

La Curtosis
La curtosis es un indicador de lo plana o
picuda que es una curva.
Cuando es cero (curtosis = 0), significa
que puede tratarse de una curva normal.
Si es positiva, quiere decir que la curva,
la distribucin o el polgono es ms
picuda(o) o elevada(o).
Si la curtosis es negativa, indica que es
ms plana la curva.

Puntuaciones z
Transformaciones que se pueden hacer a
los valores o las puntuaciones obtenidas,
con el propsito de analizar su distancia
respecto a la medida, en unidades de
desviacin estndar.
Nos indica la direccin y el grado en que
un valor individual obtenido se aleja de la
media, en una escala de unidades de
desviacin estndar.

Razones y Tasas
Una razn e a relacin entre 2 categoras.
Una tasa es la relacin entre el nmero de
casos, frecuencias, o evento de una
categora y el nmero total de
observaciones, multiplicada por un
mltiplo de 10, generalmente 100 a 1000.

Paso 4: evaluar la confiabilidad o


fiabilidad y validez lograda por el
instrumento de medicin.

La confiabilidad se calcula y evala para


todo el instrumento de medicin
utilizado, o bien, si se administraron
varios instrumentos, se determina para
cada uno de ellos.

Medida de estabilidad
(confiabilidad por test-retest)
Un mismo instrumento de medicin se
aplica dos o ms veces a un mismo grupo
de personas, despus de cierto periodo.
Si la correlacin entre los resultados de
las diferentes aplicaciones es altamente
positiva, el instrumento se considera
confiable.

Mtodo de formas alternativas o


paralelas.
No se administra el mismo instrumento de
medicin, sino dos o ms versiones
equivalentes.
Las versiones son similares en contenido,
instrucciones, duracin y otras caractersticas, y
se administran a un mismo grupo de personas
simultneamente o dentro de un periodo
relativamente corto.
El instrumento es confiable si la correlacin
entre los resultados de ambas administraciones
es positiva de manera significativa.

Mtodo de mitades partidas


(split-halves)
Necesita slo una aplicacin de la
medicin.
El conjunto total de tems o reactivos se
divide en dos mitades equivalentes y se
comparan las puntuaciones o los
resultados de ambas.
Si el instrumento es confiable, las
puntuaciones de las dos mitades deben
estar muy correlacionadas.

Medidas de coherencia o
consistencia interna
stos son coeficientes que estiman la confiabilidad:
a) El alfa de Cronbach (desarrollado por J. L.
Cronbach)
b) Los coeficientes KR-20 y KR-21 de Kuder y
Richardson (1937).
El mtodo de clculo en ambos casos requiere una
sola administracin del instrumento de medicin.

La validez
La validez del contenido se obtiene al
asegurarse que las dimensiones medidas
por el instrumento sean representativas
del universo o dominio de dimensiones de
la(s) variable(s) de inters.

Hasta aqu llegamos?


Cuando el estudio tiene una finalidad puramente exploratoria o descriptiva,
debemos interrogarnos: podemos establecer relaciones entre variables? En
caso de una respuesta positiva, es factible seguir; pero si dudamos o el
alcance se limit a explorar y describir, el trabajo de anlisis concluye y
debemos comenzar a preparar el reporte de la investigacin. De lo contrario
es necesario continuar con la estadstica inferencial.

5) Analizar mediante pruebas estadsticas las


hiptesis planteadas (anlisis estadstico inferencial)

Recoleccin
de datos en
la muestra

Clculo de
estadgrafos

Inferencia de los
parmetros mediante
tcnicas estadsticas
apropiadas

Poblacin
o universo

Para qu es til la estadstica


inferencial?
a) Probar hiptesis poblacionales
b) Estimar parmetro

En qu consiste la prueba de hiptesis?


Esta determina si la hiptesis poblacional es congruente con los
datos obtenidos en la muestra.
Una hiptesis se retiene como un valor aceptable del
parmetro, si es consistente con los datos. Si no lo es, se
rechaza (pero los datos no se descartan

Qu es una distribucin muestral?


Una distribucin muestral es un conjunto de valores sobre una
estadstica calculada de todas las muestras posibles de
determinado tamao de una poblacin.

Ejemplo de Distribucin Muestral:


Una empresa elctrica fabrica focos que tienen una duracin
que se distribuye aproximadamente en forma normal, con media
de 800 horas y desviacin estndar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 focos tenga una
vida promedio de menos de 775 horas.

0.0062

800
775

Interpretacin:

Este valor se busca en la tabla de z:


P ( 775 ) = P ( z -2.5 ) = 0.0062
La interpretacin sera que la probabilidad de que la media de la
muestra de 16 focos sea menor a 775 horas es de 0.0062.

Qu es el nivel de significancia?
Es un nivel de la probabilidad de equivocarse y que fi ja de
manera a priori el investigador.
Obtiene una estadstica en una muestra (por ejemplo, la
media) y analiza qu porcentaje tiene de confianza en que
dicha estadstica se acerque al valor de la distribucin
muestral (que es el valor de la poblacin o el parmetro).

Con qu porcentaje de confianza el investigador generaliza,


para suponer que tal cercana es real y no por un error de
muestreo? Existen dos niveles convenidos en ciencias sociales:
a) El nivel de significancia de 0.05, el cual implica que el
investigador tiene 95% de seguridad para generalizar sin
equivocarse y slo 5% en contra. En trminos de probabilidad,
0.95 y 0.05, respectivamente; ambos suman la unidad.
b) El nivel de significancia de 0.01, el cual implica que el
investigador tiene 99% en su favor y 1% en contra (0.99 y 0.01
= 1.00) para generalizar sin temor.

DISTRIBUCION NORMAL:

Cmo se relacionan la distribucin


muestral y el nivel de significancia?
Tomamos el nivel de significancia como un rea bajo la
distribucin muestral, y depende de si elegimos un nivel de 0.05 o
de 0.01.
Es decir, que nuestro valor estimado en la muestra no se
encuentre en el rea de riesgo y estemos lejos del valor de la
distribucin muestral, que insistimos es muy cercano al de la
poblacin.
As, el nivel de significancia representa reas de riesgo o
confianza en la distribucin muestral.

Se pueden cometer errores al probar


hiptesis y realizar estadstica inferencial?
Aceptar una hiptesis verdadera (decisin correcta)
Rechazar una hiptesis falsa (decisin correcta)
Aceptar una hiptesis falsa (conocido como error del Tipo II o
error beta)
Rechazar una hiptesis verdadera (conocido como error del
Tipo I o error alfa)

Prueba de hiptesis:
Hay dos tipos de anlisis estadsticos que pueden realizarse para
probar hiptesis, cada tipo posee sus caractersticas y
presuposiciones que lo sustentan:
Los anlisis paramtricos
Los anlisis no paramtricos

Tamao del efecto


El hallazgo de efectos estadsticamente significativos (cuando
se rechaza la Hiptesis Nula) pueden ser irrelevantes cuando
son de baja magnitud, lo que puede ocurrir cuando las
muestras son bastante grandes.


Qu es la prueba de diferencia de proporciones?

En algunos diseos de investigacin, el plan


muestral requiere seleccionar dos muestras
independientes, calcular las proporciones
mustrales y usar la diferencia de las dos
proporciones para estimar o probar una
diferencia entre las mismas.


Qu es el anlisis de varianza unidireccional o de un factor?
La tcnica del Anlisis de la Varianza (ANOVA o AVAR) es una de las
tcnicas ms utilizadas en los anlisis de los datos de los diseos
experimentales. Se utiliza cuando queremos contrastar ms de dos
medias, por lo que puede verse como una extensin de la prueba t para
diferencias de dos medias. El ANOVA es un mtodo muy flexible que
permite construir modelos estadsticos para el anlisis de los datos
experimentales cuyo valor ha sido constatado en muy diversas
circunstancias.
(Valor observado) = (efectos atribuibles) + (efectos no atribuibles o
residuales)


Estadstica Multivariada:

Unvector aleatorioes un vector formado por una


o ms variables aleatorias escalares.
La estadstica multivariante se ocupa de los
vectores aleatorios que tienen aplicaciones en
muchas ciencias y tcnicas. Podemos destacar
entre ellas la econometra y la taxonoma.

En losmtodos estadsticos multivariantesse pueden sintetizar


dos objetivos claros:
Proporcionar mtodos cuya finalidad es el estudio conjunto de
datos multivariantes que el anlisis estadstico uni y
bidimensional es incapaz de conseguir.
Ayudar al analista o investigador a tomar decisiones ptimas en
el contexto en el que se encuentre teniendo en cuenta la
informacin disponible por el conjunto de datos analizado.


Anlisis no Paramtricos:

Se denominan pruebas no paramtricas aquellas que no


presuponen una distribucin de probabilidad para los
datos, por ello se conocen tambin como de
distribucin libre (distribution free). En la mayor parte
de ellas los resultados estadsticos se derivan
nicamente a partir de procedimientos de ordenacin y
recuento, por lo que su base lgica es de fcil
comprensin.


Cules son las presuposiciones de la estadstica no paramtrica?

La distribucin poblacional de la variable dependiente es


normal.
El nivel de medicin de la variable dependiente es por
intervalos o razn.
Cuando dos o ms poblaciones son estudiadas, stas tienen una
variable homognea.


Cules son los mtodos o las pruebas estadsticas no paramtricas mas
usadas?

Prueba t.
Prueba de contraste de la diferencia de proporciones.
Anlisis de la varianza unidireccional. (ANOVA)
Anlisis de la variable factorial. (ANOVA)
Anlisis de covarianza. (ANOVA)
Coeficiente de Correlacin de Pearson y la regresin lineal.

Qu es la chi cuadrada o 2?
Es una prueba estadstica para evaluar hiptesis acerca de la
relacin entre dos variables categricas.

Se simboliza: 2.

Hiptesis a probar: Correlacionales

Qu son los coeficientes de correlacin e


independencia para tabulaciones cruzadas?

Qu otra aplicacin tienen las tablas


de contingencia?
Las tablas de contingencia, adems de servir
para el clculo de chi cuadrada y otros
coeficientes, son tiles para describir
conjuntamente dos o ms variables. Esto se
efecta al convertir las frecuencias observadas
en frecuencias relativas o porcentajes. En una
tabulacin cruzada puede haber tres tipos de
porcentajes respecto de cada celda.

Porcentaje en
relacin con el total
de frecuencias
observadas (N o
n de muestra).

Porcentaje en
relacin con el total
marginal de la
columna.

Porcentaje en
relacin con el total
marginal del
rengln.

Otros coeficientes de correlacin


Los coeficientes rho de
Spearman, simbolizado
como rs, y tau de Kendall,
simbolizados como t, son
medidas de correlacin
para variables en un nivel
de medicin ordinal
(ambas), de tal modo que
los individuos u objetos de
la muestra pueden
ordenarse por rangos
(jerarquas).

Otros coeficientes de correlacin

Una vista general a los procedimientos


o pruebas estadsticas

Paso 6: realizar anlisis adicionales


Este paso implica simplemente que una vez realizados
nuestros anlisis, es posible que decidamos efectuar otros
anlisis o pruebas extra para confirmar tendencias y
evaluar los datos desde diferentes ngulos. Por ejemplo,
podemos en una tabla de contingencia calcular primero
chi cuadrada y luego phi, lambda, T de Cramer (C) y el
coeficiente de contingencia. O despus de un ANOVA,
efectuar los contrastes posteriores que consideremos
apropiados. Resulta este paso un momento clave para
verificar que no se nos haya olvidado un anlisis
pertinente. En esta etapa regularmente se eligen los
anlisis multivariados.

Paso 7: preparar los resultados para


presentarlos
Se recomienda, una vez que se obtengan los resultados de los anlisis estadsticos (tablas,
grficas, cuadros, etc.), las siguientes actividades; sobre todo para quienes se inician en
la investigacin:

1. Revisar cada resultado [anlisis general anlisis especfico valores


resultantes (incluida la significancia) tablas, diagramas, cuadros y grficas].

2. Organizar los resultados (primero los descriptivos, por variable del estudio; luego
los resultados relativos a la confiabilidad y la validez; posteriormente los
inferenciales, que se pueden ordenar por hiptesis o de acuerdo con su desarrollo).

3. Cotejar diferentes resultados: su congruencia y en caso de inconsistencia


lgica volverlos a revisar. Asimismo, se debe evitar la combinacin de tablas,
diagramas o grficas que repitan datos. Por lo comn, columnas o fi las idnticas
de datos no deben aparecer en dos o ms tablas. Cuando ste es el caso, debemos
elegir la tabla o elemnto que ilustre o refleje mejor los resultados y sea la opcin
que presente mayor claridad. Una buena pregunta en este momento del proceso
es: qu valores, tablas, diagramas, cuadros o grficas son necesarias?, cules
explican mejor los resultados.

Se recomienda, una vez que se obtengan los resultados de los anlisis estadsticos (tablas,
grficas, cuadros, etc.), las siguientes actividades; sobre todo para quienes se inician en la
investigacin:
4. Priorizar la informacin ms valiosa (que es en gran parte resultado de la actividad
anterior), sobre todo si se van a producir reportes ejecutivos y otros ms extensos.
5. Copiar y/o formatear las tablas en el programa con el cual se elaborar el reporte de la
investigacin (procesador de textos o uno para presentaciones, como Word o Power Point).
Algunos programas como SPSS y Minitab permiten que se transfieran los resultados (tablas, por
ejemplo) directamente a otro programa (copiar y pegar). Por ello, resulta conveniente usar
una versin del programa de anlisis que est en el mismo idioma que se emplear para
escribir el reporte o elaborar la presentacin. Aunque, de no ser as, el texto de las tablas y
grfi cas puede modificarse, nicamente es ms tardado.

6. Comentar o describir brevemente la esencia de


los anlisis, valores, tablas, diagramas, grficas.
7. Volver a revisar los resultados.
8. Y, finalmente, elaborar el reporte de
investigacin.

CONCLUSIONES

El anlisis cuantitativo de los datos se efecta mediante la


matriz de datos, la cual est guardada como archivo.
El tipo de anlisis o pruebas estadsticas depende del nivel de
medicin de las variables, las hiptesis y el inters del
investigador.

Los principales anlisis estadsticos que pueden hacerse son:


estadstica descriptiva para cada variable (distribucin de
frecuencias, medidas de tendencia central y medidas de la
variabilidad), la transformacin a puntuaciones z, razones y
tasas, clculos de estadstica inferencial, pruebas
paramtricas, pruebas no paramtricas y anlisis
multivariados.

You might also like