You are on page 1of 16

87

TEMA VII. LAS PRUEBAS ESTADISTICAS


E
l investigador debe conocer los pormenores del analisis de datos para decidir la
metodologia que aplicara. Los datos se pueden analizar desde dos perspectivas,
dependiendo del tipo de estudio que se ha iniciado. La primera es cuantitativa y la
segunda cualitativa, cada una tiene metodologia propia y procesos diferentes para la
obtencion de resultados.
1. El Analisis Cuantitativo o Estadistico
La estadfstica es el procedimiento que se utiliza para clasificar, calcular, analizar y
resumir datos numericos obtenidos de forma sistematica. La recopilacion de datos y el
procedimiento que se utilice para procesarlos depende de la forma como se haya escogido
la direccion de la investigacion, para ello son relevantes las variables y la forma como estas
se miden, la intencionalidad del investigador al formular la hipotesis y lo que se pretende
probar con la investigacion. De modo que la metodologia es distinta para el procesamiento
de una variable por intervalos, de la que se utilice para el procesamiento de una nominal.
El analisis cuantitativo se debe usar cuando se requiere describir aspectos o
caracteristicas de la realidad, que se presentan con regularidad, de modo que el uso de las
frecuencias o repeticion de la aparicion de las caracteristicas es esencial para el diagnostico
en un elemento, pero estas caracteristicas no son tipicas de ese elemento exclusivamente,
sino que lo son de la poblacion misma.
Un ejemplo tfpico es el estudio del comportamiento de una enfermedad en un
paciente comparado con el comportamiento de la misma enfermedad, pero en varios
pacientes de la misma poblacion.
1. A. Ti pos de anal i si s est adi st i co
Se distinguen tres tipos de analisis estadistico, segun el numero de variables que se
analicen conjuntamente: univariado, bivariado y multivariado.
Anal i si s uni var i ado
El analisis univariado es el analisis basico, primario. Las caracteristicas o
propiedades de las personas o cosas se deben medir una por una, caracteristica por
caracteristica, aisladamente.
Ejemplo:
Se esta en presencia de un analisis univariado, cuando se dice que una persona pesa
95 k., independientemente de cualquier otra caracteristica.
Se estara, igualmente, en presencia de una en estadistica univariada, cuando se dice
que el 23% de las personas es de piel blanca y que el resto (77%) es de piel morena.
Las estadfsticas basicas, como la media, la mediana, la moda, la varianza y los
porcentajes, entre otros, miden solo una variable. Estas fueron hechas univariadas.
Este tipo de analisis ha sido muy criticado ya que la realidad se presenta
Manual pcma el Cwiaa de Jletadoi dc JnuMtiqacien
88
interconectada y relacionada.
Anal i si s bi var i ado
Se presenta cuando se realiza el tratamiento estadistico a dos variables de manera
simultanea. Hay varias formar de realizar este procedimiento. Una de ellas es contar
frecuencias dobles, es decir contar dos caracteristicas a la vez en un individuo, como: sexo
y estado civil. Se hace un recuento bivariado al decir que hay 80 hombres solteros.
Otro procedimiento es usar la correlacion simple para el caso de variables
cuantitativas. El procedimiento es bivariado para estas, debido a que computa el producto
de los desvios respecto de la media para dos variables, evaluadas sobre un mismo
individuo, tal como la medida y la talla.
Anal i si s mul t i var i ado
Este analisis consiste en determinar las relaciones existentes entre tres o mas
variables a partir del analisis bivariado. Estas relaciones pueden ser de diversos tipos:
descriptivas, de establecimiento de perfiles, de separacion de grupos, de segmentation,
para determinar influencias eficientes entre variables y otras. En general se las clasifica en
dos grandes grupos:
a. Met odos expl i cat i vos: regresion lineal, analisis discriminante, regresion logistica,
modelos de respuesta probit, logic y modelos log lineales entre otros
b. Met odos descr i pt i vos: analisis de conglomerados, analisis factorial, analisis de
componentes principales, analisis de correspondencias simples y multiples, entre otras.
Este tipo de analisis ocupa hoy el corazon de la estadistica; pero, es exigente y poco
amigable en comprension matematica. Sintetiza las relaciones entre las variables
estudiadas que, de otro modo, se tendrian que establecer de modo univarial o bivarial, los
cuales son largos y no son exactos.
Su aplicacion depende de la disposition del investigador a adoptar nuevos enfoques.
1. B. Cl ases de Anal i si s Est adi st i co
Hay diferentes clases de analisis estadisticos, los principales son:
1. Estadistica inferencial
2. Estadistica descriptiva
3. Pruebas parametricas
4. Pruebas NO parametricas
5. Puntuaciones Z
6. Razones y Tasas
1. Est adi st i ca i nf erenci al :
Esta se utiliza cuando se pretende que el resultado de un estudio sobre una muestra
pueda ser aplicado a una generalidad o a una universalidad, que no puede ser estudiada en
su totalidad por sus proporciones de amplitud. Es utilizada, regularmente, por los
investigadores sociales.
Manual paxa el Qum(l de Metodos de Jnve^tigacion
89
Los datos recogidos sobre la muestra se denominan estadigrafos. Estos permiten
aplicar la estadistica a toda una generalidad o al universo y ya aplicados se conocen como
parametros. Los parametros corresponden a estadisticas inferenciales, porque no se
obtuvieron de un estudio completo de la totalidad de la generalidad o del universo, pero se
aplican sobre estos.
La estadistica inferencial se utiliza para realizar dos procesos: estimar parametros y
probar hipotesis.
Ejemplo:
Se quiere saber si los choferes de Costa Rica conducen regularmente bajo los efectos
del licor. El investigador toma muestras de choferes de distintas areas del pais, distintos
gremios, determinados dias, etc. El resultado que arroje el punto medio de todos los
datos se podria tomar como un patron generalizado de los choferes de Costa Rica,
dependiendo del grado de confiabilidad de las muestras, de la siguiente manera:
Muestra 1000 choferes
Alajuela 950 conducen bajo los efectos del licor sabado y domingo.
Heredia 940 conducen bajo los efectos del licor sabado y domingo.
San Jose 980 conducen bajo los efectos del licor sabado y domingo.
Limon 960 conducen bajo los efectos del licor sabado y domingo.
Guanacaste 930 conducen bajo los efectos del licor sabado y domingo.
Cartago 920 conducen bajo los efectos del licor sabado y domingo.
Puntarenas 990 conducen bajo los efectos del licor sabado y domingo.
La suma de estas cantidades dividida entre el numero de muestras produce como
resultado que 952,85 choferes de cada mil conducen bajo los efectos del licor y esto se
puede generalizar a Costa Rica diciendo que mas del 95% de los choferes conduce bajo
los efectos del licor los sabados y domingos. Esta prueba permite la generalization, debido
a que el porcentaje de posibilidad es mayor a 95% (minimo probable permitido).
EJERCICIO N. 18
Elabore una estadistica inferencial. Se requiere saber si los peatones respetan las
senales de transito en Costa Rica. Invente los datos y las muestras. Trabaje en hojas
aparte el procedimiento y anote el resultado en los renglones siguientes:
Manual pcma e Cawa de Metodos de .Investigation
90
2. Est adi st i ca descr i pt i va
Consiste en describir los datos mediante puntuaciones o categorias y la frecuencia
en la que ocurre un evento determinado e importante para la investigacion. Este tipo de
estadistica permite obtener porcentajes con respecto a la frecuencia con la que ocurre el
evento o una serie de estos que pueden ser positivos, negativos u omisos.
Ejemplo:
Se requiere saber el porcentaje de Instituciones del estado que cumplen con el pago de
cuotas a la C C S.S. El evento es el pago y las puntuaciones serian las cantldades de
instituciones que cumplen, las que no cumplen y las que no dieron informacion. El total
de cantidades constituyen el 100% de los datos recogidos y la relacion de la cantidad de
las que si cumplen con respecto al 100% nos proporciona el porcentaje de
cumplimiento, de la siguiente manera:
OBSERVACION FREC. ABSLUTA (fa)
Cumplen 10
No cumplen 5
No dieron informacion 5
Total 20
Obt enci on de f r ecuenci a rel ati va: se divide por separado el total de cada rango de
observation entre el total de la sumatoria de las observaciones.
20=100%
10= 50%
5= 25%
OBSERVACION FREC. ABSOL.
(fa)
FREC. RELATIVA
(fr)
Cumplen
10
50%
No cumplen 5 25%
No dieron
informacion
5 25%
Total 20 100%
Esto significa que el 50% de las instituciones del estado cumplen con el pago de cuotas a
la C.C.S.S.
Manual paui el dwvso de Metodos de J nvedtigacion
91
EJERCICIO N. 19
Elabore una estadistica descriptiva y obtenga las frecuencias relativas. Se requiere saber el
porcentaje de empresas privadas que cumplen las normas de salud ocupacional. Invente los
datos y las muestras. Trabaje las tablas y el procedimiento en hojas aparte, y anote el
resultado en los renglones siguientes.
3. Pruebas par amet r i cas
Se utilizan para relacionar dos variables las cuales son medidas en un nivel por
intervalos o de razon. Se simboliza (r). Parte de las presunciones siguientes:
La distribution poblacional de la variable dependiente es normal.
El nivel de medicion de las variables es por intervalos o razon
Dos o mas pobiaciones tienen una varianza homogenea, cuando son estudiadas.
Estas poseen una dispersion similar a sus distribuciones. (Hernandez, Fernandez y
Baptista, 2010).
Las pruebas mas usadas son:
Coeficiente de correlacion de Pearson y regresion lineal
Prueba t.
Prueba de contraste de la diferencia de proporciones.
Analisis de varianza unidireccional.
Analisis de varianza factorial.
Analisis de covarianza.
4. Pruebas no par amet r i cas
Estas no se basan en ninguna suposicion en cuanto a la distribucion de probabilidad
a partir de la que fueron obtenidos los datos. La mayoria acepta distribuciones
poblacionales no normales. Se utilizan para evaluar hipotesis acerca de la relacion entre
variables.
Las mas utilizadas son las siguientes:
La chi cuadrada
Los coeficientes de correlacion e independencia para tabulaciones cruzadas.
Los coeficientes de correlacion por rangos ordenados de Spearman y Kendall.
Manual pcuta el Cuma de Meloda# de 3nue^tiqacidn
92
5. Punt uaci ones Z
Indican el grado y la direccion en que se aleja un valor respecto de la medi a, es .
escala de medicion estandar. Se calcula de la siguiente manera:
Se toma el valor del dato real, se resta al valor de la medi a y el resultado se divide entre
valor de la desvi aci on est andar
Ejemplo:
La puntuacion de un estudiante en una prueba de universidad es de 72 (dato rei
donde la media de la distribution es 78 y la desviacion estandar es 12.
Procedimiento.
Z = 72-78+12 = -0.50
Punto z = -0.50
EJERCICIO N. 20
Invente y anote un caso y los datos correspondientes al valor real, la media y la desviac
estandar. Calcule el punto z.
6. Razones y t asas
1. Razon
Es la relacion entre las frecuencias de dos categorias de datos. Se calcula dividiendc
frecuencia de la categoria mayor entre la menor.
Ejemplo:
Categoria Frecuencia
Tecnicos 120
Profesionales 30
Procedimiento
120- 30 =4
Esto significa que por cada profesional hay cuatro tecnicos.
Manual paxa et Cwtaa de Jlietodao de Jnv^tiqadon
EJERCICIO N. 21
Invente dos frecuencias y calcule la razon entre ellas.
2. Tasa
Es la relacion entre la frecuencia absoluta de la muestra y el total posible de la poblacion de
la que se toma la muestra.
Se calcula de la forma siguiente:
Se divide el valor de la frecuencia absoluta entre el total posible de la poblacion estudiada y
el resultado se multiplica por un multiplo de 10, generalmente por 100 o por 1000.
Ejemplo:
Tasa= numero de personas que votaron si al referendo X 100
numero total de votantes
Votantes positivos al referendo = 12000
Total de votantes = 250000
Procedimiento
12000+250000 = 0,048X100 = 4.8
Esto significa que 4.8 de cada 100 votantes votaron [si] al referendo.
EJERCICIO N. 22
Invente una investigacion en la que incluya la poblacion total y la muestra, calcule la tasa y
anote el resultado.
Manual paw. el Cwcao de Aietodod de 3nuestigacion
94
C. Medi das de t endenci a cent r al
Estan constituidas por los puntos medios de los valores de una distribution de datos y
ayudan a comprenderlos dentro de una escala de medicion. Los principales son tres: media,
mediana y moda.
*
1. Medi a ar i t met i ca (X)
Es la cantidad promedio de un grupo de datos. Se obtiene al dividir la sumatoria del total
de los valores de las muestras entre la cantidad de muestras escogidas.
Ejemplo:
Se debe obtener la media del aprovechamiento academico de un estudiante X. Este
estudiante cursa 13 materias, obtuvo nota de 95 en siete de el las y de 90 en las
restantes seis.
Procedimiento se suman las 13 calificaciones (1.205) y el total obtenido se divide entre
13 (92.69). La media de aprovechamiento academico o promedio del estudiante X es
92.69.
EJERCICIO N. 23
Invente un caso en el que pueda calcular la media. Debe contar con 10 muestras como
minimo, cada una con valores diferentes de las otras.
2. Medi ana (Me)
Es el valor que se encuentra ubicado exactamente a la mitad de un grupo de datos. El
orden de estos debe ser creciente, de menor a mayor. La mediana se ubica en el punto
medio y hay igual cantidad de datos hacia abajo que hacia arriba, lo que corresponde al
50% de los datos para ambos lados. Esta puede ser obtenida de dos formas y los
procedimientos dependen de la paridad o imparidad de los datos.
Obt enci on con dat os pares: se suman los dos valores centrales y se dividen entre dos, el
valor resultante constituye la mediana del total de los datos.
Ejemplo:
Grupo de datos: 15, 25, 40, 73, 89, 98.
Valores centrales: 40+73 = 113+2 = 56.5
Mediana: 56.5
Atanual pcvta el Qxwso de Metodos de Jrwedtigaewn
Obtenci on con dat os i mpares: la mediana es siempre el dato que se ubique en el centra
ze la lista.
Ejemplo:
Grupo de datos: 13, 45, 49, 78, 95
Valor central o mediana: 49
EJERCICIO N. 24
Invente un grupo de datos par y otro impar, y calcule la mediana.
3. Moda (Mo)
Esta constituida por el valor que se repite el mayor numero de veces en una lista de datos.
Se utiliza para identificar la mayor frecuencia.
Ejemplo:
24, 34, 25, 72, 24, 45r 24. 13
Moda: 24
EJERCICIO N.25
Invente una lista de datos en el que se repita un numero varias veces y establezca cual es
la moda.
Manual paxa el CwtAa de Metodai de Jnue^tigacum
D. Medi das de var i abi l i dad
Corresponden a los niveles de dispersion de los datos, cuanto se alejan estos de s
media central de los datos. Las mas utilizadas son: desviacion media, desviacion estandar.
varianza.
1. Desvi aci on medi a
Es el promedio de los valores absolutos de las desviaciones o sesgos de selection, respecto 5
promedio del grupo de datos. Se obtiene de la forma siguiente:
Se calcula el promedio de los valores de los datos y se resta ese promedio a cada uno ae
los valores. El resultado de las operaciones se suma y se divide entre el numero total ae
datos.
Formula I ( X - X )
n
Ejemplo:
Datos: 13, 25, 46, 70
Promedio: 13+25+46+70= 154 +A =38.5
Restas
13-38.5= -25.5
25-25.5= -0.5
46-25= 21
70-25= 45
Sumatoria: -25.5+ -0.5+21+45= 40
Division: 40+4= 10
Resultado
Desviacion media =10
EJERCICIO N. 26
Invente una lista de datos (al menos 8 datos distintos) y calcule la desviacion media. Realice
el procedimiento y las operaciones en hojas aparte. Anote la lista y el resultado en los
renglones siguientes.
Manual pcuta el Cwcaa de Metodos de 3twentiqacidn
97
2. Desvi aci on est andar
Mide la variabilidad de los datos u observaciones, cuanto se alejan estos, del promedio del
valor central. Se obtiene de la forma siguiente:
Se calcula el promedio de las cantidades de los datos, se resta el promedio a cada dato, el
resultado de cada operacion se eleva al cuadrado (se multiplica por si mismo), se suman
todos los resultados de las elevaciones, se divide el resultado de la suma entre el numero
de datos y se calcula la raiz cuadrada del ultimo resultado.
Ejemplo:
Datos: 25, 37, 42, 56, 65
Promedio: 25+37+42+56+65 = 225+5 = 45
Restas:
25-45 = -20
37-45= -8
42-45= -3
56-45= 11
65-45= 20
Elevaciones:
-20 x -20 = 400
-8 x -8 = 64
-3 x -3 = 9
11x 11 = 121
2 0 x 2 0 = 400
Sumatoria:
400+64+9+121+400= 994
Division:
994 + 5 = 198.8
Raiz cuadrada:
198.8 = 14.09
Resultado
Desvi aci on est andar = 14.09
EJERCICIO N. 27
Formula
Manual pcvia el Cwaa de Metad&i de 3mieatigacidn
98
Invente una lista de datos (al menos 8 datos distintos) y calcule la desviacion estandar.
Realice el procedimiento y las operaciones en hojas aparte. Anote la lista y el resultado en
los renglones siguientes.
3. Var i anza
Mide la variabilidad de los datos u observaciones, cuanto se alejan estos, del promedio del
valor central. Se obtiene elevando al cuadrado (se multiplica por si mismo) el resultado de la
desvi aci on est andar .
EJERCICIO N. 28
Tome la desviacion estandar del ejercicio 27 y calcule la varianza.
E. Di st r i buci on de f r ecuenci as
Constituye el ordenamiento de un conjunto de datos. Este representa cada uno de los
factores que se han tenido en cuenta para hacer una estadistica, por lo general se utiliza el
formato de tabl a.
Pr ocedi mi ent o:
Datos: 16, 10, 14, 55,17, 40
Se ordenan de menor a mayor.
10, 14, 16, 17, 40, 55
Se calcula:
Rango (r) =valor maximo menos el valor minimo
Clase (k) =se mutiplica 3,3 x log de cantidad de datos (N) y se suma 1. Esto corresponde al
numero de filas que deberan emplearse en la tabla.
Intervalo (i) = resultado del rango dividido entre el resultado de la clase. _r _
k
Limite real inferior (LRI)= dato menor de la muestra escogida menos 0.5
Manual paui el Cuwa de Metadad de Jtweatigacidn
99
L mite real inferior de clase =limite real superior de la clase inmediata anterior.
Limite real superior de clase (S) = limite real inferior de clase mas el intervalo
Intervalo (i) = diferencia que existe entre el limite real superior menos el limite real inferior
de una misma clase.
Frecuencia absoluta (fa)= cantidad de datos con valor ubicado entre el limite real inferior y
superior de clase, expresado en numeros naturales.
Frecuencia relativa (fr) = se divide la frecuencia absoluta de la clase entre el numero de
datos existente y se multiplica por 100.
Punto medio (Pm) =intervalo + 2 + rango inferior de clase.
Pm= _ i_ +I
2
Frecuencia absoluta mayor que (fa>) = cantidad de datos que tienen un valor mayor al
rango inferior de la linea.
Frecuencia absoluta menor que (fa<) = cantidad de datos que tienen un valor menor que el
rango superior de la linea.
Ejemplo:
Datos: 10, 14, 16, 17, 40, 55 (cantidad de datos 6)
Rango: 55-10 =45
Clase: 1+3,3 x (log6) =3,56 que se redondea a 4
Intervalo: 45-4 =11,25 se redondea al numero siguiente =12
LR
I S
fa fr Pm fa> fa<
9.5 21.5 4 66,64% 15.5 6 4
21.5 33.5 0 0 27.5 2 4
33.5 45.5 1 16,66% 39.5 2 5
45.5 57.5 1 16,66% 51.5 1 6
Las distribuciones de frecuencias pueden ser representadas de manera grafica mediante
histogramas u otros tipos de figuras preestablecidas.
El histograma contiene en el eje horizontal los Ifmites reales y en el vertical el tipo de
frecuencia y sus valores.
Ejemplo:
Manual pcvta el Cwaa de Meteda^ de Jnuedligacidn
101
F. El pol i gono de f r ecuenci as
Consiste en una grafica de las relaciones entre las puntuaciones y las frecuencias, se
construye mediante el establecimiento de los puntos medios de cada intervalo.
El punto medio se calcula de la manera siguiente:
Se divide el intervalo entre 2 y se suma al valor del limite real inferior de cada clase.
Ejemplo:
Clase (k) 9.5 21.5
Intervalo (i) 12
Procedimiento:
12+2 = 6 + 9.5 = 15.5
Punto medio = 15.5
Datos:
k= 9.5 21.5 /'= 12 Pm= 15.5
k= 21.5 33.5 / = 12 Pm= 27.7
k= 33.5 45.5 /'= 12 Pm= 39.5
k= 45.5 57.5 /'= 12 Pm= 51.5
Poligono de frecuencias
Ej empl o de apl i caci on est adi st i ca:
Se realiza una encuesta en la que se pregunta cual es la actitud hacia la gestion de la
Fedefutbol. Las categorias que se establecen son:
1. Actitud totalmente desfavorable, 2. Actitud muy desfavorable, 3. Desfavorable,
4. Favorable, 5. Muy favorable y 6. Totalmente favorable.
Se obtienen los datos siguientes:
Moda 1
Mediana 1.5
Media 1.3
Desviacion estandar 0.4
Manual pcuta el Guma de MetadxM de 3mtedtiqacwn
102
Varianza 0.16
Maximo 3.0
Minimo 1.0
Rango 2.0
Moda (1)
Media (1.3)
Mediana (1.5)
(1) (2) (3) (4) (5) (6)
Rango (2) Desv. Est
0.4
La categoria que mas se repitio es 1, las opiniones promedio se ubican en 1.5;
ninguna persona opino de manera favorable, no hay valores por encima del 4 y es a partir
de este valor que inicia el rango favorable, el rango de desviacion es de 0.4, por lo que no
altera el criterio. Esto significa que la actitud hacia la gestion de la Fedefutbol es muy
desfavorable (menos de 2).
G. Fl uj ogr ama
Es una representacion grafica de la secuencia de actividades de un proceso muestra
lo que se realiza en cada etapa, los materiales o servicios que entran y salen del proceso,
las decisiones que deben ser tomadas y las personas involucradas.
El flujograma utiliza un conjunto de simbolos para representar las etapas del proceso,
las personas o los sectores involucrados, la secuencia de las operaciones y la circulacion de
los datos y los documentos.
Los simbolos mas comunes utilizados son los siguientes:
Li mi t es: este simbolo se usa para identificar el inicio y el fin de un proceso:
Oper aci on: representa una etapa del proceso. El nombre de la etapa y de quien la ejecuta
se registran en el interior del rectangulo:
Document o: simboliza al documento resultante de la operacion respectiva. En su interior se
anota el nombre que corresponda:
Manual pcuux el de Metodoj de 3nueatigacion
103
Deci si on: representa al punto del proceso donde se debe tomar una decision. La pregunta
se escribe dentro del rombo. Dos flechas que salen del rombo muestran la direccion del
proceso, en funcion de la respuesta real:
Sent i do del fl uj o: significa
Este se usa para entender un proceso e identificar las oportunidades de mejora de la
situacion actual; disenar un nuevo proceso, incorporando las mejoras (situacion deseada);
facilitar la comunicacion entre las personas involucradas en el mismo proceso y, divulgar, en
forma clara y concisa, informaciones sobre procesos.
EJERCICIO N. 30
Invente un procedimiento y represented en un flujograma. Anote el procedimiento en los
renglones siguientes y realice el flujograma en hojas aparte.
el sentido y la secuencia de las etapas del proceso:
Manual pcvta el Cwtda de Metodaa de 3mieotigacidn

You might also like