Professional Documents
Culture Documents
ESTADSTICA APLICADA A LA
EDUCACIN
A
Algn da el pensamiento estadstico ser necesario como la habilidad para leer o escribir
(H.G. Wells)
AO 2013
Magster Agustina Subelda Coronel
INDICE
UNIDAD I
Metodologa cuantitativa.................................................................................................................................. 3
Caractersticas de la metodologa cuantitativa.............................................................................................. 3
Fases de la investigacin cuantitativa ............................................................................................................3
Definicin del tema de investigacin ........................................................................................................... 3
Planteamiento del problema........................................................................................................................ 4
Objetivos del estudio ................................................................................................................................... 4
Justificacin del estudio............................................................................................................................... 4
Revisin de la literatura marco terico ..................................................................................................... 4
Diseo metodolgico ............................................................................................................................... 5
Bibliografa................................................................................................................................................... 5
Cronograma de trabajo................................................................................................................................ 6
Concepto de poblacin y muestra...................................................................................................... 7
Principales tipos de muestras........................................................................................................................ 7
Tamao de la muestra................................................................................................................................... 8
Determinacin del tamao de la muestra probabilstica ............................................................................... 8
Representatividad de la muestra...................................................................................................................10
Distribucin del tamao de la muestra por afijacin proporcional.................................................................11
UNIDAD II
UNIDAD III
Qu
estudiar?
ASPECTOS
METODOLGI
COS Cmo se va
a realizar
la investigacin?
BIBLIOGRAFA
A qu fuentes escritas
se va a referir ?
PROBLEMA
Situacin actual
Preguntas de
invest.
OBJETIVOS
Propsitos de la
investigacin
MARCO DE
REFERENCIA
Qu hay
escrito
al respecto?
JUSTIFICAC
I N
PRESUPUESTO
Qu recursos se
CRONOGRAMA
necesitan?
Motivos para
hacer
el estudio
Cunto tiempo se
va a emplear?
Es importante sealar en el diseo los principales elementos tericos sobre los cuales se
pretende desarrollar la investigacin.
Metodolgico: Hace mencin al uso de metodologas y tcnicas especficas que han de servir de aporte
para el estudio de problemas.
Prctico:
Hiptesis
Poblacin
Muestra
Tcnicas
Instrumentos
Anlisis
BIBLIOGRAFA
Se debe tener en cuenta toda la documentacin bibliogrfica que se ha consultado en el proceso de elaboracin de la investigacin.
La presentacin del mismo se realiza teniendo en cuenta los reglamentos o normativas vigentes.
CRONOGRAMA DE TRABAJO
Considera las diferentes etapas del proyecto y el tiempo estimado para cada una de ellas.
Para el mismo se utiliza la Grfica de Gantt, que es la representacin grfica de las variables actividades de
las etapas de investigacin y tiempo de ejecucin (pueden ser en das, semanas, meses, ao)
INSTITUTO SUPERIOR DE EDUCACIN "DR. RAL PEA" - AO 2010
CRONOGRAMA DE ACTIVIDADES - DPTO DE INVESTIGACIN
ACTIVIDADES
Elaboracin de Planificacin
Taller de Polticas
Capacitacin: Enfoque por Competencias 22 al 24
Elaboracin y validacin de programas de la carrera de grado
Lectura y ajuste del informe CONACYT: (2 al 12)
Ajuste de instrumentos p 2 trab.de campo : (15 al 26)
FORO "BICENTERNARIO DE LA INDEP." 16/03
Socializacin de los resultados de la 1 interv. de la
investigacin (5 al 09/04)
Trabajo de campo, 2 intervenc (12 al 23/04)
Feria del libro en Bs As (26 al 30)
Carga y verificacin de datos
Procesamiento de datos
Anlisis de la informacin
Elaboracin del informe (2 intervencin )
Entrega del informe ( 25 de junio)
Viaje al Uruguay (12 al 16)
Ajuste de instrumentos p 3 trab.de campo
Trabajo de campo, 3 intervenc
Carga y verificacin de datos
Procesamiento de datos
Anlisis de la informacin
Elaboracin del informe final (3 intervencin )
Entrega del informe ( 25 de junio)
SEMANAS
FEB
X
X
MARZO
ABRIL
MAYO
JUNIO
JULIO
X
XX
XX
XXX
X
X
XX
X
XXXX
XXXX
XXX
XXXX
XX
AGOSTO
POBLACIN Y MUESTRA
POBLACIN O UNIVERSO, est referido a cualquier coleccin finita o infinita de elementos que in-
teresan a un estudio y poseen alguna caracterstica comn observable y pueden ser personas, instituciones,
objetos, familias, animales y otras unidades ms complejas. Toda poblacin tiene N elementos y una
muestra de n elementos, donde n < N.
Ejemplo 2:
Las instituciones de una zona
Las instituciones de un departamento
Los jvenes de una carrera
Los estudiantes de un postgrado
Los docentes de una universidad
MUESTRA, es una parte o subconjunto de una poblacin en estudio. Est constituida de elementos selec-
cionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra
slo da informacin de aquella poblacin de la que ha sido extrada.
Casual o accidentales: consisten simplemente en tomar los casos casuales hasta alcanzar un cierto tamao de la muestra. Generalmente son los muestreos que se utilizan en los sondeos. Por ej. Se incluirn en la muestra las primeras 100 personas que pasen por una esquina.
Por cuotas: es aquel en que se busca garantizar la seleccin de elementos pertenecientes a los diferentes estratos que conforman la poblacin y que dichos elementos puedan ser tenidos en cuenta en las
mismas proporciones que ocurren en esa poblacin. Por ejemplo, se quiere conocer las opiniones de los
nios de EEB y se supone que las mismas variarn de acuerdo a las edades, entonces sera conveniente hacer una estratificacin por grupo etario.
Cuando hablamos de una muestra no probabilstica, la eleccin de los elementos de la muestra no depende
de la probabilidad sino de las causas relacionadas con las caractersticas de la investigacin o de quien establece la muestra (el investigador).
El procedimiento no es mecnico, ni probabilstico, sino que depende del proceso de toma de decisiones del
investigador y, desde luego, las muestras seleccionadas obedecen a criterios definidos teniendo en cuenta
los objetivos de investigacin.
Desde el enfoque cuantitativo y para determinado diseo, la utilidad de una muestra no probabilstica reside
no tanto en una representatividad de elementos, sino en una cuidadosa y controlada eleccin de sujetos
con ciertas caractersticas definidas previamente en el planteamiento del problema.
Probabilsticas: En las muestras probabilsticas o aleatorias requiere que todos los elementos de una poblacin tengan una probabilidad conocida de ser seleccionados.
Azar simple: es la muestra donde todos los elementos de la poblacin tienen la misma probabilidad de
resultar seleccionados. El requisito fundamental es tener un listado completo de los elementos de la poblacin, por lo que en la prctica se torna difcil trabajar con poblaciones grandes.
Sistemtica: Se trata de un procedimiento de muestreo que simplifica la seleccin de las unidades. Tambin se requiere de un listado completo de los elementos de la poblacin, que debern ser numeradas
correlativamente.
El procedimiento es el siguiente:
1. Determinar el tamao de la poblacin (N)
N
n
Estratificada: Este tipo de muestreo se hace en base a determinadas variables que se consideran pertinentes para la estratificacin de la poblacin. La diferencia con respecto a la muestra por cuotas es el
hecho de que la seleccin de las unidades se realiza al azar y adems que es apta para realizar cualquier tipo de inferencia estadstica.
Por Conglomerados (clusters) y en etapas mltiples: Este tipo de diseo se utiliza en general para reducir los costos de recoleccin de datos, sin embargo, hay que tener en cuenta que aumenta el grado de
error a diferencia del muestreo estratificado. En la mayora de los casos se utiliza cuando no se cuenta
con un listado de todos los elementos de la poblacin.
Los conglomerados son unidades de un mismo tamao, es en cierto modo una estrategia opuesta a la
del muestreo estratificado, ya que en una muestra estratificada, los casos se seleccionan dentro de cada estrato, en cambio, en este tipo de muestra se selecciona entre los conglomerados; correlativamente,
as como se busca que los estratos sean lo ms homogneos posible internamente, para los conglomerados cuanto ms heterogneos sean mejor ser el resultado.
La tcnica por conglomerados se integra en diseos de muestra en etapas mltiples; muestras que suponen la definicin de unidades de muestreo en diferentes niveles.
TAMAO DE LA MUESTRA
Uno de los aspectos a concretar en las fases previas de la investigacin, es el tamao de la muestra. En
estadstica, el tamao de la muestra es el nmero de sujetos o elementos que componen
la muestra extrada de una poblacin, necesarios para que los resultados obtenidos sean representativos
de la poblacin, vlidos y confiables.
Determinar el tamao adecuado para una muestra es una eleccin crucial, por todas las consecuencias negativas que puede producir una equivocacin, representa una parte esencial del mtodo cientfico para poder llevar a cabo una investigacin. El tamao de la muestra, generalmente, se determina en funcin a los
objetivos del estudio y las caractersticas de la poblacin, as como de los recursos disponibles (costo, tiempo, entre otros).
En este sentido, es importante definir el alcance de la investigacin de manera a determinar el tipo de muestra a ser empleado (no probabilsticos -dirigidos o intencionales- o probabilsticos). La muestras dirigidas
(intencionales) o no probabilsticas, generalmente son utilizadas en los estudios exploratorios (aunque
tambin puedan ser utilizados muestras probabilsticas) e investigaciones experimentales (debido a que
los experimentos requieren de manejos de grupos no muy grandes, donde la validez externa se consolida
mediante la repeticin o reproduccin del estudio). Mientras que en aquellos estudios que requieren ser expandidos a una poblacin, como los no experimentales descriptivos o correlacionales-causales se deben utilizar las muestras probabilsticas.
(*) Donde deben ser considerados los siguientes elementos de la inferencia estadstica:
n0: Cantidad terica de elementos de la muestra. Tambin sirve para el caso en que la poblacin en estudio no sea finita.
n: Cantidad real de elementos de la muestra a partir de la poblacin asumida o de los estratos asumidos
en la poblacin.
N: Nmero total de elementos que conforman la poblacin, o nmero de estratos totales de la poblacin.
z: Valor estandarizado en funcin del grado de confiabilidad de la muestra calculada. Por ejemplo, si
consideramos trabajar con un 95 % de confiabilidad la muestra seleccionada, entonces el valor estandarizado asumir es igual a 1.96 (Para dos colas). Algunos valores standarizados (z) en funcin de grado de
confiabilidad asumido (para dos colas):
99 % ------------- z = 2,58 (Empleado con frecuencia)
97.5%------------ z = 2,24
95 % ------------- z = 1,96 (El ms empleado)
90 % ------------- z = 1,64
85%--------------- z = 1,44
80%--------------- z = 1,28
: Error asumido en el clculo. Toda expresin que se calcula contiene un error de clculo debido a las
aproximaciones decimales que surgen en la divisin por decimales, error en la seleccin de la muestra,
entre otras, por lo que este error se puede asumir entre un 1 hasta un 10 %; es decir, que se asume en
valores de probabilidad correspondiente entre un 0.01 hasta un 0.1:
Carrera
Cant. de alumnos
Informtica
Derecho
Ing. Comercial
Marketing
Total de estudiantes = N
650
825
365
720
2.560
3 % 0 , 03
p 60 % 0 , 6
q 40 % 0 , 4
Clculo de la cantidad terica de elementos de la muestra
2
2,58
z
2
n0 . p.q
0,6 0,4 86 0,6 0,4 7.396 0,6 0,4 1.775,04
0,03
Clculo de la cantidad real de elementos de la muestra a partir de la poblacin
n0
1.775,04
1.775,04
1.775,04
1.048,23 1.048
n0
1.775,04 1 0,693375 1,693375
Tamao de la muestra de estu1
1
2
.
560
N
REPRESENTATIVIDAD DE LA MUESTRA
Uno de los primeros pasos en cualquier investigacin consiste en la determinacin del universo o poblacin,
si la poblacin que nos interesa es de gran tamao, podra resultar sumamente trabajoso obtener informacin sobre todos sus elementos, en este caso se recurre a una muestra.
Para que la muestra sea representativa de la poblacin, esta debe ser seleccionada de modo tal de obtener la mxima aproximacin a los parmetros poblacionales. Uno de los mtodos para mejorar la calidad del
muestreo es la estratificacin de la poblacin.
La idea de representatividad tiene que ver con la posibilidad de que la muestra sea una rplica adecuada de
la poblacin en lo que hace a las variables relevantes. Al respecto, convendr tener en cuenta las siguientes
consideraciones:
1. Una muestra que sea representativa para determinados propsitos, puede no serlo para otros: no existe
la muestra representativa en s, para cualquier propsito.
2. Si bien existen procedimientos para evaluar la bondad de una muestra, no es la muestra en s la que es
representativa; ms bien nuestra creencia en su representatividad la que va a depender del plan de
muestreo utilizado para seleccionarla.
3. La representatividad de una muestra est dada en considerar que la misma fue extrada de una pobla-
cin con un determinado nivel de confianza (se trabaja preferiblemente con un 95 % de confianza o
ms), de asumir un determinado porcentaje en el error de clculo, que debe estar comprendido entre un
1 hasta un 10 % (0,01 hasta 0,10); y de considerar un adecuado porcentaje (desde un 1 hasta un 20 %)
10
Carrera
Informtica
Derecho
Ing. Comercial
365
Marketing
720
Total de estudiantes = N
2.560
Distribucin de la Muestra
1.048
Interpretacin
Los resultados indican que el instrumento de evaluacin ser aplicado a: 273 estudiantes de la carrera de
Informtica, 335 de Derecho, 147 de Ing. Comercial y 293 de Marketing, totalizando de esta manera una
muestra total de 1.048 estudiantes de la Universidad
11
HECHO
PROBLE
MA
Objetivos
Hiptesis
POBLACI
N
-Ubicacin
-Tamao
-Tiempo
Concepto
Categoras
Identificacin
VARIABLES
Clasificacin
Crtica
Codificacin
Procesamiento
Modelos
Pruebas
Mtodos
Tcnicas
DATOS
INFORMACI
N
Recopilacin de
datos
(Instrumentos)
MUEST
RA
Tablas
Cuadros
Grficos
INDICADOR
ES
Proporciones
Porcentajes
Tasas
ndices
Estadgrafos
Coeficientes,
etc.
Unidad
es de
anlisis
Permite comprender la bibliografa especializada (libros, estudios e investigaciones) basados en el anlisis estadstico.
Ayuda a desarrollar una investigacin rigurosa, ofreciendo fundamentos lgicos en los que se sustenta la
investigacin bsica y aplicada.
12
NOMENCLATURA ESTADSTICA
ESTADISTICAS, sinnimo de datos estadsticos, servir para designar a toda coleccin sistemtica de datos referentes
a un determinado fenmeno.
ESTADSTICO, es la persona que se dedica al estudio de la Estadstica, es el profesional que analiza estadsticas, desarrolla mtodos y modelos estadsticos y contribuye a la evolucin de la ciencia estadstica. (Roberto B. vila Acosta)
ESTADGRAFO es el trmino utilizado para designar a la persona dedicada a las tareas propias de la estadstica, aunque en ocasiones tambin es frecuente que se utilice para designar a la variable que define una distribucin estadstica,
de esta forma es comn escuchar el trmino estadgrafo de prueba.
mx.answers.yahoo.com/question, smathdown.blogspot.com
ESTADGRAFO es una caracterstica descriptiva global de una muestra .Es la medida de una caracterstica relativa a
una muestra. La mayora de los estadsticos mustrales se encuentran por medio de una frmula y suelen asignrseles
nombres simblicos que son letras latinas.
http://virtual.uav.edu.mx/tmp/2611217572402.doc
DATO, es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Dato es el resultado de la observacin, entrevista o recopilacin en general. Los datos son la materia prima de la Estadstica.
INFORMACION, es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay informacin sin datos.
VARIABLE, Son caractersticas o dimensiones observables, susceptibles de adoptar distintos valores o ser expresados
en varias categoras, tales como edad, ingresos, matrcula, Instituciones, lugar de nacimiento, ahorros, etc.. Las variables se definen e identifican en funcin de los objetivos del estudio.
INDICADORES, son elementos caractersticos que describen una situacin permitiendo su anlisis. Son referentes empricos que permiten una medicin, descripcin, ordenamiento de los datos o caractersticas en forma vlida y confiable.
La validez y confiabilidad del indicador depende de la validez de los datos utilizados y de la lgica de su relacin o construccin. En este sentido, los llamados ndices, tasas, estadgrafos, medidas de resumen, etc., son indicadores.
POBLACIN O UNIVERSO, est referido a cualquier coleccin finito o infinito de elementos que interesan a un estudio
y poseen alguna caracterstica comn observable y pueden ser personas, instituciones, objetos, familias, animales y
otras unidades ms complejas. Toda poblacin tiene N elementos y una muestra de n elementos, donde n<N.
MUESTRA, es una parte o subconjunto de una poblacin en estudio. Esta constituida de elementos seleccionados de
una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra slo da informacin de
aquella poblacin de la que ha sido extrada.
PARAMETRO, es un valor obtenido para describir en forma resumida las caractersticas pertinentes o ms importantes
acerca de una poblacin. Son las medidas de resumen de una poblacin. Una poblacin puede tener muchas caractersticas y por tanto muchos parmetros.
ESTADIGRAFO, datos empricos que se usa con fines descriptivos o analticos; son medidas de resumen estadstico de
un conjunto de datos. Las medidas de resumen de una muestra se llamarn estadgrafos. Ejemplo, la media aritmtica,
mediana, varianza, coeficiente de correlacin, etc.
CENSO, consiste en un recuento de todos los elementos en una poblacin y/o una especificacin de las distribuciones
de sus caractersticas, basados en la informacin obtenida para cada uno de los elementos.
ENCUESTA, consiste en la obtencin de datos de inters sociolgico mediante la interrogacin a los miembros de la
sociedad. Permite obtener informaciones sobre un amplio abanico de cuestiones a la vez y no slo sobre un aspecto o
problema definido.
UNIDAD DE ANLISIS, es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre los cuales se va
a obtener datos. La unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno y proporciona datos concretos.
13
VARIABLES
Objeto, proceso o caracterstica que est presente, o supuestamente presente en el fenmeno medible que
un cientfico quiere estudiar, que vara (cambia) a travs del tiempo, o que difiere de un lugar a otro o de un
individuo a otro. Los objetos, procesos o caractersticas reciben el nombre de variables en la medida en que
su modificacin provoca una modificacin en otro objeto, proceso o caracterstica.
Ejemplo 5
Variable: Sexo
Categora
1. Femenino
2. Masculino
b) Variables cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico. El dato o valor puede resultar de la operacin de contar o medir. Las variables cuantitativas pueden ser discretas y continuas.
Discreta; cuando el valor resulta de la operacin de contar, su valor est representado solo por nmeros
naturales. Ej. Cantidad de jvenes de una carrera, cantidad de docentes por carrera, cantidad de alumnos en la institucin de educacin superior, cantidad de asignaturas por carrera, Hijos por familia, nmero
de accidentes por da, habitaciones por vivienda, etc.
Continua; cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Se expresa por cualquier nmero real. Ej.
rea de parcelas, ingresos monetarios, produccin de maz, peso de los alumnos, estatura de los alumnos, tiempo de servicios, horas trabajadas de los docentes, etc.
SEGN LA ESCALA DE MEDICIN; Se presenta a continuacin las caractersticas bsicas de los cuatro niveles distinguidos por Stevens,
14
a) Variables nominales; Son aquellas que establecen la distincin de los elementos en diversas categoras, sin implicar algn orden entre ellas, distribuye a la unidad de anlisis en dos o ms categoras.
Ejemplos: sexo, estado civil, deportes que practica, profesiones, lugar de nacimiento, etc.
b) Variables ordinales: Aquellas variables que implican orden entre sus categoras, pero no grados de
distancia iguales entre ellas; estn referidas a un orden o jerarqua, donde las categoras expresan una
posicin de orden. Ejemplo: grado de instruccin, clases sociales, grado de simpata, rango de agresividad, orden de mrito, nivel de dolor, nivel de preferencia, etc.
c) Variables de intervalo: Son aquellas que suponen a la vez orden y grados de distancia iguales entre
las diversas categoras, pero no tienen un origen natural, sino convencional. En este tipo de variables es
posible describir la informacin contenida en ellas calculando el promedio, desviacin Standard (DS) y
siempre debiera tambin incluirse en base a cuantos casos (o sea el n) tienen dichos resultados. Ejemplos: coeficiente de inteligencia, temperatura, puntuacin obtenida en una escala, etc.
d) Variables de razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero
absoluto tal que significa ausencia del atributo y la razn o cociente de dos nmeros es significativo pudindose aplicarles todo tipo de instrumental matemtico. El valor de estas variables se expresa con un
nmero real. Ejemplo: edad, peso, ingresos, nmero de hijos, produccin, accidentes de trnsito, etc.
a) Variables dependientes: Son aquellas que se explican por otras variables, son los efectos o resul-
tados respecto a los cuales hay que buscar su motivo, causas o razn de ser. Es la variable que traduce
la consecuencia del efecto de una o varias razones o causas de otras variables.
b)
Variables independientes: Son las variables explicativas o predictivas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende descubrir en la investigacin. Las variables independientes (VI) son las que traducen o explican las causas o razones de las variaciones en la variable dependiente (VD). En la relacin de variables, las causas o antecedentes seran las VI y el efecto o consecuente es la VD.
Ejemplo 6
1.
2.
3.
4.
15
Los datos o valores que alcanzan las unidades en las variables estudiadas, son las respuestas o resultados que se obtienen cuando
CUADRO 1
MATRZ TRIPARTITA DE DATOS: CARACTERSTICAS SOCIODEMOGRFICAS DE LOS ESTUDIANTES DE LA MAESTRA EN EDUCACIN. AO 2012
Unidades de anlisis
(Poblacin)
01
02
03
04
05
06
07
08
09
10
11
12
Eda
Sexo
48
37
28
36
25
38
45
37
48
41
50
35
F
F
F
M
F
F
M
M
F
F
F
F
VARIABLES
Estado Civil
Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboracin: Maestra en Educacin
16
N de hijos
Aos de servicio
4
3
1
3
3
0
2
5
3
5
1
2
21
15
6
15
5
18
25
16
25
17
24
13
CONSTRUCCIN DE INDICADORES
INDICADORES: Un indicador social es una medida de resumen, de preferencia estadstica, referente a la
cantidad o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar
las unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables que se estn analizando.
Cuando se analiza una variable y se quiere comparar las categoras, se puede recurrir a los
siguientes indicadores.
RAZN / RELACIN
RAZN: Es la comparacin entre dos nmeros que puede calcularse por diferencia
RELACIN: Comparacin entre dos nmeros que puede calcularse por cociente.
Ejemplo 7: En la siguiente tabla se presenta la cantidad de estudiantes por sexo de una institucin de enseanza superior
SEXO
CANT
Mujeres
600
Varones
1.200
Total
1.800
Se desea saber;
a. Cuntos varones ms que mujeres hay en la institucin?. Interpreta.
b. Cul es la relacin entre varones y mujeres en la institucin?. Interpreta
Para dar respuesta a las preguntas planteadas se procede de la siguiente manera:
a. Ra=1.200-600=600. Interpretacin: Indica que existen 600 varones ms que mujeres en la Institucin.
b. Re
V 1200 2
PROPORCIN Y PORCENTAJE
PROPORCIN: Una proporcin (P) es una comparacin por cociente de la magnitud de una parte con la del
todo. El valor de una proporcin (P) siempre se halla entre el cero y la unidad.
0 P 1
M
600
0,33 Interpretacin: Aproximadamente la tercia parte (0,33) de los estudiantes son muT 1800
PORCENTAJE: Es la expresin de la proporcin en forma de porcentaje (%). As, para convertir una proporcin en porcentaje se multiplica dicha proporcin por 100.
17
TABLAS DE FRECUENCIAS
TABLAS DE FRECUENCIA O DE DISTRIBUCIN, son tablas de trabajos estadsticos, que presentan la
distribucin de un conjunto de elementos de acuerdo a las categoras de la variable. En ellas se observa la
frecuencia o repeticin de cada uno de los valores de la variable, que se obtiene despus de realizar la operacin de tabulacin; las tablas presentan los diversos tipos de frecuencia (absoluta, relativas, etc.)
TIPOS DE FRECUENCIAS:
FRECUENCIA ABSOLUTA (fa): Es el nmero de veces que se repite un valor.
FRECUENCIA ABSOLUTA ACUMULADA (faa): en un punto determinado, es igual a las sumas de las frecuencias absolutas anteriores al punto.
FRECUENCIA RELATIVA o DISTRIBUCIN DE PROBABILIDADES (fr): Es el cociente entre la frecuencia
absoluta y el nmero total de casos (Fabs /n), siendo n el nmero total de casos.
FRECUENCIA RELATIVA ACUMULADA (fra): en un punto determinado, es igual a las sumas de las frecuencias relativas anteriores al punto.
DISTRIBUCIN DE FRECUENCIAS: Es una tabla que indica las distintas clases en que los datos se han
clasificado y la frecuencia de valores en cada clase.
La informacin estadstica se puede presentar en forma:
NO AGRUPADA: cuando no hay muchos datos.
VARIABLE CUANTITATIVA
Ejemplo 10: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica de 12
alumnos de la carrera de Ciencias de la Educacin.
51
88
62
73
68
61
90
92
88
51
Ordena ya sea en forma ascendente o descendente los datos y halla las frecuencias.
FRECUENCIA FRECUENCIA
PUNTAJE
ABSOLUTA (fa) RELATIVA (fr)
51
61
62
68
73
88
90
92
TOTAL
2
2
2
1
1
2
1
1
12
18
62
61
16,7
16,7
16,7
8,3
8,3
16,7
8,3
8,3
100
FRECUENCIA
ABSOLUTA
ACUMULADA
faa
2
4
6
7
8
10
11
12
FRECUENCIA
RELATIVA
ACUMULADA
fra
16,7
33,4
50,1
58,4
66,7
83,4
91,7
100,0
82
73
76
87
68
61
88
91
90
92
91
63
62
71
79
65
88
51
56
77
R=92-51=41
El recorrido se puede dividir en un nmero arbitrario de intervalos de clase (m) o pequeos segmentos.
S m = nmero de intervalos, entonces: la amplitud (c) o el tamao del intervalo est dado por:
( R 1)
ci
m
Para elegir un nmero arbitrario de intervalos se calcula R+1 y se verifica si este resultado es mltiplo de
algn nmero, como por ejemplo R+1=41+1=42. El 42 es mltiplo de 2, 3, 6, 7, 14, es decir, que el nmero
arbitrario de intervalos (m) a ser elegido puede ser cualquiera de esos divisores.
Se considera a m=6 como el nmero arbitrario, entonces, la amplitud o el tamao del intervalo (c) ser:
41 1 42
7
6
6
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
El intervalo contiene a:
51, 52, 53, 54, 55, 56, 57
58, 59, 60, 61, 62, 63, 64
65, 66, 67, 68, 69, 70, 71
72, 73, 74, 75, 76, 77, 78
79, 80, 81, 82, 83, 84, 85
86, 87, 88, 89, 90, 91, 92
Cada intervalo de clase tiene: Lmite inferior y un lmite superior; es el menor y el valor que delimita un intervalo de clase.
Intervalo de clase Lmite inferior
51 - 57
51
Lmite superior
57
19
yi Marca de clase
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89
Mtodo general para hallar la distribucin de frecuencias para datos agrupados en intervalos
1) Determina el valor mximo y el mnimo entre todos los datos registrados y as calcular el RANGO: es el
valor mximo menos el valor mnimo.
2) Divide el rango en un nmero arbitrario (m) de INTERVALO DE CLASE del mismo tamao.
3) Halla la MARCA DE CLASE.
4) Determina el nmero de observaciones que cae dentro de cada intervalo de clase, es decir, encontrar la
frecuencia de clase, mediante un conteo de los datos.
Ejemplo 12: Agrupa utilizando los datos del ejemplo anterior. Considera m=7 para el tamao de intervalo
PUNTAJE
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
TOTAL
Marca de clase
yi
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89
20
FRECUENCIA
ABSOLUTA (fa)
2
4
4
4
2
8
24
FRECUENCIA
RELATIVA
(fr)
8,3
16,7
16,7
16,7
8,3
33,3
100
FRECUENCIA
ABSOLUTA
ACUMULADA
faa
2
6
10
14
16
24
FRECUENCIA
RELATIVA ACUMULADA fra
16,7
25,0
41,7
58,4
66,7
100,0
01
02
03
04
05
06
07
08
09
10
11
12
Eda
Sexo
48
37
28
36
25
38
45
37
48
41
50
35
F
F
F
M
F
F
M
M
F
F
F
F
VARIABLES
Estado Civil
Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboracin: Maestra en Educacin
N de hijos
Aos de servicio
4
3
1
3
3
0
2
5
3
5
1
2
21
15
6
15
5
18
25
16
25
17
24
13
Frecuencia
9
3
12
Porcentaje
75,0
25,0
100,0
Interpretacin: Se puede notar que en el grupo de estudiantes la mayora son mujeres, representando un
75% del total de estudiantes de la Maestra en Educacin.
PARA TENER EN CUENTA: En variables cuantitativas, no se calculan frecuencias acumuladas
21
Ejemplo 14 Cuadro 2
Cuadro 3
SECTOR TOTAL %
SECTOR
Oficial
Privado
Total
Oficial
Privado
Total
55.231
29.433
84.664
65,2
34,8
100,0
SEXO
Mujeres
30.377
15.600
45.977
Hombres
24.854
13.833
38.687
TOTAL
55.231
29.433
84.664
22
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
fa
5
8
5
12
10
12
12
11
10
10
fa
8
7
6
4
3
2
1
0
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
PUNTAJE
FUENTE: Universidad XX
ELABORACIN: Universidad XX. Facultad XX. Dpto Est
23
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
MARCA
DE
CLASE
27
42
57
72
87
fa
5
8
5
12
10
fa
12
11
10
9
8
7
6
5
4
3
2
1
0
12
10
8
12
27
42
57
72
87
102
PUNTAJE MEDIO
FUENTE: INST. XX.
ELABORACIN: ......
OJIVAS
Para representar las frecuencias acumuladas (absolutas o relativas) se utilizan las Ojivas o polgonos
acumulativos de frecuencias. Se construye ubicando los extremos de los intervalos en el eje x y en el eje
y el valor de las frecuencias acumuladas. En el extremo superior de cada intervalo se levanta un segmento
de altura igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se
une, con segmentos de recta, los extremos de los segmentos verticales, obteniendo una lnea poligonal que,
partir de la ltima frecuencia acumulada, se extiende paralelamente al eje horizontal.
PUNTAJE
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
MARCA
DE
CLASE
27
42
57
72
87
fa
5
8
5
12
10
faa
fa a
40
35
5
13
18
30
40
30
30
25
20
18
15
13
10
0
20
34
35
49
50
64
65
PUNTAJE
FUENTE: INST. X X .
ELA B ORA CIN: ......
24
79
80
94
Matricula
156000
154000
152000
150000
148000
146000
144000
2003
2004
2005
2006
2007
AOS
FUENTE: INST.AO 2003-2007
VARIABLES CUALITATIVAS
BARRAS
El grfico de barra (o diagrama de barras) se puede representar en forma vertical u horizontal. El ancho de
las barras debe ser constante y pueden ser de cualquier tamao, mientras que las barras no se sobrepongan. Este tipo de grfico se usa para representar variables relacionadas entre s
BARRAS VERTICALES
S el grfico corresponde al de barra vertical, entonces, las categoras de la variable independiente son registradas horizontalmente y sobre ellas son levantadas columnas de alturas correspondientes a la variable
dependiente (frecuencia).
BARRAS HORIZONTALES
Se diferencia de las barras verticales por la posicin entre la variable y la frecuencia. Las variables pueden
ser ordenadas en forma creciente o decreciente de acuerdo a la frecuencia o alguna otra clasificacin.
GRAFICO 6: DESERCIN
UNIVERSITARIA POR CARRERA. AO
2007
Comer cial
7.000
6.000
Ar quitectur a
5.000
4.000
3.000
2.000
Inf or mtica
1.000
0
Der echo
Desercin
Diseo
0
DEPARTAMENTO
FUENTE: INST.
25
10
15
20
25
30
BARRAS COMPUESTAS
GRFICO DE PILAS
Este tipo de grfico sirve para representar un fenmeno dividido en categoras que a su vez se dividen
en subcategoras. Para su elaboracin se utilizan
generalmente, cifras absolutas y no relativas.
Las barras pueden estar en posicin vertical u horizontal
GRFICO N 7: EDUCACIN
SUPERIOR. MATRCULA POR AO,
SEGN SECTOR
180.000
160.000
140.000
120.000
149.719
167.262
130.979
100.000
80.000
60.000
40.000
35.915
39.039
45.394
20.000
0
1991
1992
1993
AO
Pblico
FUENTE: XXXXX
ELABORACIN:
Privado
CIRCULAR O DE SECTORES
Se utiliza para demostrar una proporcin de un todo y solamente cuando la variable est dividida en pocas
categoras, en caso contrario pierde su principal cualidad que es la legibilidad.
Para construir un grfico circular se calculan los ngulos repartiendo 360 en partes directamente proporcionales a cada una de las frecuencias, que pueden ser cifras absolutas o relativas.
Varn
63%
Fuente:
26
x 1 x 2 x 3 ....... x n
n
i 1
Mediana (Me); una vez ordenados los datos, para calcular la mediana se toma como referencia el valor de
(n+1)/2 para los datos no agrupados.
b.
c.
Moda (Mo); es el valor ms frecuente para una variable, es decir, al que le corresponde mayor frecuencia.
Ejemplo 15 Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin,
por 12 alumnos del primer semestre.
75
82
a)
b)
c)
d)
87
75
74
94
62
77
93
69
78
73
7 5 8 7 74 62 93 78 82 75 94 77 69 73
939
78 , 25
12
12
Interpretacin: Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25
puntos
c) Para calcular la mediana (Me) se procede a:
27
69
78
73
82
74
87
75
93
75
94
Calcular
Posicin
de
1
62
2
69
Posicin
Puntos
la
mediana
3
73
4
74
5
75
n 1 13
6 ,5
2
2
6
75
7
77
8
78
9
82
10
87
11
93
12
94
75 77
76
2
Interpretacin: esto implica que aproximadamente el 50% de los estudiantes han obtenido hasta 76 puntos
e) En cuanto al puntaje ms frecuente es 75, porque tiene mayor frecuencia, es decir 3.
a) Tabla de frecuencias
Puntajes (Yi)
10
18
22
24
28
30
fa=ni
1
4
6
6
7
6
30
fa=ni
1
4
6
6
7
6
30
Yi.ni
10x1=10
18x4=72
22x6=132
24x6=144
28x7=196
30x6=180
Y .n
i
734
10,1 18 , 4 22 , 6 24 , 6 28 , 7 30 , 6
734
24 , 47
30
30
28
Calcular
n 30
15
2 2
Puntajes (Yi)
Yj-1
Yj
10
18
22
24
28
30
n=
fa=ni
1
4
6
6
7
6
30
faa=Ni
1
5
11 Nj-1
n
15
17 Nj
2
24
30
Como 2 15 no coincide con ningn Ni, el valor se encuentra entre dos valores de Ni o sea:
N j 1 11
n
15 N j 17 entonces
2
Me
24
tos o menos.
23
28
23
28
30
23
22
18
23
30
30
10
22
24
18
30
28
22
22
28
22
28
22
24
30
18
28
a)Tabla de frecuencias
Puntajes (Yi)
10
18
22
23
24
28
30
b)
fa=ni
1
4
6
4
2
7
6
Puntajes (Yi)
10
18
22
23
24
28
30
30
fa=ni
1
4
6
4
2
7
6
30
Yi.ni
10x1=10
18x4=72
22x6=132
23x4=92
24x2=48
28x7=196
30x6=180
Yi .ni 730
10,1 18 , 4 22 , 6 23 , 4 24 , 2 28 , 7 30 , 6
730
24 , 33
30
30
29
Calcular
n 30
15
2 2
Puntajes (Yi)
10
18
22
Yj-1 23
Yj 24
28
30
n=
n
15
2
Como
Me
fa=ni
1
4
6
4
2
7
6
30
faa=Ni
1
5
11
15 Nj-1
17 Nj
24
30
coincide
con
n
15
2
Ni,
1
Yj 1 Yj 1 23 24 23,5 , es decir,
2
2
entonces,
N j 1
n
15 N j 17
2
entonces
Interpretacin: El 50% de los alumnos tienen puntajes iguales o menores que 23,5 puntos.
d) En cuanto al puntaje ms frecuente de los estudiantes es de 28 puntos, porque tiene mayor frecuencia (7).
MEDIDAS DE DISPERSIN
Son aquellos valores que nos dan una idea de cuan alejados estn unos datos de otros, es decir es necesario tener una idea del grado de concentracin o dispersin de las observaciones alrededor de un valor central o de posicin.
Los estadgrafos de dispersin de mayor uso son:
Rango o recorrido: es un estadgrafo de dispersin muy limitado, pues slo considera los valores extremos
de la distribucin
DATOS NO AGRUPADOS
Desviacin media: o desviacin promedio de un conjunto de observaciones se define por
n
X
DM
j 1
Xj respecto a X .
Varianza: En la perspectiva de construir un indicador que dimensione la desviacin o distancia promedio de
los Xj respecto a X , se propuso elevar al cuadrado de la desviacin X j X a fin que sea siempre no negativa. De esta manera la varianza queda definida como:
n
V (X ) s2
X
j 1
30
s s2
La desviacin estndar, al igual que la varianza; es no negativa, puesto que es la raz cuadrada positiva de
la varianza. A mayor dispersin le corresponder una mayor desviacin estndar.
Interpretacin de la desviacin estndar
Si la desviacin estndar es ms grande que la media, esto probablemente indica un sesgo, es decir
sugiere que una o ms puntuaciones extremas inflaron la media y la desviacin estndar.
Si la desviacin estndar no es de la mitad de tamao de la media o menos, se debe tener en cuidado al
examinar la distribucin para analizar la posible existencia de sesgos o valores extremos.
Coeficiente de variacin (CV): Es una medida de variacin RELATIVA, mide el grado de dispersin de un
conjunto de datos en relacin con su media. Uno de sus usos ms comunes es para expresar la desviacin
estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado
de variabilidad que la desviacin tpica o estndar. Todos los valores deben ser positivos y su media de por
tanto un valor positivo. El CV pierde utilidad cuando la media se aproxima a cero
Es til para comparar la dispersin de conjunto de datos que tienen distintas desviaciones estndar y distintos promedios.
Interpretacin del coeficiente de variacin
s
CV
__
.100
69
73
74
75
75
77
78
82
87
93
94
Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25 puntos
a) Calcula la desviacin media de los puntajes obtenidos.
b) Calcula la varianza y la desviacin tpica o estndar.
c) Calcula el coeficiente de variacin
d) Interpreta los resultados
a) Calcula la desviacin media de los puntajes obtenidos.
n
Aplicando la frmula:
DM
X
DM
, se tiene
j 1
62 78,25 69 78,25 73 78,25 74 78,25 2. 75 78,25 77 78,25 78 78,25 82 78,25 87 78,25 93 78,25 94 78,25
12
16,25 9,25 5,25 4,25 2 * 3,25 1,25 0,25 3,75 8,75 14,75 15,75 86
DM
7,1666 7,2
12
12
Interpretacin: Lo que significa que la distancia media entre cada uno de los valores y el valor central es de
7,2 puntos
b) Calcula la varianza y la desviacin tpica o estndar.
n
31
V (X ) s2
X
j 1
16,252 9,252 5,252 4,252 2.3,252 1,252 0,252 3,752 8,752 14,752 15,752
12
264,0625 85,5625 27,5625 18,0625 21,125 1,5625 0,0625 14,0625 76,5625 217,5625 248,0625 974,25
s
81,1875 81,19
12
12
2
s 2 81,19
s s2
s 81,19 9,01
CV
s
__
9,01
.100 11,515 11,52%
78,25
MEDIDAS DE ASOCIACIN
Son medidas que se usan para evaluar la asociacin entre un evento y un factor de estudio. Los tpicos estadsticos de asociacin son la correlacin y la regresin.
CORRELACIN: Expresa el grado y sentido de la variacin concomitante de dos o ms series de datos. Es
decir, analiza la relacin entre dos o ms variables, siempre que se tenga un indicio que entre ellas existe
por lo menos cierto grado de dependencia o asociacin. La correlacin entre dos variables no implica, por s
misma, ninguna relacin de causalidad
Clasificacin
Perfecta
Imperfecta
Nula
(r
Positiva
(variacin
Negativa
(variacin
(r
1)
(0
r 1;
- 1 r 0)
0)
de
las
series
en
sentido
en
el mismo
sentido)
contrario)
32
El sentido mide la variacin de los valores de B con respecto a A: si al crecer los valores de A lo
hacen los de B, la relacin es positiva (ver grfico 1); si al crecer los valores de A disminuyen los de B, la
relacin es negativa (ver grfico 2).
La forma establece el tipo de lnea que define el mejor ajuste: la lnea recta, la curva monotnica o la curva no monotnica
Diagramas de Dispersin
Los Diagramas de Dispersin o Grficos de Correlacin permiten estudiar la relacin entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlacin entre ambas si cada vez que aumenta el valor de X
aumenta proporcionalmente el valor de Y (Correlacin positiva o directa) o si cada vez que aumenta el valor
de X disminuye en igual proporcin el valor de Y (Correlacin negativa o indirecta).
En un grfico de correlacin representamos cada par X, Y como un punto donde se cortan las coordenadas
de X e Y:
Grfico 1
Grfico 2
Como se observa en el grfico 1 ambas variables presentan una correlacin lineal positiva; es decir, a medida que aumenta el valor de la variable Estatura aumenta tambin el valor de la variable Peso. Mientras que
en el grfico 2 se observa una relacin lineal negativa; es decir que a medida que aumentan los aos de estudio, disminuye el nmero de hijos.
Se habla de correlacin lineal fuerte cuando la nube de puntos se parezca mucho a una recta y ser cada
vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta.
Grfico 3
33
Propiedades de r
n . XY
n .
X . Y
.n .Y Y
rb
6 . D 2
rbp
X q p.q
.
St
y
N. N 2 1
A . D B .C
B . A C . C D . B D
B.C
Xq
. pq
St
Ejemplo 18: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a
10
11
12
13
14
15
16
17
18
Velocidad lectora
(X)
69
68
38
50
57
33
30
38
39
22
20
37
62
35
41
50
43
19
Comprensin
lectora (Y)
29
30
10
21
24
11
12
08
07
05
03
06
28
12
09
20
16
02
Comprensin lectora
35
30
25
20
15
10
5
0
0
20
40
60
80
Velocidad lectora
b) Cul es el grado y el sentido de la relacin entre las variables velocidad lectora y comprensin lectora?
Magster Agustina Subelda Coronel
34
Como la velocidad lectora y comprensin lectora son variables continuas o de razn, para medir el grado
se utiliza el coeficiente r de Pearson. La frmula, para datos sin agrupar y a partir de puntuaciones directas
es:
rxy
n.XYX.Y
n.X X .n.Y Y
2
X
Y
3
4
5
38
50
57
10
21
24
380 1050 1368
6
33
11
363
900
X 751
100
441
576
Y 253
121
7
30
12
360
8
38
8
304
9 10
39 22
7
5
273 110
11
20
3
60
12
13
37
62
6
28
222 1736
14
35
12
420
15
16
41
50
9
20
369 1000
17
43
16
688
900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245
144
64
XY 12.782
49
25
36
35.245
784
144
2
81
4.975
400
256
N=18
n. X
n. XY X . Y
2
Obtenemos
X . n .Y Y
2
r xy
40073
0,94
42406 ,56
0 , 94
Por tanto, la relacin entre X (velocidad lectora) e Y (comprensin lectora) es imperfecta positiva y alta
para la muestra, es decir que la relacin entre la velocidad lectora y la comprensin lectora es significativa.
35
18
19
751
2
253
38 12782
4
4975
REGRESIN LINEAL
La correlacin es til para medir si la relacin que existe entre las variables es aproximadamente lineal o no;
mientras que la regresin sirve para buscar la ecuacin matemtica que mejor describe la relacin entre las
variables, consiste en cuantificar la relacin que existe entre las variables con el fin de predecir cules sern
los valores de una variable cuando se conocen los valores de la otra.
El coeficiente de correlacin lineal determina si, efectivamente, existe relacin entre dos variables. Una
vez que se concluye la existencia de relacin, la regresin nos permite definir la recta que mejor se ajusta a
esta nube de puntos.
Y a bX
Donde "Y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra variable "X"
(variable independiente). Para definir la recta hay que determinar los valores de los parmetros "a" y "b":
La regresin lineal permite calcular el valor de estos dos parmetros, definiendo la recta que mejor se ajusta a esta nube de puntos.
El parmetro "a" es el valor que toma la variable dependiente "Y", cuando la variable independiente "X" vale
0, y es el punto donde la recta cruza el eje vertical.
El parmetro "b" o coeficiente de regresin determina la pendiente de la recta, su grado de inclinacin.
Viene determinado por la siguiente frmula:
n . XY
n X
X . Y
Donde; b = coeficiente de regresin (pendiente de la recta de regresin)
X
2
b = coeficiente de regresin
36
10
11
12
13
14
15
16
17
18
Velocidad lectora
(X)
69
68
38
50
57
33
30
38
39
22
20
37
62
35
41
50
43
19
Comprensin
lectora (Y)
29
30
10
21
24
11
12
08
07
05
03
06
28
12
09
20
16
02
Diagrama de dispersin
Comprensin lectora
35
30
25
20
15
10
5
0
0
20
40
60
80
Velocidad lectora
Grficamente se puede visualizar la existencia de una correlacin lineal positiva y alta para la muestra, es
decir que la relacin entre estas dos variables es significativa (vase ejemplo 18, donde rxy 0,94 ). Concluida la existencia de relacin entre ambas variables a travs del coeficiente de correlacin r Pearson, la
regresin permite definir la recta que mejor se ajusta a esta nube de puntos.
n. XY X Y
n X 2 X
4
5
38
50
57
10
21
24
380 1050 1368
6
33
11
363
XY 12.782
X 35.245
2
37
8
38
8
304
9
10 11 12
13
14
15
16
17 18
39 22 20
37
62
35
41
50
43 19
751
7
5
3
6
28
12
9
20
16
2
253
273 110 60 222 1736 420 369 1000 688 38 12782
900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245
X Y 190.003
X 564.001
7
30
12
360
n=18
X 41.72
Y 18.06
n. XY X Y
n X X
2
0.57
18 * 35245 564001 634410 564001 70409
a Y b X 18 . 06 0 . 57 41 . 72 18 . 06 23 . 7804
5 . 72
38
INFERENCIAS ESTADSTICAS
PRUEBAS DE HIPTESIS
Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine la poblacin entera.
Esto por supuesto sera imprctico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencia
que confirme o no la hiptesis. La prueba de hiptesis estadstica cuantifica el proceso de toma de decisiones.
Hiptesis
Explicaciones tentativas del fenmeno investigado que se formulan como proposiciones. Hernndez y et.al
(2004)
Hiptesis de investigacin (Hi): Proposiciones tentativas sobre las posibles relaciones ente 2 o ms variables
(Hernndez Sampieri, 2004)
Hiptesis nula (Ho); es aquella que se establece para ser rechazada o anulada, es decir es la hiptesis que
se quiere contrastar. Sirven para refutar o negar lo que afirma la hiptesis de investigacin.
Hiptesis alternativa (Ha); son posibilidades alternativas-ante las hiptesis de investigacin y nula. Ofrecen
otra descripcin o explicacin distintas a las que proporcionan estos tipos de hiptesis.
A continuacin se presentan ejemplos de las diversas hiptesis;
Hi: Los hombres le atribuyen ms importancia al atractivo fsico en sus relaciones heterosexuales que las mujeres.
Ho: Los hombres no le atribuyen ms importancia al atractivo fsico en sus relaciones heterosexuales que mujeres.
Ha: Los hombres /e atribuyen menos importancia al atractivo fsico en sus relaciones heterosexuales que mujeres.
b.
HIPTESIS CORRELACIONALES. Especifican la relacin entre dos o ms variables; estas investigaciones establecen relaciones de dos o ms variables (correlacin bivariada o correlacin mltiple).
Alcanzan un nivel predictivo y parcialmente explicativo. En la correlacin no se habla de la variable dependiente y la independiente, esta es propia de investigaciones causales. Estas hiptesis se contextualizan en la realidad y se someten a pruebas empricas.
c.
HIPTESIS QUE ESTABLECEN CAUSALIDAD. Esta hiptesis, adems de afirmar la relacin entre
dos o ms variables; tienen un sentido de entendimiento entre las variables. Es decir, establecen relaciones de causa- efecto
El estudiante que obtiene nota alta en estadstica, obtendr nota alta en contabilidad
El nio que tiene un alto nivel intelectual, tendr mejor comprensin lectora.
39
Grados de libertad
Los procedimientos estadsticos (instrumentos de medicin y tcnica) tienen limitaciones (distorsionan la interpretacin de los datos) que repercuten potencialmente en la valoracin exacta de parmetros de poblacin. En este sentido, el trmino de grados de libertad se emplea para referirse a qu tan flexible es un procedimiento estadstico. Por lo que, mientras ms grados de libertad se tenga, mejor, porque los grados de
libertad son el nmero de oportunidades de muestreo para compensar las limitaciones, distorsiones y debilidades potenciales en los procedimientos estadsticos. (Ritchey, 2001)
40
Estadstico de la
prueba
Correlacin
lineal simple
y regresin
n2
tr r
1 r 2
Correlacin
rho de
Spearman
de rangos
ordenados
Correlacin
gamma de
rangos ordenados
Prueba de
chi cuadrado
de asociacin
rs 1
G
N de
muestras
6 D 2
n(n 2 1)
f f
f f
O E 2
E
N, tipo y nivel
de medicin
de las variables
Peculiaridades o
suposiciones
gl n 2
Dos variables de
intervalo / razn
u ordinales de
tipo intervalo
n 10
Dos variables
ordinales
No aplica
Dos variables
ordinales
gl ( f 1)(c 1)
Dos variables
nominales
/ordinales
Requiere al menos 5
casos por casilla
Mientras que, el enunciado de la hiptesis alternativa depende del planteamiento de la pregunta de investigacin y pueden ser;
41
blacin en estudio, las r de las muestras se centrarn alrededor de cero con un error estndar inversamente relacionado con el tamao de la muestra (es decir, a mayor tamao de la muestra menor ser el
3
error estndar )
t ; valores
4. Observe los resultados de la muestra en cuestin y calcule los efectos de la prueba, el estadstico de la
prueba y el valor p.
El estadstico de la prueba utilizado es
donde
tr r
n2
. Con gl n 2
1 r 2
gl = grados de libertad
5. Tome la decisin de rechazo
La H est : 0 se rechaza cuando t r t , as p<0.05.
6. Interprete y aplique las mejores estimaciones en trminos cotidianos.
La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin
Ejemplo 20: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a
10
11
12
13
14
15
16
17
18
Velocidad lectora
(X)
69
68
38
50
57
33
30
38
39
22
20
37
62
35
41
50
43
19
Comprensin
lectora (Y)
29
30
10
21
24
11
12
08
07
05
03
06
28
12
09
20
16
02
La ley de los grandes nmeros sostiene que, para una distribucin muestral de medias, cuanto mayor sea el tamao de la
muestra n, menor ser el error estndar.
Magster Agustina Subelda Coronel
42
rxy 0,94
Poblacin: Nios de 1
grado
X = velocidad lectora
Y= comprensin lectora
Es ?
Muestra: 18 nios
del 1 grado
r=0.94
43
0.05 y gl 16 , es
t 1 . 746
4. Observacin
El diagrama de dispersin revela una relacin lineal, r=0.94. n=18
Efecto de la prueba = 0.94 (es decir, efecto = r
0.94 0 0.94 )
El estadstico de la prueba
n2
18 2
16
16
0.94
0.94
0.94
0.94 137.46 0.94 11.724
2
2
1 0.8836
0.1164
1 r
1 0.94
t r 11.02 Error Estndar
tr r
Como
H alt
ra.
Fuerza
Naturaleza : siendo b=0.57 puntos en la comprensin lectora por punto en la velocidad lectora, es decir, un aumento de un punto en la velocidad lectora se relaciona con un aumento de 0.57
en la comprensin lectora.
A partir de este anlisis se puede concluir que la comprensin lectora puede explicarse por la velocidad lectora, de esta manera la mejor estimacin de la relacin en la poblacin est dada por;
44
2)
Es el nombre de una prueba de hiptesis que determina si dos variables nominales (variables categricas)
estn relacionadas o no.
La prueba chi-cuadrado puede usarse para:
Prueba de independencia
La prueba es particularmente til para analizar la relacin de variables cualitativas nominales u ordinales y determinar si las dos variables son independientes o no, cuando se refiere a individuos de una poblacin con una muestra representativa de ella, la frecuencia esperada de cada casilla en la tabulacin cruzada por lo menos sea de 5 (cinco).
2
Los datos de variables cualitativas o categricas representan atributos y se organizan en tablas llamadas
tablas de contingencia o tablas de clasificacin cruzada.
TABLA DE CONTINGENCIA
Una Tabla de contingencia contiene datos recogidos contados y organizados (con r filas y c columnas)
tiene la siguiente forma:
V
A
R
A
Donde:
A1
A2
A3
Ar
Total
B1
O11
O21
O31
B2
O12
O22
O32
VAR B
B3
O13
O23
O33
Or1
C1
Or2
C2
Or3
C3
Bc
O1c
O2c
O3c
Orc
Cc
Total
R1
R2
R3
Rr
n
45
La distribucin es una prueba que parte del supuesto de no relacin entre variables.
2
2.
observ
O E 2
E casilla
gl f 1c 1
totalm
, f:fila y c: columna
tica (Anexo 2)
4. Observe los resultados en cuestin de la muestra y calcule los efectos de la prueba, el estadstico de
la prueba y el valor p (de extraer una muestra con diferencias entre las frecuencias observadas y las
esperadas tan inusuales o ms inusuales que aquellas observadas cuando, de hecho, no existe relacin
entre las variables), valor p<0.001
5. Tome la decisin de rechazo: Si
entonces rechace la hiptesis estadstica (hiptesis nula), y acepte la hiptesis alternativa al nivel de confianza del 95%, lo implica que las variables estn relacionadas.
6. Interprete y aplique las mejores estimaciones en trminos cotidianos
2
observ
I
II
Total por columna
Desempeo acadmico
Malo
Regular Bueno
42
54
96
24
78
102
30
72
102
96
204
Gran total 300
Grado I= Malo/Regular
Grado II= Bueno
46
das
Ecasilla
I
II
Total por columna
Desempeo acadmico
Malo
Regular
Bueno
96
204
Gran total 300
La distribucin es una prueba que parte del supuesto de no relacin entre variables.
2
2.
2 observ
O E 2
Ecasilla
gl f 1c 1 2 13 1 2
3. Nivel de significancia:
grantotal
(Anexo 2)
4. Observe los resultados en cuestin de la muestra y calcule los efectos de la prueba, el estadstico de
la prueba y el valor p (de extraer una muestra con diferencias entre las frecuencias observadas y las
esperadas tan inusuales o ms inusuales que aquellas observadas cuando, de hecho, no existe relacin
entre las variables), valor p<0.001 .
47
48
ANEXO
49
observ
50
TABLA DE LA DISTRIBUCION CHI- CUADRADO.Valores crticos de la Chi-cuadrado.Para una combinacin particular de grados de libertad en el numerador y en el denominador, las entradas
representan los valores crticos de la Chi-cuadrado, correspondientes a un rea de extremo superior especificado de .-
Grados de
Libertad
0.25
0.10
0.05
0.025
0.01
0.005
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1.323
2.773
4.108
5.385
6.626
7.841
9.037
10.219
11.389
12.549
13.701
14.845
15.984
17.117
18.245
19.369
20.489
21.605
22.718
23.828
24.935
26.039
27.141
28.241
29.339
30.435
31.528
32.620
33.711
34.800
2.706
4.605
6.251
7.779
9.236
10.645
12.017
13.362
14.684
15.987
17.275
18.549
19.812
21.064
22.307
23.542
24.769
25.989
27.204
28.412
29.615
30.813
32.007
33.196
34.382
35.563
36.741
37.916
39.087
40.256
3.841
5.991
7.815
9.488
11.071
12.592
14.067
15507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773
5.024
7.378
9.348
11.143
12.833
14.449
16.013
17.535
19.023
20.483
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.852
34.170
35.479
36.781
38.076
39.364
40.646
41.923
43.194
44.461
45.722
46.979
6.635
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
37.566
38.832
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892
7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
25.188
26.757
28.299
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
41.401
42.796
44.181
45.559
46928
48.290
49.645
50.993
52.336
53.672
51
vila Acosta, Roberto. Estadstica Elemental Con 300 problemas resueltos (1996). Lima Per:
Nueva Edicin, Estudios y Ediciones R.
vila Acosta, Roberto. Introduccin a la Metodologa de la Investigacin La tesis Profesional Gua para elaborar la tesis - Aplicaciones y Ejemplos (1997). Lima Per: Estudios y Ediciones R.A,
Hernndez Sampieri, R., Fernndez, C. y Baptista P. Metodologa de la Investigacin (2008). Mxico: Mc Graw-Hill.
Lebart, L., Morineau, A. y Fnelon JP. Tratamiento Estadstico de Datos - Mtodos y Programas
(1994). - Marcombo, Boixareu.
Levin, Richard. ESTADISTICA PARA ADMINISTRADORES. 7a. edicin. Editorial Prentice Hall Hispanoamericana, Pgs. 93-107
Ritchey, Ferris J.. Estadstica para las Ciencias Sociales. (2001). Mxico: Mc Graw-Hill
52