You are on page 1of 52

Estadstica aplicada a la Educacin

ESTADSTICA APLICADA A LA
EDUCACIN

A
Algn da el pensamiento estadstico ser necesario como la habilidad para leer o escribir
(H.G. Wells)

Magster Agustina Subelda Coronel

AO 2013
Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin

INDICE
UNIDAD I

INTRODUCCIN A LA METODOLOGIA DE LA INVESTIGACIN CUANTITATIVA.


POBLACIN Y MUESTRA

Metodologa cuantitativa.................................................................................................................................. 3
Caractersticas de la metodologa cuantitativa.............................................................................................. 3
Fases de la investigacin cuantitativa ............................................................................................................3
Definicin del tema de investigacin ........................................................................................................... 3
Planteamiento del problema........................................................................................................................ 4
Objetivos del estudio ................................................................................................................................... 4
Justificacin del estudio............................................................................................................................... 4
Revisin de la literatura marco terico ..................................................................................................... 4
Diseo metodolgico ............................................................................................................................... 5
Bibliografa................................................................................................................................................... 5
Cronograma de trabajo................................................................................................................................ 6
Concepto de poblacin y muestra...................................................................................................... 7
Principales tipos de muestras........................................................................................................................ 7
Tamao de la muestra................................................................................................................................... 8
Determinacin del tamao de la muestra probabilstica ............................................................................... 8
Representatividad de la muestra...................................................................................................................10
Distribucin del tamao de la muestra por afijacin proporcional.................................................................11

UNIDAD II

INTRODUCCIN A LA ESTADSTICA. ORGANIZACIN Y PRESENTACIN DE


DATOS

Concepto de la estadstica ..............................................................................................................................12


Importancia de la estadstica ..........................................................................................................................12
Funciones de la estadstica .............................................................................................................................12
Nomenclatura estadstica ................................................................................................................................13
Variables ..........................................................................................................................................................14
Categoras de las variables ...........................................................................................................................14
Clasificacin de las variables ........................................................................................................................14
Elementos bsicos de la estadstica ...............................................................................................................15
Elaboracin de matriz tripartita de datos .........................................................................................................16
Construccin de indicadores ...........................................................................................................................17
Razn, relacin..............................................................................................................................................17
Proporcin, porcentaje...................................................................................................................................17
Construccin de tablas de frecuencias............................................................................................................18
Elaboracin de cuadros estadsticos...............................................................................................................22
Partes principales de un cuadro estadstico..................................................................................................22
Construccin de grficos estadsticos .............................................................................................................22
Principales partes de un grfico ....................................................................................................................23
Principales tipos de grficos..........................................................................................................................23

UNIDAD III

ANLISIS DE DATOS DE UNA MUESTRA O POBLACIN

Estadsticas descriptivas .................................................................................................................................27


Medidas de centralizacin (media, mediana y moda) ...................................................................................27
Medidas de dispersin (rango, desviacin media, varianza, desviacin estndar, CV) ...............................30
Medidas de asociacin (correlacin, regresin)............................................................................................32
Inferencias estadsticas ...................................................................................................................................39
Pruebas de hiptesis .......................................................................................................................................39
Pruebas de hiptesis .......................................................................................................................................39
Variables cuantitativas Distribucin t..........................................................................................................41
Variables cualitativas Distribucin chi-cuadrado ........................................................................................45
ANEXOS ..........................................................................................................................................................49
BIBLIOGRAFA ................................................................................................................................................51
Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin

UNIDAD 1: INTRODUCCIN A LA METODOLOGA CUANTITATIVA.


POBLACIN Y MUESTRA
METODOLOGA CUANTITATIVA
Es una manera de enfocar los modelos de la investigacin basada en un paradigma explicativo, cuando se
busca una explicacin matemtica (cuantitativa) al problema, especialmente en el campo de la Estadstica.
Sus resultados estarn reflejados en frecuencias absolutas, porcentajes, tasas, ndices, grficos, tablas, etc.
Ofrece mucha informacin pero, no se ver en profundidad.

CARACTERSTICAS DE LA METODOLOGA CUANTITATIVA

Basada en la induccin probabilstica del positivismo lgico


Medicin penetrante y controlada
Objetiva
Inferencias ms all de los datos
Confirmatoria, deductiva
Orientada al resultado
Datos "slidos y repetibles
Generalizable
Particularista
Realidad esttica

PREPARACIN DEL PROYECTO DE INVESTIGACIN


FASES DE UN DISEO DE INVESTIGACIN
TEMA

Qu
estudiar?

ASPECTOS
METODOLGI
COS Cmo se va
a realizar
la investigacin?

BIBLIOGRAFA

A qu fuentes escritas
se va a referir ?

PROBLEMA

Situacin actual
Preguntas de
invest.

OBJETIVOS

Propsitos de la
investigacin

MARCO DE
REFERENCIA
Qu hay
escrito
al respecto?

JUSTIFICAC
I N

PRESUPUESTO
Qu recursos se

CRONOGRAMA

necesitan?

Motivos para

hacer
el estudio

Cunto tiempo se
va a emplear?

DEFINICIN DEL TEMA DE INVESTIGACIN


En esta parte el investigador, define en qu rea del conocimiento quiere llevar a cabo la investigacin. Se
plantea algunas preguntas tales como:
Es el tema de inters?
Existe informacin sobre el mismo? Dnde?
Qu resultados puede proporcionar la investigacin?
Debe conocer el objeto de investigacin.
Debe documentarse en todo tipo de material referido a su tema.
Define el ttulo preliminar de la investigacin
Consulta con expertos que lo ayudar a delimitar el objeto de conocimiento.
Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin

PLANTEAMIENTO DEL PROBLEMA


En este apartado se realiza una breve descripcin de la situacin actual del tema que se va a investigar ubicndolo en un contexto que lo haga comprensible (yendo de lo general a lo particular), se identifica y
describen los sntomas o efectos que se observan y se los relaciona con las causas que los producen. La formulacin puede hacerse en forma de pregunta/s.
Ejemplo 1: En la actualidad, el nivel formativo de los estudiantes que ingresan a la Universidad Nacional ha
bajado considerablemente con respecto a los aos anteriores. Por otro lado, en el mercado aparecen diversas instituciones privadas competidoras que ofrecen formaciones similares que con cuotas mnimas se pueden cursar y obtener un ttulo igual o similar a las otorgadas por la Universidad Nacional.
Efecto o sntoma: Descenso de calidad educativa
Causas: Nivel de formacin, Currculo, competencia, etc.

OBJETIVOS DEL ESTUDIO


Son los propsitos que se persigue en la INVESTIGACIN
Para qu y qu se busca con este estudio?
Qu quiero hacer en la investigacin?
Qu es lo que busco conocer?
A dnde quiero llegar?
Se recomienda formular un solo objetivo general global, coherente con el problema planteado, y ms objetivos especficos que conducirn a lograr el objetivo general y que son alcanzables con la metodologa
propuesta.
El objetivo debe redactarse con un verbo en infinitivo al principio que denote la bsqueda de un conocimiento, por ejemplo: determinar, identificar, evaluar, analizar, describir, desarrollar, descubrir, clasificar,
enumerar, establecer, experimentar, observar, obtener, proponer, comparar, intuir, percibir, capturar,
acopiar, desarrollar, discutir, elaborar, recolectar, concentrar, discutir, comprobar, aplicar, probar, inferir,
aclarar, acoger, actualizar, abatir, comprender, adecuar, adquirir, debatir, afirmar, advertir, afrontar, agotar, ahondar, definir, generar, guiar, diferenciar, comentar, estudiar, estructurar, sugerir, reforzar, explicar, registrar, buscar, recopilar, examinar, estudiar, entre otros.

JUSTIFICACIN DEL ESTUDIO


Cules son los motivos que justifican la realizacin de esta investigacin?
Los motivos pueden ser de carcter:
Terico:

Es importante sealar en el diseo los principales elementos tericos sobre los cuales se
pretende desarrollar la investigacin.

Metodolgico: Hace mencin al uso de metodologas y tcnicas especficas que han de servir de aporte
para el estudio de problemas.
Prctico:

Se manifiestan en el inters del investigador por acrecentar sus conocimientos, obtener un


ttulo acadmico o contribuir a la solucin de problemas concretos.

Se responden a preguntas tales como:


Cul es la importancia de este estudio?Para qu sirve?
Cul es su trascendencia para la sociedad?
A quin beneficiar la investigacin? Cul ser el aporte?
Qu alcance y limitaciones tendr?
Se justifica la realizacin del estudio desde el punto de vista del investigador.

REVISIN DE LA LITERATURA MARCO TERICO


Qu teora/ informaciones se tiene sobre el tema?
Quines han investigado ya sobre este tema?
Qu antecedentes se tiene sobre el contenido del tema?
En la investigacin que se va a realizar se debe tomar en cuenta el conocimiento ya existente sobre el tema.
Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin


Se atiende lo que los diferentes autores ya escribieron sobre el tema. Con esto se fundamenta tericamente
el trabajo de investigacin.
Su funcin es definir el significado de los trminos (lenguaje tcnico) que se van a emplear durante el proceso de construccin del conocimiento en la investigacin.
Se realiza una definicin operacional de los conceptos fundamentales del estudio.Por sobre todas las cosas
se debe explicar exactamente el alcance de cada una de las palabras o frases que van a definir el mbito del
trabajo de investigacin.

ASPECTO O DISEO METODOLGICO


Es la estrategia que se utilizar para cumplir con los objetivos de la investigacin. En este parte se explica la
realizacin del trabajo, se describen los procedimientos y tcnicas a ser utilizados
Cmo se va realizar el estudio?
Cules son los procedimientos y tcnicas que se va a tener en cuenta en la realizacin del trabajo?
Los componentes a tener en cuenta son:
Diseo
Enfoques
Alcance
Aspectos
Metodolgi
cos

Hiptesis
Poblacin
Muestra
Tcnicas
Instrumentos
Anlisis

Experimental (pre exp, cuasi, puros)


No experimental (Transeccional, longitudinal)
Cuantitativo, Cualitativo
Exploratorio, descriptivos, Correlacionales,
Explicativos
Nulas, de investigacin, estadstica
Probabilstico, No probabilistico

Encuestas, cuestionarios, sondeos, test


escalas de aptitudes, etc.
Prg, explorar datos, Evaluar, anlisis estadsticos

BIBLIOGRAFA
Se debe tener en cuenta toda la documentacin bibliogrfica que se ha consultado en el proceso de elaboracin de la investigacin.
La presentacin del mismo se realiza teniendo en cuenta los reglamentos o normativas vigentes.

Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin

CRONOGRAMA DE TRABAJO
Considera las diferentes etapas del proyecto y el tiempo estimado para cada una de ellas.
Para el mismo se utiliza la Grfica de Gantt, que es la representacin grfica de las variables actividades de
las etapas de investigacin y tiempo de ejecucin (pueden ser en das, semanas, meses, ao)
INSTITUTO SUPERIOR DE EDUCACIN "DR. RAL PEA" - AO 2010
CRONOGRAMA DE ACTIVIDADES - DPTO DE INVESTIGACIN
ACTIVIDADES
Elaboracin de Planificacin
Taller de Polticas
Capacitacin: Enfoque por Competencias 22 al 24
Elaboracin y validacin de programas de la carrera de grado
Lectura y ajuste del informe CONACYT: (2 al 12)
Ajuste de instrumentos p 2 trab.de campo : (15 al 26)
FORO "BICENTERNARIO DE LA INDEP." 16/03
Socializacin de los resultados de la 1 interv. de la
investigacin (5 al 09/04)
Trabajo de campo, 2 intervenc (12 al 23/04)
Feria del libro en Bs As (26 al 30)
Carga y verificacin de datos
Procesamiento de datos
Anlisis de la informacin
Elaboracin del informe (2 intervencin )
Entrega del informe ( 25 de junio)
Viaje al Uruguay (12 al 16)
Ajuste de instrumentos p 3 trab.de campo
Trabajo de campo, 3 intervenc
Carga y verificacin de datos
Procesamiento de datos
Anlisis de la informacin
Elaboracin del informe final (3 intervencin )
Entrega del informe ( 25 de junio)

Magster Agustina Subelda Coronel

SEMANAS
FEB

X
X

MARZO

ABRIL

MAYO

JUNIO

JULIO

X
XX
XX

XXX
X
X

XX

X
XXXX
XXXX
XXX
XXXX
XX

AGOSTO

SETIEMBRE OCTUBRE NOVIEMBRE

Estadstica aplicada a la Educacin

POBLACIN Y MUESTRA
POBLACIN O UNIVERSO, est referido a cualquier coleccin finita o infinita de elementos que in-

teresan a un estudio y poseen alguna caracterstica comn observable y pueden ser personas, instituciones,
objetos, familias, animales y otras unidades ms complejas. Toda poblacin tiene N elementos y una
muestra de n elementos, donde n < N.
Ejemplo 2:
Las instituciones de una zona
Las instituciones de un departamento
Los jvenes de una carrera
Los estudiantes de un postgrado
Los docentes de una universidad

MUESTRA, es una parte o subconjunto de una poblacin en estudio. Est constituida de elementos selec-

cionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra
slo da informacin de aquella poblacin de la que ha sido extrada.

PRINCIPALES TIPOS DE MUESTRAS


No-probabilstica: En este tipo de muestreo no hay modo alguno de evaluar estadsticamente los resultados
obtenidos a partir de la muestra. Se utiliza mucho debido a su comodidad y bajo costo.

Casual o accidentales: consisten simplemente en tomar los casos casuales hasta alcanzar un cierto tamao de la muestra. Generalmente son los muestreos que se utilizan en los sondeos. Por ej. Se incluirn en la muestra las primeras 100 personas que pasen por una esquina.

Por cuotas: es aquel en que se busca garantizar la seleccin de elementos pertenecientes a los diferentes estratos que conforman la poblacin y que dichos elementos puedan ser tenidos en cuenta en las
mismas proporciones que ocurren en esa poblacin. Por ejemplo, se quiere conocer las opiniones de los
nios de EEB y se supone que las mismas variarn de acuerdo a las edades, entonces sera conveniente hacer una estratificacin por grupo etario.

Cuando hablamos de una muestra no probabilstica, la eleccin de los elementos de la muestra no depende
de la probabilidad sino de las causas relacionadas con las caractersticas de la investigacin o de quien establece la muestra (el investigador).
El procedimiento no es mecnico, ni probabilstico, sino que depende del proceso de toma de decisiones del
investigador y, desde luego, las muestras seleccionadas obedecen a criterios definidos teniendo en cuenta
los objetivos de investigacin.
Desde el enfoque cuantitativo y para determinado diseo, la utilidad de una muestra no probabilstica reside
no tanto en una representatividad de elementos, sino en una cuidadosa y controlada eleccin de sujetos
con ciertas caractersticas definidas previamente en el planteamiento del problema.
Probabilsticas: En las muestras probabilsticas o aleatorias requiere que todos los elementos de una poblacin tengan una probabilidad conocida de ser seleccionados.

Azar simple: es la muestra donde todos los elementos de la poblacin tienen la misma probabilidad de
resultar seleccionados. El requisito fundamental es tener un listado completo de los elementos de la poblacin, por lo que en la prctica se torna difcil trabajar con poblaciones grandes.

Sistemtica: Se trata de un procedimiento de muestreo que simplifica la seleccin de las unidades. Tambin se requiere de un listado completo de los elementos de la poblacin, que debern ser numeradas
correlativamente.
El procedimiento es el siguiente:
1. Determinar el tamao de la poblacin (N)

Segn Denis Baranger, Construccin y anlisis de datos

Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin


2. Determinar el tamao de la muestra (n).
3. Establecer la fraccin de muestreo f

N
n

4. Seleccionar un solo nmero al azar, que corresponder a la primera unidad seleccionada.


5. A la primera unidad seleccionada se le suma la fraccin de muestreo y se procede sucesivamente
hasta completar la muestra.

Estratificada: Este tipo de muestreo se hace en base a determinadas variables que se consideran pertinentes para la estratificacin de la poblacin. La diferencia con respecto a la muestra por cuotas es el
hecho de que la seleccin de las unidades se realiza al azar y adems que es apta para realizar cualquier tipo de inferencia estadstica.

Por Conglomerados (clusters) y en etapas mltiples: Este tipo de diseo se utiliza en general para reducir los costos de recoleccin de datos, sin embargo, hay que tener en cuenta que aumenta el grado de
error a diferencia del muestreo estratificado. En la mayora de los casos se utiliza cuando no se cuenta
con un listado de todos los elementos de la poblacin.
Los conglomerados son unidades de un mismo tamao, es en cierto modo una estrategia opuesta a la
del muestreo estratificado, ya que en una muestra estratificada, los casos se seleccionan dentro de cada estrato, en cambio, en este tipo de muestra se selecciona entre los conglomerados; correlativamente,
as como se busca que los estratos sean lo ms homogneos posible internamente, para los conglomerados cuanto ms heterogneos sean mejor ser el resultado.
La tcnica por conglomerados se integra en diseos de muestra en etapas mltiples; muestras que suponen la definicin de unidades de muestreo en diferentes niveles.

TAMAO DE LA MUESTRA
Uno de los aspectos a concretar en las fases previas de la investigacin, es el tamao de la muestra. En
estadstica, el tamao de la muestra es el nmero de sujetos o elementos que componen
la muestra extrada de una poblacin, necesarios para que los resultados obtenidos sean representativos
de la poblacin, vlidos y confiables.
Determinar el tamao adecuado para una muestra es una eleccin crucial, por todas las consecuencias negativas que puede producir una equivocacin, representa una parte esencial del mtodo cientfico para poder llevar a cabo una investigacin. El tamao de la muestra, generalmente, se determina en funcin a los
objetivos del estudio y las caractersticas de la poblacin, as como de los recursos disponibles (costo, tiempo, entre otros).
En este sentido, es importante definir el alcance de la investigacin de manera a determinar el tipo de muestra a ser empleado (no probabilsticos -dirigidos o intencionales- o probabilsticos). La muestras dirigidas
(intencionales) o no probabilsticas, generalmente son utilizadas en los estudios exploratorios (aunque
tambin puedan ser utilizados muestras probabilsticas) e investigaciones experimentales (debido a que
los experimentos requieren de manejos de grupos no muy grandes, donde la validez externa se consolida
mediante la repeticin o reproduccin del estudio). Mientras que en aquellos estudios que requieren ser expandidos a una poblacin, como los no experimentales descriptivos o correlacionales-causales se deben utilizar las muestras probabilsticas.

Determinacin de la muestra probabilstica


En caso que se desee determinar el tamao de la muestra para encuestas, sondeos de mercadotecnia y
estudios de investigacin, se recurre a la determinacin del tamao de la muestra probabilstica, segn la
aplicacin de las siguientes frmulas.

Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin

(*) Donde deben ser considerados los siguientes elementos de la inferencia estadstica:

n0: Cantidad terica de elementos de la muestra. Tambin sirve para el caso en que la poblacin en estudio no sea finita.
n: Cantidad real de elementos de la muestra a partir de la poblacin asumida o de los estratos asumidos
en la poblacin.
N: Nmero total de elementos que conforman la poblacin, o nmero de estratos totales de la poblacin.
z: Valor estandarizado en funcin del grado de confiabilidad de la muestra calculada. Por ejemplo, si
consideramos trabajar con un 95 % de confiabilidad la muestra seleccionada, entonces el valor estandarizado asumir es igual a 1.96 (Para dos colas). Algunos valores standarizados (z) en funcin de grado de
confiabilidad asumido (para dos colas):
99 % ------------- z = 2,58 (Empleado con frecuencia)
97.5%------------ z = 2,24
95 % ------------- z = 1,96 (El ms empleado)
90 % ------------- z = 1,64
85%--------------- z = 1,44
80%--------------- z = 1,28
: Error asumido en el clculo. Toda expresin que se calcula contiene un error de clculo debido a las
aproximaciones decimales que surgen en la divisin por decimales, error en la seleccin de la muestra,
entre otras, por lo que este error se puede asumir entre un 1 hasta un 10 %; es decir, que se asume en
valores de probabilidad correspondiente entre un 0.01 hasta un 0.1:

Para 3 N 10 --------------------- Se asume = 0.1 (un error del 10 %).

Para N > 10 --------------------- Se asume = 0.05 (un error del 5 %).


q: probabilidad de la poblacin que no presenta las caractersticas. Parmetro mediante el cual se
asume qu por ciento o proporcin de la muestra no puede presentar las mismas caractersticas de la
poblacin, debido a diversos factores subjetivos y objetivos de los individuos u objetos que conforman la
poblacin. Muchos autores plantean esta probabilidad entre un 1 hasta un 25 %, otros asumen, cuando
no se conoce esta variable asumir el valor mximo de 50 %. A continuacin se propone la siguiente tabla:
Para 3 N 19 ------- Se asume q = 0,01 (un 1 %).
Para 20 N 29 ------ Se asume q = 0,01 hasta 0,02 (del 1 al 2 %).
Para 30 N 79 ----- Se asume q = 0,02 hasta 0,05 (del 2 al 5 %).
Para 80 N 159 ---- Se asume q = 0,05 hasta 0,10 (del 5 al 10 %).
Para N 160 --------- Se asume q = 0,05 hasta 0,20 (del 5 al 20 %).
p: Probabilidad de la poblacin que presenta las caractersticas. Es la probabilidad que tiene la muestra en poseer las mismas cualidades de la poblacin (homogeneidad) y est determinada por:
Como p + q = 1 (Probabilidad mxima) p = 1 q
En caso de no contar con la informacin respecto a p y q se recomienda el uso del valor p = 0,5 (50%)
que maximiza el tamao muestral. Asimismo, a decir de Ritchey F, 2001, una norma tradicional para determinar las muestras para encuestas, sondeos de mercadotecnia y estudios de investigacin, consiste en reportar los resultados con 95% de confianza y 3 por ciento de rango de error.
Ejemplo 3: Determinacin de tamao para una muestra probabilstica
La universidad se encuentra abocada en realizar una evaluacin del desempeo docente, para ello desea
consultar a los estudiantes. Debido al alto costo que podra ocasionar la aplicacin del instrumento a todos
los estudiantes y al escaso tiempo con que se cuenta, se recurre a una muestra que facilite informacin adecuada, por lo que se debe tener en cuenta; p = 60%, q =40%, con un margen de error de 3% y con un nivel
de confianza de 99%. Determine el tamao de la muestra de estudiantes a ser utilizada para la evaluacin.

Magster Agustina Subelda Coronel

Estadstica aplicada a la Educacin


A continuacin se presenta la distribucin de alumnos por carrera de la Universidad.

Carrera

Cant. de alumnos

Informtica
Derecho
Ing. Comercial
Marketing
Total de estudiantes = N

650
825
365
720
2.560

Datos para el clculo del tamao de la muestra probabilstica


N 2 . 560
z 2 , 58 ........ para .. 99 %.. nivel .de .confianza

3 % 0 , 03
p 60 % 0 , 6
q 40 % 0 , 4
Clculo de la cantidad terica de elementos de la muestra
2

2,58
z
2
n0 . p.q
0,6 0,4 86 0,6 0,4 7.396 0,6 0,4 1.775,04

0,03
Clculo de la cantidad real de elementos de la muestra a partir de la poblacin

n0
1.775,04
1.775,04
1.775,04

1.048,23 1.048
n0
1.775,04 1 0,693375 1,693375
Tamao de la muestra de estu1
1
2
.
560
N

diantes a ser utilizada para la evaluacin.

REPRESENTATIVIDAD DE LA MUESTRA
Uno de los primeros pasos en cualquier investigacin consiste en la determinacin del universo o poblacin,
si la poblacin que nos interesa es de gran tamao, podra resultar sumamente trabajoso obtener informacin sobre todos sus elementos, en este caso se recurre a una muestra.
Para que la muestra sea representativa de la poblacin, esta debe ser seleccionada de modo tal de obtener la mxima aproximacin a los parmetros poblacionales. Uno de los mtodos para mejorar la calidad del
muestreo es la estratificacin de la poblacin.
La idea de representatividad tiene que ver con la posibilidad de que la muestra sea una rplica adecuada de
la poblacin en lo que hace a las variables relevantes. Al respecto, convendr tener en cuenta las siguientes
consideraciones:
1. Una muestra que sea representativa para determinados propsitos, puede no serlo para otros: no existe
la muestra representativa en s, para cualquier propsito.
2. Si bien existen procedimientos para evaluar la bondad de una muestra, no es la muestra en s la que es
representativa; ms bien nuestra creencia en su representatividad la que va a depender del plan de
muestreo utilizado para seleccionarla.

3. La representatividad de una muestra est dada en considerar que la misma fue extrada de una pobla-

cin con un determinado nivel de confianza (se trabaja preferiblemente con un 95 % de confianza o
ms), de asumir un determinado porcentaje en el error de clculo, que debe estar comprendido entre un
1 hasta un 10 % (0,01 hasta 0,10); y de considerar un adecuado porcentaje (desde un 1 hasta un 20 %)

Magster Agustina Subelda Coronel

10

Estadstica aplicada a la Educacin


en valores probabilsticos (0, 01 hasta 0, 2) de que la muestra no posee las caractersticas de la poblacin.

DISTRIBUCIN DEL TAMAO DE LA MUESTRA POR ESTRATOS (AFIJACIN PROPORCIONAL)


Una vez seleccionada la muestra total, el problema est en cmo proceder para distribuir sta de manera
equitativa o proporcional con relacin a cada estrato constituido. Esto se lleva a cabo mediante la aplicacin de la metodologa de la afijacin proporcional.
Para determinar el tamao de la muestra por afijacin proporcional se procede de la siguiente manera:
1.
2.
3.
4.

Se estratifica la poblacin de acuerdo a las determinadas variables que se consideran pertinentes.


Se calcula la proporcin por estrato
Se determina el tamao de la muestra
Se multiplica cada una de las proporciones de cada estrato por el tamao de la muestra.

Ejemplo 4: Distribucin del tamao de la muestra por estrato (Afijacin proporcional)


Teniendo en cuenta el resultado obtenido en el ejemplo anterior. Distribuir el tamao total de muestra igual a
1.048 estudiantes por carrera para realizar la evaluacin del desempeo docente.
A continuacin se presenta la distribucin de alumnos por carrera de la Universidad.

Carrera
Informtica
Derecho

Cant. de Proporcin de alumalumnos


nos por carrera
650
650 2.560 0,26
825
825 2.560 0,32

Ing. Comercial

365

Marketing

720

Total de estudiantes = N

2.560

365 2.560 0,14


365 2.560 0,28
1

Distribucin de la Muestra

0,26 1.048 272,48 273


0,32 1.048 335,36 335
0,14 1.048 146,72 147
0,28 1.048 293,44 293
Total de estudiantes para la muestra = n=

1.048

Interpretacin
Los resultados indican que el instrumento de evaluacin ser aplicado a: 273 estudiantes de la carrera de
Informtica, 335 de Derecho, 147 de Ing. Comercial y 293 de Marketing, totalizando de esta manera una
muestra total de 1.048 estudiantes de la Universidad

Magster Agustina Subelda Coronel

11

Estadstica aplicada a la Educacin

UNIDAD 2: INTRODUCCIN A LA ESTADSTICA. ORGANIZACIN Y


PRESENTACIN DE DATOS
Qu es la Estadstica?
Es la ciencia que tiene por objeto la recoleccin, clasificacin y anlisis de conjuntos de datos de observaciones obtenidos en un estudio, para interpretarlos y obtener leyes y relaciones entre ellas, que orienta la
toma de decisiones a partir del anlisis e interpretacin de observaciones realizadas en forma directa o experimentalmente
OPERACIONALIZACIN DEL TRABAJO ESTADSTICO
INFORME
INTERPRETACIN
ANLISIS
DESCRIPCIN

RESULTADOS CONCLUSIONES RECOMENDACIONES

HECHO
PROBLE
MA
Objetivos
Hiptesis
POBLACI
N
-Ubicacin

-Tamao
-Tiempo

Concepto
Categoras
Identificacin

VARIABLES

Clasificacin
Crtica
Codificacin
Procesamiento

Modelos
Pruebas
Mtodos
Tcnicas

DATOS

INFORMACI
N

Recopilacin de
datos
(Instrumentos)

MUEST
RA

Tablas
Cuadros
Grficos

INDICADOR
ES
Proporciones
Porcentajes
Tasas
ndices
Estadgrafos
Coeficientes,
etc.

Unidad
es de
anlisis

Por qu es importante la estadstica?

Permite comprender la bibliografa especializada (libros, estudios e investigaciones) basados en el anlisis estadstico.

Constituye una herramienta auxiliar de utilidad inmediata y prctica en el trabajo profesional.

Ayuda a desarrollar una investigacin rigurosa, ofreciendo fundamentos lgicos en los que se sustenta la
investigacin bsica y aplicada.

Qu funciones cumple la estadstica?


Descriptiva: Se hace una descripcin del resumen de los datos mediante el empleo de medidas de clculos
(%, promedios, desviacin estndar y coeficientes de correlacin).
Inferencial: Consiste en inferir propiedades de una poblacin sobre la base de una muestra con resultados
conocidos.
Predictiva: Orienta la toma de decisiones con vigencia y efecto en el futuro (estimativo).

Magster Agustina Subelda Coronel

12

Estadstica aplicada a la Educacin

NOMENCLATURA ESTADSTICA
ESTADISTICAS, sinnimo de datos estadsticos, servir para designar a toda coleccin sistemtica de datos referentes
a un determinado fenmeno.
ESTADSTICO, es la persona que se dedica al estudio de la Estadstica, es el profesional que analiza estadsticas, desarrolla mtodos y modelos estadsticos y contribuye a la evolucin de la ciencia estadstica. (Roberto B. vila Acosta)
ESTADGRAFO es el trmino utilizado para designar a la persona dedicada a las tareas propias de la estadstica, aunque en ocasiones tambin es frecuente que se utilice para designar a la variable que define una distribucin estadstica,
de esta forma es comn escuchar el trmino estadgrafo de prueba.
mx.answers.yahoo.com/question, smathdown.blogspot.com
ESTADGRAFO es una caracterstica descriptiva global de una muestra .Es la medida de una caracterstica relativa a
una muestra. La mayora de los estadsticos mustrales se encuentran por medio de una frmula y suelen asignrseles
nombres simblicos que son letras latinas.
http://virtual.uav.edu.mx/tmp/2611217572402.doc
DATO, es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Dato es el resultado de la observacin, entrevista o recopilacin en general. Los datos son la materia prima de la Estadstica.
INFORMACION, es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay informacin sin datos.
VARIABLE, Son caractersticas o dimensiones observables, susceptibles de adoptar distintos valores o ser expresados
en varias categoras, tales como edad, ingresos, matrcula, Instituciones, lugar de nacimiento, ahorros, etc.. Las variables se definen e identifican en funcin de los objetivos del estudio.
INDICADORES, son elementos caractersticos que describen una situacin permitiendo su anlisis. Son referentes empricos que permiten una medicin, descripcin, ordenamiento de los datos o caractersticas en forma vlida y confiable.
La validez y confiabilidad del indicador depende de la validez de los datos utilizados y de la lgica de su relacin o construccin. En este sentido, los llamados ndices, tasas, estadgrafos, medidas de resumen, etc., son indicadores.
POBLACIN O UNIVERSO, est referido a cualquier coleccin finito o infinito de elementos que interesan a un estudio
y poseen alguna caracterstica comn observable y pueden ser personas, instituciones, objetos, familias, animales y
otras unidades ms complejas. Toda poblacin tiene N elementos y una muestra de n elementos, donde n<N.
MUESTRA, es una parte o subconjunto de una poblacin en estudio. Esta constituida de elementos seleccionados de
una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra slo da informacin de
aquella poblacin de la que ha sido extrada.
PARAMETRO, es un valor obtenido para describir en forma resumida las caractersticas pertinentes o ms importantes
acerca de una poblacin. Son las medidas de resumen de una poblacin. Una poblacin puede tener muchas caractersticas y por tanto muchos parmetros.
ESTADIGRAFO, datos empricos que se usa con fines descriptivos o analticos; son medidas de resumen estadstico de
un conjunto de datos. Las medidas de resumen de una muestra se llamarn estadgrafos. Ejemplo, la media aritmtica,
mediana, varianza, coeficiente de correlacin, etc.
CENSO, consiste en un recuento de todos los elementos en una poblacin y/o una especificacin de las distribuciones
de sus caractersticas, basados en la informacin obtenida para cada uno de los elementos.
ENCUESTA, consiste en la obtencin de datos de inters sociolgico mediante la interrogacin a los miembros de la
sociedad. Permite obtener informaciones sobre un amplio abanico de cuestiones a la vez y no slo sobre un aspecto o
problema definido.

UNIDAD DE ANLISIS, es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre los cuales se va

a obtener datos. La unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno y proporciona datos concretos.

Magster Agustina Subelda Coronel

13

Estadstica aplicada a la Educacin

VARIABLES
Objeto, proceso o caracterstica que est presente, o supuestamente presente en el fenmeno medible que
un cientfico quiere estudiar, que vara (cambia) a travs del tiempo, o que difiere de un lugar a otro o de un
individuo a otro. Los objetos, procesos o caractersticas reciben el nombre de variables en la medida en que
su modificacin provoca una modificacin en otro objeto, proceso o caracterstica.

CATEGORAS DE LAS VARIABLES


Cada uno de los grupos de clasificacin de una variable recibe el nombre de categora, clase, nmina o
lista.
Un conjunto de categoras para una determinada variable constituye la escala de clasificacin.

Las categoras deben ser excluyentes entre s.


En conjunto deben ser exhaustivas (cada posible respuesta en una categora).

Ejemplo 5
Variable: Sexo
Categora
1. Femenino
2. Masculino

CLASIFICACIN DE LAS VARIABLES


Las variables se clasifican segn diversos criterios. A continuacin se presentan algunas;

SEGN LA NATURALEZA DE LA VARIABLE

a) Variables cualitativas o estadsticas de atributos


Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo; sus datos se expresan mediante una palabra, es no numrico. Por ejemplo: estado civil, lugar de nacimiento, profesiones,
actividad econmica, causas de accidentes, etc.

b) Variables cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico. El dato o valor puede resultar de la operacin de contar o medir. Las variables cuantitativas pueden ser discretas y continuas.
Discreta; cuando el valor resulta de la operacin de contar, su valor est representado solo por nmeros
naturales. Ej. Cantidad de jvenes de una carrera, cantidad de docentes por carrera, cantidad de alumnos en la institucin de educacin superior, cantidad de asignaturas por carrera, Hijos por familia, nmero
de accidentes por da, habitaciones por vivienda, etc.
Continua; cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Se expresa por cualquier nmero real. Ej.
rea de parcelas, ingresos monetarios, produccin de maz, peso de los alumnos, estatura de los alumnos, tiempo de servicios, horas trabajadas de los docentes, etc.

SEGN LA ESCALA DE MEDICIN; Se presenta a continuacin las caractersticas bsicas de los cuatro niveles distinguidos por Stevens,

Magster Agustina Subelda Coronel

14

Estadstica aplicada a la Educacin

a) Variables nominales; Son aquellas que establecen la distincin de los elementos en diversas categoras, sin implicar algn orden entre ellas, distribuye a la unidad de anlisis en dos o ms categoras.
Ejemplos: sexo, estado civil, deportes que practica, profesiones, lugar de nacimiento, etc.

b) Variables ordinales: Aquellas variables que implican orden entre sus categoras, pero no grados de
distancia iguales entre ellas; estn referidas a un orden o jerarqua, donde las categoras expresan una
posicin de orden. Ejemplo: grado de instruccin, clases sociales, grado de simpata, rango de agresividad, orden de mrito, nivel de dolor, nivel de preferencia, etc.

c) Variables de intervalo: Son aquellas que suponen a la vez orden y grados de distancia iguales entre

las diversas categoras, pero no tienen un origen natural, sino convencional. En este tipo de variables es
posible describir la informacin contenida en ellas calculando el promedio, desviacin Standard (DS) y
siempre debiera tambin incluirse en base a cuantos casos (o sea el n) tienen dichos resultados. Ejemplos: coeficiente de inteligencia, temperatura, puntuacin obtenida en una escala, etc.

d) Variables de razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero

absoluto tal que significa ausencia del atributo y la razn o cociente de dos nmeros es significativo pudindose aplicarles todo tipo de instrumental matemtico. El valor de estas variables se expresa con un
nmero real. Ejemplo: edad, peso, ingresos, nmero de hijos, produccin, accidentes de trnsito, etc.

SEGN LA RELACIN ENTRE VARIABLES

a) Variables dependientes: Son aquellas que se explican por otras variables, son los efectos o resul-

tados respecto a los cuales hay que buscar su motivo, causas o razn de ser. Es la variable que traduce
la consecuencia del efecto de una o varias razones o causas de otras variables.

b)

Variables independientes: Son las variables explicativas o predictivas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende descubrir en la investigacin. Las variables independientes (VI) son las que traducen o explican las causas o razones de las variaciones en la variable dependiente (VD). En la relacin de variables, las causas o antecedentes seran las VI y el efecto o consecuente es la VD.

Ejemplo 6
1.
2.
3.
4.

El presupuesto familiar (VD) depende de los ingresos (VI).


El volumen de ventas (VD) se explica por la inversin en propaganda (VI).
El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los padres (VI).
El analfabetismo (VD) tiene relacin con el lugar de residencia (VI) y la expansin del servicio educativo (VI).
5. El aprendizaje de los jvenes (VD) tiene relacin con las estrategias de enseanza del docente (VI).
6. Las estrategias de enseanza del docente (VD) depende de su formacin pedaggica (VI).
7. Los aos de estudios de la madre (VI) determinan el logro educativo del hijo (VD).
8. La inversin en la capacitacin docente (VI) aumenta el logro escolar (VD).

MATRIZ TRIPARTITA. ELEMENTOS BSICOS DE LA ESTADSTICA


En el trabajo estadstico existen tres elementos bsicos como son: la poblacin o muestra (unidades de anlisis), las variables o caractersticas, y los datos. A esto se lo denomina matriz tripartita
1. Los elementos o unidades de anlisis (poblacin) que pueden ser personas, instituciones, objetos,
familias, etc. y otras unidades ms complejas. Estas unidades tienen una caracterstica en comn, en
cuanto constituyen el objeto de estudio de una investigacin.
2. Las variables, dimensiones o caractersticas que se desea conocer en relacin a las unidades de anlisis, tales como matrcula, instituciones, etc.
Magster Agustina Subelda Coronel

15

Estadstica aplicada a la Educacin


3.

Los datos o valores que alcanzan las unidades en las variables estudiadas, son las respuestas o resultados que se obtienen cuando

CUADRO 1
MATRZ TRIPARTITA DE DATOS: CARACTERSTICAS SOCIODEMOGRFICAS DE LOS ESTUDIANTES DE LA MAESTRA EN EDUCACIN. AO 2012

Unidades de anlisis
(Poblacin)

01
02
03
04
05
06
07
08
09
10
11
12

Eda

Sexo

48
37
28
36
25
38
45
37
48
41
50
35

F
F
F
M
F
F
M
M
F
F
F
F

VARIABLES

Estado Civil

Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboracin: Maestra en Educacin

Magster Agustina Subelda Coronel

16

N de hijos

Aos de servicio

4
3
1
3
3
0
2
5
3
5
1
2

21
15
6
15
5
18
25
16
25
17
24
13

Estadstica aplicada a la Educacin

CONSTRUCCIN DE INDICADORES
INDICADORES: Un indicador social es una medida de resumen, de preferencia estadstica, referente a la

cantidad o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar
las unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables que se estn analizando.

Cuando se analiza una variable y se quiere comparar las categoras, se puede recurrir a los
siguientes indicadores.
RAZN / RELACIN
RAZN: Es la comparacin entre dos nmeros que puede calcularse por diferencia
RELACIN: Comparacin entre dos nmeros que puede calcularse por cociente.
Ejemplo 7: En la siguiente tabla se presenta la cantidad de estudiantes por sexo de una institucin de enseanza superior
SEXO
CANT
Mujeres
600
Varones
1.200
Total
1.800
Se desea saber;
a. Cuntos varones ms que mujeres hay en la institucin?. Interpreta.
b. Cul es la relacin entre varones y mujeres en la institucin?. Interpreta
Para dar respuesta a las preguntas planteadas se procede de la siguiente manera:
a. Ra=1.200-600=600. Interpretacin: Indica que existen 600 varones ms que mujeres en la Institucin.
b. Re

V 1200 2

Interpretacin: Indica que por cada 2 varones hay 1 mujer.


M
600 1

PROPORCIN Y PORCENTAJE
PROPORCIN: Una proporcin (P) es una comparacin por cociente de la magnitud de una parte con la del
todo. El valor de una proporcin (P) siempre se halla entre el cero y la unidad.
0 P 1

Ejemplo 8: Atendiendo al ejemplo anterior, se desea saber;


a. Cul es la proporcin de mujeres en la institucin?. Interpreta.

M
600

0,33 Interpretacin: Aproximadamente la tercia parte (0,33) de los estudiantes son muT 1800

jeres. O de cada 10 estudiantes 3 son mujeres

PORCENTAJE: Es la expresin de la proporcin en forma de porcentaje (%). As, para convertir una proporcin en porcentaje se multiplica dicha proporcin por 100.

Magster Agustina Subelda Coronel

17

Estadstica aplicada a la Educacin


Ejemplo 9: Indica el porcentaje de mujeres matriculadas en la enseanza superior.
MATRCULA
PORCENTAJE
MUJERES
TOTAL
(600/1.800)*100=33,3%
600
1.800
Interpretacin: El 33,3% de los estudiantes de la institucin de educacin superior son mujeres.
PARA TENER EN CUENTA: Los indicadores; razn, relacin, proporcin y porcentaje pueden ser calculados tanto para variables cuantitativas como variables cualitativas.

TABLAS DE FRECUENCIAS
TABLAS DE FRECUENCIA O DE DISTRIBUCIN, son tablas de trabajos estadsticos, que presentan la
distribucin de un conjunto de elementos de acuerdo a las categoras de la variable. En ellas se observa la
frecuencia o repeticin de cada uno de los valores de la variable, que se obtiene despus de realizar la operacin de tabulacin; las tablas presentan los diversos tipos de frecuencia (absoluta, relativas, etc.)
TIPOS DE FRECUENCIAS:
FRECUENCIA ABSOLUTA (fa): Es el nmero de veces que se repite un valor.
FRECUENCIA ABSOLUTA ACUMULADA (faa): en un punto determinado, es igual a las sumas de las frecuencias absolutas anteriores al punto.
FRECUENCIA RELATIVA o DISTRIBUCIN DE PROBABILIDADES (fr): Es el cociente entre la frecuencia
absoluta y el nmero total de casos (Fabs /n), siendo n el nmero total de casos.
FRECUENCIA RELATIVA ACUMULADA (fra): en un punto determinado, es igual a las sumas de las frecuencias relativas anteriores al punto.
DISTRIBUCIN DE FRECUENCIAS: Es una tabla que indica las distintas clases en que los datos se han
clasificado y la frecuencia de valores en cada clase.
La informacin estadstica se puede presentar en forma:
NO AGRUPADA: cuando no hay muchos datos.
VARIABLE CUANTITATIVA
Ejemplo 10: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica de 12
alumnos de la carrera de Ciencias de la Educacin.
51
88

62
73

68
61

90
92

88
51

Ordena ya sea en forma ascendente o descendente los datos y halla las frecuencias.
FRECUENCIA FRECUENCIA
PUNTAJE
ABSOLUTA (fa) RELATIVA (fr)

51
61
62
68
73
88
90
92
TOTAL

2
2
2
1
1
2
1
1
12

Magster Agustina Subelda Coronel

18

62
61

16,7
16,7
16,7
8,3
8,3
16,7
8,3
8,3
100

FRECUENCIA
ABSOLUTA
ACUMULADA
faa

2
4
6
7
8
10
11
12

FRECUENCIA
RELATIVA
ACUMULADA
fra

16,7
33,4
50,1
58,4
66,7
83,4
91,7
100,0

Estadstica aplicada a la Educacin


Rango o Recorrido: En todo conjunto de valores de la variable Xi, es posible conocer el mximo y el mnimo valor de Xi, donde Xmax-Xmin constituye el rango o recorrido (R) de la variable.
R=Xmx Xmn
Considerando el ejemplo anterior, se calcula el Rango
Xmx=92
Xmin=51
R=92-51=41
PARA TENER EN CUENTA: Existen en plaza software informticos que facilita la elaboracin de la tabla y
el clculo de la distribucin de frecuencias (Se puede hacer con Excel, Access, entre otros). Asimismo, hay
software estadstico especfico para ello (el ms usado y conocido es el SPSS)
DATOS AGRUPADOS EN INTERVALOS: cuando hay muchos datos.
Ejemplo 11: Los datos siguientes corresponden a los puntajes obtenidos en un examen de matemtica
75
88
68
58

82
73
76
87

68
61
88
91

90
92
91
63

62
71
79
65

88
51
56
77

R=92-51=41
El recorrido se puede dividir en un nmero arbitrario de intervalos de clase (m) o pequeos segmentos.
S m = nmero de intervalos, entonces: la amplitud (c) o el tamao del intervalo est dado por:
( R 1)
ci
m
Para elegir un nmero arbitrario de intervalos se calcula R+1 y se verifica si este resultado es mltiplo de
algn nmero, como por ejemplo R+1=41+1=42. El 42 es mltiplo de 2, 3, 6, 7, 14, es decir, que el nmero
arbitrario de intervalos (m) a ser elegido puede ser cualquiera de esos divisores.
Se considera a m=6 como el nmero arbitrario, entonces, la amplitud o el tamao del intervalo (c) ser:

41 1 42

7
6
6

Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92

El intervalo contiene a:
51, 52, 53, 54, 55, 56, 57
58, 59, 60, 61, 62, 63, 64
65, 66, 67, 68, 69, 70, 71
72, 73, 74, 75, 76, 77, 78
79, 80, 81, 82, 83, 84, 85
86, 87, 88, 89, 90, 91, 92

Cada intervalo de clase tiene: Lmite inferior y un lmite superior; es el menor y el valor que delimita un intervalo de clase.
Intervalo de clase Lmite inferior
51 - 57
51

Lmite superior
57

Los intervalos pueden ser:


Cerrado: cuando incluyen los extremos del mismo.
Intervalo de clase Cerrado
Incluye a 51 y 57
51 - 57
Magster Agustina Subelda Coronel

19

Estadstica aplicada a la Educacin

Abierto: cuando se excluyen los extremos del mismo.


Intervalo de clase Abierto
(51 - 57)
No incluye a 51 y 57
Cerrado y abierto: cuando incluye el lmite inferior y excluye el lmite superior.
Intervalo de clase Cerrado y Abierto
Incluye a 51 y no incluye a 57
51 - 57)
Abierto y cerrado: cuando excluye el lmite inferior e incluye el lmite superior
Intervalo de clase Abierto y cerrado
No incluye a 51 e incluye a 57
(51 - 57
El punto medio de cada intervalo se llama marca de clase y se denota por yi
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92

yi Marca de clase
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89

Mtodo general para hallar la distribucin de frecuencias para datos agrupados en intervalos
1) Determina el valor mximo y el mnimo entre todos los datos registrados y as calcular el RANGO: es el
valor mximo menos el valor mnimo.
2) Divide el rango en un nmero arbitrario (m) de INTERVALO DE CLASE del mismo tamao.
3) Halla la MARCA DE CLASE.
4) Determina el nmero de observaciones que cae dentro de cada intervalo de clase, es decir, encontrar la
frecuencia de clase, mediante un conteo de los datos.
Ejemplo 12: Agrupa utilizando los datos del ejemplo anterior. Considera m=7 para el tamao de intervalo
PUNTAJE
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
TOTAL

Marca de clase
yi
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89

Magster Agustina Subelda Coronel

20

FRECUENCIA
ABSOLUTA (fa)

2
4
4
4
2
8
24

FRECUENCIA
RELATIVA
(fr)

8,3
16,7
16,7
16,7
8,3
33,3
100

FRECUENCIA
ABSOLUTA
ACUMULADA
faa

2
6
10
14
16
24

FRECUENCIA
RELATIVA ACUMULADA fra

16,7
25,0
41,7
58,4
66,7
100,0

Estadstica aplicada a la Educacin


VARIABLE CUALITATIVA
Ejemplo 13: Utilizando los datos de la siguiente matriz tripartita
Unidades de anlisis
(Poblacin)

01
02
03
04
05
06
07
08
09
10
11
12

Eda

Sexo

48
37
28
36
25
38
45
37
48
41
50
35

F
F
F
M
F
F
M
M
F
F
F
F

VARIABLES

Estado Civil

Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboracin: Maestra en Educacin

N de hijos

Aos de servicio

4
3
1
3
3
0
2
5
3
5
1
2

21
15
6
15
5
18
25
16
25
17
24
13

a. Elabora una tabla de distribucin de frecuencias para la variable SEXO. Interpreta.


Para la elaboracin de la tabla de frecuencias de la variable SEXO, se procede de la siguiente manera;
1. Elaborar una tabla
2. Colocar la variable y sus categoras
3. Contar cuantas veces aparecen cada una de las categoras en la matriz de anlisis
4. Calcular el porcentaje
SEXO
F
M
Total

Frecuencia
9
3
12

Porcentaje
75,0
25,0
100,0

Interpretacin: Se puede notar que en el grupo de estudiantes la mayora son mujeres, representando un
75% del total de estudiantes de la Maestra en Educacin.
PARA TENER EN CUENTA: En variables cuantitativas, no se calculan frecuencias acumuladas

Magster Agustina Subelda Coronel

21

Estadstica aplicada a la Educacin

ELABORACIN DE CUADROS ESTADSTICOS


CUADROS ESTADSTICOS; es el arreglo ordenado, columnas y filas, de datos estadsticos o caractersticas relacionadas, con el objeto de ofrecer informacin estadstica de fcil lectura, comparacin e interpretacin y ser autoexplicativos.
En un cuadro de dos variables o de doble entrada, se distinguen una Variable Principal colocada en forma
horizontal y una Variable Secundaria colocada en forma vertical. No es la nica forma de presentar datos,
pero es la ms recomendable, si lo permite la naturaleza de las variables. Para diferenciar las variables principal y secundaria, en el ttulo del cuadro se antepone la palabra POR a la variable principal y SEGN a la
variable secundaria.
PARTES PRINCIPALES DE UN CUADRO ESTADSTICO
1.
2.
3.
4.
5.
6.
7.
8.

Nmero del cuadro.


Ttulo
Encabezamiento o conceptos.
Cuerpo
Nota de pie o llamadas
Fuente
Nota de unidad de medidas
Elaboracin

Ejemplo 14 Cuadro 2

Cuadro 3

PARAGUAY. EDUCACIN INICIAL.


MATRCULA SEGN SECTOR. AO 1996

PARAGUAY. EDUCACIN INICIAL.


MATRCULA POR SEXO, SEGN SECTOR. AO 1996

SECTOR TOTAL %

SECTOR

Oficial
Privado
Total

Oficial
Privado
Total

55.231
29.433
84.664

65,2
34,8
100,0

Fuente. MEC. Anuario Estadstico. Ao 1996


Elaboracin. Direccin..........

SEXO
Mujeres

30.377
15.600
45.977

Hombres

24.854
13.833
38.687

Fuente. MEC. Anuario Estadstico. Ao 1996


Elaboracin. Direccin..........

TOTAL
55.231
29.433
84.664

CONSTRUCCIN DE GRFICOS ESTADSTICOS


Un grfico o diagrama es una representacin pictrica, de figuras geomtricas, de superficie o volumen, con
el objeto de ilustrar los cambios o dimensin de una variable, para comparar visualmente dos o ms variables similares o relacionadas.
Las cualidades esenciales del grfico son: simplicidad, claridad y veracidad. Los grficos de una sola variable sirven para fines comparativos de cantidades absolutas, tasas, proporciones, etc. Pueden tener la forma
de barras, superficies, puntos o lneas. Los grficos de dos variables, se construyen en el plano rectangular
o de coordenadas cartesianas, donde hay dos ejes, X e Y. En el eje Y (ordenada) se colocan los valores de
la variable independiente y en X (abscisa) la variable independiente, siendo y = f(x).
PRINCIPALES PARTES DE UN GRFICO
1) TTULO, como en los cuadros, es una descripcin del contenido del grfico debe indicar claramente la
naturaleza del fenmeno representando.
2) DIAGRAMAS, est dado por el propio dibujo del grfico, y como en el cuerpo del grfico, estn representados los datos indicados en el ttulo.
3) ESCALAS Y/O LEYENDAS, son indicaciones donde se precisa la correspondencia entre los elementos
del grfico y la naturaleza de las medidas representadas.
4) FUENTE de los datos estadsticos representados.

Magster Agustina Subelda Coronel

22

Estadstica aplicada a la Educacin


PRINCIPALES TIPOS DE GRFICOS
VARIABLES CUANTITATIVAS
HISTOGRAMA:
Es el grfico utilizado en las distribuciones agrupadas en clases o intervalos, construido con barras verticales
que no guardan separacin entre ellas. Para construirlo se marcan en el eje x (abscisa) los intervalos (las
clases) y en el eje y (ordenada) las frecuencias (absolutas o relativas). Sobre cada intervalo se dibuja una
barra proporcional a su frecuencia.

GRFICO N 1: CANT. DE ALUMNOS SEGN PUNTAJE


PUNTAJE

20 - 34
35 - 49
50 - 64
65 - 79
80 - 94

fa
5
8
5
12
10

12

12
11

10

10

fa

8
7
6

4
3
2
1
0
20 - 34

35 - 49

50 - 64

65 - 79

80 - 94

PUNTAJE
FUENTE: Universidad XX
ELABORACIN: Universidad XX. Facultad XX. Dpto Est

Magster Agustina Subelda Coronel

23

Estadstica aplicada a la Educacin


POLGONO DE FRECUENCIAS
Para construirlo se calculan los puntos medios (marca de clase) de los intervalos, se levanta un segmento de
altura igual a la respectiva frecuencia (absoluta o relativa), luego se unen los extremos con una lnea poligonal.
PUNTAJE

20 - 34
35 - 49
50 - 64
65 - 79
80 - 94

MARCA
DE
CLASE

27
42
57
72
87

fa
5
8
5
12
10

GRFICO 2: ALUMNOS SEGN PUNTAJE MEDIO

fa

12
11
10
9
8
7
6
5
4
3
2
1
0

12
10
8

12

27

42

57

72

87

102

PUNTAJE MEDIO
FUENTE: INST. XX.
ELABORACIN: ......

OJIVAS
Para representar las frecuencias acumuladas (absolutas o relativas) se utilizan las Ojivas o polgonos
acumulativos de frecuencias. Se construye ubicando los extremos de los intervalos en el eje x y en el eje
y el valor de las frecuencias acumuladas. En el extremo superior de cada intervalo se levanta un segmento
de altura igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se
une, con segmentos de recta, los extremos de los segmentos verticales, obteniendo una lnea poligonal que,
partir de la ltima frecuencia acumulada, se extiende paralelamente al eje horizontal.

PUNTAJE

20 - 34
35 - 49
50 - 64
65 - 79
80 - 94

MARCA
DE
CLASE

27
42
57
72
87

fa
5
8
5
12
10

faa

fa a

GRFICO 3: FRECUENCIA ACUM ULATIV A SEGN PUNTAJE


40

40

35

5
13
18
30
40

30

30

25

20
18
15
13
10

0
20

34

35

49

50

64

65

PUNTAJE
FUENTE: INST. X X .
ELA B ORA CIN: ......

Magster Agustina Subelda Coronel

24

79

80

94

Estadstica aplicada a la Educacin


LINEAS
Este tipo de grfico relaciona variables entre s (variable dependiente y variables independientes).
Un grfico que muestre la distribucin de una variable en funcin del tiempo se llama GRFICO DE SUCESIN
EN EL TIEMPO.

GRAFICO 4: EVOLUCIN DE LA MAT


UNIVERSITARIA. PERIODO 2003-2007
160000
158000

Matricula

156000
154000
152000
150000
148000
146000
144000

2003

2004

2005

2006

2007

AOS
FUENTE: INST.AO 2003-2007

VARIABLES CUALITATIVAS
BARRAS
El grfico de barra (o diagrama de barras) se puede representar en forma vertical u horizontal. El ancho de
las barras debe ser constante y pueden ser de cualquier tamao, mientras que las barras no se sobrepongan. Este tipo de grfico se usa para representar variables relacionadas entre s
BARRAS VERTICALES
S el grfico corresponde al de barra vertical, entonces, las categoras de la variable independiente son registradas horizontalmente y sobre ellas son levantadas columnas de alturas correspondientes a la variable
dependiente (frecuencia).
BARRAS HORIZONTALES
Se diferencia de las barras verticales por la posicin entre la variable y la frecuencia. Las variables pueden
ser ordenadas en forma creciente o decreciente de acuerdo a la frecuencia o alguna otra clasificacin.

GRFICO N 5: EDUCACIN SUPERIOR.


DESERTORES SEGN DEPARTAM ENTO.
AO 2006

GRAFICO 6: DESERCIN
UNIVERSITARIA POR CARRERA. AO
2007
Comer cial

7.000
6.000

Ar quitectur a

5.000
4.000
3.000
2.000

Inf or mtica

1.000
0

Der echo

Desercin

Diseo

0
DEPARTAMENTO

FUENTE: INST.

Magster Agustina Subelda Coronel

25

10

15

20

25

30

Estadstica aplicada a la Educacin


ELABORACIN

BARRAS COMPUESTAS

GRFICO DE PILAS

Este tipo de grfico sirve para representar un fenmeno dividido en categoras que a su vez se dividen
en subcategoras. Para su elaboracin se utilizan
generalmente, cifras absolutas y no relativas.
Las barras pueden estar en posicin vertical u horizontal

Se utiliza para comparar categoras o subcategoras


de una variable, es decir, ilustra las partes en un
todo. Se construye sobre una escala de frecuencia
relativa (de cero a cien).

GRFICO N 7: EDUCACIN
SUPERIOR. MATRCULA POR AO,
SEGN SECTOR
180.000
160.000
140.000
120.000

149.719

167.262

130.979

100.000
80.000
60.000
40.000

35.915

39.039

45.394

20.000
0
1991

1992

1993

AO
Pblico

FUENTE: XXXXX
ELABORACIN:

Privado

FUENTE: MEC. ANUARIO 1993


ELABORACIN:

CIRCULAR O DE SECTORES
Se utiliza para demostrar una proporcin de un todo y solamente cuando la variable est dividida en pocas
categoras, en caso contrario pierde su principal cualidad que es la legibilidad.
Para construir un grfico circular se calculan los ngulos repartiendo 360 en partes directamente proporcionales a cada una de las frecuencias, que pueden ser cifras absolutas o relativas.

GRAFICO : ESCUELA XX.


DISTRIBUCIN DE ESTUDIANTES DEL
5 POR SEXO
Mujer
37%

Varn
63%

Fuente:

Magster Agustina Subelda Coronel

26

Estadstica aplicada a la Educacin

UNIDAD 3 - ANLISIS DE LOS DATOS DE UNA MUESTRA O POBLACIN


VARIABLES CUANTITATIVAS
ESTADSTICAS DESCRIPTIVAS
MEDIDAS DE CENTRALIZACIN
Son estadgrafos que describen la posicin que ocupa una distribucin de frecuencia alrededor de un valor
de la variable, es decir los valores observados se agrupan alrededor de cierto valor central o valor medio.
Las medidas de centralizacin de uso ms frecuente son: la media aritmtica (promedio), la mediana, las
cuartilas, las decilas, los percentiles y la moda.
DATOS NO AGRUPADOS
Media aritmtica; comnmente se lo conoce como promedio, se define y calcula dividiendo la suma de los
valores de la variable entre el nmero de observaciones o valores.
n

Suma de valores de la variable


Nmero de valores

x 1 x 2 x 3 ....... x n
n

i 1

Mediana (Me); una vez ordenados los datos, para calcular la mediana se toma como referencia el valor de
(n+1)/2 para los datos no agrupados.
b.
c.

Se ordenan los datos


Calcular (n+1)/2, que determina el lugar o posicin donde estar ubicado el valor de la mediana; y si se
tiene como datos un nmero:
Impar, la mediana es igual al valor del trmino central.
Par; la mediana es igual al promedio de los dos valores centrales.

Moda (Mo); es el valor ms frecuente para una variable, es decir, al que le corresponde mayor frecuencia.
Ejemplo 15 Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin,
por 12 alumnos del primer semestre.
75
82
a)
b)
c)
d)

87
75

74
94

62
77

93
69

78
73

Cul es el puntaje mnimo y cul el mximo?


Cul es la media o el promedio de los puntajes obtenidos por los alumnos? Interpretar
Calcular la mediana de los puntajes obtenidos. Interpretar
Cul es el puntaje ms frecuente?

a) El puntaje mnimo es 62 y el mximo es 94.


b) El puntaje promedio est dado por:

7 5 8 7 74 62 93 78 82 75 94 77 69 73
939

78 , 25
12
12

Interpretacin: Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25
puntos
c) Para calcular la mediana (Me) se procede a:

Ordenar los datos (puede ser en forma ascendente o descendente)

Magster Agustina Subelda Coronel

27

Estadstica aplicada a la Educacin


62
77

69
78

73
82

74
87

75
93

75
94

Calcular

Posicin

de

1
62

2
69

Posicin
Puntos

la

mediana
3
73

4
74

La mediana est dada por Me

5
75

n 1 13

6 ,5
2
2
6
75

7
77

8
78

9
82

10
87

11
93

12
94

75 77
76
2

Interpretacin: esto implica que aproximadamente el 50% de los estudiantes han obtenido hasta 76 puntos
e) En cuanto al puntaje ms frecuente es 75, porque tiene mayor frecuencia, es decir 3.
a) Tabla de frecuencias
Puntajes (Yi)
10
18
22
24
28
30

fa=ni
1
4
6
6
7
6
30

a) El puntaje promedio est dado por:


Puntajes (Yi)
10
18
22
24
28
30

fa=ni
1
4
6
6
7
6
30

Yi.ni
10x1=10
18x4=72
22x6=132
24x6=144
28x7=196
30x6=180

Y .n
i

734

10,1 18 , 4 22 , 6 24 , 6 28 , 7 30 , 6
734

24 , 47
30
30

El puntaje promedio de los alumnos es de 24,47 puntos.

Magster Agustina Subelda Coronel

28

Estadstica aplicada a la Educacin


b) Para calcular la mediana (Me) se procede a:

Determinar las frecuencias absolutas acumuladas Ni =faa

Calcular

n 30

15
2 2

Puntajes (Yi)

Yj-1
Yj

10
18
22
24
28
30
n=

fa=ni
1
4
6
6
7
6
30

faa=Ni
1
5
11 Nj-1
n
15
17 Nj
2
24
30

Como 2 15 no coincide con ningn Ni, el valor se encuentra entre dos valores de Ni o sea:

N j 1 11

n
15 N j 17 entonces
2

Me

, es decir, existen 17 alumnos que tienen 24 pun-

24

tos o menos.

c) En cuanto al puntaje ms frecuente es 28, porque tiene mayor frecuencia (7).


Ejemplo 16: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica, por
30 alumnos de un curso de licenciatura.
30
28
18
a)
b)
c)
d)

23
28
23

28
30
23

22
18
23

30
30
10

22
24
18

30
28
22

22
28
22

28
22
24

30
18
28

Agrupar los datos en una tabla de frecuencias


Cul es la media o el promedio de los puntajes obtenidos por los alumnos?
Calcular la mediana de los puntajes obtenidos. Interpretar
Cul es el puntaje ms frecuente?

a)Tabla de frecuencias
Puntajes (Yi)
10
18
22
23
24
28
30

b)

El puntaje promedio est dado por:

fa=ni
1
4
6
4
2
7
6

Puntajes (Yi)
10
18
22
23
24
28
30

30

fa=ni
1
4
6
4
2
7
6
30

Yi.ni
10x1=10
18x4=72
22x6=132
23x4=92
24x2=48
28x7=196
30x6=180
Yi .ni 730

10,1 18 , 4 22 , 6 23 , 4 24 , 2 28 , 7 30 , 6
730

24 , 33
30
30

El puntaje medio de los alumnos es de 24,33 puntos.


c) Para calcular la mediana (Me) se procede a:

Determinar las frecuencias absolutas acumuladas Ni =faa

Magster Agustina Subelda Coronel

29

Estadstica aplicada a la Educacin

Calcular

n 30

15
2 2

Puntajes (Yi)
10
18
22
Yj-1 23
Yj 24
28
30
n=
n
15
2

Como

Me

fa=ni
1
4
6
4
2
7
6
30

faa=Ni
1
5
11
15 Nj-1
17 Nj
24
30

coincide

con

n
15
2

Ni,

1
Yj 1 Yj 1 23 24 23,5 , es decir,
2
2

entonces,

N j 1

n
15 N j 17
2

entonces

Interpretacin: El 50% de los alumnos tienen puntajes iguales o menores que 23,5 puntos.
d) En cuanto al puntaje ms frecuente de los estudiantes es de 28 puntos, porque tiene mayor frecuencia (7).

MEDIDAS DE DISPERSIN
Son aquellos valores que nos dan una idea de cuan alejados estn unos datos de otros, es decir es necesario tener una idea del grado de concentracin o dispersin de las observaciones alrededor de un valor central o de posicin.
Los estadgrafos de dispersin de mayor uso son:
Rango o recorrido: es un estadgrafo de dispersin muy limitado, pues slo considera los valores extremos
de la distribucin
DATOS NO AGRUPADOS
Desviacin media: o desviacin promedio de un conjunto de observaciones se define por
n

X
DM

j 1

donde X es la media aritmtica y

X j X es el valor absoluto de las desviaciones de

Xj respecto a X .
Varianza: En la perspectiva de construir un indicador que dimensione la desviacin o distancia promedio de
los Xj respecto a X , se propuso elevar al cuadrado de la desviacin X j X a fin que sea siempre no negativa. De esta manera la varianza queda definida como:
n

V (X ) s2

X
j 1

La varianza es el estadgrafo de dispersin ms importante, que asociado a

la media aritmtica se constituyen en los pilares fundamentales de la estadstica.


Desviacin tpica o estndar: es uno de los estadgrafos de mayor uso, en el cual las unidades de la variable ya no estn elevadas al cuadrado.
Magster Agustina Subelda Coronel

30

Estadstica aplicada a la Educacin

s s2
La desviacin estndar, al igual que la varianza; es no negativa, puesto que es la raz cuadrada positiva de
la varianza. A mayor dispersin le corresponder una mayor desviacin estndar.
Interpretacin de la desviacin estndar

Si la desviacin estndar es ms grande que la media, esto probablemente indica un sesgo, es decir
sugiere que una o ms puntuaciones extremas inflaron la media y la desviacin estndar.
Si la desviacin estndar no es de la mitad de tamao de la media o menos, se debe tener en cuidado al
examinar la distribucin para analizar la posible existencia de sesgos o valores extremos.

Coeficiente de variacin (CV): Es una medida de variacin RELATIVA, mide el grado de dispersin de un
conjunto de datos en relacin con su media. Uno de sus usos ms comunes es para expresar la desviacin
estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado
de variabilidad que la desviacin tpica o estndar. Todos los valores deben ser positivos y su media de por
tanto un valor positivo. El CV pierde utilidad cuando la media se aproxima a cero
Es til para comparar la dispersin de conjunto de datos que tienen distintas desviaciones estndar y distintos promedios.
Interpretacin del coeficiente de variacin
s

CV

__

.100

26% o ms Muy Heterogneo


16% a 25% Heterogneo
11% a 15% Homogneo
0% a 10% Muy Homogneo

Ejemplo 17: Usando los datos correspondientes al ejemplo 16.


62

69

73

74

75

75

77

78

82

87

93

94

Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25 puntos
a) Calcula la desviacin media de los puntajes obtenidos.
b) Calcula la varianza y la desviacin tpica o estndar.
c) Calcula el coeficiente de variacin
d) Interpreta los resultados
a) Calcula la desviacin media de los puntajes obtenidos.
n

Aplicando la frmula:
DM

X
DM

, se tiene

j 1

62 78,25 69 78,25 73 78,25 74 78,25 2. 75 78,25 77 78,25 78 78,25 82 78,25 87 78,25 93 78,25 94 78,25

12
16,25 9,25 5,25 4,25 2 * 3,25 1,25 0,25 3,75 8,75 14,75 15,75 86
DM

7,1666 7,2
12
12

Interpretacin: Lo que significa que la distancia media entre cada uno de los valores y el valor central es de
7,2 puntos
b) Calcula la varianza y la desviacin tpica o estndar.
n

Aplicando la frmula para el clculo de la varianza:


s2

62 78,25 69 78,25 73 78,25 74 78,25


2

Magster Agustina Subelda Coronel

31

V (X ) s2

X
j 1

2.75 78,25 77 78,25 78 78,25 82 78,252 87 78,252 93 78,252 94 78,252


12
2

Estadstica aplicada a la Educacin


s2

16,252 9,252 5,252 4,252 2.3,252 1,252 0,252 3,752 8,752 14,752 15,752

12
264,0625 85,5625 27,5625 18,0625 21,125 1,5625 0,0625 14,0625 76,5625 217,5625 248,0625 974,25
s

81,1875 81,19
12
12
2

s 2 81,19

La varianza es de 81,19 puntos


Para el clculo de la desviacin tpica o estndar, se aplica la siguiente frmula:

s s2

s 81,19 9,01

El valor de la desviacin tpica o estndar es de 9,01 puntos


c) Calcula el coeficiente de variacin e Interpreta los resultado
Se aplica la frmula CV

CV

s
__

.100 , reemplazando por los valores se tiene:

9,01
.100 11,515 11,52%
78,25

El coeficiente de variacin indica que la desviacin


tpica o estndar representa el 11,52% del valor de
la media de puntos. Lo que significa que los puntajes de los estudiantes son homogneos

MEDIDAS DE ASOCIACIN
Son medidas que se usan para evaluar la asociacin entre un evento y un factor de estudio. Los tpicos estadsticos de asociacin son la correlacin y la regresin.
CORRELACIN: Expresa el grado y sentido de la variacin concomitante de dos o ms series de datos. Es
decir, analiza la relacin entre dos o ms variables, siempre que se tenga un indicio que entre ellas existe
por lo menos cierto grado de dependencia o asociacin. La correlacin entre dos variables no implica, por s
misma, ninguna relacin de causalidad
Clasificacin

Perfecta

Imperfecta
Nula
(r

Segn criterio cuantitativo

Segn criterio cualitativo

Positiva
(variacin
Negativa
(variacin

(r

1)
(0

r 1;

- 1 r 0)

0)

de

las

series

en

sentido

en

el mismo

sentido)

contrario)

Fuerza, sentido y forma de la correlacin


La relacin entre dos variables cuantitativas queda representada mediante laliena de mejor ajuste, trazada a
partir de la nube de puntos (diagramas de dispersin). Los principales componentes elementales de una lnea de ajuste y, por lo tanto, de una correlacin, son la fuerza, el sentido y la forma
La fuerza segn el caso, mide el grado en que la lnea representa a la nube de puntos en un diagrama de dispersin: si la nube es estrecha y alargada, se representa por una lnea recta (ver grfico 1 y
2), lo que indica que la relacin es fuerte; si la nube de puntos tiene una tendencia elptica o circular (ver
grfico 3), la relacin es dbil.

Magster Agustina Subelda Coronel

32

Estadstica aplicada a la Educacin

El sentido mide la variacin de los valores de B con respecto a A: si al crecer los valores de A lo
hacen los de B, la relacin es positiva (ver grfico 1); si al crecer los valores de A disminuyen los de B, la
relacin es negativa (ver grfico 2).
La forma establece el tipo de lnea que define el mejor ajuste: la lnea recta, la curva monotnica o la curva no monotnica

Diagramas de Dispersin
Los Diagramas de Dispersin o Grficos de Correlacin permiten estudiar la relacin entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlacin entre ambas si cada vez que aumenta el valor de X
aumenta proporcionalmente el valor de Y (Correlacin positiva o directa) o si cada vez que aumenta el valor
de X disminuye en igual proporcin el valor de Y (Correlacin negativa o indirecta).
En un grfico de correlacin representamos cada par X, Y como un punto donde se cortan las coordenadas
de X e Y:
Grfico 1

Grfico 2

Como se observa en el grfico 1 ambas variables presentan una correlacin lineal positiva; es decir, a medida que aumenta el valor de la variable Estatura aumenta tambin el valor de la variable Peso. Mientras que
en el grfico 2 se observa una relacin lineal negativa; es decir que a medida que aumentan los aos de estudio, disminuye el nmero de hijos.
Se habla de correlacin lineal fuerte cuando la nube de puntos se parezca mucho a una recta y ser cada
vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta.
Grfico 3

Magster Agustina Subelda Coronel

33

Estadstica aplicada a la Educacin

Propiedades de r

1. Si r>0, entonces existe correlacin directa positiva


2. Si r<0, entonces existe correlacin inversa negativa
2
3. Si r =1, entonces existe correlacin rectilnea
Interpretacin de r

0,00 r < 0,20


0,20 r < 0,40
0,40 r < 0,70
0,70 r < 1,00

Existe correlacin no significativa (muy dbil)


Existe baja correlacin (dbil)
Existe significativa correlacin (considerable)
Existe alto grado de asociacin (fuerte)

ALGUNOS COEFICIENTES DE CORRELACIN


PEARSON:(dos variables de razn continuas)
r xy

n . XY

n .

X . Y
.n .Y Y

BISERIAL: (una variable continua y otra dicotomizada)

rb

SPEARMAN: (dos variables ordinales)


rS 1

6 . D 2

rbp

X q p.q
.
St
y

CUADRUPLE: (dos variables dicotmicas)

N. N 2 1

BISERIAL-PUNTUAL: (una variable continua y otra


dicotmica)
X

A . D B .C
B . A C . C D . B D

TETRACRICO: (dos variables dicotomizadas


A.D

B.C

Xq
. pq
St

Ejemplo 18: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a

10

11

12

13

14

15

16

17

18

Velocidad lectora
(X)

69

68

38

50

57

33

30

38

39

22

20

37

62

35

41

50

43

19

Comprensin
lectora (Y)

29

30

10

21

24

11

12

08

07

05

03

06

28

12

09

20

16

02

a) Representa la informacin en un diagrama de dispersin


Diagrama de dispersin

Comprensin lectora

35
30
25
20
15
10
5
0
0

20

40

60

80

Velocidad lectora

b) Cul es el grado y el sentido de la relacin entre las variables velocidad lectora y comprensin lectora?
Magster Agustina Subelda Coronel

34

Estadstica aplicada a la Educacin

Como la velocidad lectora y comprensin lectora son variables continuas o de razn, para medir el grado
se utiliza el coeficiente r de Pearson. La frmula, para datos sin agrupar y a partir de puntuaciones directas
es:

rxy

n.XYX.Y

n.X X .n.Y Y
2

Para aplicar la frmula son necesarios los siguientes clculos previos:


1
2
X
69
68
Y
29
30
X.Y 2001 2040
2

X
Y

3
4
5
38
50
57
10
21
24
380 1050 1368

6
33
11
363

4761 4624 1444 2500 3249 1089


841

900

X 751

100

441

576

Y 253

121

7
30
12
360

8
38
8
304

9 10
39 22
7
5
273 110

11
20
3
60

12
13
37
62
6
28
222 1736

14
35
12
420

15
16
41
50
9
20
369 1000

17
43
16
688

900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245
144

64

XY 12.782

49

25

36

35.245

784

144
2

81

4.975

400

256
N=18

Sustituyendo estos valores en la frmula:


rxy

n. X

n. XY X . Y
2

Obtenemos

X . n .Y Y
2

r xy

18 .12782 751 .253

18.35245 751 .18.4975 253


2

40073
0,94
42406 ,56

0 , 94

Por tanto, la relacin entre X (velocidad lectora) e Y (comprensin lectora) es imperfecta positiva y alta
para la muestra, es decir que la relacin entre la velocidad lectora y la comprensin lectora es significativa.

Magster Agustina Subelda Coronel

35

18
19
751
2
253
38 12782
4

4975

Estadstica aplicada a la Educacin

REGRESIN LINEAL
La correlacin es til para medir si la relacin que existe entre las variables es aproximadamente lineal o no;
mientras que la regresin sirve para buscar la ecuacin matemtica que mejor describe la relacin entre las
variables, consiste en cuantificar la relacin que existe entre las variables con el fin de predecir cules sern
los valores de una variable cuando se conocen los valores de la otra.
El coeficiente de correlacin lineal determina si, efectivamente, existe relacin entre dos variables. Una
vez que se concluye la existencia de relacin, la regresin nos permite definir la recta que mejor se ajusta a
esta nube de puntos.

Una recta viene definida por la siguiente frmula:

Y a bX

Donde "Y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra variable "X"
(variable independiente). Para definir la recta hay que determinar los valores de los parmetros "a" y "b":
La regresin lineal permite calcular el valor de estos dos parmetros, definiendo la recta que mejor se ajusta a esta nube de puntos.
El parmetro "a" es el valor que toma la variable dependiente "Y", cuando la variable independiente "X" vale
0, y es el punto donde la recta cruza el eje vertical.
El parmetro "b" o coeficiente de regresin determina la pendiente de la recta, su grado de inclinacin.
Viene determinado por la siguiente frmula:
n . XY

n X

X . Y
Donde; b = coeficiente de regresin (pendiente de la recta de regresin)
X
2

X = una variable independiente de nivel de intervalo/razn (u ordinal de tipo intervalo)


Y = una variable dependiente de nivel de intervalo/razn (u ordinal de tipo intervalo)
n = tamao de la muestra
Clculo del parmetro a;
a

Donde; a = interseccin del eje y

Y = promedio de la variable dependiente


X = promedio de la variable independiente

b = coeficiente de regresin

Magster Agustina Subelda Coronel

36

Estadstica aplicada a la Educacin


Ejemplo 19: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a

10

11

12

13

14

15

16

17

18

Velocidad lectora
(X)

69

68

38

50

57

33

30

38

39

22

20

37

62

35

41

50

43

19

Comprensin
lectora (Y)

29

30

10

21

24

11

12

08

07

05

03

06

28

12

09

20

16

02

Diagrama de dispersin

Comprensin lectora

35
30
25
20
15
10
5
0
0

20

40

60

80

Velocidad lectora

Grficamente se puede visualizar la existencia de una correlacin lineal positiva y alta para la muestra, es
decir que la relacin entre estas dos variables es significativa (vase ejemplo 18, donde rxy 0,94 ). Concluida la existencia de relacin entre ambas variables a travs del coeficiente de correlacin r Pearson, la
regresin permite definir la recta que mejor se ajusta a esta nube de puntos.

La recta se define de la siguiente manera: Y = a + b X, donde X es la variable independiente (velocidad


lectora) e Y (comprensin lectora), los parmetros a y b se determinan de la siguiente manera;

n. XY X Y
n X 2 X

Donde; b = coeficiente de regresin (pendiente de la recta de regresin)

X = una variable independiente de nivel de intervalo/razn u ordinal (Velocidad lectora)


Y = una variable dependiente de nivel de intervalo/razn u ordinal (Comprensin lectora)
n = tamao de la muestra
Para aplicar la frmula son necesarios los siguientes clculos previos:
1
2
X
69
68
Y
29
30
X.Y 2001 2040
2

4
5
38
50
57
10
21
24
380 1050 1368

6
33
11
363

4761 4624 1444 2500 3249 1089

XY 12.782
X 35.245
2

37

8
38
8
304

9
10 11 12
13
14
15
16
17 18
39 22 20
37
62
35
41
50
43 19
751
7
5
3
6
28
12
9
20
16
2
253
273 110 60 222 1736 420 369 1000 688 38 12782

900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245

X Y 190.003
X 564.001

Clculo del coeficiente de regresin b


Magster Agustina Subelda Coronel

7
30
12
360

n=18

X 41.72

Y 18.06

Estadstica aplicada a la Educacin

n. XY X Y
n X X
2

18 12782 190003 230076 190003 40073

0.57
18 * 35245 564001 634410 564001 70409

Clculo del parmetro a o constante de la ecuacin de regresin;

a Y b X 18 . 06 0 . 57 41 . 72 18 . 06 23 . 7804

5 . 72

Sustituyendo estos valores en la frmula de la ecuacin de la recta de ajuste se tiene:

Y a bX 5.72 0.57 X , es decir Comprensin lectora = -5.72+0.57xVelocidad Lectora


Esta ecuacin de regresin puede usarse para calcular, la mejor estimacin de la Comprensin lectora (Y)
para cualquier valor de la Velocidad lectora (X). Sin embargo, esta asociacin debera ser validada mediante
pruebas de hiptesis adecuadas.

Magster Agustina Subelda Coronel

38

Estadstica aplicada a la Educacin

INFERENCIAS ESTADSTICAS
PRUEBAS DE HIPTESIS
Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine la poblacin entera.
Esto por supuesto sera imprctico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencia
que confirme o no la hiptesis. La prueba de hiptesis estadstica cuantifica el proceso de toma de decisiones.

Hiptesis
Explicaciones tentativas del fenmeno investigado que se formulan como proposiciones. Hernndez y et.al
(2004)

Hiptesis de investigacin (Hi): Proposiciones tentativas sobre las posibles relaciones ente 2 o ms variables
(Hernndez Sampieri, 2004)
Hiptesis nula (Ho); es aquella que se establece para ser rechazada o anulada, es decir es la hiptesis que
se quiere contrastar. Sirven para refutar o negar lo que afirma la hiptesis de investigacin.
Hiptesis alternativa (Ha); son posibilidades alternativas-ante las hiptesis de investigacin y nula. Ofrecen
otra descripcin o explicacin distintas a las que proporcionan estos tipos de hiptesis.
A continuacin se presentan ejemplos de las diversas hiptesis;
Hi: Los hombres le atribuyen ms importancia al atractivo fsico en sus relaciones heterosexuales que las mujeres.
Ho: Los hombres no le atribuyen ms importancia al atractivo fsico en sus relaciones heterosexuales que mujeres.
Ha: Los hombres /e atribuyen menos importancia al atractivo fsico en sus relaciones heterosexuales que mujeres.

Tipos de hiptesis segn la funcin en la investigacin:


Segn Hernndez y et.al (2004) algunos tipos ms usuales de hiptesis son:
a.

HIPTESIS DESCRIPTIVAS. Analiza las variables que se van a observar en un contexto o en la


manifestacin de otra variable. Este tipo de hiptesis puede o no relacionar variables y finalmente no
toda investigacin descriptiva puede tener hiptesis. Ejemplo:

"existe un alto porcentaje de egresados que no alcanzan el xito profesional"

"la mayora de ingresantes a la universidad estn entrenados en la memorizacin mecnica y de corto


plazo"

b.

HIPTESIS CORRELACIONALES. Especifican la relacin entre dos o ms variables; estas investigaciones establecen relaciones de dos o ms variables (correlacin bivariada o correlacin mltiple).
Alcanzan un nivel predictivo y parcialmente explicativo. En la correlacin no se habla de la variable dependiente y la independiente, esta es propia de investigaciones causales. Estas hiptesis se contextualizan en la realidad y se someten a pruebas empricas.

c.

Existe relacin entre la nota de estadstica y la nota de contabilidad.


Existe relacin entre el nivel intelectual de los nios y su comprensin lectora.

HIPTESIS QUE ESTABLECEN CAUSALIDAD. Esta hiptesis, adems de afirmar la relacin entre
dos o ms variables; tienen un sentido de entendimiento entre las variables. Es decir, establecen relaciones de causa- efecto

El estudiante que obtiene nota alta en estadstica, obtendr nota alta en contabilidad
El nio que tiene un alto nivel intelectual, tendr mejor comprensin lectora.

Magster Agustina Subelda Coronel

39

Estadstica aplicada a la Educacin


Observacin: No todos los problemas de investigacin requieren de hiptesis, los problemas descriptivos y
tcnicos pueden tenerlos, pero no es imprescindible. En los problemas explicativos es muy difcil prescindir
de ellas.

Grados de libertad
Los procedimientos estadsticos (instrumentos de medicin y tcnica) tienen limitaciones (distorsionan la interpretacin de los datos) que repercuten potencialmente en la valoracin exacta de parmetros de poblacin. En este sentido, el trmino de grados de libertad se emplea para referirse a qu tan flexible es un procedimiento estadstico. Por lo que, mientras ms grados de libertad se tenga, mejor, porque los grados de
libertad son el nmero de oportunidades de muestreo para compensar las limitaciones, distorsiones y debilidades potenciales en los procedimientos estadsticos. (Ritchey, 2001)

Tipos de error y nivel de significancia


Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido un error de tipo I.
Por otra parte si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha cometido un error
de tipo II. En ambos casos se ha producido un juicio errneo.
Para que las reglas de decisin sean buenas, deben disearse de modo que minimicen los errores de decisin, y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un intento de disminuir un
tipo de error suele ir acompaado de un crecimiento del otro tipo. En la prctica un tipo de error puede ser
ms grave que el otro, y debe alcanzarse un compromiso que disminuya el error ms grave, la nica forma
de disminuir ambos a la vez es aumentar el tamao de la muestra, que no siempre es posible.
Nivel de significancia o nivel de error de muestreo
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a correr el riesgo
de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por
, se suele
especificar antes de la muestra, de manera que los resultados no influyan en nuestra eleccin.
En la prctica es frecuente un nivel de significancia de 0.05 0.01, si bien se usan otros valores. Si, por
ejemplo, se escoge un nivel de significancia del 5% 0.05 al disear una regla de decisin entonces hay
unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera haberse aceptado; es decir,
tenemos un 95% de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hiptesis tiene una probabilidad del 5% de ser falsa.

Criterios para la seleccin de una prueba estadstica


Muchas veces nos preguntamos acerca de cules son las frmulas estadsticas correctas para un problema
particular. En este sentido, la tarea se vuelve ms fcil hacindonos las siguientes preguntas (Ritchey,
2001).

Cuntas variables estamos observando para esta prueba?


Cules son los niveles de medicin de las variables?, son variables nominales, ordinales o de razn/intervalo?
Estamos tratando con una muestra representativa de una sola poblacin, o con ms?
Cul es el tamao de la muestra, y/o cuntos grados de libertad estn disponibles para la prueba?
Existen circunstancias peculiares a considerar?

Magster Agustina Subelda Coronel

40

Estadstica aplicada a la Educacin


Pruebas estadsticas, sus aplicaciones y frmulas
Nombre de
la prueba

Estadstico de la
prueba

Correlacin
lineal simple
y regresin

n2
tr r
1 r 2

Correlacin
rho de
Spearman
de rangos
ordenados
Correlacin
gamma de
rangos ordenados
Prueba de
chi cuadrado
de asociacin

rs 1
G

N de
muestras

6 D 2

n(n 2 1)

f f
f f

O E 2
E

Tamao de la muestra/ grados de libertad

N, tipo y nivel
de medicin
de las variables

Peculiaridades o
suposiciones

gl n 2

Dos variables de
intervalo / razn
u ordinales de
tipo intervalo

n 10

Dos variables
ordinales

Requiere pocos rangos empatados

No aplica

Dos variables
ordinales

Tolera muchos rangos


empatados

gl ( f 1)(c 1)

Dos variables
nominales
/ordinales

Requiere al menos 5
casos por casilla

Las variables deben


relacionarse linealmente

DISTRIBUCIN t PARA UN ANLISIS DE CORRELACIN Y REGRESIN


El anlisis de correlacin y regresin (distribucin t, gl=n-2), a travs del coeficiente de correlacin r de
Pearson, se usa para comprobar una hiptesis de que existe relacin entre dos variables de intervalo/razn
2
u ordinales (una variable independiente X y una variable dependiente Y) cuando :
1. Se tiene una muestra representativa de una sola poblacin
2. Se tienen dos variables de de intervalo/razn u ordinales
3. No existe ninguna restriccin en el tamao de la muestra; pero generalmente cuanto ms grande sea n,
ser mejor
4. Un diagrama de dispersin de las coordenadas de las dos variables se ajusta a un patrn lineal
Por ejemplo
Estn relacionadas las calificaciones con las ausencias a clase?
Lista de verificacin para los seis pasos de la inferencia estadstica (Ritchey, 2001)
Preparacin de la prueba
Formule la pregunta de investigacin; liste las especificaciones, incluso las variables (X; Y), sus niveles de
medicin, la(s) poblacin(es) bajo estudio, y la(s) muestra(s) y el (los) tamao(s) de la(s) muestra(s); seleccione la prueba estadstica; proporcione observaciones de estadsticos y parmetros; y trace un diagrama
conceptual.
Seis pasos
Empleando el smbolo H para hiptesis
1. Enuncie la H estadstica y la H alternativa
El enunciado de la hiptesis estadstica es

H est : 0 , es decir no existe relacin entre las variables

Mientras que, el enunciado de la hiptesis alternativa depende del planteamiento de la pregunta de investigacin y pueden ser;

De dos colas, no direccional (es decir,

Segn Ritchey, Ferris 2001


Magster Agustina Subelda Coronel

41

0 ; existe una relacin)

Estadstica aplicada a la Educacin

0 ; existe una relacin negativa)


Una cola en la direccin positiva (es decir, 0 ; existe una relacin positiva)
Una cola en la direccin negativa (es decir,

2. Describa la distribucin muestral


Se describe la distribucin a ser utilizada, en este caso la distribucin t aproximadamente normal, los

gl n 2 . Si H est : 0 es verdadera y repetidamente se extraen muestras de tamao n de la po-

blacin en estudio, las r de las muestras se centrarn alrededor de cero con un error estndar inversamente relacionado con el tamao de la muestra (es decir, a mayor tamao de la muestra menor ser el
3
error estndar )

3. Determine el nivel de significancia ( ) y especifique el valor crtico de la prueba.

Frecuentemente se utiliza un nivel de confianza de 95%, al que le corresponde un nivel de significancia


de 5% (0.05), si bien se usan otros valores. Lo que significa, que hay unas cinco oportunidades entre
cien de rechazar la hiptesis cuando debiera haberse aceptado (error tipo I); es decir, tenemos un 95%
de confianza de que se ha adoptado la decisin correcta.
El valor crtico se determina a partir de la tabla de la distribucin t (ver anexo), se obtiene la
crticos de t para los niveles de significancia y los grados de libertad especificados.

t ; valores

4. Observe los resultados de la muestra en cuestin y calcule los efectos de la prueba, el estadstico de la
prueba y el valor p.
El estadstico de la prueba utilizado es
donde

tr r

n2
. Con gl n 2
1 r 2

t r = la prueba t para el coeficiente de correlacin r de Pearson


r = coeficiente de correlacin r de Pearson calculado en una muestra
n = tamao de la muestra

gl = grados de libertad
5. Tome la decisin de rechazo
La H est : 0 se rechaza cuando t r t , as p<0.05.
6. Interprete y aplique las mejores estimaciones en trminos cotidianos.
La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin

Existencia : describiendo la existencia de la relacin entre variables


Direccin : que puede ser positiva o negativa, se determina por el signo de r y b
Fuerza
: es la proporcin de la variacin en Y explicada por X, sabiendo que se relacionan y se
2

mide con r x100 .


Naturaleza : En este punto se interpreta la pendiente de la lnea de regresin b.

Ejemplo 20: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a

10

11

12

13

14

15

16

17

18

Velocidad lectora
(X)

69

68

38

50

57

33

30

38

39

22

20

37

62

35

41

50

43

19

Comprensin
lectora (Y)

29

30

10

21

24

11

12

08

07

05

03

06

28

12

09

20

16

02

La ley de los grandes nmeros sostiene que, para una distribucin muestral de medias, cuanto mayor sea el tamao de la
muestra n, menor ser el error estndar.
Magster Agustina Subelda Coronel

42

Estadstica aplicada a la Educacin


a) Probar la hiptesis de la existencia de relacin entre la velocidad lectora y la comprensin lectora en los
nios del 1 G
Preparacin para la prueba
Tanto el diagrama de dispersin como los datos de coeficiente de correlacin rxy 0,94 y regresin sugieren una relacin lineal. Sin embargo, el patrn lineal de la muestra tan slo puede ser el resultado del error
de muestreo.
Hiptesis de investigacin : Existe a relacin entre la velocidad lectora y la comprensin lectora en los nios
del 1 G?
: Variables; X = velocidad lectora, Y = comprensin lectora, ambas son variables
de intervalo/razn.
Poblacin
: nios del 1 G.
Muestra
: 18 nios
Procedimiento estadstico : la prueba t para la significancia del coeficiente de correlacin r de Pearson, distribucin t nos permite probar la hiptesis planteada.
Observaciones
: el diagrama de dispersin sugiere una relacin lineal; los datos y clculos son
Especificaciones

rxy 0,94

Y a bX 5.72 0.57 X n=18.

En el siguiente diagrama conceptual se visualiza la pregunta de investigacin.

Poblacin: Nios de 1
grado
X = velocidad lectora
Y= comprensin lectora
Es ?

Muestra: 18 nios
del 1 grado
r=0.94

Donde rho ( ) es el coeficiente de correlacin que se obtendra si el coeficiente de correlacin de Pearson


se calculara para la poblacin entera.
Seis pasos
1. Enuncie la H estadstica (algunos lo denominan tambin hiptesis nula) y la H alternativa

H 0 : 0 . Es decir, no existe relacin entre la velocidad lectora y la comprensin lectora


H alt : 0 . Es decir, existe una relacin positiva entre la velocidad lectora y la comprensin lectora.
De una cola (porque tiene direccin)

2. Describa la distribucin muestral


La distribucin t aproximadamente normal, con gl n 2 18 2 16 . Si H est : 0 es verdadera y repetidamente se extraen muestras de tamao 18 de la poblacin de nios de 1 grado, las r de las
muestras se centrarn alrededor de cero con un error estndar inversamente relacionado con el tamao
de la muestra.
3. Determine el nivel de significancia ( ) y especifique el valor crtico de la prueba.
Se define 0.05 , (en este caso se supone que si la hiptesis es rechazada tiene una probabilidad del
5% de ser falsa) de una cola, pues se supone una relacin positiva.
Magster Agustina Subelda Coronel

43

Estadstica aplicada a la Educacin


El valor crtico para

0.05 y gl 16 , es

t 1 . 746

se busca en la tabla de distribucin t anexa

4. Observacin
El diagrama de dispersin revela una relacin lineal, r=0.94. n=18
Efecto de la prueba = 0.94 (es decir, efecto = r

0.94 0 0.94 )

El estadstico de la prueba

n2
18 2
16
16
0.94
0.94
0.94
0.94 137.46 0.94 11.724
2
2
1 0.8836
0.1164
1 r
1 0.94
t r 11.02 Error Estndar
tr r

5. Tome la decisin de rechazo

t r 11.02 t 1.746 , y p<0.05, entonces la H est : 0 se rechaza y se acepta la


: 0 , es decir que existe una relacin positiva entre la velocidad lectora y la comprensin lecto-

Como

H alt
ra.

6. Interprete y aplique las mejores estimaciones en trminos cotidianos.


La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin
Existencia : existe una relacin positiva entre la velocidad lectora (VI) y la (VD) comprensin lectora
en los nios del 1 grado
Direccin

: la relacin es positiva, ya que r =0.94 y b=0.57 son positivos.

Fuerza

: r 0.94 100 0.8836 100 88 .36 % de la variacin de la comprensin lectora


se explica por la velocidad lectora en los nios del 1 grado.

Naturaleza : siendo b=0.57 puntos en la comprensin lectora por punto en la velocidad lectora, es decir, un aumento de un punto en la velocidad lectora se relaciona con un aumento de 0.57
en la comprensin lectora.
A partir de este anlisis se puede concluir que la comprensin lectora puede explicarse por la velocidad lectora, de esta manera la mejor estimacin de la relacin en la poblacin est dada por;

Y a bX 5.72 0.57 X , es decir Comprensin lectora = -5.72+0.57xVelocidad Lectora

Magster Agustina Subelda Coronel

44

Estadstica aplicada a la Educacin


PRUEBA DE DISTRIBUCIN CHI CUADRADO (

2)

Es el nombre de una prueba de hiptesis que determina si dos variables nominales (variables categricas)
estn relacionadas o no.
La prueba chi-cuadrado puede usarse para:

Prueba de independencia
La prueba es particularmente til para analizar la relacin de variables cualitativas nominales u ordinales y determinar si las dos variables son independientes o no, cuando se refiere a individuos de una poblacin con una muestra representativa de ella, la frecuencia esperada de cada casilla en la tabulacin cruzada por lo menos sea de 5 (cinco).
2

Los datos de variables cualitativas o categricas representan atributos y se organizan en tablas llamadas
tablas de contingencia o tablas de clasificacin cruzada.
TABLA DE CONTINGENCIA
Una Tabla de contingencia contiene datos recogidos contados y organizados (con r filas y c columnas)
tiene la siguiente forma:

V
A
R
A
Donde:

A1
A2
A3

Ar
Total

B1
O11
O21
O31

B2
O12
O22
O32

VAR B
B3

O13
O23
O33

Or1
C1

Or2
C2

Or3
C3

Bc
O1c
O2c
O3c

Orc
Cc

Total
R1
R2
R3
Rr
n

Oij ; es el nmero de sujetos que tienen las caractersticas Ai y Bj a la vez.


Rr ; (i=1,..,r) es la suma de la i-sima fila de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Ai
Cj ; (j=1,..,c) es la suma de la j-sima columna de la tabla. Es decir, es el total de sujetos que poseen la
caracterstica Bj
n ; representa el total de observaciones tomadas
La pregunta es: Existe o no relacin entre las variables X e Y?, es decir, si X e Y son o no independientes.

Magster Agustina Subelda Coronel

45

Estadstica aplicada a la Educacin


Lista de verificacin para los seis pasos de la inferencia estadstica (Ritchey, 2001)
Preparacin de la prueba
Formule la pregunta de investigacin; liste las especificaciones, incluso las variables (X; Y), sus niveles de
medicin, la(s) poblacin(es) bajo estudio, y la(s) muestra(s) y el (los) tamao(s) de la(s) muestra(s); seleccione la prueba estadstica; proporcione observaciones de estadsticos y parmetros; y trace un diagrama
conceptual.
Seis pasos para realizar una prueba

1. Lea cuidadosamente el enunciado del problema y realice una conjetura


Escribir la hiptesis estadstica (llamado tambin hiptesis nula) y la alternativa, y estipule la direccin
de la prueba

H est : 2 observ 0 : Las variables X e Y son independientes


2
Hiptesis alternativa H alt : obsev 0 : Existe alguna relacin entre X e Y
Hiptesis estadstica

La distribucin es una prueba que parte del supuesto de no relacin entre variables.
2

2.

Describa la distribucin muestral;

observ

O E 2

O: frecuencias observadas E: frecuencias esperadas


Donde la frecuencia esperada de cada casilla es
3. Determine el nivel de significancia
2

E casilla

gl f 1c 1

totalm

, f:fila y c: columna

arg inalporcol umna totalm arg inalporfil a


grantotal

y especifique el valor crtico de la prueba de la tabla estads-

tica (Anexo 2)
4. Observe los resultados en cuestin de la muestra y calcule los efectos de la prueba, el estadstico de
la prueba y el valor p (de extraer una muestra con diferencias entre las frecuencias observadas y las
esperadas tan inusuales o ms inusuales que aquellas observadas cuando, de hecho, no existe relacin
entre las variables), valor p<0.001

5. Tome la decisin de rechazo: Si
entonces rechace la hiptesis estadstica (hiptesis nula), y acepte la hiptesis alternativa al nivel de confianza del 95%, lo implica que las variables estn relacionadas.
6. Interprete y aplique las mejores estimaciones en trminos cotidianos
2

observ

Para tener en cuenta:


Si se utiliza algn software estadstico, el mismo arroja el resultado de chi-cuadrado junto con su significancia. En este caso, si el valor de la significancia es menor a 0.05 o a 0.01, entonces se acepta la hiptesis
de investigacin.
Ejemplo 21: Una institucin educativa realiz un estudio para verificar si el desempeo acadmico se relaciona con el grado de estado nutricional de los estudiantes del tercer ciclo. Para lo cual se elige una muestra
aleatoria de 300 estudiantes y se clasifican en la siguiente tabla de contingencia.
Grado de estado nutricional

I
II
Total por columna

Desempeo acadmico
Malo

Regular Bueno

42
54
96

24
78
102

30
72
102

Total marginal por fila

96
204
Gran total 300

Grado I= Malo/Regular
Grado II= Bueno

a) Probar la hiptesis de que el grado estado nutricional afecta el desempeo acadmico


Magster Agustina Subelda Coronel

46

Estadstica aplicada a la Educacin


b) Determine el grado de relacin
Preparacin de la prueba
Pregunta de investigacin; el grado nutricional de los estudiantes afecta su desempeo acadmico?
Variables cualitativas nominales en estudio; X=grado nutricional, Y= desempeo acadmico,
Poblacin bajo estudio; Estudiantes del tercer ciclo de una institucin educativa
Muestra (n); compuesta por 300 estudiantes del tercer ciclo de una institucin

Prueba estadstica; prueba de la relacin entre dos variables nominales


Observaciones de estadsticos y parmetros; Frecuencias observadas y frecuencias esperadas calcula2

das

Ecasilla

Grado de estado nutricional

I
II
Total por columna

Desempeo acadmico
Malo

Regular

Bueno

42(30,72) 24(32,64) 30(32,64)


54(65,28) 78(69,36) 72(69,36)
96
102
102

Seis pasos para realizar una prueba


1. Establece las hiptesis

Hiptesis estadstica H est


desempeo acadmico.

Hiptesis alternativa H alt


desempeo acadmico.

Total marginal por fila

96
204
Gran total 300

: 2 observ 0 : es decir, el grado estado nutricional es independiente del


: 2 obsev 0 : Existe una relacin entre el grado estado nutricional y el

La distribucin es una prueba que parte del supuesto de no relacin entre variables.
2

2.

Describa la distribucin muestral;

2 observ

O E 2

O: frecuencias observadas E: frecuencias esperadas


Donde la frecuencia esperada de cada casilla es
Grados de libertad:

Ecasilla

totalmarg inalporcolumnatotalmarg inalporfila

gl f 1c 1 2 13 1 2

3. Nivel de significancia:

grantotal

0,05 el valor crtico de la prueba 2 0 , 05 ; gl 2 5,99


;

(Anexo 2)

4. Observe los resultados en cuestin de la muestra y calcule los efectos de la prueba, el estadstico de

la prueba y el valor p (de extraer una muestra con diferencias entre las frecuencias observadas y las
esperadas tan inusuales o ms inusuales que aquellas observadas cuando, de hecho, no existe relacin
entre las variables), valor p<0.001 .

Magster Agustina Subelda Coronel

47

Estadstica aplicada a la Educacin

Magster Agustina Subelda Coronel

48

Estadstica aplicada a la Educacin


9 , 7683

5 , 99
5. Decisin de rechazo: Como
entonces rechace la hiptesis estadstica
(hiptesis nula), y se acepta la hiptesis alternativa.
6. Conclusin: se acepta la hiptesis alternativa con 95% de confianza sobre la existencia de una relacin
entre el grado estado nutricional y el desempeo acadmico.
2

ANEXO

Magster Agustina Subelda Coronel

49

observ

Estadstica aplicada a la Educacin

Magster Agustina Subelda Coronel

50

Estadstica aplicada a la Educacin

TABLA DE LA DISTRIBUCION CHI- CUADRADO.Valores crticos de la Chi-cuadrado.Para una combinacin particular de grados de libertad en el numerador y en el denominador, las entradas
representan los valores crticos de la Chi-cuadrado, correspondientes a un rea de extremo superior especificado de .-

AREAS DE EXTREMOS SUPERIOR ()

Grados de
Libertad

0.25

0.10

0.05

0.025

0.01

0.005

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

1.323
2.773
4.108
5.385
6.626
7.841
9.037
10.219
11.389
12.549
13.701
14.845
15.984
17.117
18.245
19.369
20.489
21.605
22.718
23.828
24.935
26.039
27.141
28.241
29.339
30.435
31.528
32.620
33.711
34.800

2.706
4.605
6.251
7.779
9.236
10.645
12.017
13.362
14.684
15.987
17.275
18.549
19.812
21.064
22.307
23.542
24.769
25.989
27.204
28.412
29.615
30.813
32.007
33.196
34.382
35.563
36.741
37.916
39.087
40.256

3.841
5.991
7.815
9.488
11.071
12.592
14.067
15507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773

5.024
7.378
9.348
11.143
12.833
14.449
16.013
17.535
19.023
20.483
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.852
34.170
35.479
36.781
38.076
39.364
40.646
41.923
43.194
44.461
45.722
46.979

6.635
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
37.566
38.832
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892

7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
25.188
26.757
28.299
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
41.401
42.796
44.181
45.559
46928
48.290
49.645
50.993
52.336
53.672

Magster Agustina Subelda Coronel

51

Estadstica aplicada a la Educacin


BIBLIOGRAFA

vila Acosta, Roberto. Estadstica Elemental Con 300 problemas resueltos (1996). Lima Per:
Nueva Edicin, Estudios y Ediciones R.

vila Acosta, Roberto. Introduccin a la Metodologa de la Investigacin La tesis Profesional Gua para elaborar la tesis - Aplicaciones y Ejemplos (1997). Lima Per: Estudios y Ediciones R.A,

Baranger. Construccin y anlisis de datos Introduccin al uso de tcnicas cuantitativas en la


Investigacin Social (1992). Argentina: Edit. Universitaria.

Hernndez Sampieri, R., Fernndez, C. y Baptista P. Metodologa de la Investigacin (2008). Mxico: Mc Graw-Hill.

Lebart, L., Morineau, A. y Fnelon JP. Tratamiento Estadstico de Datos - Mtodos y Programas
(1994). - Marcombo, Boixareu.

Levin, Richard. ESTADISTICA PARA ADMINISTRADORES. 7a. edicin. Editorial Prentice Hall Hispanoamericana, Pgs. 93-107

Montgomery, H W. Probabilidad y Estadstica para Ingeniera y Administracin (1995). Mxico:


Cia. Editorial Continental S.A 3ra. Edicin.

Murria y Spiegel. Probabilidad y Estadstica (1975). Mxico: Mc Graw-Hill.

Ritchey, Ferris J.. Estadstica para las Ciencias Sociales. (2001). Mxico: Mc Graw-Hill

Magster Agustina Subelda Coronel

52

You might also like