You are on page 1of 80

Apuntes de Estadstica elaborados por el Profr.

Oscar Arturo Herrera Estrada

DEPTO. DE DISCIPLINAS FILOSFICAS,


METODOLGICAS E INSTRUMENTALES

APUNTES DE ESTADSTICA
DEL PROFR. OSCAR ARTURO HERRERA ESTRADA
PRESIDENTE DE LA ACEDMIA DE INSTRUMENTALES
COLABORACIN DE LOS ESTUDIANTES EN LA SNTESIS DE LOS MISMOS:
(A TODOS MUCHAS GRACIAS)

TEMARIO

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Presentacin

Concepto de estadstica
Estadstica Descriptiva Paramtrica
Estadstica Descriptiva Inferencial
Estadstica no Paramtrica
Diseo Muestral
Planteamiento de problema y Prueba de Hiptesis
Probabilidad
Probabilidad Conjunta Condicional
Cociente t o t de student
La prueba X
Anlisis de Varianza en dos o ms direcciones por rangos de
Friedman
Anlisis de Varianza en una direccin por rangos de Kruskal
Wallis
Correlacin
Ecuacin de regresin
Cuestionario de estadstica

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

PRESENTACIN
Para quienes estudian por primera vez estadstica, incluso para aquellos que ya han tomado
algn curso, deben saber que es una materia sin mayores dificultades para ser abordada. l
tener que aplicar ciertas frmulas para lograr y presentar los resultados sobre los cuales se
podrn hacer anlisis ms objetivos, es agradable y sencillo, porque es muy fcil referir
sucesos (medibles), y expresarlos cuantitativamente.
La estadstica en sntesis es un imprescindible instrumento de apoyo en la investigacin, y
debe estar anticipada por un adecuado diseo metodolgico.
La estadstica, como instrumento de apoyo metodolgico tiene varias funciones: una vez
elegido algn tema a investigar, y tener con claridad los conceptos, de contar con cierta y
elemental informacin bibliogrfica. Si se requiere hacer uso de ella para tener datos de
campo directo entonces se utiliza.
Cualquiera que sea el universo, con la adecuada aplicacin de la estadstica se estar en la
posibilidad de realizar un representativo diseo muestral, de acuerdo a los requerimientos de
la investigacin y los recursos de que se dispone, como los son el recurso del tiempo, el
recurso humano, el material, el presupuesto, etc. (Tema especial donde analizaremos desde
la adecuada elaboracin de cuestionarios, lo mismo la aplicacin de las encuestas, el tipo y
tamao de la muestra con su nivel o grado de confianza preestablecido). Para posteriormente
hacer el acopio o la recoleccin de los datos, mismos que para su mejor anlisis e
interpretacin se tienen que organizar, ordenndolos quizs en continuo ascendente y
presentndolos en tablas o en grficas estadsticas.
Plasmar numricamente las investigaciones con el uso de la estadstica es la forma ms
adecuada y fcil, tanto para presentar, como para leer, interpretar y analizar los fenmenos
cuantificables y as con mayor facilidad, poder obtener ciertas conclusiones, observaciones,
alternativas o propuestas, situacin que depende ms de la postura del investigador ante la
realidad, que de la estadstica ya que sta no condiciona a la teora sino que es un
imprescindible instrumento que bien utilizado te sirve de mucho apoyo.
Aun resulta para ti ms sencillo y fcil saber que no hablamos de la estadstica en abstracto
ni en trminos muy generales, sino que haremos referencia a la estadstica aplicada tanto a la
psicologa, como a la medicina, a la educacin, etc. por lo que a travs de ejemplos prcticos
y comunes a estas carreras del rea de la salud, las asignaturas de estadstica sern ms
gratas y aceptables.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

CONCEPTOS BASICOS

Estadstica- es un instrumento de apoyo a la teora que sirve para recopilar los datos
mediante un adecuado diseo muestral, para ordenarlos y organizarlos en tablas o en
grficas estadsticas, mismas que facilitan los anlisis y nos ayudan a obtener relativas
conclusiones con bases ms slidas; adems, sobre la base del conocimiento, de nuestra
muestra podremos inferir comportamientos de la poblacin con niveles o grados de
confianza menores al 100%, y hacer si se requiere, comparaciones entre el
comportamiento de varias muestras.

1.
2.
3.
4.
5.
6.
7.
8.
9.

Pasos de la Estadstica
Eleccin del tema.
Delimitar el tema
Justificacin.
Planteamiento del problema Qu quiero saber?.
Objetivos (tanto generales como particulares o especficos).
Marco terico o antecedentes, a travs de la investigacin bibliogrfica.
Estudio de campo.
Diseo de muestra.
Eleccin del tipo de muestreo.

Estadstica paramtrica Es la que requiere que los elementos que integran las muestras
contengan elementos parmetros o medibles ejemplo; (edad, peso, nivel de ingresos,
grado educativo, etc.)

Estadstica Descriptiva Es un instrumento de apoyo para describir ms claramente los


sucesos o fenmenos del comportamiento de la poblacin, o del universo de estudio, a
travs de grficas o tablas.
Paramtrica

Requiere, que los elementos que integran las


muestras sean medibles, y a partir del
conocimiento de la muestra inferimos el
comportamiento de la totalidad del universo
de estudio pero con niveles o grados de
confianza menores al 100%.

Es la que no requiere que los elementos que


integran las muestras elementos medibles o
parmetricos, solo requiere que los
elementos que integran las muestras tengan
alguna caracterstica en comn: hombresmujeres,
fumadores-No
fumadores,
universitarios no universitarios, liberales o
conservadores, etc.

Estadstica
Descriptiva

NO Paramtrica

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

ESTADSTICA PARAMTRICA INFERENCIAL: Requiere que las muestras contengan


elementos paramtricos, y a partir del conocimiento de la muestra inferimos
comportamientos de la totalidad del universo de estudio o de la poblacin, con niveles o
grados de confianza menores al 100%

PROBABILIDAD:

Es una posibilidad medible que se basa en los sucesos esperados en


relacin a las observaciones de sucesos anteriores; o se basa tambin en sucesos
esperados en relacin a los sucesos posibles. Ejemplo: con una moneda puede caer
guila o sello. Si esperamos que caiga guila el procedimiento es el siguiente:
Suceso esperado A .
A = guila S = sello.

Suceso posible A S = .5 = 50 % (es como razonamos para saber la probabilidad de


que caiga guila)

DISEO MUESTRAL: Es el procedimiento que nos garantiza que una muestra es


realmente representativa de la poblacin y esta integrado por tamao de la muestra, por el
tipo de muestreo, por un diseo adecuado del cuestionario, la acertada capacitacin de los
encuestadores y los recursos, stos son todos los elementos que se contemplan para
obtener una muestra representativa evitando en lo posible sesgos (falso, mentira), mismo
que est integrado por: Elementos de muestreo y elementos de no muestreo.

Estadstica no paramtrica. Es la que no requiere que quienes integran la muestra


contengan elementos paramtricos, solo requiere que los elementos contengan algunas
caractersticas en comn. Ejemplo fumadores universitarios y fumadores no universitarios,
hombres o mujeres, etc.

Correlacin. Es una asociacin existente entre dos variables donde una de las variables
por lo general X es independiente y la otra por lo general Y es dependiente.

VARIABLES

DEFINICIN: Es una propiedad o caracterstica del sujeto, cosa o elemento que se estudia,
el cual puede variar en la medicin de un sujeto a otro.
Ejemplos: sexo, religin, escolaridad, edad, aprendizaje, inteligencia, etc.
La variable se aplica a un grupo de personas u objetos, los cuales pueden adquirir diversos
valores respecto a la variable. Seta adquiere valor para la investigacin cientfica cuando
pueden ser relacionadas con otras (formar parte de una hiptesis o una teora).
En investigacin, la identificacin de variables inicia desde el momento en que se define el
problema a investigar y se formulan los objetivos. Este proceso continua cuando se trabaja en
la construccin del marco terico; momento en que se identifican las variables que se
relacionan con el problema de estudio y en que se conceptualizan las mismas.
Por ejemplo: en una investigacin sobre diabetes, hbitos de alimentacin de los diabticos
que acuden a la UMF 89, del IMSS el problema seala las variables principales
(concentracin de glucosa en sangre, consumo de alimentos), mientras que otras variables

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

pueden ser identificadas en los objetivos como son: conocimiento sobre la diabetes, sobre su
tratamiento, autocuidado y actividad educativa.
La identificacin de las variables de estudio es sumamente importante, tal vez tanto como
haber hecho una buena identificacin del problema; sin embargo, no basta con identificarlas;
es necesario definir en forma ms precisa que es lo que se va a estudiar y cmo se va a
entender cada trmino a fin de evitar confusiones ambigedades.
Operacionalizacin de variables.
La operacionalizacin de una variable consiste en llevar la variable de un nivel abstracto a un
plano ms concreto y su funcin bsica es precisar al mximo el significado que se le otorga
a una variable en un determinado estudio. Hermida plantea que operacionalizar las variables
significa explicar como se van a medir. La operacionalizacin es una de las tareas ms
difciles del proceso de investigacin; sin embargo, es un momento de gran importancia pues
tendr repercusiones en todos los momentos siguientes, razn por la que se le debe de
prestar mucha atencin.
En algunos casos las variables que aparecen enunciadas en los objetivos y en el marco
terico no ofrecen mayor dificultad en cuanto a su descripcin, definicin y medicin. Por
ejemplo: edad, ingreso, aos de escolaridad, nmero de hijos. Estas son variables simples
cuya comprensin es ms fcil. Sin embargo, es frecuente que se incluyan variables de
mayor complejidad que tienen que ser definidas claramente para entender su significado y
para llegar a su medicin. Ejemplo de stas sera: marginacin socioeconmica, trato
humanizado al paciente, satisfaccin con un programa educativo, accesibilidad a los servicios
de salud, calidad de la atencin brindada.
Es evidente que cada persona tiene una conceptualizacin diferente de lo que es el
significado de estos trminos o caractersticas y que si tratamos de hacer la medicin de
estas variables antes de haberlas conceptualizado y definido claramente, al final tendramos
informacin poco vlida y poco confiable.
Ejemplo de la operacionalizacin de una variable sencilla y una compleja:
Variable

Sencilla
Edad
Compleja
Accesibilidad a los
servicios de salud

Definicin
conceptual

Dimensiones
(variables
contenidas en la
definicin
conceptual)
Aos cumplidos de la Ninguna
persona
Accesibilidad
Mayor o menor
geogrfica
posibilidad de tomar
contacto con los
Accesibilidad
servicios de salud
econmica
para recibir
asistencia
Accesibilidad cultural

Indicadores
Definicin operacional

de 1 a 99 o ms.
Tiempo medido en horas y
minutos que tarda una persona
para trasladarse de su domicilio
al centro de salud
Cantidad de dinero que gasta
para recibir la atencin.
Disponibilidad econmica para
cubrir el gasto.
Conocimientos sobre la atencin

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

que se da en el centro de salud.


Percepcin del problema de
salud.

Medicin de variables
Una vez definidas las variables de tal forma que faciliten la observacin emprica en
necesario considerar el tipo de medicin que debe realizarse para lograr lo planteado en la
investigacin. Antes de discutir cuestiones relacionadas con la medicin, es necesario
algunos aspectos generales de sta, tales como su naturaleza, niveles, escalas, alcances y
su relacin con la validez y confiabilidad.
Segn Escalante, medicin es la clasificacin de casos o situaciones y sus propiedades, de
acuerdo a ciertas reglas lgicas.
Tal como se ha comentado anteriormente, al hablar de las variables y los valores que stas
pueden tomar, la clasificacin puede hacerse en trminos de categoras o de valores
numricos que las variables asumen en una escala.
Siegel indica que la medicin se refiere generalmente a la asignacin de nmeros a las
observaciones, de modo que los nmeros sean susceptibles de anlisis por medio de
manipulaciones y operaciones de acuerdo con ciertas reglas. La relacin con los objetos que
se estn observando y los nmeros es tan directa que mediante la manipulacin de los
nmeros se obtiene nueva informacin acerca de los objetos.
En resumen, medicin se refiere a la cualificacin o cuantificacin de una variable para un
estudio dado, en consecuencia, las variables se clasifican segn la capacidad o nivel en que
permiten medir los objetos, es decir, que la caracterstica ms comn o bsica de una
variable es la de diferenciar entre la presencia o ausencia de la propiedad que ella enuncia.
La clasificacin bsica de las variables es la que permite asignar distintos valores cualitativos
o cuantitativos para los diferentes fenmenos bajo estudio.
Cuando se habla de una variable cualitativa se refiere al hecho de no sta no puede ser
medida en trminos de la cantidad de la propiedad presente, sino que solo se determina la
presencia o no de ella; (ejemplo: sexo, ocupacin, religin, procedencia, estado civil); y no es
posible asignarles un mayor o menor peso a las categoras, lo nico que se puede hacer es
clasificarlas.
Las variables de corte cuantitativo son aquellas cuya magnitud puede ser medida en trminos
numricos, esto es, que los valores de los fenmenos se encuentran distribuidos a lo largo de
una escala; (ejemplo: edad, peso, talla, escolaridad, debido a que) y se les puede asignar un
mayor o menor peso a cada una de ellas. Estas a su vez pueden dividirse en discontinuas y
continuas, segn su unidad de medicin; es decir si se pueden fraccionar como la
temperatura (36.5, 36.8) o en su defecto la medicin en por medio de nmero completos
(nmero de hijos).
Con respecto a las escalas de medicin, las variables pueden clasificarse en cuatro clases:
Escala nominal: es el nivel ms elemental de medicin y consiste en clasificar los objetos de
estudio segn las categoras de una variable: ejemplo: estado marital que se clasifica as:
soltero, casado, viudo, divorciado, unin libre. Seta clasificacin solo nombra los indicadores

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

de la variable pero no representa ninguna jerarquizacin, dado que todos los indicadores se
encuentran al mismo nivel.
Escala ordinal; Este tipo de escala se utiliza para clasificar los objetos, hechos o fenmenos
en forma jerrquica, segn el grado que posea una caracterstica determinada, sin
proporcionar informacin sino la magnitud de las diferencias entre los casos as clasificados;
ejemplo: tipo de higiene (excelente, buena, regular, mala).En este caso se refleja distancia
entre una y otra categora, o cunto es mayor una de otra.
Escala de intervalo; Es la que clasifica a la variable de acuerdo a un rango numrico. Este
tipo de escala intervalar mide las variables cuantitativas, siendo igual la distancia entre dos
puntos o valores de un continuo. Sin embargo el punto cero es arbitrario y convencional, por
lo que no se pueden establecer razones o proporciones, ni comparar dos escalas sin definir el
mismo punto departida. Las variables de inteligencia, rendimiento acadmico y temperatura,
debido a que el punto cero es arbitrario; tomando como ejemplo la temperatura, se puede
decir que el cero no representa la ausencia de calor; sin embargo, la distancia entre
cualesquiera dos puntos de la escala es igual, o sea, que el cambio de temperatura entre 36
y 37C es igual al cambio entre 40 y 41C. Al medir temperatura, no se puede decir que 20C
es el doble de 10C. Esto debido a que cuando el termmetro marca 0 grados; en realidad la
temperatura es de 273 grados. Por esto solo podemos decir que una temperatura de 20
grados es 10 grados ms que una de 10.
Escala de proporcin razn; Este tipo de escala constituye el nivel ms alto de medicin
para las variables cuantitativas; contiene las caractersticas de una escala de intervalo con la
ventaja adicional de poseer el cero absoluto, lo cual permite determinar la proporcin
conocida de valores de la escala. El peso, la talla y nmero de alumnos son ejemplos de
variables de razn o proporcin, en las que el cero representa la nulidad o ausencia de lo que
se estudia. Por esta propiedad de la escala se puede establecer razones tales como se dan
en la variable peso, en la cual se dice que un peso de 50 libras es el doble de uno de 25 kilos,
o uno de 100 kilos es 4 veces mayor que uno de 25.
Referentes:
Pineda EB, De Alvarado EL, De Canales EH. Metodologa de la investigacin. Manual para el
desarrollo del personal de salud. Serie PALTEX para Ejecutores de Programas de Salud
No.35. OPS, segunda edicin. Washington, D.C., 1994.
Hernndez Sampieri R, Fernndez Collado C, Baptista Lucio P. Metodologa de la
investigacin. Editorial Mc. Graw Hill. Segunda edicin, Mxico, 1998.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

DISEO MUESTRAL
MUESTRA: se define como una parte que representa en algo al conjunto, a la totalidad. Por
lo que la muestra debe contener las caractersticas que la identifican con la totalidad.
Entre ms grande es el universo, la muestra debe ser ms representativa, es decir a
mayor muestra, mayor confiabilidad.
DISEO MUESTRAL: Son todos los elementos que se contemplan para obtener una muestra
representativa evitando en lo posible sesgos (falso, mentira), mismo que est integrado
por:
Errores de muestreo:

Tamao de la muestra
Tipo de muestreo

Errores de no muestreo:

Diseo del cuestionario.


Capacitacin de encuestadores.
Recursos.

n = N (r)
(N 1) D + R

n = tamao de la muestra.
N = tamao de la poblacin, universo o totalidad.
r = varianza total r = p x q
p+q=1
p = varianza de la poblacin.
D = confianza total.

Varianza de la poblacin es igual al porcentaje de la variable principal de estudio, ejemplo:


Si en una poblacin la variable principal de estudio son las mujeres y stas representan el
60%, entonces p=.6 por lo tanto q=.4 p x q = (.6) (.4) = .24
Cuando se desconoce el porcentaje de la variable principal de estudio, la varianza es igual a .
5 (p = .5) que es la mxima varianza, porque p x q = (.5) (.5) = .25
D = B2/4
B = porcentaje de error de muestreo, o complemento del nivel o grado de confianza.
B =.02 En este caso el nivel o grado de confianza es del 98% = .98 por lo que B = .02
EL TAMAO DE LA MUESTRA DEPENDE DE :
EL TAMAO DE LA POBLACIN

DEL

n=

NIVEL

GRADO DE CONFIANZA

N ( r)
(N-1) D + r

n = tamao de la muestra
N = tamao de la poblacin (real o estimado aproximado)
r = (p)(q)
p + q = 1 por lo tanto 1-p = q
P = Varianza de la poblacin. Cuando se desconoce el valor de la Varianza se maneja:

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

P =.5 por lo tanto


q =.5
D = B2
4
B = complemento del nivel o grado de confianzas
PROBLEMA COMO (EJEMPLO).
N = 3930,160 personas que integran el universo de estudio
95% B = .05
D = (.05)2
D = .0025
D = .000625
4
4
r = (.5)(.5) r = .25
n = (3930,160) (.25)
(3930,159)(.000625)+.25
N = 3930,160
D = (.02)2
D =.0004
4
4
n =(3930,160)(.25)
(3930,159)(.0001)+.25

n = 982540
2456.59
98%

n =399

redondeado n = a 400

B = 0.02

D =.0001
r = .25
n = 982 540
393.2659

n = 2498.41 redondeado n = a 2,500

PROBLEMA
1. De una poblacin de aspirantes al Bachillerato General a la U. de G. que en nmero son
13,220. Obtener el tamao de la muestra con un nivel de confianza del 98% y 95%
n = 13,220
n = N ( r)
D = B2
98%
(N-1) D + r
4
D =.0001
n = (13,220)(.25)
n = 3 305
n = 2,102.5
(13,219)(.0001)+.25
1.5719
Redondeando n, es igual a 2,100
N = 13,220
95%
D = .000625

n = (13 220)(.25)
n = 3 305 n = 388.320
(13 219)(.000625)+.25
8.511

Redondeando n, es igual a 390


Realiza los siguientes ejercicios:
1.- N = 100,000
Nivel de confianza = 98%
r = se desconoce
2.- N = 100,000
Nivel de confianza = 95%
r = se desconoce
3.- N = 100,000
Nivel de confianza = 95%
P =.3

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

4.- N = 400
Nivel de confianza = 95%
r = se desconoce
TIPOS DE DISEOS DE MUESTREO
MUESTREO AL AZAR ALEATORIO O PROBABILSTICO.
Considera que todos los elementos de la poblacin tienen la misma probabilidad de ser
elegidos como parte de la muestra. Ejemplo: las primeras 385 personas que nos encontremos
las encuestamos.
MUESTREO AL AZAR ALEATORIO ORDENADO.
Considera que todos los elementos de la poblacin tienen la misma probabilidad de ser
elegidos como parte de la muestra, pero con un orden. Ejemplo: cada 5 personas, una si y
cuatro no.
MUESTREO AL AZAR ALEATORIO ORDENADO SISTEMATIZADO:
Todos los elementos tienen la misma probabilidad de ser elegidos, pero con un orden y un
sistema. Ejemplo: el primero, el de enmedio y el ltimo de la lista de cada grupo del CUCS.
MUESTREO POR CONGLOMERADO O AGRUPAMIENTO:
Todos los elementos tienen la misma probabilidad de ser elegidos siguiendo un orden, un
sistema, pero es correspondiente o exclusivo de un tipo de poblacin. Ejemplo: una escuela,
una colonia, aficionados a algn espectculo, la gente de un tianguis, etc.

MUESTREO ESTRATIFICADO:
Sigue un orden, sistema y agrupamiento, pero afirma que la poblacin no es homognea sino
heterognea, por lo tanto se deben considerar en la muestra estratos de la poblacin.
Ejemplo: Hombres/mujeres, nivel econmico o clase social, niveles de estudio, etc.
MUESTREO COMBINADO:
Sigue orden, sistema, agrupamiento, y estratos, pero es el muestreo que nosotros nos
proponemos realizar pero con previa y plena justificacin.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

DISEO DEL CUESTIONARIO


1. Todo cuestionario en un principio es piloto, hasta que se defina que ya est aprobado,
despus de un breve ensayo o de la aplicacin de un pequeo muestreo.
2. Todo cuestionario debe llevar encabezado a manera de presentacin, de explicar el
propsito, los objetivos la intencin.
3. Debe captar los datos generales del encuestado, como; sexo, edad, escolaridad, etc. , a
excepcin el nombre y el domicilio de los encuestados, para evitar que se inhiban.
4. Debe estar basado en el planteamiento inicial del problema.
5. No debe tener preguntas de ms ni de menos. Slo las que se requieran.
6. El lenguaje debe ser comn (no corriente ni cientfico). O con tecnicismos.
7. La mayora de preguntas deben ser cerradas y si es posible utilizar claves, opciones de
abanico. Las claves son utilizadas para preguntas abiertas, cuando una letra representa las
convicciones de las personas sin que stas se den cuenta, slo el encuestador.
8. Desde el diseo del cuestionario se deben tambin disear los elementos del vaciado.
9. Las preguntas no debe empezar con SI o NO.
10- Ninguna pregunta debe inducir a la respuesta, ni hacerse en forma de negacin, tampoco
comenzar con, Verdad que...
11- Se recomienda iniciar por preguntas sencillas y luego las relativamente ms complicadas,
esto va de acuerdo con la intimidad o grado de dificultad de la pregunta.
CARACTERISTICAS DEL ENCUESTADOR
Preferentemente que el encuestador sea el propio investigador, pero si no que el
ayudante tenga la instruccin adecuada.
Es importante que el encuestador tenga presente las caractersticas de los
encuestados.
Debe de manejar un lenguaje comn
Adaptarse al horario
Tener buen carcter y una posicin neutral, pero sobre todo mucha tica.
RECURSOS POR ORDEN JERARQUICO

El Recurso del Tiempo


El Recurso Humano
El Recurso Econmico
El Recurso Material.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Ya una vez hecha la encuesta:


1.-Acopio
De una muestra se seleccionaron 13 personas con un padecimiento similar pero poco comn,
cuyas edades diferentes oscilan entre los 7 y 18 aos; los resultados fueron los siguientes:
7, 15, 18, 16, 17, 8, 13, 10, 8, 8, 12, 18, 12
2.-Ordenar ascendentemente los datos obtenidos
7, 8, 8, 8, 10, 12, 12, 13, 15, 16, 17, 18, 18
3.- Medidas de tendencia central
x/n= X

162/13= 12.46

Media aritmtica es igual a 12.46 redondeando es igual a 12.5


4.-Moda (El predominante), o el que tiene la frecuencia ms alta
Mo = 8
5.-Mediana n +1 = 13+1 = 14 = 7 lugar
= 12
2
2
2
n+1/2
7, 8, 8, 8, 10, 12, 12, 13, 15, 16, 17, 18, 18,
6.-Rango o amplitud total
Lmite superior Lmite inferior + 1
18 7 + 1 = 12
7.-Divisiones del rango en grupos, clases o intervalos (deben ser del mismo tamao)
7-10
11-14
15-18

Frecuencia
5
2
5

Media Aritmtica X = (F X) = 145


n
13

X
8.5
12.5
15.5
=

11.15

FX
42.5
25
77.5
145

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

ENCUESTA
De una encuesta realizada por 28 alumnos en la Zona Centro de Guadalajara, a un total de
448 encuestados. La pregunta es te has visto obligado a faltar a tu trabajo o a tu escuela por
lo menos un da a consecuencia del padecimiento de alguna enfermedad en los ltimos dos
meses? y qu edad tienes?
Las edades de los que respondieron que si haban faltado por causa de alguna enfermedad:
ACOPIO O RECOLECCIN DE DATOS
14,16,21,12,20,25,40,27,30,24,35,50,19,18,18,24,25,28,30,20,28,50,12,47,35,17,30,32,45,15,
19, 22, 46,32,52,42,22,46,25,20,30,32,21.
Los que faltaron por causa de enfermedad fueron 43 que equivalen a 448/43= .0959 es decir,
el 9.59% de los encuestados.
ORDENAR.

Las

edades

de

menor

mayor:

12,12,14,15,16,17,18,19,19,20,20,20,21,21,22,22,24,24,25,25,25,27,28,28,30,30,30,30,32,32,
32, 35,35,40,42,45,46,46,47,50,50,52.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIN AGRUPAR:
* RANGO.- Es la distancia existente entre el dato menor y el dato mayor ms uno, tambin se
le conoce como amplitud total.
r = Ls - Li + 1
52 - 12 + 1 = 41
* FRECUENCIA.- Es la cantidad (en este caso) de personas que hay en cada intervalo.
* MARCA DE CLASE.- Es igual a punto medio de cada clase, que es igual al lmite inferior
ms lmite superior entre dos.
X = Li + Ls / 2
MODA: Dato que se repite ms o tiene la frecuencia ms alta, en este caso la moda es 30.
MEDIANA: En medio de todos los datos, la frmula es Md = n + 1 / 2 n = nmero de
vctimas. Md = 43 + 1 / 2

Md = 44/2 = 22 lugar. La edad que se encuentre en el lugar

nmero 22 es la mediana, en este caso 25 aos.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

MEDIA ARITMTICA: Es la suma de todas las edades entre el total de datos, la frmula es
X = x/n X= 1198/42=27.86 La media aritmtica o el promedio de edad redondeado es de
28 aos.

CAMPANA DE GAUSS O CURVA NORMAL


Lepticurtica

curva normal

12______________52
Mayora de datos centrados

12_______________52
distribucin normal

plasticurtica

12________________52
Datos muy dispersos

Las medidas de dispersin se miden a partir de la media aritmtica.


RANGO COMO AMPLITUD TOTAL. La diferencia entre 12 y 52 es de 40 aos, incluidos
ambos lmites es 41
r = LS-LI +1 En base al rango el investigador elige en cuantas clases o grupos lo divide.
r = rango o amplitud total
LS = lmite superior
r= 52-12 + 1 = 40 + 1 r = 41 1, en este caso, como es

LI = lmite inferior

nmero primo le aumentamos otro ms para que sea divisible.


Separamos los grupos en tres clases o intervalos de igual tamao en ste caso de l4
personas:
GRUPOS

FRECUENCIA (f)

MARCA DE CLASE O PUNTO MEDIO (x)

12-25 aos

22

12 + 25 /2= 18.5

26-39 aos

12

26 + 39 /2= 32.5

40-53 aos

40 + 53/2= 46.5

x= x/n

Media aritmtica para datos agrupados es la sumatoria de la multiplicacin de

frecuencia por marca de clase dividido entre las vctimas.


1

En el caso de que con el rango que obtuvimos no podamos agrupar podemos aumentarlo, en este caso se
aumenta la edad a 53 aos y as el rango aumenta a 42.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

x= x /n
22 18.5 = 407
12

32.5 = 390

x= 1215.5/ 43 = 28.26

9 46.5 = 418.5
= 1215.5
Para obtener la moda para datos ordenados y agrupados aplica la siguiente formula:
Moda =

L +

d1__

d1 + d2
donde L = limite inferior de la clase modal (es decir, la clase con mayor frecuencia)
d1 = frecuencia de la clase modal menos frecuencia de la clase anterior
d2 = frecuencia de la clase modal menos frecuencia de la siguiente clase.
c = amplitud del intervalo de clase o tamao de clase.
Para obtener la mediana para datos ordenados y agrupados aplica la siguiente formula:
Mediana = L + n/2

- F

Fm
Donde L = limite inferior de la clase mediana ( es decir, la clase que contiene al elemento
mediano de la distribucin).
n = nmero de observaciones en el conjunto de datos, o total de los datos.
F = suma de las frecuencias en las clases inferiores a la clase mediana.
fm = frecuencia de la clase mediana
c = amplitud del intervalo de clase o tamao de clase.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

EJERCICO;
- HACER UN EJEMPLO CON LOS DATOS DE PERSONAS ATENDIDAS POR
CONGESTIN

ALCOHOLICA EN EL MES DE ENERO DE 2001 EN LA CRUZ

ROJA DE GUADALAJARA.
ACOPIO DE DATOS:
16,21,20,40,30,19,25,28,30,28,50,12,47,35,32,45,19,22,46,32,52,42,22,46,30,32.
Total de atendidos por congestin alcohlica 26.
ORDENAR: 12,16,19,19,20,21,22,22,25,28,28,30,30,30,32,32,32,35,40,42,45,46,46,47,50,52.
Medidas de tendencia central para datos sin agrupar.
Moda = 30 y 32
Mediana = n + 1 / 2

Md = 26 + 1 / 2= 27/2 = 13.5 Como se redondea a 14 y es par se

promedian los aos 30 + 30 / 2 = 30 La mediana es 30.


Media aritmtica es la suma de las edades entre el nmero de personas atendidas.
x = 821/26= 31.57 redondeado a 32 el promedio de edad.
Medidas de dispersin a partir de la media aritmtica
Rango = 52-12 + 1= 41 aumentamos la edad a 53 para obtener un rango de 42 y dividir en 3
intervalos de 14 persona.
Grupo

frecuencia

marca de clase

12-25

12 + 25/2 = 18.5

9/26

26-39

26 + 39/2 = 32.5

18

9/26

40-53

40 + 53/2 = 46.5

26

9/26

Media aritmtica para datos agrupados


9 18.5 = 166.5
9 32.5 = 292.5
8 46.5 = 372
831 / 26 = 31.9 redondeado a 32
1.- Opten de los siguientes datos;
1.- Media aritmtica

frecuencia acumulada frecuencia relativa

x= x/n

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

2.- Medida de tendencia central


3.- Mediana
4.- Rango o amplitud total.

Acopio o recoleccin de datos


19, 19, 19, 20, 18, 22, 18, 18, 18, 19, 19, 19, 19, 20, 21, 23, 22, 17, 18, 18, 20, 18, 20, 19, 19,
19, 19, 18, 18, 18, 25
Medidas de Dispersin
DESVIACIN MEDIA (D.M.) Es igual ala sumatoria de diferencias entre la media aritmtica y
marcas de clase, dividida a su vez entre el total de datos.
__
D.M. = (X - X ) n
Es decir la diferencia entre la media aritmtica para datos agrupados y la marca de clase (tres
en este caso)
x = 28.26
28.26 - 18.5 = 9.76
32.5 - 28.26 = 4.24
46.5 - 28.26 = 18.24
32.24 / 43 = .749 = DM = .75
VARIANZA (S) Es la sumatoria de las diferencias entre las marcas de clase y la media
aritmtica al cuadrado por la frecuencia entre la suma total de personas menos uno.
2
S

__
2
( X - X) f n - 1

9.76 = 95.25 (22) = 2095.5


4.24 =17.97 (12) = 215.64
18.24= 332.69 (09) = 2994.27
5305.41 / 42
DESVIACIN ESTNDAR (S) S =

S =

126.32
(x-x) f /n-1

ERROR ESTNDAR (Sx)


_
____
S x = S n 1 = 11.23 / 42 = 11.23/6.48= 1.73

S = 11.23

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

INFERENCIA ESTADSTICA: inferir es conocer el comportamiento de la poblacin o universo


con niveles de confianza menores al 100% a partir del conocimiento de la muestra.

10 _ 12

17

X = 11
M: media aritmtica de la poblacin.
_
Cul es el nivel de confianza de que M se encuentre entre 10 y 12 aos?
_ _
M=X -+ SX
Sx
_
_
_
Z= X M
SUPUESTO NECESARIO:
M=X
_
SX
_
Z1 = X1 -M
Z1 =
10 11
Z1 = -11
_
SX
1
_
Z2 = X2 M
Z2 =
12 11
Z2 = 1
_
SX
1
Cul es el nivel de confianza de que se encuentre M para un rango establecido entre 9 y
12.5 aos?
Z1 = 9 11
1

Z1 = -2

Z2 = 12.5 11

Z2 = 1.5

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Media Aritmtica de la Poblacin


Para saber en base a la muestra entre que rango o entre qu lmites se encuentra el
promedio de una poblacin de acuerdo a cierto nivel de confianza (90, 95 99 %, etc.)
M=X

+ x (%)

x (%)

Constantes preestablecidas para estos niveles o grados de confianza


90%= 1.68
95%= 1.96
99%= 2.58
Cociente Z
Se utiliza para lograr saber el nivel o grado de confianza
7
X= 12.8
17
Z= X
M
18
x
Esta operacin se realiza a partir de la Media Aritmtica de la muestra, para inferir en que
rango o entre que limites se encuentra la media aritmtica de la poblacin.
Una vez que se obtenga el resultado de ambas operaciones se tendr que consultar la tabla
del porcentaje del rea de la curva.
Realiza las medidas de dispersin con los 31 datos del ejercicio anterior
Conociendo la media aritmtica de la muestra anterior que es 19.06 Entre que limites
o en que rango se encuentra la media aritmtica de la poblacin con niveles
preestablecidos del 90% constante de 1.68 95% constante de 1.96 y 99% constante
de 2.58?
Cul ser el nivel o nmero de confianza, si la media aritmtica se encuentra en un
rango entre el limite inferior de 18 y limite superior de 20?

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

CARACTERSTICAS DE TABLAS Y GRFICAS ESTADSTICAS


Encabezado: contenido de los datos (de qu hablan los datos, vctimas, edades)
Localidad: Zona centro de Guadalajara.
Fecha o periodo
Fuente: cmo o de dnde obtuvimos los datos?,

Y puede ser directa cuando nos constan

los datos de la encuesta e indirecta, de una agencia, un libro, revista, peridico, etc.
FORMAS DE PRESENTAR LOS DATOS. Grfica de barras, histograma, polgono de
frecuencia y grfica de pastel (o pay).
NMERO DE PERSONAS ENCUESTADAS EN LA ZONA CENTRO DEL MUNICIPIO DE GUADALAJARA, (POR EDADES)
DE QUIENES POR CAUSA DE ALGUNA ENFERMEDAD SE VIERON OBLIGADAS A FALTAR A SU TRABAJO O ESCUELA
POR LO MENOS UN DA, EN EL LTIMO MES
(ENCUESTA REALIZADA EN AGOSTO DE 2007)

En las grficas de barras, se debe presentar un eje X que es el mayor y un eje Y. En el


primero, van las frecuencias y en el eje horizontal van los intervalos de edades.

25
20
15
10
5
0
0-12

13-25

26-39

40-53

Para el polgono de frecuencia se encuentran y se sealan los puntos en el cruce de marca


de clase de cada intervalo, y su respectiva frecuencia y se unen los puntos.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

25
20
15
10
5
0
18.5

32.5

46.5

En la grfica de pastel 360 son equivalentes al 100% por lo que se divide la frecuencia de
cada intervalo entre el total de datos y el resultado se multiplica por 360
22/ 43 = .5116 X 360 = 183.6
12/ 43 = .2790 X 360 = 97.2
09/ 43 = .2090 X 360 = 72
.
Total = 360 grados
Los resultados pueden anotarse dentro o fuera de la grfica y sta puede estar a colores, con
su correspondiente indicador

40-53
21%

0-12
0%

26-39
27%

13-25
52%

Fuente: Directa, por medio encuesta


Intervalos

frecuencia absoluta

frecuencia acumulada

12-25

22

22

22/43

26-39

12

34

12/43

40-53

43

9/43

frecuencia relativa

f = frecuencia absoluta fa = Frecuencia acumulada fr = frecuencia relativa.


EJERCICIO

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

CAMBIAR DEL PROBLEMA ORIGINAL LAS FRECUENCIAS A 10, 22 Y 13 = 45


personas.
Media aritmtica para datos agrupados x = f x / n
frecuencia

marca de clase

10

18.5

185

22

32.5

715

13

46.5

604.5
1,504.5 / 45 = 34.43 = X

Desviacin media = (x-x) /n


34.43 - 18.5 = 15.93
34.43 - 32.5 =

1.93

46.5 - 34-43 = 12.07


29.93 / 45 = 0.6651
Varianza S = (x-x) f /n-1
15.93 = 253.7649

10 = 2,537.649

1.93 =

22 =

3.7249

12.07 = 145.6849

81.9478

13 = 1,893.9037
4,513.5005 / 44 = 102.5795

Desviacin estndar, es la raz cuadrada de la varianza S= 10.1281


SX= S
N-1
Error estndar 10.1281/ 44 = 10.1281/ 6.6332

Sx= 1.5268

Tambin

es

conocido como elemento de inferencia estadstica.


INFERENCIA ESTADSTICA
INFERENCIA. Es Conocer el comportamiento de la poblacin con niveles o grados de
confianza menores al 100% en base al conocimiento del comportamiento de la muestra.
Media aritmtica 28.26=

12___________________53

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

En qu rango o entre qu lmites encontramos la media aritmtica de la poblacin con un


nivel o grado de confianza del 90,95, y 99%?
La constante para inferir al 90% = 1.68
al 95% = 1.96
al 99% = 2.58
La media aritmtica de la poblacin es M.
M = X Sx (constante)
Para el 90%
M = 28.26 (1.73) (1.68)
M = 28.26 + 2.9 = 31.16
M = 28.26 - 2.9 = 25.36
_____________________________
25.36

28.26

31.16

El promedio de edad de personas asaltadas entre 25 y 31 aos de edad con 90% de


confianza.
Para el 95% de confianza
M = 28.26 + 3.39 = 31.65
M = 28.26 - 3.39 = 24.87
El promedio de edad de asaltados se encuentra en un rango comprendido entre 31.5 y 25.
Para el 99% de confianza
M = 28.26 + 4.46 =32.72
M = 28.26 - 4.46 = 23.8
El promedio de edad de asaltados se encuentra en un rango comprendido entre 33 y 24
aos.
Con un nivel o grado de confianza del 99%.
Si tenemos un rango con lmite inferior de 26 y lmite superior de 30, para encontrar el nivel
de confianza del rango que establecimos se utiliza el cociente Z. (Supuesto necesario X = M).
Z = X - M /Sx
Z = X - M/Sx= 26-28.26/1.73 = -2.26 / 1.73 = -1.30
Z = 30-28.26 / 1.73 = 1.74 / 1.73 = 1
x = lmite inferior
x = lmite superior

26_______________30

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

EJEMPLOS DE ESTADSTICA DESCRIPTIVA PARAMTRICA


1. Asalto en la va pblica reportados en la zona centro de Guadalajara, del 2006 al 2007
2. Edad:
25,28,18,20,45,30,23,21,23,60,26,26,30,34,16,18,22,22,21,26,24,26,31,48,60,30,19,32,
44,37,22,56,35,21,50,25,43,28,32,13.
3. Ordenados
13,16,18,18,19,20,21,21,21,22,22,22,23,23,24,25,25,25,26,26,26,26,28,28,30,30,30,31,
32,32,34,37,43,44,45,48,50,56,60,60.
4. Rango R= LS-LI+1 R=60-13+1 R=48
5. Moda = 26 aos
6. Promedio
= x
= 1200
= 30 Promedio
n
40
7. Resultado = 30 aos
F
24
10
6
F=40

13-28
29-44
45-60
x= fx
n

= 1172
40

x
20.5
36.5
52.5

fx
492
365
315
1172

= 29.3

D.M.= (x-x)2
n

=( x - x) f
n-1

=5 546.4
39

39.1
40

= .98
=142.21

= 142.21
= 11.92
Error estndar
x=

n-1

= 11.92
39

= 11.92
6.24

=1.91

(x-x)
8.7
7.2
23.2
39.1

(x-x)2
77.44
51.84
528.24
667.52

(x-x)2 f
1858.56
518.4
3 169.44
5 546.4

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Este es un elemento de inferencia Estadstica que sirve para conocer el


comportamiento de la poblacin a partir del conocimiento de nuestra muestra pero son
niveles de confianza menores al 100%.
PROBLEMA
Entre que limites o que rango se encuentra la media aritmtica (M) de la poblacin entre un
nivel o grado de confianza del 90%, 95% y 99%.
X = 29.3
TABLA
90%=1.68
95%=1.96
99%=2.58
90%
x=29.3
x = 1.96
95%
x=29.3
x= 1.68
99%
x=29.3
x =2.28

M= x +x =29.3 +(1.91)(1.68) =29.3+3.2086 =32.5086


x -x =29.3-(1.91)(1.68) = 29.3 - 3.2086 =26.0914
M= x +x =29.3+1.91 (1.96) =29.3 +3.7436 =33.0436
x -x =29.3-(1.91) (1.96) =29.3 - 3.7436 =25.5564

M= x +x =29.3+(1.91)(2.58) =29.3+4.9278 =34.2536


x -x =29.3-(1.91)(2.58) =29.3 -4.9278 =24.3722

NIVEL O GRADO DE CONFINAZA DE ACUERDO CON NUESTRA AFIRMACIN


-M
Z= x-M
x
26.09

32.50
x=29.3

Z1= x -M = 27-29.3 = 2.3 =1.20 Consultando la tabla de valores Z = 38.49%


x
1.91
1.91
Z2= x -M
x

= 31-29.3 = 1.7
1.91
1.91

=.89

Consultando la tabla de valores Z = 31.33%


Nivel de confianza

DE 26 A 32 AOS
Z1= x-M
x

= 26-29.3
1.91

=3.3
1.91

= 1.72

=.4573 = 45.73%

=69.82%

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Z2= x-M =32-29.3


x
1.91

=2.7
1.91

= 1.41

=.4207 = 42.07%
=87.80%

Z1= x-M =26.5-29.3


x
1.91

=2.8 = 1.46
1.91

=42.79%

Z2= x-M =31.5-29.3 = 2.2 = 1.15


x
1.91
1.91

=37 39%
=80.18%

HIPTESIS

Planteamiento y prueba de Hiptesis. Sirve y se utiliza para conocer el comportamiento


semejante o diferente entre las muestras, pero con niveles de confianza menores al 100%,
por lo general 95% y 99%. Usualmente se plantea la Hiptesis nula al iniciar el problema
(Ho)

Cociente T
Es una prueba paramtrica, sirve para conocer el comportamiento entre dos muestras
ante una situacin comn a ambas.
Caractersticas:
Se utiliza para muestras grandes y para muestras chicas.
Se puede aplicar a muestras de igual o de diferentes tamao
Sirve para comparar 2 muestras
Es una prueba paramtrica
Se plantea desde el principio la Hiptesis nula (Ho) con su nivel o grado de confianza.
FORMULA GENERAL
T=

X- Y
Sxydif

Grado de Libertad
Se toma de 2 muestras a comparar y posteriormente cuando y se obtenga el resultado se
tendr que auxiliar de la tabla de valores crticos de t, para saber el resultado y poder ser
comparado con el resultado del cociente t. gl = (n-1) + (n-1)
Hiptesis nula: Ho
Siempre afirma que las muestras comparadas actan de manera semejante ante situacin
especifica comparada y con un nivel o grado de confianza que se preestablece desde el
principio . Por lo general se plantea al principio, con su nivel o grado de confianza

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Cuando se realiza la prueba estadstica y las desviaciones son mayores que la que establece
la tabla de grados de libertad, en ese momento esta se invalida y se plantea la hiptesis
alternativa (HI ) conocida tambin como hiptesis de investigacin.
La hiptesis alternativa a firma que las muestras actan o se comportan de manera diferente
ante una situacin comparada; esto comprobado en el mismo nivel o grado de confianza que
se establece al principio, desde que planteamos la hiptesis nula.

ERRORES EN LOS QUE NO DEBEMOS CAER.


Tipo 1: Aceptar Una hiptesis nula como valida cuando las diferencias si son significativas
Tipo 2: Rechazar una hiptesis nula cuando las diferencias no son significativas.
Ejemplo:
se requiere saber si la condicin bajo la cual se hace la accin de donar es o no influenciada
por la condicin bajo la cual se haga ; es decir, se tiene o se observan como ejemplos 25
personas de las cuales 12 son donadores conocidos , y 13 de identidad desconocida...
X= conocidos
Y= desconocido
X X2 Y Y2
3
9 5 25
5 25 3 9
9 81 6 36
8 64 4 16
7 49 7 49
6 36 2 4
5 25 1 1
9 81 4 16
10 100 6 36
12 144 12 144
11 121 2 4
8 64 1 1
3 9
Ho = la accin de donar no es influenciada por la condicin bajo la cual se haga, esto
afirmado con un grado de confianza del 95%
PROBLEMA
Se requiere saber si la actitud caritativa de donar se ve o no influenciada por la condicin bajo
la cual se haga o se realice. Para ello se observan dos grupos de donadores: uno integrado
por ocho donadores conocidos, y otro por nueve donadores annimos.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Ho= La actitud caritativa de los donadores no se ve influenciada por la condicin bajo la cul
se haga o se done X = 5.87
Y = 3.44
C
x
5
3
8
7
2
9
7
6
47

x2
25
9
64
49
4
81
64
36
332
39.6

A
y
3
5
8
2
1
3
2
4
3
31

y2
9
25
64
4
1
9
4
16
9
141
15.6

Con un grado de confianza del 95%


x= x2-x2
= 332-(5.87)2 = 41.5-34.45 = 7.05
n
8
y= y2-y2
= 141-(3.44)2
n
9
x=
= 2.27
=2.65
n-1
7
2.64
y=

n-1

= 1.95
8

dif xy = x2 + y2
t= x - y
x dif xy

= 1.95
2.82

= 15.66-11.83

= 3.83

=1.95

=1.00
=.69

= (1)+(.69)

=5.87-3.44
1.21

=2.65

=2.43
1.21

1 + .4761

1.4761 =1.21

=2.00

GRADOS DE LIBERTAD
gl= (n-1)+(n-1)

=(8-1)+(9-1)

=7+8

=15

El limite mximo de 1.753 si lo rebasa se anula la Ho y se plantea la Hi.


El resultado es 2.23 a comparacin de 1.753, por lo tanto se rechaza la Ho. Y se establece la
Hi.
Hi= la actitud de los donadores s se ve influenciada por la condicin bajo la cual se done
comprobado con un nivel o grado de confianza del 95% Es decir los donadores conocidos
son ms caritativos que los annimos.
Ejercicio.
Se quiere saber si influye el hecho de que una persona guarde reposo o no guarde reposo,
en el tiempo de recuperacin despus de haber sufrido una fractura de 2do grado.
X= No guardan reposo
Y= Si guardan reposo
X
X2
Y Y2
4
16
2 4

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

2
3.5
2.5
6
4
5

4
12.25
6.25
36
16
25

8
6
9
5
4
6

64
36
81
25
16
36

Ho= El hecho de mantener reposo o no, despus de sufrir una fractura de 2do grado no
influye con el tiempo de recuperacin, esto afirmado con un grado de confianza del 95%.
Probabilidad
La posibilidad no es medible y la probabilidad puede medirse con cierto grado de
confianza. Entonces la probabilidad es una posibilidad medible.
Probabilidad de lluvia el 16 de junio de 1999.
Referencia observacin de los 16 de junio de los ltimos 10 aos anteriores.
SE= suceso esperado
SO= suceso observado
SE
SE
SP= suceso posible
SO
SP
89
90
91
92
93
94
98
96
97
98
si
no
no
no
si
no
si
no
no
si
SE
SO
SE
SO

si
SO
no
SO

4
10
6
10

SE
SP

=3
AS

=1
2

SE
SP

= 3
1,2,3,4,5,6,

=5

=40% de que s llueva


la suma de que si o no llueva es 100% = 1
=60% de que no llueva
= 50% probabilidad de un lado de una moneda
=1
6

=0.166 probabilidad de un lado de un dado

La Probabilidad Conjunta es igual a la multiplicacin de las probabilidades individuales.


De un juego de baraja con 52 cartas, sacamos las siguientes cartas:
1 rey = 4 sin meter el rey
52
1 as = 4 sin meter el as, ni el rey
51
Otro rey = 3
(4) (4) (3) = 48 =0.0003619 =.0362%
50
52 51 50
132,600
la probabilidad de que no suceda es igual a 1- .0003619 = .9996381 = 99.96381%
PROBLEMA
2 Ponchitos
3 negras
2.agitas

nfora de
canicas

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

1 flor
3 verdes
2 blancas
1. Cul es la probabilidad de sacar una flor y sin meter la flor y enseguida sacar una negra?
( 1) ( 3) = 3
13
12
156
2. Cul es la probabilidad de sacar una blanca y sin meter la blanca sacar un ponchito?
( 2 ) ( 2)
=4
13
12
156
CHI CUADRADA
X= es una prueba estadstica no paramtrica que solo requiere que los elementos que
integran las muestras contengan alguna caracterstica en comn. Ejemplo hombres y
mujeres, universitarios y no universitarios.
CARACTERSTICAS

No requiere que las muestras sean de gran tamao.


No requiere muestras de igual tamao
Se debe plantear desde el principio la Ho con su nivel o grado de confianza.
PLANTEAMIENTO DEL PROBLEMA
Se requiere saber si la actitud poltica e ideolgica de los padres influye o no respecto a la
eleccin del mtodo de crianza para educar a sus hijos. Para ello observamos dos muestras:
la primera integrada por 20 papas conservadores, y la segunda por 21 liberales.
M. de C.
flexibles
rgidos

Conservadore
Liberales
s
5
A=fo fe=9.26
14
15
C=fo fe=10.7
7
3
20
21

B=fo
D=fo

fe=9.73
fe=11.2
6

1.Ho al 95%
La actitud poltica e ideolgica de los padres no influye respecto al mtodo de crianza
para educar a sus hijos
2. Establecer grados de libertad
gl=(c-1)(r-1) =(2-1) (2-1) =1 Tabla =3.84 (variacin no significativa)
c= columnas
r= renglones
3. Formulacin
Formula DIRECTA
X=N(AD-BC)
=41(210-35)
=41(175)
(A+B)(A+C)(B+D)(C+D)
(5+14)(5+15)(14+7)(15+7) (19)(20)(21)(22)
X=1255,625
=7.152
175,560
Se rechaza la Ho y se plantea como valida la Hi.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

la actitud poltica e ideolgica de los padres si influye respecto al mtodo de crianza para
educar a sus hijos esto afirmado con un nivel o grado de confianza del 95%
formula general.
X= (fo-fe)
fe=(TMR)(TMC)
fe
n
fo= frecuencia obtenida (datos obtenidos)
fe= frecuencia esperada(datos estimados)
fe=(TMR)(TMC)
n
fe=(TMR)(TMC)
n
fe=(TMR)(TMC)
n

=(22)(20) =
440
=10.73
41
41
=(22)(21) =462
=11.26
41
41
=(20)(19) =380
=9.26
41
41

fe=(TMR)(TMC)
n

=(19)(20) =399
41
41

X=(fo-fe)
fe
X=(7-11.26)
11.26
X=(fo-fe)
fe

=(15-10.73)
10.73
=1.61

=1.69

=9.73
X=(5-9.96)
9.26

X=(14-9.73)
9.73

=1.69+1.61+2.65+1.87

=2.65

=1.87

=7.82 resultado semejante al de la formula directa.

Ejercicio.
1. Se quiere saber si el uso de proteccin por trabajadores de obras pblicas marca una
diferencia en el nmero de accidentes, con respecto a los que no lo usan.
M1=trabajadores que usan proteccin
M2=trabajadores que no usan proteccin
M1
19
6

M2
10
12

Ho= no existe diferencia significativa en el nmero de accidentes ocurridos en personas que


por el uso o carencia de medidas de seguridad con relacin al nmero de accidentes, esto se
plantea con un nivel o grado de confianza de 95%
2. Se requiere saber si existe una diferencia significativa en el numero de trabajadores que no
sufren y sufren accidentes (los cuales pueden ser: leves, graves), donde se distinguen dos
grupos de trabajadores: uno que usa proteccin y otro grupo que no usa proteccin.
M1= trabajadores que usan proteccin
M2= trabajadores que no usan proteccin

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Situacin
Sin accidentes
Con accidentes leves
Con accidentes graves

M1
20
7
5

M2
14
6
14

Ho= no existe diferencia significativa en el nmero de accidentes marcada por el uso de


proteccin o carencia de la misma, esto se plantea con un nivel o grado de confianza de 95%.

PRUEBA DE LA MEDIANA
Se convoca a los estudiantes de Psicologa a un concurso de aficionado al canto con un
jurado de expertos con temas alusivos al amor. Para ello se medir tiempo que los
participantes estn dispuestos a estar cantando; a menor tiempo cantado es igual a mayor
nerviosismo turbaciones; a mayor tiempo cantado menor nerviosismo.
X= hombres =3,9,12,17,21,14,22
y= mujeres =15.3.5.8.7.6.12.11
1 Ordenar
3,3,5,6,7,8,9,11,12,12,14,15,17,21,22
2. El elemento mediano significa sobre
n+1 =15+1 =16
=8 Lugar que es el nmero 11
2
2
2
x
5
2

SOBRE
DEBAJO

Y
3
5

Ho= El nerviosismo mostrado entre hombres y mujeres es muy semejante con un nivel o
grado de confianza del 95%.
gl= (c-1(r-1) =(2-1)(2-1) =1 =3.84
X= N(AD-BC)
(A+B)(A+C)(B+D)(C+D)
X=15(19)
3136

=15(361)
3136

=15(5)(5)-(3)(2)
(5+3)(5+2)(3+5)(2+5)
= 5415
3136

= 15(25-6)
(8)(7)(8)(7)

=1.72

X=(fo-fe)
fo=5,3,2,5
fe= (TMR)(TMC)
fe
N
fe1=(8)(7) =3.73
fe2=(8)(8) =4.26
fe3=(7)(7) =3.26
15
15
15
X=(fo-fe)
fe
X1=(5-4.26)
=(1.27)
=1.61
=.432
3.73
3.73
3.73
X2=(3-4.26)
4.26

=(1.26)
4.26

=1.58
4.26

=.372

fe4=(7)(8) =3.73
15

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

X3=(2-3.26)
3.26

=(1.26)
3.26

=1.58
3.26

X4=(5-3.73)
3.73

=(1.26)
3.73

=1.61
3.73

=.486
=.432

X=
=.432+.372+.486+.432 =1.72
Se acepta la Ho con un grado de confianza del 95% lo que quiere decir que las diferencias
entre ambas muestras aunque existen no son significativas.
Ejercicio.
Se somete a experimentacin un nuevo mtodo teraputico para pacientes que sufren de
fractura de primer y segundo grado, para ello se observan dos grupos, uno de adolescentes y
otro de adultos; y se requiere saber si existe una diferencia significativa entre estos dos
grupos con respecto l numero de semanas que tardan en aliviarse por completo.
G1= adolescentes con fracturas de 1er y 2do grado
G2= adultos con fracturas de 1er y 2do grado
G1
5
3
4
3
5
7
9

G2
4
9
12
10
7
3
14
12
9

Ho= no influye la edad en tiempo de recuperacin o saneamiento de adultos y adolescentes


que sufren fracturas de 1er y 2do grado, esto se plantea con un nivel o grado de confianza del
95%

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

ANLISIS DE VARIANZA EN DOS O MS DIRECCIONES POR RANGOS DE FRIEDMAN


Este anlisis de Varianza sirve o se utiliza cuando se requiere comprobar si una muestra sufre
cambios o no, significativos ante dos o ms direcciones.
CARACTERSTICAS

No se requiere que la muestra sea muy grande

Se plantea desde un principio la Ho con su nivel o grado de confianza


PLANTEAMIENTO DEL PROBLEMA
Se requiere saber si existe o no relacin entre el nivel de violencia percibido por los
nios y su grado de hostilidad manifiesta, para ello hemos diseado un test psicomtrico en
tres versiones semejantes. Mismo que vamos a aplicar de la siguiente forma.
20=nada de hostilidad 40=hostilidad medio 60=mxima hostilidad manifiesta.
R1

A
B
C
D
E
F

Violencia
Baja
30
35
50
25
20
25

3
3
1
3
3
3

Violencia
Mediana
35
40
35
30
25
30

G
H
I
J

35
40
30
25

3
1
3
3

40
30
35
30

R1=26

R2
2
2
3
2
2
1.5

Violencia
alta
40
45
40
35
30
30

1
1
2
1
1
1.5

2
3
2
2

45
35
40
35

1
2
1
1

R2=21.5

R3

R3=12.5

Ho= El nivel percibido de violencia de los nios no influye respecto a la hostilidad manifiesta.
Esto afirmado con un nivel de confianza del 95%
gl= K-1
K= numero de condiciones bajo la cual se mide la muestra.
gl=3-1 =2 gl=5.99
Xr=[

12

] [(ir) ]-3N(K+1)

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

3N(K+1)
Xr=( 12
)
[(26) +(21.3) +(12.5) ] - [3(10)](3+1)
(3) (10) [3+1]
Xr={ 12 ] [676+453.69+156.25]- (30)(4)
(30)(4)
Xr=(.1)(1285.95) - 120
Xr=129.45 -120
= 8.595
Se rechaza la Ho. Si influye el grado violencia percibida por los nios y su hostilidad
manifiesta en ellos con un 95% de grado de confianza.
Ejercicio.
Se requiere saber si existe una diferencia significativa en el tiempo de recuperacin de unos
pacientes sometidos a un tratamiento con 3 dosis diferentes.
X
A
B
C
D
E
F
G
H
I
J

1D
12
8
13
10
9
3
5
10
9
8

R1
1
3
2
1
1
1
1
1
1
1
R1=13

2D
10
10
13
8
7
2
3
9
8
6

R2
2
1.5
2
2
2
2
2
2
2
2
R2=19.5

3D
8
10
13
7
6
1
2
8
6
4

R3
3
1.5
2
3
3
3
3
3
3
3
R3=27.5

Ho= no hay diferencia significativa en la dosis con respecto a los das de recuperacin, esto
con un nivel o grado de libertad del 95%

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

ANLISIS DE VARIANZA EN UNA DIRECCIN POR RANGOS DE KRUSKAL WALLIS


CARACTERISTICAS

Esta prueba no paramtrica se utiliza para conocer si dos o ms muestras actan de


manera semejante o diferente ante una situacin comn.

No requiere muestras de gran tamao


No se requiere que sean iguales
Se plantea la Hiptesis nula desde el principio.

PLANTEAMIENTO DEL PROBLEMA


Se requiere saber si hay o no relacin entre la edad de las personas y la facilidad o
dificultad para que estas obtengan un empleo de base. Para ello observamos tres grupos
diferenciados por la edad.
Adultos
A.J.
15
3
5
6
10
11
7
9

Jvenes
R1
16
2
4
5
10
12
6
8.5
R1=63.5

Adultos
A.M
4
14
27
21
18
13
11
8
9

Medianos
Adultos Seniles
R1
1 1
3
17 17
15
11 12
22
29 23
19.5
31 24
8
26 21
4
40 25
12
21 19.5
7
R3=192.5
8.5
R2=119
Ho= La edad no influye respecto a la facilidad o dificultad para que estas personas obtengan
un empleo de base. Afirmado con un grado o nivel de confianza del 95%
DATOS
12= constante
H= [ 12 ] [(
Ri)] - 3(N+1)
N= total de elementos
N(N+1)
n
Ri= rango infinito
n= cantidad de elementos de cada muestra
Grados de libertad
gl= (K-1)
K= numero de muestras o rangos

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

gl=3-1

=2

X=5.99

H= 12
(63.5) +(119) +)192.5) -3(26)
25(26) 8
9
8
H=(.018)504.03+1573.44+2538.28-78
H=(.018)(4613.75)-78
H=5.08 No se rechaza la Ho.
Ejercicio.
Se quiere saber influye la edad para que los medicamentos tengan un mejor efecto y tengan
un tiempo de saneamiento diferente. Todo esto ante un mismo tratamiento.
G1= adolescentes
G2= jvenes
G3= adultos
G1
R1
5
5
7
8.5
21
24
3
3
4
4
6
6.5
7
8.5
10
11.5
12
15
19
21
R1=107

G2
10
17
21
30
20
13
9
6
11
15

R2
11.5
19
24
30
22
16.5
10
6.5
13.5
18
R2=171

G3
2
22
25
18
23
11
13
1
29
40
21

R3
2
26
28
20
27
13.5
16.5
1
29
31
24
R3=218

Ho= no influye la edad para que las personas que sufren una enfermedad en comn con un
mismo tratamiento tarden diferente tiempo en recuperarce, esto con un nivel o grado de
confianza de 95%
ANLISIS DE VARIANZA EN UNA DIRECCIN POR RANGOS DE KRUSKAL WALLIS
gl=2 = 5.991
H=4.67
El resultado es menor al que marca la tabla de grados de libertad los grados de libertad por
lo tanto se acepta la hiptesis nula.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

CORRELACIN
Relacin existentes entre 2 variables donde una por lo general x es la variable
independiente a y es la variable dependiente. Tambin nos sirve para medir la correlacin o
la relacin existente entre dos muestras, sirve para predecir o estimar el comportamiento de
la variable dependiente Y, en relacin del conocimiento de la variable X independiente.
y= x
y
2
x
y
1
.5
3
1.5
5
2.5
x
No obstante, saber si existe una asociacin entre las variables, lo importante es que esta
puede ser medible por la R Pearson .Ejemplo a mayor estatura mayor peso, a mayor grado
de estudios mayor nivel de ingresos, etc.
PLANTEAMIENTO DEL PROBLEMA
x
10
6
3
6
15

A mayor grado de estudios de los paps, mayor grado de estudios de los hijos
x
Zx
Y
y
Zy
(Zx)(Zy)
100
-0.07
12
144
-0.23
0.01
36
-0.79
9
81
-0.86
0.67
9
-1.33
15
225
-0.38
0.50
36
-0.79
6
36
-1.43
1.16
225
0.82
12
144
-0.23
-0.18

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

20
13
=73
x=10.42
x= x2-x2
n
y= y2-y2
n
R=(Zx)(Zy)
n

400
169

1.72
0.46

475-(10.42)2
7
= 1370-13.14
7

=4.59
7

22
16
=92
y=13.14

484
256

= 139.28-108.57
= 195.571-17265

1.84
0.84

3.16
0.27
=4.59

=5.54
=4.8

=0.65%

Existe para esta muestra un .65% de correlacin existente entre papas e hijos
FRMULA R PEARSON.
R= (zx)(zy)/ N
Consigna: A mayor edad (y) mayor estatura (x).
Medir asociacin entre 0- 1.
Ejercicio.
Inventar una medida para ver las frecuencia del estrs.
Estrs de los hijos en relacin a estrs de los padres, tomando de referencia al primognito.
X
X
Y
Y
5
25
+-1.408
68
-1.05 (-1.40)(-1.05) = 1.47
17
289 +-.28 3
169 .04
(.28)(.40) = -112
23
529 1.12 20
400 .5
(1.12)(.5) = .56
6
36
-1.26 8
64
-1.05 (-1.26)(-1.05)= 1.32
16
256 .14
14
196 -.27 (.14)(-.27)= .037
13
169 .28
18
324 .24
(.28)(.24)= .067
25
62
2.05 32
1024 1.40 (2.05)(1.40)= 2.87
1929
2241
105/7= X = 15
_
Y = 16.14
_
1. Zx = x x/ sx
_
1 Zy = yy/ sy
__
2. Sx = x / n x
Sx = 129/7 (15)
Sx = 275.5-225 = 50.5
Sx = 7.10
__
2. Sy= y / n y

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Sy= 2241 /7 (16.14)


Sy = 320.4-260.4 = 59.65
Sy= 7.72
__
3. Zx = x-x/ sx
Zx = 5-15/ 7.10 = -10/7.10 = -1.40
4. r= (zx)/zy)/N = 6/7 = .85
Ecuacin de Regresin
X = 12
Y = 27
___ ___
Y = r (sy/sx)X r (Sy/sx) X + Y
= .85(7.72/7.10)12 - .85(7.72/7.10)15+16.14
=.85(1.08)12-.85(1.08)(15)+16.14
=11.01-13.77+16.14
=-2.76+16.14
=13.38
Tarea.
__ __
X = r (sy/sx)Y r (sy/sx) X+Y =
X = .85 (1.08)27 - .85(1.08)(15)+16.14
X = 24.78 -13.77 +16.14
X = 11.01 +16.14 = 27.15
ECUACIN DE REGRESIN
Sirve para conocer o saber el valor estimado de y en base al valor a x.
Est entrada estadstica no paramtrica sirve o se utiliza para conocer el comportamiento de
dos o ms muestras en una situacin comn a ambas.
PROBLEMA
1 Si un pap estudi 22 aos, cuntos estudio el hijo
2 Si un pap estudi 8 aos, cuntos estudio el hijo
y^=r(y)x-r(y) x+y
r=.65
(x) (x)
y=4.8
x=5.54
1.y^=.65(4.8)22-.65(4.8) 10.42+13.14
x=22
(5.54)
(5.54)
x=10.42
y^=.65(0.86) 22-0.65(.86)10.42+13.14
y=13.14
2.y^=.65(4.8) 8-.65(4.8)10.42+13.14
(5.54)
(5.54)
y^=.65(0.86) 22-0.65(.86)10.42+13.14

=19.61

=11.78

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

CUESTIONARIO DE ESTADSTICAS
1.- Desarrolla o explica las caractersticas que integran el diseo muestral.
Se encuentra integrado por errores de muestreo y errores de no muestreo.
* Errores de muestreo: tamao de la muestra y tipo de muestreo.
* Errores de no muestreo: capacitacin de encuestadores, diseo de cuestionario y recursos
* Tamao de la muestra: tipo de poblacin y nivel o grado de confianza.
* Tipos de muestreo: al azar aleatorio, al azar aleatorio ordenado, al azar aleatorio
sistematizado, por conglomerado, muestreo estratificado y muestreo combinado.
2.- Desarrolla y explica de que elementos depende el tamao de la muestra.
Depende del tamao de la poblacin pero ms del nivel o grado de confianza.
3.- Desarrolla cada uno de los tipos de muestreo.
* Al azar aleatorio.- todos los elementos de la poblacin tienen la misma probabilidad de ser
elegido como parte de la muestra.
* Al azar aleatorio ordenado.- es igual al anterior pero lleva un orden.
* Al azar aleatorio ordenado sistematizado.- es igual al anterior pero con un sistema.
* Muestro por conglomerado o agrupamiento.- igual al anterior pero con la caracterstica
de la que el grupo encuestado sea especfico.
* Muestreo estratificado.- es igual al anterior pero afirma que como la poblacin no es
homognea sino heterognea se deben considerar lo diversos estratos de la misma y de ser
posible en proporcin a la poblacin.
4.- Enuncia por lo menos nueve caractersticas del cuestionario.
1.- Debe tener encabezado
2.- No debe tener una pregunta ms, ni una pregunta menos de las que se requieran.
3.- Debe estar basado en el planteamiento del problema.
4.- Debe estar integrado por preguntas cerradas.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

5.- Debe contener algunas preguntas abiertas.


6.- Todo cuestionario es piloto hasta que se pruebe que esta bien elaborada.
7.- Las preguntas deben de ser claras, precisas, cortas, con lenguaje estandar.
8.- Ninguna pregunta debe negar, ni inducir a la repuesta.
9.- La secuencia de las preguntas debe ser de la ms sencilla a la ms complicada.
5.- Desarrolla en que consiste la capacitacin de los encuestadores.
Deben conocer el contenido de la investigacin, deben tener tica. Es importante considerar
el tiempo, los recursos humanos, el material y los recursos financieros.
6.- Por qu es importante considerar los recursos en la encuesta?
Porque sin ellos no se puede realizar ninguna actividad.
7.- Qu es la muestra?
Es una parte de la poblacin que contiene tericamente las mismas caractersticas de la
poblacin que se desea estudiar. Sus medidas reciben el nombre de estadsticos.
8.- Qu es estadstica en relacin a la teora?
Es un instrumento de apoyo que sirve para describirla, representar los datos, hacer anlisis
ms concretos, para obtener conclusiones con mejores bases y que adems con el
conocimiento de la muestra podemos inferir comportamiento de poblaciones.
9.- Desarrolla las caractersticas de la estadstica descriptiva
Son actividades estadsticas encaminadas a describir cuantitativamente una serie de
personas, lugares o cosas.
10.- Desarrolla el concepto de estadstica descriptiva inferencial.
No se puede inferir algo que ya est descrito
11.- Desarrolla la estadstica paramtrica descriptiva.
Es aquella estadstica paramtrica medible que podemos representar en tablas o grficas
estadsticas
12.- Desarrolla lo que es inferencia estadstica.
Es conocer el comportamiento de la poblacin en base al conocimiento del comportamiento
de la muestra pero con niveles de confianza menores al 100 %.
13.- Desarrolla lo que son las medidas de tendencia central.
* Media aritmtica.- tambin se le llama media. Es la medida de tendencia central que se
encuentra con ms frecuencia; se calcula sumando lo valores para los cuales se desea la
media y dividiendo el resultado por el nmero de valores que entran en la suma.
* Mediana.- es aquel valor que se encuentra en la mitad de una muestra o poblacin cuyos
valores estn ordenados, en orden de magnitud (significa el lugar).
* Moda.- es el valor que aparece con mayor frecuencia en un grupo de datos..
14.- Desarrolla el concepto de las medidas de dispersin o variabilidad.
Son medidas en que los valores individuales se desvan de la media aritmtica.
* Rango, o amplitud total- es la distancia que existente entre el dato mayor y el dato menor.
* Varianza.* Desviacin estndar.- es igual a la raz cuadrada de la varianza.
* Error estndar.- es igual a la desviacin estndar entre la raz cuadrada de n menos uno.
15.- Qu es probabilidad?
Es un posibilidad medible que se basa en la observacin de los hechos o sucesos anteriores
en relacin a los sucesos esperados. ( Tiene una base o fundamento )
16.- Qu es probabilidad conjunta?

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Es la multiplicacin de las probabilidades individuales.


17.- Qu es probabilidad condicional?
Es la probabilidad conjunta que adems depende de los sucesos anteriores.
18.- Qu es en qu consiste la utilizacin de los niveles de confianza
preestablecidos del 90 %, 95 % y 99%?
Porque a mayor precisin menor grado de confianza, y a menor precisin mayor grado
desconfianza.
19.- Para qu sirve la utilizacin del cociente Z ?
Es el nivel de confianza requerido para generalizar los resultados hacia toda la poblacin.
20.- En qu condiciones o para qu se utiliza el cociente T o T de estudio?
Para conocer el comportamiento de dos muestras ante una situacin comn a ambas.
21.- Qu es una prueba de hiptesis?
Es comprobar sistemticamente nuestras hiptesis acerca de la naturaleza de la realidad
social, an aquellas que parezcan lgicas, verdaderas o evidentes por si mismas.
22.- Qu es una hiptesis nula?
La que nos afirma que dos o ms muestras se comportan de manera semejante ante una
situacin comn a ambas. Esto con niveles o grados de confianza de 95 y 99 %, por lo tanto
la hiptesis nula niega diferencias de comportamiento significativa entre las muestras.

23.- Qu es una hiptesis alternativa?


Se formula cuando la hiptesis nula es desechada y nos afirma ( dos o ms muestras actan
de manera diferente ante est situacin en comn) con el mismo nivel o grado de confianza
planteado desde la hiptesis nula.
24.- Cuales son los tipos de errores en los que no debemos caer?
Error uno, rechazar una hiptesis nula cuando esta tiene o debera ser aceptada y el error
dos, aceptar una hiptesis como valida o verdadera cuando esta debi haber sido rechazada.
25.- Que es una correlacin?
Es una asociacin existente entre dos variables en donde por lo general X es la variable
independiente y la Y es la variable dependiente.
26.- Desarrolla lo que es una ecuacin de regresin.
Se utiliza para un problema de prediccin mltiple en la que entran las tres variables, es decir,
de esa ecuacin de regresin mltiple: se puede predecir un valor X para toda persona. La
correlacin entre estos valores predichos (X1) y los obtenidos (X1). Esta es otra interpretacin
de un coeficiente de correlacin mltiple.
27.- Desarrolla la estadstica no parametrica.
Es la estadstica que no requiere slo elementos paramtricos o medibles, slo requiere que
los elementos se integren en las muestras que tengan una caracterstica en comn.
28.- Desarrolla lo que es chi cuadrada.
Esta entrada estadstica no paramtrica sirve o se utiliza para conocer el comportamiento de
dos o ms muestras en una situacin comn a ambas.
29.- Qu importancia tiene explicar adecuadamente el resultado?.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Para conocer con mayor exactitud el comportamiento de la poblacin con relacin a un tema
o problema determinado.
Caractersticas que considero de un cuestionario para entrevista.
Brevedad
Claridad
Concisa
Opcin Mltiple
Tema en especfico
Coherente
Con un diseo adecuado para obtener resultados concretos.
Que no contenga sesgos es decir, que no este manipulado.

Ejercicios adicionales
DISEO MUESTRAL TAMAO DE LA MUESTRA

Mod=19 Md = 20
Frecuencia Relativa = Fa / Ft = 20/31
6/31
5/31
Punto Medio = Ls +Li /2
Rango= Ls Li +1
31 -17 +1 = 15
Clase
Frecuencia Absoluta
1. 17-21
20
2. 22-26
6
3. 27-31
5

Ef = n = 31

F Acumulada
20
26
31

F Relativa
X
.64
19
.19
24
.17
29

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Frecuencia Absoluta.
HISTOGRAMA
Y
20
15
10
5
X 17-21

22-26
27-31
CLASES
POLIGONO DE FRECUENCIAS
20
15 10
5

19

24

29
= 360 = 100
31 = 100
.64 x 360 = 230

Ejemplo de encuesta.
Anota tu edad. en el ltimo ao haz tenido relaciones sexuales con proteccin?
Un encuesta debe de llevar: Encabezado, explicar el contenido de los datos, lugar o localidad,
fecha o periodo, pi de pgina, fuente: indirecta bibliografa, directa - Encuesta
Media Aritmtica
____
X = fx / n
___
X = fx / n = 669 / 31 = 21.58
_
f
x fx
(x-x)
17 -21 20
22-26
6

19
24

380
144

2.58
2.42

_
(x-x) f
133.12
35.13

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

27-31

29

17

145
669

7.42
12.42

275.28
443.53

_
x = 21.58

31

DESVIACIN MEDIA
_
DM = ( x x) / n
DM = 12.42 / 31
DM = 0.40
VARIANZA
S = t = G = O
FRMULA
S = ( x x) f / n-1 = 443.53 / 30 = 14.78
Desviacin Estndar.
S=T=

=
_
S = ( x x)f /n -1 = 443.53/ 30 = 14.78
S = 3.84
Error Estndar.
Sx = tx = x = x
_
Sx = S/ n-1
_
Sx = 3.84/ 30
_
Sx = 3.84 / 5.47
_
Sx= 0.70
Ejercicio

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

En base a la muestra en que rango o entre que lmites se encuentra la media aritmtica de
la poblacin?
_
M
90% = 1.68
95% = 1.96
99% = 2.58
_
_
_
M = x + - sx (95%)
sx (95%)
_
M = 21.58 + (0.70) (1.96)
_
M = 21.58 (.70) (1.96)
_
M = 21.58 +1.37 = 22.95
_
M = 21.58 -1.37 = 20.21
Entre 20 aos y 23 aos se encuentra la edad de nuestra poblacin.
Tarea.
_
_
_
M = x + - sx (99%)
sx (99%)
_
M = 21.58 + (0.70) (2.58)
_
M = 21.58 (.70) (2.58)
_
M = 21.58 +1.806= 23.386
_
M = 21.58 -1.806 = 19.774
_
_
_
M = x + - sx (90%)
sx (90%)
_
M = 21.58 + (0.70) (1.68)
_
M = 21.58 (.70) (1.68)
_
M = 21.58 +1.176 = 22.756
_
M = 21.58 -1.176 = 20.404
__ __
SUPUESTO:
M=X
__

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

M = 96.61%
17

31

20 21.58 23
Z = Grado de Confianza.
- X1 = Lmite inferior
Frmula
__ __
Z=MX
Sx
Z1 = 21.58-20/ 0.70
Z1 = 1.58 / 0.70
Z1 = 2.25 = 48.78%
X2 = limite Superior
__
Z2 = M X2
Sx
Z2 = 21.58 -23 / 0.70
Z2 = 1.42 / .70 = 2.02 = 47.83%
__
Entre 20 y 22 se encuentra la M y el grado de confiabilidad se obtiene sumando 48.78 +
47.83
Ejercicio.
__
Li= 20.5 Ls= 22.5 M = 21.58
Z1 = 21.58 20.5/ 0.70 = 1.08 / 0.70 = 1.54 = 43.82
Z2 = 21.58 22.5 = 1.31 = 40.49
40.49 + 43.82 = 84.31
Planteamiento y Prueba de Hiptesis.
Se utiliza para comunicar el comportamiento de dos muestras ante una situacin comn a
ambas.
Se plantea desde el principio la hiptesis nula con nivel o grado de confianza.
Afirmando (Ho) que el comportamiento entre las muestras es semejante, es decir niega
diferencias significativas.
Cuando las diferencias si son significativas por f el resultado, o porque estas rebasen lo
establecido por grados de libertad, se plantea la hiptesis alternativa o de investigacin ( Hi)
que afirma que las muestras comparadas, s son diferentes, es decir que no son semejantes.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

1 Paso
Se plantea la hiptesis nula
Ho: niega que las diferencia entre ambas sea significativa para desarrollar una depresin.
95% nivel de confianza.
2 paso
Establecer grado de libertad
gl = ( n-1)+ ( n -1)
gl = (8-1) + (7-1)
gl = (7)+ (6)
gl = 13
1.77 limite de diferencia, diferencia mxima
COCIENTE T O T DE STUDENT
__ __ _ _
T = X Y / Sx y dif
Caractersticas.
- Prueba estadstica paramtrica
- Se utiliza para conocer si sus muestras comparten semejanzas o diferencias.
- Se utiliza para muestras grandes o muestras pequeas
- Se utiliza para muestras iguales o de diferente tamao
- Se plantea desde el principio la hiptesis nula (Ho) con su nivel o grado de
confianza.
Ejercicio.
Depresin infantil.
Se someten a terapia
Igual tratamiento
Ambas se observan desde el primer da y ver cuanto se tarda en recuperar
NIAS
X
4
6
5
3
7
2.5
8
7

NIOS
Y
7
2
1
4
1
2
3

Pasos.
1. Plantear Ho.
2. gl = (n-1) + (n-1)
gl = (8-1) + (7-1)
gl = 7+6 = 13
gl = 13
1.77
3. elevar al cuadrado X y Y y sumarlos

Ho 95%

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

NIAS X
X
4
16
6
36
5
25
3
9
7
49
2.5
6.25
8
64
7
49
42.5 254.25

NIOS Y
Y
7 49
2 4
1 1
4 16
1 1
2 4
3 9
20 84

Frmula Cociente T.
_ _ __
T= x y / Sx y dif
Pasos.
_
1. X = 42.5 /8 = 5.31
y = 20 /7 = 2.86
2. Desviacin Estndar.
_
Sx = x - x
= 254.25/8 5.31 = 31.78 28.19= 3.5 Sx= 1.87 = 1.90
n
_
Sy = y - y = 84 / 7 2.86 = 12 -8.17 = 3.83 Sy = 1.95
n
3. Error Estndar_
_
Sx = Sx / n-1 = 1.90/ 8-1= 1.90/ 7 = 1.90 /2.64
Sx = .72
_
_
Sy = Sy / n-1 = 1.95/ 7-1 = 1.95/ 6 = 1.95/ 2.45
Sy = .80
4. Error Estndar de la Diferencia
__
_
_
Sxy dif Sx + Sy
__
Sxy dif .72 + .80 = .518 + .64 = 1.158 = 1.076
__ __ _ _
5. T = X Y / Sx y dif
t = 5.31 2.86 / 1.07
t = 2.45 / 1.07
t = 2.29

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Tarea.
NIAS X
X
4
16
6
36
5
25
3
9
7
49
2.5
6.25
8
64
7
49
42.5 254.25

NIOS Y
Y
7 49
2 4
1 1
4 16
1 1
2 4
3 9
3.5 12.25
23.5 96.5

Frmula Cociente T.
_ _ __
T= x y / Sx y dif
Pasos.
_
1. X = 42.5 /8 = 5.31
y = 23.5/8 = 2.93
2. Desviacin Estndar.
_
Sx = x - x
= 254.25/8 5.31 = 31.78 28.19= 3.5 Sx= 1.89 = 1.90
n
_
Sy = y - y = 96.5/ 8 2.93 = 12.06 - 8.58= 3.48 Sy = 1.86
n
3. Error Estndar_
Sx = Sx / n-1 = 1.90/ 8-1= 1.90/ 7 = 1.90 /2.64
_
Sy = Sy / n-1 = 1.86/ 8-1 = 1.86/ 7= 1.86/ 2.64
4. Error Estndar de la Diferencia
__
_
_
Sxy dif Sx + Sy
__
Sxy dif .72 + .70 = .518 + .49 = 1.008 = 1.003
__ __ _ _
5. T = X Y / Sx y dif
t = 5.31 2.93 / 1.003
t = 2.38 / 1.003
t = 2.372

_
Sx = .72
_
Sy = .70

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

PRUEBA NO PARAMTRICA
X = ( fo fe)
fe
MDC = Mtodo de Crianza
Fo = Cantidad de personas observadas.
Caractersticas Chi cuadrada no requiere que los elementos que integra la muestra no
contenga datos paramtricos. Solo se requiere que contengan alguna caracterstica en
comn. Sirve para comparar el comportamiento de 2 o ms circustancias. Se aplica para
muestras grandes o pequeas.
Se aplica para muestras iguales o de diferente tamao.
Se plantea desde el principio la hiptesis nula con su grado o nivel de confianza.
Ejercicio
El mtodo que los padres eligen para educar a sus hijos es o no influenciado por la postura
ideolgica de estos.
Usted se considera rgido o flexible en el mtodo que usa?
Mdc

Conservadores Liberales 19
20

Rgido

fo = 14
fe = 10.76
.98

Flexible

fo = 6
fe = 9.23
1.13

fo = 7
fe = 10.23
.102

fo= 12
fe = 8.76
1.20

C = no. Columnas o muestras


R = Renglones o mtodos
TMR = total marginal rengln. Suma de lo que esta en el rengln de cada casilla.
TMC = Suma columna
fe = Frecuencia esperada
Ho. 95%
gl = ( c -1 ) ( r-1)
gl = (2 1) ( 2 -1)
gl = 1
gl = 3.84
X = ( fo fe)

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Fe fe = (TMR) (TMC) / N
Ejemplo:
fe = 21x20 / 39 = 420 / 39 = 10.76

TMR = 14+7 =21

TMC = 14 + 6 = 20

X = (14 10.76)/ 10.76 = (3.24) /10.76 = 10.49/ 10.76 = .98


X = (7 -10.23) / 10.23 = (-3.23)/ 10.23 = 1.01
.98+ .102 + 1.13 + 1.20 = 3.4.12
X = 3.412
FRMULA DIRECTA
Solo se utiliza en 2 x 2.
fo = 14 A
fo = 7B
fo = 6 C

fo = 12 D

FRMULA
X

=
N( AD BC)
(A+B) (A+C) (B+D) (C+D)
AD = 14 X 12 = 168
BC = 6 X 7 = 42
X= 39 (168 42) = (126) = 15876 x 39
X = 619164 / (14+7)(14+6)(7+12)(6+12)
X = 619164 / (21) (20) (19) (18)
X = 619164 / 143640
X = 4.310
PRUEBA DE LA MEDIANA
MUJERES
HOMBRES
5
2
3
8
7
9
2
6
4
5
4
5.5
2
10
3
3
5
Md = n +1 /2
Pasos.
1. Md = 17 +1 / 2 = 18 / 2 = 9 ----> lugar de la mediana
2. Ordenar los datos.
2-2-2-3-3-34-4-5-5-5-5.5-6-7-8-9-10
El elemento mediano se considera sobre:
S = sobre la mediana D = debajo de la mediana
M
H

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Fo= 3
.649
Fo = 6
.739

Fo = 6
4.23
.739
Fo = 2
3.76
.821

D
TAREA
X = ( fo fe)
fe
TMR = 3+6 = 9
TMC = 3+6 = 9
1. fe = 9x9 /17 = 81 / 17 = 4.76
(3-4.76)/ 4.76 = (-1.76)/ 4.76 = 3.09/ 4.76 = .649
2. TMR = 3+6 = 9

TMC = 6+2 = 8

Fe = 9x8/ 17 = 72 /17 = 4.23


(6-4.23)/ 4.23 = (1.77)/ 4.23 = 3.13/ 4.23 = .739
3.

TMR = 6+2 = 8

TMC = 6+3 = 9

Fe = 8x9/ 17 = 72 = 4.23
(6-4.23)/ 4.23 = (1.77)/ 4.23 = 3.13/ 4.23 = .739
4.

TMR = 6+2 = 8

TMC = 2+6 = 8

Fe = 8x8 /17 = 64/ 17 = 3.76


(2-3.76) /3.76 = (-1.76)/3.76 = 3.09/3.76 = .821
X = 2.948
ANLISIS DE VARIANZA EN DOS O MAS DIRECCIONES POR RANGOS DE FRIEDMAN.
Frmula
Xr = 12 / 3N ( k+1) ( E Ri ) 3N (k +1)
Caractersticas.
1 sola muestra ante diferentes circunstancias
Explicacin Frmula.
12 constante
3 constante
N total de datos que integran la muestra
K num. De circunstancias o condiciones en que se mide la muestra.
+1 constante
sumatoria, suma de cada uno de los rangos
Ri rango infinito
E sumatoria de la sumatoria

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Ejercicio.
Conocer si existe o no relacin entre la violencia de los programas de tv y la hostilidad que
manifiesta.
Ho. 95%
V BAJA R1 V MEDIA R2 V ALTA R3
A
50
3
35
2
20
2.5
C
40
1
45
2.5
45
3
D
25
1
30
2
40
2
E
30
2
30
2
30
3
F
30
1
35
2
40
1
G
30
2
40
3
25
3
H
35
1
40
2
50
3
I
40
1.5
40
1.5
50
3
J
20
1
25
2
40
3
B
25
1
30
2
35
3
ERI = 14.5
21
24.5
PASOS.
1. gl = (k-1) = (3-1) =2 = 5.991
2. Dar valor a rangos. Al mas alto se le da 3, medio 2, bajo 1.
3. Sumatoria
4. Sustitucin
Parte 1.
X = 12 /3N( k+1)
X= 12 / 3(10) (3+1) = 12 / 30(4) = 12/ 120 = .1
Parte 2.
( E Ri) -3 N (k+1)
(14.5) +(21) + (24.5) 3(10)(3+1)
(210.25+441+600.25)-120
Parte 3.
(.1)(1.25.15)-120= 5.15
Tarea.
En el E 6, poner 30, 30, 35.
Xr = 12/2N (k+1) ( E Ri) -3 N (k+1)
Xr= 12/ 30(4) ( E Ri) (30)(4)
Xr= 0.1( E Ri)-120
Xr= (0.1) ((4) + (20.5)+(25.5)) -120
Xr= (0.1) (196+420.25+650.25)-120
Xr= (0.1) (1266.5)-120

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Xr= 126.65 -120


Xr= 6.65
ANLISIS DE VARIANZA EN UNA SOLA DIRECCIN POR RANGOS DE KRUSKAL
WALLIS.
Hiptesis: La edad no influye en la terapia. 95% de confianza.
2 o 3 muestras ante 1 circunstancia.
Ejercicio.
Problemas respiratorios causados por estrs.
Adolescentes
R1
adultos Jvenes
8
9
7
6
3
3.5
3
3.5
2
2
12
10.5 23
20
12
10.5 20
17
10
9
18
14.5
9
8
17
13
6
5
21
18.5
8
7
19
16
ri=
59.5 14
12
116.5
Valor de Rangos: Menos dias 1 Mas das 25

R2
8
1
30
16
18
21
29
32
25

Adultos edad Media

Gl = (k-1) ) (3-1) = 2 = 5.99


Frmula:
El valor del rango se da de acuerdo a los datos.
H= 12/ (N)(N+1) ( Ri/n)
H= 12/ (25) (26) = 12/ 650 = (.018)
=((59.5)/ 8 + (116.5))/ 9 + (149)/ 8).018 3 (25+1)
=(442.53+1508.03+2775).018-3(26)
=(4725.56).018-78
=85.06-78=7.06
HOJA DE RESPUESTAS DE EJERCICIOS
Diseo muestral:
1.- 2,439 jovenes
2.- 398 jovenes
3.- 334 jovenes
4.- 200 jovenes
Tipos de diseo de muestra
1.- Media aritmtica 19.32
2.- Medida de tendencia centra 19l
3.- Mediana ocupa el lugar 16 y el nmero es el 19

1
24
22
14.5
18.5
23
25
21
149

R3

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

4.- Rango o amplitud total 9


Medidas de dispersin
1.- Varianza = .33
2.- La media aritmtica es
90% = +19.614, -18.506
95% = + 19.70, - 18.41
99% = +19.91, -18,20
3.- 99.64%
COCIENTE T
gl=13 = 1.7709
t= 1.35
En ste caso el resultado es de 1.35 a comparacin de los grados de libertad que tengo que
es de 1.77, por lo tanto es aceptada la Ho. Y por consecuencia no se plantea la Hi.
CHI CUADRADA
gl=1=3.841
x2= 4.6
Por lo anterior observamos que x 2 es mayor que nuestro nivel o grado de libertad, en este
momento nuestra hiptesis nula (Ho) es rechazada y se plantea la hiptesis alternativa (Hi)
Hi= si existe una diferencia significativa en el nmero de accidentes ocurridos en trabajadores
de obras publicas que utilizan proteccin a quienes no lo utilizan, esto se plantea con un nivel
o grado de confianza de 95%.
gl=2 =5.99
x2= 7.2
Por lo anterior observamos que x 2 es mayor que nuestro nivel o grado de libertad, en este
momento nuestra hiptesis nula (Ho) es rechazada y se plantea la hiptesis alternativa (Hi)
Hi= si existe una diferencia significativa en el nmero de accidentes ocurridos en trabajadores
de obras publicas que utilizan proteccin a quienes no lo utilizan, esto se plantea con un nivel
o grado de confianza de 95%.
PRUEBA DE LA MEDIANA
gl= 1 = 3.841
X2= 2.83
Por lo anterior observamos que si existe diferencia pero esta no es significativa por lo que se
acepta la hiptesis nula.
ANLISIS DE VARIANZA EN DOS O MS DIRECCIONES POR RANGOS DE FRIEDMAN
gl=2 = 5.99

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

xr2= 10.55
Como hay una diferencia significativa entre los grados de libertad y el resultado se rechaza la
hiptesis nula (Ho) y se plantea la hiptesis alternativa (Hi)
Hi= si hay diferencia significativa en la dosis con respecto a los das de recuperacin, esto
con un nivel o grado de libertad del 95%
ANLISIS DE VARIANZA EN UNA DIRECCIN POR RANGOS DE KRUSKAL WALLIS
gl=2 = 5.991
H=4.67
El resultado es menor que los grados de libertad requeridos por lo tanto se acepta la hiptesis
nula (Ho), y no se plantea la Hi.

COEFICIENTE T
Gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

90%
0.10
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319

95%
0.05
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714

97.5%
0.025
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069

99%
0.01
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500

99.5%
0.005
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

g.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

24
1.318
25
1.316
26
1.315
27
1.314
28
1.313
29 2 1.3112
30 X
1.310
X .025
40 .0000393
1.303
.000982
60 .0100 1.296
.0506
120 .0717 1.289
.216
.207
.484

1.282
.412
.831
.676
1.237
.989
1.690
1.344
2.180
1.735
2.700
2.156
3.247
2.603
3.816
3.074
4.404
3.565
5.009
4.075
5.629
4.601
6.212
5.142
6.908
5.697
7.564
6.265
8.231
6.844
8.907
7.434
9.591
8.034
10.283
8.643
10.982
9.260
11.688
9.886
12.401
10.520
13.120
11.160
13.844
11.808
14.573
12.461
15.308
13.121
16.047
13.787
16.791
17.192
20.707
24.311
27.991
35.535
43.275
51.172
59.196
67.328

20.5669
24.433
28.366
32.357
40.482
48.758
57.153
65.647
74.222

1.711
1.708
1.706
1.703
1.701
21.699 2
1.697X ..90
X .05
1.6842.706
.00393
.1031.6714.605
.3521.6586.251
.7111.6457.779
1.145
9.236
1.635
10.645
2.167
12.017
2.733
13.362
3.325
14.684
3.940
15.987
4.575
17.275
5.226
18.549
5.892
19.812
6.571
21.064
7.261
22.307
7.962
23.542
8.672
24.769
9.390
25.989
10.117 27.204
10.851 28.412
11.591 29.615
12.338 30.813
13.091 32.007
13.848 33.196
14.611 34.382
15.379 35.563
16.151 36.741
16.928 37.916
17.708 39.087
18.493 40.256

2.064
2.060
2.056
2.052
2.048
2.045
2
X 2.042
..95
2.021
3.841
2.000
5.991
1.960
7.815
9.488
1.960
11.070
12.592
14.067
15.507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773

2.492
2.485
2.479
2.473
2.467
2.462
2
2
X ..975 X2.457
.99
2.423
5.024
6.635
2.390
7.378
9.210
2.326
9.348
11.345
11.143 13.277
2.326
12.832 15.086
14.449 16.812
16.013 18.475
17.535 20.090
19.023 21.666
20.483 23.209
21.920 24.725
23.336 26.217
24.736 27.688
26.119 29.141
27.488 30.578
28.845 32.000
30.191 33.409
31.526 34.805
32.852 36.191
34.170 37.566
35.479 38.932
36.781 40.289
38.076 41.638
39.364 42.982
40.646 44.314
41.923 45.642
43.194 46.963
44.461 48.278
45.722 49.588
46.979 50.892

2.797
2.787
2.779
2.771
2.763
2.756
2
X .995 2.750
2.704
7.879
10.597 2.660
12.838 2.617
14.860 2.576
16.750
18.548
20.278
21.955
23.589
25.188
26.757
28.300
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
41.401
42.796
44.181
45.558
46.928
48.290
49.645
50.993
52.336
53.672

22.465
26.509
30.612
34.764
43.188
51.739
60.391
69.126
77.929

49.802
55.758
61.656
67.505
79.082
90.531
101.879
113.145
124.342

53.203
59.342
65.410
71.420
83.298
95.023
106.629
118.136
129.561

60.275
66.766
73.166
79.490
91.952
104.215
116.321
128.299
140.169

46.059
51.805
57.505
63.167
74.397
85.527
96.578
107.565
118.498

57.342
63.691
69.957
76.154
88.379
100.425
112.329
124.116
135.807

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

TABLA JI CUADRADA

Z
0.0
0.1
0.2
0.3
0.4

.00
.0000
.0398
.0793
.1179
.1554

.01
.0040
.0438
.0832
.1217
.1591

.02
.0080
.0478
.0871
.1255
.1628

.03
.0120
.0517
.0910
.1293
.1664

.04
.0160
.0557
.0948
.1331
.1700

.05
.0199
.0596
.0987
.1368
.1736

.06
.0239
.0636
.1026
.1406
.1772

.07
.0279
.0675
.1064
.1443
.1808

.08
.0319
.0714
.1103
.1480
.1844

.09
.0359
.0753
.1141
.1517
.1879

0.5
0.6
0.7
0.8
0.9

.1915
.2257
.2580
.2881
.3159

.1950
.2291
.2612
.2910
.3186

.1985
.2324
.2642
.2939
.3112

.2019
.2357
.2673
.2967
.3238

.2054
.2389
.2704
.2995
.3264

.2088
.2422
.2734
.3023
.3289

.2123
.2454
.2764
.3051
.3315

.2157
.2486
.2794
.3078
.3340

.2190
.2518
.2823
.3106
.3365

.2224
.2549
.2852
.3133
.3389

1.0
1.1
1.2
1.3
1.4

.3413
.3643
.3849
.4032
.4192

.3438
.3665
.3869
.4049
.4207

.3461
.3686
.3888
.4066
.4222

.3485
.3708
.3907
.4082
.4236

.3508
.3729
.3925
.4099
.4251

.3531
.3749
.3944
.4115
.4265

.3554
.3770
.3962
.4131
.4279

.3577
.3790
.3980
.4147
.4292

.3599
.3810
.3997
.4162
.4306

.3621
.3830
.4014
.4177
.4319

1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.5
4.0

.4332
.4452
.4554
.4641
.4713
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4987
4997
4999

.4345
.4463
.4564
.4649
.4719
.4778
.4826
.4864
.4896
.4920
.4940
.4955
.4966
.4975
.4982

.4357
.4474
.4573
.4656
.4726
.4783
.4830
.4868
.4898
.4922
.4941
.4956
.4967
.4976
.4983

.4370
.4484
.4582
.4664
.4732
.4788
.4834
.4871
.4901
.4925
.4943
.4957
.4968
.4977
.4983

.4382
.4495
.4591
.4671
.4738
.4793
.4838
.4875
.4904
.4927
.4945
.4959
.4969
.4977
.4984

.4394
.4505
.4599
.4678
.4744
.4798
.4842
.4878
.4906
.4929
.4946
.4960
.4970
.4978
.4984

.4406
.4515
.4608
.4686
.4750
.4803
.4846
.4881
.4909
.4931
.4948
.4961
.4971
.4979
.4985

.4418
.4525
.4616
.4693
.4756
.4808
.4850
.4884
.4911
.4932
.4949
.4962
.4972
.4979
.4985

.4429
.4535
.4625
.4699
.4761
.4812
.4854
.4887
.4913
.4934
.4951
.4963
.4973
.4980
.4986

.4441
.4545
.4633
.4709
.4767
.4817
.4857
.4890
.4916
.4936
.4952
.4964
.4974
.4981
.4986

TABLA Z

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Ejemplo, para z 1.96, el rea sombreada es 0.4750 fuera del rea total de 1.0000
GUIA DE EXAMEN

(mayo 2008)

1. Expn de manera clara la importancia de explicar el resultado.


2. De manera amplia, describe el concepto de Estadstica.
3. Describe el concepto de poblacin y el de muestra.
4. Resuelve: (Medidas de tendencia central, Medidas de desviacin y dispersin,
Graficar). 16, 18, 25, 24, 31, 19, 32, 17, 18, 33, 18 -.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

5. Describe las caractersticas y uso del Cociente T.


6. Explica con ejemplos en qu consiste el planteamiento o la prueba de hiptesis.
7. Explica en qu consiste el uso de la x2 (Chi cuadrada) como prueba no paramtrica.
8. Explica las caractersticas y el uso de la prueba de la mediana de x 2 (Chi cuadrada).
9. Describe las caractersticas y el uso del anlisis de varianza en 2 o ms direcciones
por rango de Friedman.
10. Describe las caractersticas y el uso del anlisis de varianza en una direccin de la
prueba de Kruskal Wallis.
11. Resuelve: Estima el valor de y con base en la ecuacin de regresin.
r= 0.81
Ox= 4
Oy= 2
x= 15
y= 14
x= 3 y 23.
12. Explica en qu consisten los llamados errores de no muestreo del diseo muestral.
13. Ante una poblacin estimada de 25,000 personas, y una varianza desconocida;
encuentra los tamaos de muestra a 4 niveles o grados de confianza de 95%, 96%,
97% y 98%.

Estadstica Avanzada.
Estadstica:
Instrumento de apoyo a la teora.
Sirve para recopilar variables cualitativas y cuantitativas.
Su ordenacin es ascendente; es decir, de menor a mayor.
Es importante su agrupacin.
Nos proporciona elementos para plasmarlo en grficos ( Cuadros y tablas)
Fuente: Para saber de donde se obtienen los datos. Nos ayuda a obtener muestreos.
La estadstica nos permite conocer como se comporta el universo pero no al 100%. Nos permite
INFERIR.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Nos sirve para comparar muestras.


Conocer la correlacin entre variables dependientes e independientes.
Inferir entre la variable dependiente e independiente.
TAREA:
Caractersticas que considero de un cuestionario para entrevista.
Brevedad
Claridad
Concisa
Opcin Mltiple
Tema en especfico
Coherente
Con un diseo adecuado para obtener resultados concretos.
Que no contenga sesgos es decir, que no este manipulado.
DISEO MUESTRAL TAMAO DE LA MUESTRA
N = Universo, poblacin real o aprox.
n = Muestra- Extrae una parte de la poblacin. Es representativa.
r = Varianza Total
B = Error
Varianza: Porcentaje de la variable principal de estudio.
Notas:
Nivel mnimo de confianza aceptado socialmente: 95%
Cuando se desconoce el % de P es igual a .5
FRMULA: n = N(r) / (N-1) D+r
Nivel de confianza es igual a 98%
N = 8000
r = p*q
p+q
P = varianza de N = .4
B = .02
D = B/4 = (.02) = .0004/4 = .0001
n = (8000)(.25)
= 2000
= 2000 = 1904.9 = 1910
(7999)(.0001)+.25 .7999+.25 1.0499

Ejercicios
N= 8000
n = 800000(.25) = 200000 = 2492.21
(799999)(.0001)+.25 80.2499
N= 800000 con nivel de 95% confianza
n = N(r)/ N-1) D+r

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

B= .05
D= B/4 = (.05)/4 = .0025/4 = .000625
n= 8000 (.25)
=
2000 = 380
(8000-1).000625+.25 5.249375
TIPOS DE MUESTREO ALEATORIO O PROBABILISTICO.
Todos los miembros de la poblacin tienen la misma probabilidad de formar parte de la muestra.

Aleatorio
Probabilstica
Ordenado
Sistematizado
Conglomerados o racimos
Muestreo Combinado
Errores de No muestreo

Cuestionario: Encabezado, datos generales que se requieren, menos, nombre y domicilio. Sexo si hay
comparacin. Y mnimo dos preguntas abiertas.
TAREA.
800 000 con 95% confianza.
Frmula
n = N(r) / (N-1) D+r
B= .05
D= = B/4 = (.05)/4 = .0025/4 = .000625
n = 800000 (25)
= 200000
=
200000 = 399.8006 = 400
(800000-1).00625+.25 (799999).250655 500.24937
ACOPIO: RECOPILACIN DE DATOS
18-20-21-17-21-19-22-19-19-24-18-19-20-18-20-22-25-28-19-23-25-30-28-18-17-19-20-31-29-20-21
Paso 1. Ordenar en forma ascendente
17-17-18-18-18-18-19-19-19-19-19-19-20-20-20-20-20-21-21-21-22-22-23-24-25-25-28-28-29-30-31
Paso 2. Promedio. Suma de todos los datos entre la suma de todos los factores
X = x = 670 = 21.61
Promedio de Edad = 21.61
Paso 3. Moda. Dato que mas se repite.
Moda = 19
Paso 4. Mediana.
Frmula: Md = n+1
2
Md= 31+1 = 32 = 16
2
2
Mediana = 20

Lugar de la mediana = 16

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

FRECUENCIAS

Mod=19

Md = 20

Frecuencia Relativa = Fa / Ft = 20/31


6/31
5/31
Punto Medio = Ls +Li /2
Rango= Ls Li +1
31 -17 +1 = 15
Clase
Frecuencia Absoluta
1. 17-21
20
2. 22-26
6
3. 27-31
5

F Acumulada
20
26
31
Ef = n = 31

Frecuencia Absoluta.
HISTOGRAMA
Y
20
15
10
5
X 17-21

22-26
CLASES

27-31

POLIGONO DE FRECUENCIAS
20

15 10
5

F Relativa
.64
.19
.17

X
19
24
29

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

19

24

29
= 360 = 100
31 = 100
.64 x 360 = 230

Ejemplo de encuesta.
Anota tu edad. en el ltimo ao haz tenido relaciones sexuales con proteccin?
Un encuesta debe de llevar: Encabezado, explicar el contenido de los datos, lugar o localidad, fecha o
periodo, pi de pgina, fuente: indirecta bibliografa, directa - Encuesta
Media Aritmtica
____
X = fx / n
___
X = fx / n = 669 / 31 = 21.58
_
f
x fx
(x-x)
17 -21 20
22-26
6
27-31
5

19
24
29

17

380
144
145
669

2.58
2.42
7.42
12.42

_
x = 21.58
DESVIACIN MEDIA
_
DM = ( x x) / n
DM = 12.42 / 31
DM = 0.40
VARIANZA
S = t = G = O

_
(x-x)f
133.12
35.13
275.28
443.53

31

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

FRMULA
S = ( x x) f / n-1 = 443.53 / 30 = 14.78
Desviacin Estndar.
S=T=

=
_
S = ( x x)f /n -1 = 443.53/ 30 = 14.78
S = 3.84
Error Estndar.
_
Sx = tx =
x =
_
Sx = S/ n-1
_
Sx = 3.84/ 30
_
Sx = 3.84 / 5.47
_
Sx= 0.70

_
x

Ejercicio
En base a la muestra en que rango o entre que lmites se encuentra la media aritmtica de la poblacin?
_
M
90% = 1.68
95% = 1.96
99% = 2.58
_
_
_
M = x + - sx (95%)
sx (95%)
_
M = 21.58 + (0.70) (1.96)
_
M = 21.58 (.70) (1.96)
_
M = 21.58 +1.37 = 22.95
_
M = 21.58 -1.37 = 20.20
Entre 20 aos y 23 aos se encuentra la edad de nuestra poblacin.
Tarea.
_
_
_
M = x + - sx (99%)
sx (99%)
_

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

M = 21.58 + (0.70) (2.58)


_
M = 21.58 (.70) (2.58)
_
M = 21.58 +1.806= 23.386
_
M = 21.58 -1.806 = 19.774
_
_
_
M = x + - sx (90%)
sx (90%)
_
M = 21.58 + (0.70) (1.68)
_
M = 21.58 (.70) (1.68)
_
M = 21.58 +1.176 = 22.756
_
M = 21.58 -1.176 = 20.404
__ __
SUPUESTO: M = X
__
M = 96.61%
17

31

20 21.58 23
Z = Grado de Confianza.
Frmula
__ __
Z=MX
Sx
Z1 = 21.58-20/ 0.70
Z1 = 1.58 / 0.70
Z1 = 2.25 = 48.78%
X2 = limite Superior
__
Z2 = M X2
Sx

- X1 = Lmite inferior

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Z2 = 21.58 -23 / 0.70


Z2 = 1.42 / .70 = 2.02 = 47.83%
__
Entre 20 y 22 se encuentra la M y el grado de confiabilidad se obtiene sumando 48.78 + 47.83
Ejercicio.
__
Li= 20.5 Ls= 22.5 M = 21.58
Z1 = 21.58 20.5/ 0.70 = 1.08 / 0.70 = 1.54 = 43.82
Z2 = 21.58 22.5 = 1.31 = 40.49
40.49 + 43.82 = 84.31
Planteamiento y Prueba de Hiptesis.
Se utiliza para comunicar el comportamiento de dos muestras ante una situacin comn a ambas.
Se plantea desde el principio la hiptesis nula con nivel o grado de confianza.
Afirmando (Ho) que el comportamiento entre las muestras es semejante, es decir niega diferencias
significativas.
Cuando las diferencias si son significativas por f el resultado, o porque estas rebasen lo establecido
por grados de libertad, se plantea la hiptesis alternativa o de investigacin ( Hi) que afirma que las
muestras comparadas, s son diferentes, es decir que no son semejantes.
1 Paso
Se plantea la hiptesis nula
Ho: niega que las diferencia entre ambas sea significativa para desarrollar una depresin.
95% nivel de confianza.
2 paso
Establecer grado de libertad
gl = ( n-1)+ ( n -1)
gl = (8-1) + (7-1)
gl = (7)+ (6)
gl = 13
1.77 limite de diferencia, diferencia mxima
COCIENTE T O T DE STUDENT
__ __ _ _
T = X Y / Sx y dif
Caractersticas.
- Prueba estadstica paramtrica
- Se utiliza para conocer si sus muestras comparten semejanzas o diferencias.
- Se utiliza para muestras grandes o muestras pequeas
- Se utiliza para muestras iguales o de diferente tamao

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Se plantea desde el principio la hiptesis nula (Ho) con su nivel o grado de confianza.

Ejercicio.
Depresin infantil.
Se someten a terapia
Igual tratamiento
Ambas se observan desde el primer da y ver cuanto se tarda en recuperar
NIAS
X
4
6
5
3
7
2.5
8
7

NIOS
Y
7
2
1
4
1
2
3

Ho 95%

Pasos.
1. Plantear Ho.
2. gl = (n-1) + (n-1)
gl = (8-1) + (7-1)
gl = 7+6 = 13
gl = 13
1.77
3. elevar al cuadrado X y Y y sumarlos
NIAS X
X
4
16
6
36
5
25
3
9
7
49
2.5
6.25
8
64
7
49
42.5 254.25

NIOS
Y
7
2
1
4
1
2
3
20

Frmula Cociente T.
_ _ __
T= x y / Sx y dif
Pasos.
_
1. X = 42.5 /8 = 5.31
y = 20 /7 = 2.86

Y
49
4
1
16
1
4
9
84

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

2. Desviacin Estndar.
_
Sx = x - x
= 254.25/8 5.31 = 31.78 28.19= 3.5 Sx= 1.89 = 1.90
n
_
Sy = y - y = 84 / 7 2.86 = 12 -8.17 = 3.83 Sy = 1.95
n
3. Error Estndar_
_
Sx = Sx / n-1 = 1.90/ 8-1= 1.90/ 7 = 1.90 /2.64
Sx = .72
_
_
Sy = Sy / n-1 = 1.95/ 7-1 = 1.95/ 6 = 1.95/ 2.45
Sy = .80
4. Error Estndar de la Diferencia
__
_
_
Sxy dif Sx + Sy
__
Sxy dif .72 + .80 = .518 + .64 = 1.158 = 1.076
__ __ _ _
5. T = X Y / Sx y dif
t = 5.31 2.86 / 1.07
t = 2.45 / 1.07
t = 2.29
Tarea.
NIAS X
X
4
16
6
36
5
25
3
9
7
49
2.5
6.25
8
64
7
49
42.5 254.25

NIOS Y
Y
7 49
2 4
1 1
4 16
1 1
2 4
3 9
3.5 12.25
23.5 96.5

Frmula Cociente T.
_ _ __
T= x y / Sx y dif
Pasos.
_
1. X = 42.5 /8 = 5.31
y = 23.5/8 = 2.93
2. Desviacin Estndar.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

_
Sx = x - x
n

= 254.25/8 5.31 = 31.78 28.19= 3.5 Sx= 1.89 = 1.90

_
Sy = y - y = 96.5/ 8 2.93 = 12.06 - 8.58= 3.48 Sy = 1.86
n
3. Error Estndar_
Sx = Sx / n-1 = 1.90/ 8-1= 1.90/ 7 = 1.90 /2.64
_
Sy = Sy / n-1 = 1.86/ 8-1 = 1.86/ 7= 1.86/ 2.64

_
Sx = .72
_
Sy = .70

4. Error Estndar de la Diferencia


__
_
_
Sxy dif Sx + Sy
__
Sxy dif .72 + .70 = .518 + .49 = 1.008 = 1.003
__ __ _ _
5. T = X Y / Sx y dif
t = 5.31 2.93 / 1.003
t = 2.38 / 1.003
t = 2.372
PRUEBA NO PARAMTRICA
X = ( fo fe)
fe
MDC = Mtodo de Crianza
Fo = Cantidad de personas observadas.
Caractersticas Chi cuadrada no requiere que los elementos que integra la muestra no contenga datos
paramtricos. Solo se requiere que contengan alguna caracterstica en comn. Sirve para comparar el
comportamiento de 2 o ms circustancias. Se aplica para muestras grandes o pequeas.
Se aplica para muestras iguales o de diferente tamao.
Se plantea desde el principio la hiptesis nula con su grado o nivel de confianza.
Ejercicio
El mtodo que los padres eligen para educar a sus hijos es o no influenciado por la postura ideolgica
de estos.
Usted se considera rgido o flexible en el mtodo que usa?

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Mdc

Conservadore Liberales 19
s 20

Rgido

fo = 14
fe = 10.76
.98

Flexible

fo = 6
fe = 9.23
1.13

fo = 7
fe = 10.23
.102

fo= 12
fe = 8.76
1.20

C = no. Columnas o muestras


R = Renglones o mtodos
TMR = total marginal rengln. Suma de lo que esta en el rengln de cada casilla.
TMC = Suma columna
fe = Frecuencia esperada
Ho. 95%
gl = ( c -1 ) ( r-1)
gl = (2 1) ( 2 -1)
gl = 1
gl = 3.84
X = ( fo fe)
fe
fe = (TMR) (TMC) / N
TMR = 14+7 =21
TMC = 14 + 6 = 20
Ejemplo:
fe = 21x20 / 39 = 420 / 39 = 10.76
X = (14 10.76)/ 10.76 = (3.24) /10.76 = 10.49/ 10.76 = .98
X = (7 -10.23) / 10.23 = (-3.23)/ 10.23 = 1.01
.98+ .102 + 1.13 + 1.20 = 3.4.12
X = 3.412
FRMULA DIRECTA
Solo se utilize en 2 x 2.
fo = 14 A

fo = 7B

fo = 6 C

fo = 12 D

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

FRMULA
X = N( AD BC)
(A+B) (A+C) (C+D)
AD = 14 X 12 = 168
BC = 6 X 7 = 42
X= 39 (168 42) = (126) = 15876 x 39
X = 619164 / (14+7)(14+6)(7+12)(6+12)
X = 619164 / (21) (20) (19) (18)
X = 619164 / 143640
X = 4.310
PRUEBA DE LA MEDIANA
9
8
MUJERES
HOMBRES
6
2
3
8
7
9
2
6
4
5
4
5.5
2
10
3
3
5
Md = n +1 /2
Pasos.
1. Md = 17 +1 / 2 = 18 / 2 = 9 ----> lugar de la mediana
2. Ordenar los datos.
2-2-2-3-3-34-4-5-5-5-5.5-6-7-8-9-10
El elemento mediano se considera sobre:
S = sobre la mediana D = debajo de la mediana
S
M
Fo= 3
.649

H
Fo = 6
4.23
.739

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Fo = 6
.739

Fo = 2
3.76
.821

D
TAREA
X = ( fo fe)
fe
TMR = 3+6 = 9
TMC = 3+6 = 9
1. fe = 9x9 /17 = 81 / 17 = 4.76
(3-4.76)/ 4.76 = (-1.76)/ 4.76 = 3.09/ 4.76 = .649
2.
TMR = 3+6 = 9
TMC = 6+2 = 8
Fe = 9x8/ 17 = 72 /17 = 4.23
(6-4.23)/ 4.23 = (1.77)/ 4.23 = 3.13/ 4.23 = .739
3.
TMR = 6+2 = 8
TMC = 6+3 = 9
Fe = 8x9/ 17 = 72 = 4.23
(6-4.23)/ 4.23 = (1.77)/ 4.23 = 3.13/ 4.23 = .739
4.
TMR = 6+2 = 8
TMC = 2+6 = 8
Fe = 8x8 /17 = 64/ 17 = 3.76
(2-3.76) /3.76 = (-1.76)/3.76 = 3.09/3.76 = .821
X = 2.948

ANLISIS DE VARIANZA EN 2 O MAS DIRECCIONES POR RANGOS DE FRIEDMAN.


Frmula
Xr = 12 / 3N ( k+1) ( E Ri ) 3N (k +1)
Caractersticas.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

1 sola muestra ante diferentes circunstancias


Explicacin Frmula.
12 constante
3 constante
N total de datos que integran la muestra
K num. De circunstancias o condiciones en que se mide la muestra.
+1 constante
sumatoria, suma de cada uno de los rangos
Ri rango infinito
E sumatoria de la sumatoria
Ejercicio.
Conocer si existe o no relacin entre la violencia de los programas de tv y la hostilidad que manifiesta.
Ho. 95%
A
C
D
E
F
G
H
I
J
B

V BAJA R1 V MEDIA R2 V ALTA


50
3
35
2
20
40
1
45
2.5
45
25
1
30
2
40
30
2
30
2
30
30
1
35
2
40
30
2
40
3
25
35
1
40
2
50
40
1.5
40
1.5
50
20
1
25
2
40
25
1
30
2
35
ERI = 14.5
21

R3
2.5
3
2
3
1
3
3
3
3
3
24.5

PASOS.
1. gl = (k-1) = (3-1) =2 = 5.991
2. Dar valor a rangos. Al mas alto se le da 3, medio 2, bajo 1.
3. Sumatoria
4. Sustitucin
Parte 1.
X = 12 /3N( k+1)
X= 12 / 3(10) (3+1) = 12 / 30(4) = 12/ 120 = .1
Parte 2.
( E Ri) -3 N (k+1)
(14.5) +(21) + (24.5) 3(10)(3+1)
(210.25+441+600.25)-120
Parte 3.
(.1)(1.25.15)-120= 5.15
Tarea.
En el E 6, poner 30, 30, 35.

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

Xr = 12/2N (k+1) ( E Ri) -3 N (k+1)


Xr= 12/ 30(4) ( E Ri) (30)(4)
Xr= 0.1( E Ri)-120
Xr= (0.1) ((4) + (20.5)+(25.5)) -120
Xr= (0.1) (196+420.25+650.25)-120
Xr= (0.1) (1266.5)-120
Xr= 126.65 -120
Xr= 6.65
ANLISIS DE VARIANZA DE 1 SOLA DIRECCIN POR RANGOS DE KRUSKAL WALLIS.
Hiptesis: La edad no influye en la terapia.
95%
2 o 3 muestras ante 1 circunstancia.
Ejercicio.
Problemas respiratorios causados por estrs.
Adolescentes R1
8
7
6
3
3.5
12
10.5
12
10.5
10
9
9
8
6
5
8
7
ri=
59.5

adultos Jvenes
9
3
2
23
20
18
17
21
19
14

R2
3.5
2
20
17
14.5
13
18.5
16
12
116.5

Adultos edad Media R3


8
1
1
30
24
16
22
18
14.5
21
18.5
29
23
32
25
25
21
149

Valor de Rangos: Menos dias 1 Mas das 25


Gl = (k-1) ) (3-1) = 2 = 5.99
Frmula:
El valor del rango se da de acuerdo a los datos.
H= 12/ (N)(N+1) ( Ri/n)
H= 12/ (25) (26) = 12/ 650 = (.018)
=((59.5)/ 8 + (116.5))/ 9 + (149)/ 8).018 3 (25+1)

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

=(442.53+1508.03+2775).018-3(26)
=(4725.56).018-78
=85.06-78=7.06
FRMULA R PEARSON.
R= (zx)(zy)/ N
Consigna: A mayor edad (y) mayor estatura (x).
Medir asociacin entre 0- 1.
Ejercicio.
Inventar una medida para ver las frecuencia del estrs.
Estrs de los hijos en relacin a estrs de los padres, tomando de referencia al primognito.
X
5
17
23
6
16
13
25

X
25
+-1.40
289 +-.28
529 1.12
36
-1.26
256 .14
169 .28
62
2.05
1929
105/7= X = 15
_
Y= 16.14
_
1. Zx= x x/ sx
_
1 Zy=yy/ sy

Y
8
3
20
8
14
18
32

Y
68
169
400
64
196
324
1024
2241

__
2. Sx = x / n x
Sx = 129/7 (15)
Sx = 275.5-225 = 50.5
Sx = 7.10
__
2. Sy= y / n y
Sy= 2241 /7 (16.14)
Sy = 320.4-260.4 = 59.65
Sy= 7.72
_
3. Zx = x-x/ sx
Zx = 5-15/ 7.10 = -10/7.10 = -1.40

-1.05
.04
.5
-1.05
-.27
.24
1.40

(-1.40)(-1.05) = 1.47
(.28)(.40) = -112
(1.12)(.5) = .56
(-1.26)(-1.05)= 1.32
(.14)(-.27)= .037
(.28)(.24)= .067
(2.05)(1.40)= 2.87

Apuntes de Estadstica elaborados por el Profr. Oscar Arturo Herrera Estrada

4.
r= (zx)/zy)/N = 6/7 = .85
Ecuacin de Regresin
X = 12
Y = 27
___ ___
Y = r (sy/sx)X r (Sy/sx) X + Y
= .85(7.72/7.10)12 - .85(7.72/7.10)15+16.14
=.85(1.08)12-.85(1.08)(15)+16.14
=11.01-13.77+16.14
=-2.76+16.14
=13.38
Tarea.
__ __
X = r (sy/sx)Y r (sy/sx) X+Y =
X = .85 (1.08)27 - .85(1.08)(15)+16.14
X = 24.78 -13.77 +16.14
X = 11.01 +16.14 = 27.15
MUCHAS GRACIAS POR ESTUDIAR DIARIAMENTE.

You might also like