Professional Documents
Culture Documents
FACULTAD DE INGENIERIA
ESTADISTICA
Antecedentes de la estadstica.
La estadstica desde su origen y a lo largo de la historia ha mostrado un
respetable prestigio en las estrategias de hacer uso de la informacin recopilada
con la finalidad de analizar la informacin contenida en datos.
Es comn sorprenderse de los resultados que predice la estadstica, tan es as
que en ocasiones resulta difcil pensar en que una estadstica no ha funcionado,
aunque tambin es importante considerar que siempre existe el error estadstico o
el error humano cometido al realizar una extraccin.
En la actualidad el hombre ha hecho uso de la estadstica en casos que van desde
el clculo ms sencillo hasta el ms complejo. En la vida diaria se pueden
observar ejemplos del uso de la estadstica; ya que el uso de sta es tan amplio
que se extiende desde un simple clculo hasta los mtodos utilizados para el
conocimiento cientfico y de la sociedad.
Conceptos de estadstica.
Significa descripciones numricas. Es el estudio de los fenmenos aleatorios. Es
la obtencin de conclusiones basada en los datos experimentales.
George C. Canavaros.
Es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a
individuos, grupos, series de hechos, etc. Y deducir de ellos gracias al anlisis de
estos datos unos significados precisos o unas previsiones para el futuro.
En general es la ciencia que trata de la recopilacin, organizacin, presentacin,
anlisis e interpretacin de datos numricos con el fin de realizar una toma de
decisin ms efectiva.
David Ruiz Muoz.
La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y
analizar datos, as como para sacar conclusiones vlidas y tomar decisiones
razonables basadas en tal anlisis.
Murria R. Spegiel.
Objetivo de la estadstica.
La estadstica como ciencia se encarga de recopilar, e interpretar datos que en el
futuro servirn para proyectar posibles problemticas futuras, consiguiendo segn
estos datos, la solucin ms viable y rpida.
El objetivo bsico de la estadstica es hacer inferencia acerca de una poblacin
con base a la informacin contenida en una muestra, qu significa esto?
Inferir significa inducir una cosa de otra, llevar consigo, conducir a un resultado.
Es decir se pretende establecer inferencia acerca de una poblacin, entendiendo a
la poblacin como un conjunto de individuos, organismos o entes inanimados de
los cuales queremos conocer alguna o algunas caractersticas para que nos
ayuden a tomar una decisin u obtener alguna conclusin de suma importancia, y
Donde:
Fi= Frecuencia Relativa
N= Tamao de muestra
Ni= Frecuencia absoluta
Frecuencia Acumulada: Es la suma acumulativa de las frecuencias absolutas de
cada uno de los intervalos.
Frecuencia Relativa Acumulada: Es el cociente entre la frecuencia absoluta
acumulada y el nmero total de datos.
Para comenzar, hay algunos datos que debemos calcular, estos son: el RANGO,
NUMERO DE CLASES y TAMAO O ANCHURA DE INTERVALO.
Estos datos los podemos calcular mediante frmulas, y utilizando los datos que se
nos presentan.
http://est...frecuencias/
Representaciones grficas.
Histograma.
Un Histograma es un tipo especial de grfica de barras que despliega la
variabilidad dentro de un proceso, tambin toma datos variables (tales como
alturas, pesos, densidades, tiempo, temperaturas, etc.) y despliega su
distribucin. Un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables, normalmente sealando las
marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los
datos.
Figura 1, Histograma y polgono.
Polgono de frecuencias.
Se representa por M o .
Se calcula:
en
clase modal.
f i - + 1 es la frecuencia absoluta inmediatamente posterior a la clase
modal.
a i es la amplitud de la clase.
Mediana.
Es el valor que ocupa el lugar central de todos los datos cuando
stos estn ordenados de menor a mayor .
La mediana se representa por M e .
La mediana se puede hallar slo para variables cuantitativas .
Calculo:
La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
Calculo:
Varianza.
La varianza es la media aritmtica del cuadrado de las desviaciones respecto
a la media de una distribucin estadstica.
Desviacin estndar.
La desviacin estndar es la raz cuadrada de la varianza.
Anexos 3,4.
http://www.dit...centralizacion.html
Intervalos de confianza.
Un intervalo de confianza es un rango de valores, derivado de los estadsticos de
la muestra, que posiblemente incluya el valor de un parmetro de poblacin
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos
muestras de una poblacin en particular generen intervalos de confianza idnticos.
Se calcula:
Distribucin normal.
Sin duda, la distribucin continua de probabilidad ms importante, por la
frecuencia con que se encuentra y por sus aplicaciones tericas, es la distribucin
normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada por primera
vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace
(1812) y Gauss (1809), en relacin con la teora de los errores de observacin
astronmica y fsica.
Est caracterizada por dos parmetros: la media, y la desviacin tpica, .
La curva normal adopta un nmero infinito de formas, determinadas por sus
parmetros y .
Tiene forma de campana, es asinttica al eje de las abscisas (para x = ) Los
puntos de inflexin tienen como abscisas los valores . Simtrica con respecto
a la media () donde coinciden la mediana (Mn) y la moda (Mo).
Figura 3, Campana de Gauss
Tipos de muestreo.
Muestreo aleatorio simple.
Distribucin muestral.
Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede
ser infinita o finita.
En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a
muestreo con reposicin.
Si consideremos todas las posibles muestras de tamao n en una poblacin, para
cada muestra podemos calcular un estadstico (media, desviacin estndar,
proporcin,...) que variar de una a otra.
As obtenemos una distribucin del estadstico que se llama distribucin muestral.
Estimacin de tamao de muestra.
Determinar el tamao de la muestra que se va a seleccionar es un paso
importante en cualquier estudio de investigacin. Por ejemplo, un investigador
desea determinar la prevalencia de problemas oculares en nios en edad escolar
y quiere realizar una encuesta.
La pregunta importante que debe ser contestada en todas las encuestas de
muestra es: "Cuntos participantes deben ser elegidos para una encuesta?" Sin
embargo, la respuesta no puede ser dada sin tener en cuenta los objetivos y
circunstancias de las investigaciones.
La eleccin del tamao de la muestra depende de consideraciones no estadsticas
y estadsticas. Las consideraciones no estadsticas pueden incluir la disponibilidad
de los recursos, la mano de obra, el presupuesto, la tica y el marco de muestreo.
Las consideraciones estadsticas incluirn la precisin deseada de la estimacin
de la prevalencia y la prevalencia esperada de los problemas oculares en nios en
edad escolar.
Para determinar el tamao adecuado de las muestras es necesario seguir los tres
criterios:
1. Nivel de precisin
El nivel de precisin, tambin llamado error de muestreo, es el rango en donde se
estima que est el valor real de la poblacin. Este rango se expresa en puntos
porcentuales. Por lo tanto, si un investigador descubre que el 70% de los
agricultores de la muestra han adoptado una tecnologa recomendada con una
tasa de precisin de ~+mn~ 5%, el investigador puede concluir que entre el 65% y
el 75% de los agricultores de la poblacin han adoptado la nueva tecnologa.
2. Nivel de confianza
El intervalo de confianza es la medida estadstica del nmero de veces de cada
100 que se espera que los resultados se encuentren dentro de un rango
especfico.
Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una
accin probablemente cubrirn las expectativas el 90% de las veces.
La idea bsica descripta en el Teorema del lmite central es que cuando una
poblacin se muestrea muchas veces, el valor promedio de un atributo obtenido es
igual al valor real de la poblacin. En otras palabras, si un intervalo de confianza
es del 95%, significa que 95 de 100 muestras tendrn el valor real de la poblacin
dentro del rango de precisin.
3. Grado de variabilidad
Dependiendo de la poblacin objetivo y los atributos a considerar, el grado
de variabilidad vara considerablemente. Cuanto ms heterognea sea una
poblacin, mayor deber ser el tamao de la muestra para obtener un nivel ptimo
de precisin. Ten en cuenta que una proporcin de 55% indica un nivel ms alto
de variabilidad que un 10% o un 80%. Esto se debe a que 10% y 80% significa
que una gran mayora no posee o posee el atributo en cuestin.
Existen muchos enfoques para determinar el tamao de la muestra, incluyendo el
uso de un censo en el caso de poblaciones ms pequeas, el uso de tablas
publicadas, imitar un tamao de muestra de estudios similares y aplicar frmulas
para calcular un tamao de la muestra.
http://explorable...muestra
Anexos.
Figura 1
Figura 2.
Figura 3.
Anexo 1.
Los siguientes datos son los coeficientes que obtuvieron 50 estudiantes en una
prueba de matemticas
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 97 55 60 76 75 69 35 45 63
Rango = 97-32 = 65
Regla de struges= K= 1+3.3 log (50) = 6.64
Tamao de intervalo = 65/6.64 = 9.79
Clase
Fi
fac
fr
frc
lr
Mc
32-41
42-51
52-61
62-71
72-81
82-91
92-101
4
6
8
12
11
7
2
4
10
18
30
41
48
50
0.08
0.12
0.16
0.24
0.22
0.14
0.04
0.08
0.12
0.36
0.60
0.82
0.96
1
31.5-41.5
41.5-51.5
51.5-61.5
61.5-71.5
71.5-81-5
81.5-91.5
92.5-
35.5
45.5
55.5
65.5
75.5
85.5
95.5
101.5
14
12
10
8
FI
6
4
2
0
LR
Histograma
31.5
41.5
51.5
61.5
71.5
81.5
91.5
OJIVA
1.2
1
0.8
FRC
0.6
0.4
0.2
0
36.5
46.5
56.5
66.5
76.5
86.5
96.5
LR
OJIVA
Anexo 2.
A 40 estudiantes se investig que estimen el nmero de horas que habran de
estudiar la semana pasada obtenindose los siguientes resultados
Rango= 65-30 = 35
Regla de struges= K= 1+3.3 log (40) = 6.31
Tamao de intervalo = 35/6.31= 5.54
Clase
FI
FAC
FRC
LR
30-35
36-41
8
6
8
14
0.2
0.35
29.5-35.5 32.5
35.5-41.5 38.5
8
14
42-47
19
0.457
41.5-47-
44.5
19
48-53
54-59
7
11
26
37
0.65
0.925
5
47.5-53.5 50.5
53.5-59.5 56.5
26
37
60-65
40
59-5-
40
65.5
MC
62.5
FAC
12
10
8
FI
6
4
2
0
LR
Histograma
29.5
35.5
41.5
47.5
53.5
59.5
OJIVA
1.2
1
0.8
FRC
0.6
0.4
0.2
0
32.5
38.5
40.5
50.5
LR
OJIVA
56.5
62.5
Anexo 3.
En la siguiente tabla se muestran los pesos en libras de 150 personas que
utilizaron un elevador.
Clase
75-89
90-104
105-119
120-134
135-149
150-164
165-179
180-194
195-209
210-224
Fi
10
11
23
26
31
23
9
9
6
2
Fac
10
21
44
70
101
124
133
142
148
150
x
82
97
112
127
142
157
172
187
202
217
Fx
820
1067
2576
3302
4402
3611
1548
1683
1212
934
|M-x|
55.7
40.7
25.7
10.7
4.3
19.3
34.3
49.3
64.3
79.3
=20655
Media: M=
Fx
N
M=20655/150
Fi(M-x)2
31024.9
18221.39
15191.27
2976.74
573.19
8567.27
10588.41
21874.41
24806.94
12576.98
=146401.5
M=
137.7
Mediana= Lxi + (
N
FaA
2
)i
Fc
Med=
137.41
Moda= Lxi + (d1/d1+d2) i
S2 =Fi (M-x)2 /n
Moda= 140.76
S2=976.01
S=
976.01
S=31.24
Histograma
35
30
25
20
Fi
15
10
5
0
82
97
112
127
142
157
172
187
202
Mc
Ojiva
1.2
1
0.8
FRC 0.6
0.4
0.2
0
89.5 104.5 119.5 134.5 149.5 164.5 179.5 194.5 209.5 224.5
LR
217
Anexo 4.
Los siguientes datos son los pesos neonatales en libras de 200 bebes prematuros.
Clase
0.5-0.9
1.0-1.4
1.5-1.9
2.0-2.4
2.5-2.9
3.0-3.4
3.5-3.9
4.0-4.4
Fi
10
19
24
27
29
34
40
17
Fac
10
29
53
80
109
143
183
200
x
0.7
1.2
1.7
2.2
2.7
3.2
3.7
4.2
Fx
7
22.8
40.8
59.4
78.3
108.8
148
71.4
|M-x|
1.98
1.48
0.98
0.48
0.02
0.52
1.02
1.52
=536.5
Media: M=
Fx
N
M=536.5/200
Fi(M-x)2
39.20
41.61
23.04
6.22
0.01
9.19
41.61
39.27
=200.15
M=
2.68
Mediana= Lxi + (
N
FaA
2
)i
Fc
Med= 2.84
Moda= Lxi + (d1/d1+d2) i
S2 =Fi (M-x)2 /n
S=
1.00075
S=1.00037
Moda= 3.60
S2=1.00075
Histograma
45
40
35
30
25
20
15
10
Fi 5
0
LR
Ojiva
1.2
1
0.8
0.6
0.4
FRC
0.2
0
LR
Anexo 5.
Se toma una muestra de 25 sacos de cemento de un camin, la cual arrojo una
media de 50.5kg y una desviacin estndar de 1.5kg, encuentre el intervalo de
confianza a 90%
X =50.5
N =25
=1.5
N.C. = 90%
50
( 1.645 )( 1.5 )
=
25
0.4505
1.65
0.4495
1.64
promedio: 1.645
100 o mas
100 o menos
De 90 108
De 92 97
89 o menos
117 o mas
97 o menos, o 114 o mas
h) De 105 112
Cuantas personas se esperaran que tuvieran IQ de:
i)
j)
k)
l)
120 o mas
De 99 101
91 o mas
108 o menos
R: 0.5
b) 100 o menos
R: 0.5
c) De 90 108
R:
108100
=0.67 z=|
=0.53
|90100
|
15
15 |
z=
90 108
0.2486+0.2019= 0.4505
d) De 92 97
=0.53
|92100
15 |
z=
R:
92 97
=0.2
|97100
15 |
z=
0.2019-0.0793=0.1226
e) 89 o menos
R:
=0.73
|89100
15 |
z=
0.5-0.2673=0.2327
f) 117 o menos
R:
=1.13
|117100
15 |
z=
0.5-0.3708=0.1292
R:
=0.2
|97100
15 |
z=
0.5-0.0793=0.4207
0.5-0.3238=0.1762
h) De 105 112
|105100
|=0.33
15
=0.8
|112100
15 |
z=
z=
105 112
0.2881-0.1293=0.1588
R:
i) 120 o mas
R:
=1.33
|120100
15 |
z=
4750
100
1938.95 40.82
0.4082x100=40.82
1939 Personas
j) De 99 101
R:
=0.07
|99100
15 |
z=
5.94 282.15
100
4750
|101100
|=0.07
15
z=
283 Personas
|114100
|=0.93
15
z=
k) 91 o mas
R:
=0.6
|91100
15 |
z=
0.2257+0.5=0.7257
72.57 3447.07
100
4750
3448 Personas
l) 108 o menos
R:
|108100
|=0.53
15
z=
0.2019
20.19 959.025
100
4750
m) 127 o mas
960 Personas
R:
=1.8
|127100
15 |
z=
0.5-0.4641=0.0359
3.59%
n) De 93 96
R:
=0.46
|93100
15 |
z=
0.1626-0.3238=0.1612
0.3238
=0.26
|96100
15 |
z=
0.1026
16.12%
o) 111 o mas
R:
=0.73
|111100
15 |
z=
0.2673
0.5-0.2673=0.2327
23.27%
Anexo 7.
De que tamao debera de ser la muestra con un 95% de nivel de confianza, si se
sabe que la desviacin de un experimento es de 120 y se desea que el error de la
media sea de 20 con respecto a la media real.
zD
n ( E )
n((1.96x120)/20)2 138.2979
139.
Anexo 8.
Se desea realizar una investigacin para estimar el peso medio de los recien
nacidos de madres fumadoras, se admite un error de 50gr. con un nivel de
confianza del 95%, si por estudios anteriores se sabe que la desviacin del peso
medio de tales recien nacidos es de 400gr. Qu tamao minmo de muestra se
necesita en la investigacin?
zD 2
(
n E )
n((1.96x400)/50)2 245.86
246.
Referencias.
Libros:
Probabilidad y estadistica, aplicaciones y metodos. Autor: George C Canavaros.
Manual de estadistica. Autor: David Ruz Muoz.
Estadstica, segunda edicion, Mc Graw Hill. Autor: Murray R. Spiegel.
Enlaces:
https://estadisticohouse.wordpress.com/tag/agrupamiento-de-datos/
https://estadistik.wordpress.com/2011/05/02/5-tablas-y-distribucion-de-frecuencias/
http://graficosdeexperimentosalaetorios.blogspot.mx/2013/05/histograma-poligonode-frecuencia-y.html
http://www.ditutor.com/estadistica/medidas_centralizacion.html
https://explorable.com/es/tamano-de-la-muestra