Professional Documents
Culture Documents
Estadstica I
Lima-Per
Los hombres dudan muchas veces antes de dar el primer paso, porque piensan que no podrn alcanzar la meta que se han propuesto. Esta actitud es el principal obstculo que se opone a su progreso, y que cada uno de nosotros con un pequeo esfuerzo de voluntad puede vencer.
Mahatma Gandhi
Manual del Alumno 12. Distribucin Bidimensional ............................................. .34 14. Regresin Lineal.................................................45 15. Regresin Lineal - Anlisis de Correlacin ...............49 16. Anlisis de Regresin Lineal .............................................65 17. Nmeros Indices ................................................................75 Problemas resueltos..... ...................................83 10. Problemas propuestos....90
ESTADISTICA: Es una ciencia aplicada a cualquier tema del saber humano y se encarga de recopilar, ordenar, clasificar y presentar una informacin llamada Muestra, con el fin de inferir acerca del comportamiento de una poblacin. La Estadstica se clasifica en: 1. Estadstica Descriptiva; es la que se encarga de recopilar, ordenar, clasificar y presenta una informacin, llamada muestra aleatoria. 2. Estadstica Inferencial; es la parte de la Estadstica que se encarga de inferir sobre el comportamiento de una poblacin a partir de una muestra, bajo un margen de error o incertidumbre que es cuantificado por la teora de probabilidades. CONCEPTOS FUNDAMENTALES EN ESTADISTICA POBLACION: Es un conjunto de observaciones que tienen una caracterstica en comn la cual se desea estudiar, la poblacin representa la totalidad de elementos de un determinado estudio y puede ser finita o infinita. Ejemplos: 1. Habitantes de Lima (aptos para el sufragio). Infinita
CURSO: ESTADISTICA I CICLO III
Poblacin
Una poblacin si es infinita no se puede estudiar en forma completa; an si es finita es muy engorroso estudiarla en forma completa por que involucra prdida de tiempo, dinero, etc., por esta razn nos basamos en una muestra aleatoria. MUESTRA Es un subconjunto de la poblacin y para que la muestra sea representativa debe ser aleatoria o no sesgada.
Una muestra es aleatoria cuando cada elemento de la poblacin tiene la misma posibilidad de ser seleccionado en la muestra. La demostraremos por: n= tamao de la muestra nmero total de observaciones en la muestra.
Ejemplos: 1. Encuesta a 900 personas de Lima aptos para el sufragio. n = 900 2. Altura (mts) de 45 alumnos de WIENER
n = 45.
PARAMETRO
Nmero que representa a la poblacin. Este valor generalmente es estimado a partir de una muestra, porque para que sea calculado exactamente se requiere de la informacin completa de una poblacin lo cual es muy difcil (los procesos de estimacin de parmetros ser tema de estudio en Estadstica Inferencial).
ESTADIGRAFO
Llamado tambin estadstico o estimador. Nmero que representa a la muestra y que puede ser calculado teniendo la informacin de una muestra. Los Estadgrafos se dividen en:
Manual del Alumno 1. Estadgrafos de Posicin o Tendencia Central: Son aquellos nmeros que tienden al centro de las observaciones. 2. Es tadgrafos de Dispersin: Son aquellos nmeros que cuantifican la variabilidad de las observaciones de una muestra.
DATO:
Es la recopilacin o anotacin de cada caracterstica de las observaciones de una muestra.
Ejemplo: Altura (mts) de n=5 alumnos de WIENER: 1.65, 1.59, 1.68, 1.63, 1.69.
SESION # 2
CAPITULO II ESTADISTICA DESCRIPTIVA La Estadstica Descriptiva, se encarga de recopilar la informacin de una muestra aleatoria, esta informacin tiene que ser ordenada para una buena presentacin; Esta ordenacin se basa en las llamadas Tablas de Frecuencias y tambin en los Grficos Estadsticos. RECOPILACION DE DATOS Es el momento en el cual el investigador se pone en contacto con los objetos o elementos sometidos a estudio, con el propsito de obtener datos o respuestas de las variables consideradas; a partir de estos
Manual del Alumno datos o respuestas se calculan los Estadgrafos o indicadores estadsticos. FUENTES DE DATOS La fuente de datos, es el lugar, la institucin, las personas o elementos donde estn o que poseen los datos que se necesitan para cada uno de las variables o aspectos de la investigacin o estudio. En general, se puede disponer de cinco tipos de fuentes de datos: 1. Las Oficinas de Estadstica.- Como instituciones responsables de recopilar, procesar y publicar las estadsticas sociales o nacionales.
2. Archivos o Registros Administrativos.- Como el Registro Civil, Electoral, Escalafn o Personal, Padrn de Contribuyentes, etc.. Estos registros no tienen fines Estadsticos, su funcin es de tipo legal y administrativo, sin embargo pueden utilizarse como fuentes de datos estadsticos. 3. Documentos.- Boletines, e informes estadsticos que son las publicaciones o estudios que preparan los organismos especializados. 4. Encuestas y Censos.- Son fuentes directas y especiales, que se construyen en un momento determinado, recopilando datos de una parte o de la totalidad de una poblacin. 5. Los Elementos o Sujetos.- Son aquellos que estn sometidos a un estudio, pueden ser personas, instituciones, animales u objetos.
CURSO: ESTADISTICA I CICLO III
TECNICAS DE RECOPILACION O RECOLECCION DE DATOS Es el conjunto de mtodos y procedimientos que se llevan a cabo para recolectar los datos. Las ms frecuentes tcnicas utilizadas son: 1. La Observacin.- Es la accin de mirar de mirar en forma sistemtica y profunda, con el inters de descubrir la importancia de aquello que se observa. 2. La Tcnica Documental.- Es aquella que busca datos a travs de documentos, fuentes escritas o grficas de todo tipo. Ejm.: Libros, Informes, Autobiografas, fotografas, planos, videos, etc. 3. La Entrevista.- Es la interrelacin o dilogo entre personas, donde una de ellas se llama Entrevistador o Encuestador quien solicita a otra persona llamada Entrevistado o Encuestado le proporcione algunos datos o informacin. 4. El Cuestionario.- Es un instrumento constituido por un conjunto de preguntas sistemticamente elaboradas, que se formulan al Entrevistado o Encuestado, con el propsito de obtener los datos de las variables consideradas en el estudio. El Cuestionario se desarrolla en el Formulario o Cdula, en donde las preguntas estn debidamente organizadas. 5. La Encuesta.- Es la tcnica por la cual se obtiene la informacin tal como se necesita, preparada exprofesamente y con objetivo estadstico. Permite observar y registrar caractersticas en las unidades de anlisis de una determinada poblacin o muestra,
10
Manual del Alumno delimitada en el tiempo y en el espacio. El Entrevistado da respuesta a las preguntas en el formulario o Cdula..
SESION # 3
CAPITULO III LAS VARIABLES ESTADISTICAS LA VARIABLE: Es la representacin simblica de los datos. Ejemplo: Sea X: altura de 5 alumnos de WIENER Donde: X1= 1.65 mts., X4 = 1.63 mts. Las variables se clasifican en: I. Variable Cualitativa: Es aquella variable que representa a datos que indican cualidades, caractersticas, propiedades, etc., no son numricas (no medibles).
Xi, i= 1 a 5
Ejemplos: X= Control de calidad de productos de una industria. Bueno, Malo, Regular, Muy Bueno.
Estado Civil de una muestra de 200 personas. Soltero, Casado, Viudo, Divorciado.
Y=
II.
Variable Cuantitativa: Es aquella variable que representa a datos que indican valores numricos (son medibles), y se clasifican en:
11
Variable Discreta: Es aquella que representa a datos numricos que no se pueden fraccionar, sirven para contar o enumerar (pertenecen a los reales). Variable Continua: Es aquella variable que representa a datos que pueden ser fraccionados (pertenecen a los reales). Ejemplo: El Peso (Kg.) de 6 personas. 65, 56, 59, 70, 63.
La variable continua es la que ms utilizamos, especialmente para los estudios correspondientes en Ingeniera (Volumen, Temperatura, Pesos, Mediciones, etc.).
SESION # 4
Distribucin o Tablas de Frecuencias: Es la condensacin, simplificacin, ordenacin, del conjunto de observaciones que forman la muestra; la caracterstica principal es no perder ningn dato de la muestra. Tambin se puede decir que la Distribucin de Frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Categoras o Clases.- Son los datos que estn agrupados por sus caractersticas comunes.
12
Manual del Alumno Frecuencia de Clases.- Es el nmero o cantidad de datos que componen una Categora o Clase. Las Frecuencias se clasifican en : 1. Frecuencia Absoluta (Simple).- Representa a la cantidad de datos de cada Clase. 2. Frecuencia Absoluta Acumulada.- Representa a la suma en forma acumulativa de Clase en Clase de sus respectivas Frecuencias Absolutas. 3. Frecuencia Relativa (Simple) .- Es el % que representa a la cantidad de datos de una Clase con respecto al total de datos. 4. Frecuencia Relativa Acumulada.- Representa a la suma en forma acumulativa de Clase en Clase de sus respectivas Frecuencias Relativas. Veamos un ejemplo (4.1) : Medimos la altura de los nios de una clase y obtenemos los siguientes resultados (cm): Alumno Estatura Alumno Estatura Alumno Estatura x x X x x x Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21 Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29 Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26 Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22 Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28 Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27 Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26 Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23 Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22 Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21 Si presentamos esta informacin estructurada obtendramos la siguiente Tabla de Frecuencias:
CURSO: ESTADISTICA I CICLO III
13
Manual del Alumno Variable (Valor) X 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias Absolutas Frecuencias Relativas Simple Acumulada Simple Acumulada X X X x 1 4 4 2 1 2 3 3 4 3 3 1 5 9 11 12 14 17 20 24 27 30 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%
Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. Segn los tipos de variables y formas de la tabla de frecuencias, tendremos las siguientes Tablas de frecuencias 1ER. CASO: Tablas de Frecuencias para la variable Cualitativa:
En este caso como la variable cualitativa indica cualidades, propiedades, etc., y no son medibles; entonces se agrupa de acuerdo a cada categora que se diferencia en la variable cualitativa. (Sin un orden establecido).
Ejemplo: (4.2).
CURSO: ESTADISTICA I CICLO III
14
Se tiene la siguiente informacin que representa el Estado Civil de 50 personas encuestadas (edad; 20-30 aos).
No. de personas 25 10 1 6 8
N DE PERSONAS
ESTADO CIVIL
CURSO: ESTADISTICA I CICLO III
Conviviente
15
PORCENTAJES
Soltero Conviviente
Divorciado Viudo
Casado
16
Manual del Alumno La tdf es de la sgte. forma general: Clase Xi x1 x2 . . . Xm Donde: n = numero de clases o intervalos de clase. fi = frecuencia absoluta: es el nmero de observaciones que hay en cada clase o intervalo de clase. Adems: fi+f2+f3+. ...+ fm =n m fi = n i=1 Fi f1 f2 . . . Fm Fi F1 F2 . . . Fm=n hi h1 h2 . . . hm Hi H1 H2 . . . .Hm=1
Fi = frecuencia absoluta acumulada: es el numero de observaciones acumuladas hasta la clase i, es decir: F1=f1 F2=f1+f2 . .
CURSO: ESTADISTICA I CICLO III
17
hi = frecuencia relativa: representa la relacin que existe entre la frecuencia absoluta y el nmero total de observaciones:
hi
fi n
Generalmente la frecuencia relativa se expresa en forma porcentual: hi % = 100%. Hi = frecuencia relativa acumuladas hasta la clase i. Hi=h1 H2=h1+h2 . . Hm=h1+h2+....hm=1 acumulada: frecuencias relativas
Tambin :
Hi
Fi n
18
Los siguientes datos representan el numero de defectos en 15 diskettes: 5, 10, 5, 11,6,6,3,3,3,5,5,5,10,6,3. Agrupar en tabla de frecuencias: Solucin: Como la muestra es pequea y la variable representa a datos discretos, entonces agrupamos en clases: No de Defectos Xi 3 5 6 10 11 No. diskettes fi 4 5 3 2 1
Fi
hi%
Hi%
4 9 12 14 15
19
N DE DISKETTES
6 4 2 0 3 5 6 DEFECTOS 10 11
3ER. CASO: Tabla de frecuencias por intervalos de clase: En este caso generalmente la variable es continua, tambin puede ser usado para la variable discreta siendo la muestra grande (generalmente n >= 30).
La tdf tiene la siguiente forma:
Intervalos (Li - Ls) [Xo - X1> [X1 X2> . . . . . [Xm-1- Xm]
Xi X1 X2 . . . . . Xm
Fi f1 f2 . . . . . Fm
Fi F1 F2 . . . . . Fm
hi h1 h2 . . . . . hm
Hi H1 H2 . . . . . Hm
Donde:
20
Manual del Alumno X i= marca de clase o punto medio de cada intervalo de clase, se obtiene mediante la semisuma de los limites de cada intervalo.
X i = Ls + Li 2 fi , Fi, hi, Hi ; representan las frecuencias definidas en el caso anterior. Procedimiento para construir una tdf por intervalos de clase: 1er. Paso: Calcular el nmero de intervalos de clase (K):
Para calcular el valor de K, tenemos dos criterios:
a) Criterio personal; de acuerdo a la experiencia del investigador se puede asumir un valor de m para un tamao de muestra determinado. b) Mediante la Regla de Sturges: K =1 +3.3 log. n 2do. Paso: Calcular la amplitud o tamao del intervalo de clase:(A)
Para calcular la amplitud del intervalo (A) nos basaremos en la siguiente expresin:
21
Manual del Alumno A = Rango de la muestra K donde: Rango de la muestra = Valor Mayor Valor Menor Con este procedimiento calculamos una amplitud que ser constante para cada intervalo, y lo mismo ocurrir entre cada marca de clase. Los intervalos sern de la forma: [Li Ls], pudiendo ser considerado cerrado en el ltimo intervalo. La amplitud A es preferible que sea redondeada considerando la misma cantidad de decimales que tengan los dato de la muestra. 3er. Paso: Tabulaciones Tabular y presentar los datos agrupados en la tdf., Ejemplos: (2.3) Los siguientes datos representan el peso (gr.) de 35 sobrecitos de unas sustancias: 68, 73, 61, 46, 49, 96, 68, 90, 97, 53, 75, 93, 72, 60, 71, 75, 74, 75, 71, 77, 83, 68, 85, 76, 88, 59, 78, 62, 55, 48, 43, 47, 60, 84, 80. Agrupar en tdf. Solucin: 1) Calculamos K = 1 +3,3 Log 35 = 6.095 = 6 2) Calcula la amplitud del intervalo A:
22
97 43 6
3) Tabular en tdf: Peso (grs) [43 52> [52 61> [61 70> [70 79> [79 88> [88 97] Xi 47.5 56.5 65.5 74.5 83.5 92.5
A = 9
fi 5 5 5 11 4 5
Fi 5 10 15 26 30 35
Se observa por ejemplo que: 11 sobrecitos tienen un peso comprendido en el intervalo [70-79> grs. y representan el 31.4% del total. Tambin vemos que 15 sobrecitos pesan menos de 70 grs. y representan el 42.9% del total.
23
SESION # 6
PRESENTACION DE DATOS
LOS GRAFICOS Los grficos son representaciones en forma de figuras geomtricas, de superficie o volumen con el objeto de ilustrar los cambios o dimensin de una variable, para comparar visualmente dos o ms variables similares o relacionadas. Para una rpida comprensin de situaciones o variaciones en cantidades, es muy til traducir los nmeros en grficos o imgenes. Por su naturaleza, un grfico no toma en cuenta los detalles y no tiene la misma precisin que una tabla estadstica. Veamos algunos tipos de Grficos : 1. Histograma de frecuencias: Representa un conjunto de rectngulos levantados desde cada intervalo de clase hasta la frecuencia correspondiente (absoluta relativa). 2. Polgono de frecuencias: Consiste en unir los puntos medios marcas de clase levantadas hasta cada frecuencia correspondientes, generalmente para su construccin nos podemos basar del Histograma de frecuencias. Propiedad: Area del Histograma = Area del Polgono de frecuencia.
CURSO: ESTADISTICA I CICLO III
24
3. Ojiva: Se construye basndose en un diagrama escalonado, es decir considerando las frecuencias acumuladas (absoluta relativa), y uniendo los lmites de cada intervalo.
HISTOGRAMA DE FRECUENCIAS
12.00 10.00 8.00 6.00 4.00 2.00 0.00 .47.5 .56.5 .65.5 .74.5 .83.5 .92.5
fi
Xi
SESION # 7
25
X 1. La Media Aritmtica Llamada tambin promedio, es el estadigrafo de posicin ms simple y fcil de calcular, por eso es el ms comn. Se calcula teniendo en cuenta los siguientes casos:
1er. Caso: Datos no agrupados en tablas de frecuencias: Sean X1, X2............, Xn variables que representan los n datos de una muestra, la media aritmtica se calcula:
n
X
i
Xi 1 n
Xi * fi n
tambin:
X
CURSO: ESTADISTICA I CICLO III
Xi * hi
26
PROPIEDADES DE LA MEDIA ARITMETICA 1. La media de los datos todos iguales a una misma constante es igual a la constante: Sea K = cte. y cada Xi = k ----------------X X (K ) K
2. Si a cada dato e le suma o resta una constante k, la media queda sumada o restada por dicha constante: Si Xi = Xi + K -------------------- X(Y) = X(X+k) = X (X) + k 3. Si a cada dato se le multiplica o divide por una constante k, la media queda multiplicada o dividida por dicha constante. 4. S Yi = Xi* k ------------------------- X(Y) = X(X* k) = X (X) * k
NOTA. Todas las propiedades cumplen para datos agrupados y no agrupados
27
( Xi X )
0 0
Datos no agrupados
( Xi X ) * fi
Datos agrupados
es igual a cero.
28
SESION # 8
ESTADIGRAFOS DE TENDENCIA CENTRAL 2. Media Geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la muestra).
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicador sobre el de los aos anteriores. En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media, perdiendo sta representatividad.
29
3. La Mediana (Me) : Es aquel estadgrafo de posicin que divide en dos partes iguales al conjunto de observaciones; es decir la mediana representa el valor central de una distribucin de datos ordenados en forma creciente o decreciente. 1er. Caso: Datos No agrupados en TDF: Primero se ordena los datos en forma creciente o decreciente y luego se tiene en cuenta s: a) n es impar. La mediana es el valor central.
Me X n 1 2
Ejemplo: Calcular la Me de los siguientes valores: 32, 34, 31, 42, 36, 41, 32, 45, 37, n=9 Ordenando: 31, 32, 32, 34, 34, 36, 37, 41, 42, 45. Observamos el valor central: Me=36 (representa el 5to. dato) b) n es par.La mediana es igual al promedio o la semisuma de los valores centrales.
30
Me
16 17 2
16.5
Me
Li
Ame * n
2 f me
Fme
Donde: Li = Ame := Fme-1 = mediana. fme = limite inferior de la clase mediana. tamao del intervalo de la clase mediana. Frec. Abs. Acumulada anterior a la clase Frecuencia absoluta de la clase mediana.
Clase Mediana: Es aquel intervalo que contiene el valor que ocupa la posicin media, es decir contiene a la mediana. Se calcula mediante: El primer valor Fi mayor o igual que n/2
CURSO: ESTADISTICA I CICLO III
31
4. LA MODA (Mo)
Representa al valor que ms se repite en un conjunto de observaciones:
Si la distribucin de frecuencias tiene un solo valor mximo, entonces: UNIMODAL. - Si la distribucin presenta ms de un valor mximo: , entonces: POLIMODAL. Si no hay algn valor que se repita con ms frecuencia: DISTRIBUCION UNIFORME 1er. Caso: Datos no agrupadas Sealar el valor que ms se repite. Ej. 4,5,6,7,4,5,4,6,5,5,4,5,5 UNIMODAL Ej.
Mo = 5
7,7,6,8,8,6,8,7,7,9,12,11,10,8 Mo = 8 BIMODAL
Mo
Li
Amo *
D1 D1 D 2
32
Li = Amo =
D1 D2 = =
limite inferior de la clase modal. Amplitud de la clase modal. Diferencia ente la Frec. Absoluta de la clase modal menos la frecuencia absoluta anterior. Diferencia ente la Frec. Absoluta de la clase modal menos la siguiente.
Clase Modal: Representa el intervalo con la mayor frecuencia absoluta. Ejemplos. (3.1)
33
Calcular la Media Aritmtica, Mediana y Moda de la Tabla de frecuencias del ejemplo (2.3).
70.336
gramos
35 Me 70 9 *
2 11
15
72.05
gramos
Para calcular la Moda, la clase modal es el 4to. intervalo, por que presenta la mayor frecuencia absoluta. D1=11 - 5 = 6 D2=11 4 =7
Mo 70 9 * 6 6 7 74 .15
Gramos
SESION # 9
34
Las medidas de Posicin o de Tendencia no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos). Los deciles y percentiles se calculan de igual manera,
35
1 cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2 cuartil: es el valor 1,26 cm, ya que entre este valor y el 1 cuartil se situa otro 25% de la frecuencia. 3 cuartil: es el valor 1,28 cm, ya que entre este valor y el 2 cuartil se sita otro 25% de la frecuencia. Adems, por encima suya queda el restante 25% de la frecuencia.
CURSO: ESTADISTICA I CICLO III
36
Atencin: cuando un cuartil recae en un valor que se ha repetido ms de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posicin no central sera realmente una de las repeticiones Frmulas para calcular los Cuartiles Para calcular el Primer Cuartil
n 4 F1 i F2
Q1
Li
Q2
Li
F1 i F2
Q3
Li
DONDE:
Q1 = Primer Cuartil Q2 = Segundo Cuartil Q3 = Tercer Cuartil
CURSO: ESTADISTICA I CICLO III
37
Ejemplo: Calcular el Primer Cuartil de la siguiente distribucin de frecuencias, referente al consumo de energa elctrica de un grupo de usuarios
Consumo Kw Hora 05 - 24 25 - 44 45 - 64 65 - 84 85 - 104 105 - 124 125 - 144 145 - 164 Nmero de Frecuencia Consumidor Acumulada 4 4 6 10 14 24 22 46 14 60 5 65 7 72 3 75 75 Lmites Reales 4.5 24.5 44.5 64.5 84.5 104.5 124.5 144.5 - 24.5 - 44.5 - 64.5 - 84.5 - 104.5 - 124.5 - 144.5 - 164.5
Q1
44 .5
75 4
10 20 14 57 KwHora
Como cada Cuartil representa el 25%, entonces el Primer Percerntil ser el 25%. Respuesta.- El 25% de los usuarios consume 57 KW Hora.
38
D = El Decil Li = Lmite Real inferior de la Clase que contiene el Decil D # = El nmero de Decil que se quiere hallar n = Nmero de datos F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil F2 = Frecuencia absoluta de la Clase del Cuartil i = Intervalo de Clase
Utilizando el ejemplo: Calcular el Cuarto Decil de la distribucin de frecuencias, referente al consumo de energa elctrica del grupo de usuarios
Como cada Decil representa el 10%, entonces el Cuarto Decil ser el 40%.. Respuesta.- El 40% de los usuarios consume 69.95 KW Hora.
39
Utilizando el ejemplo: Calcular el Percentil 79 de la distribucin de frecuencias, referente al consumo de energa elctrica del grupo de usuarios
Como cada Percentil representa el 1%, entonces el Percerntil 79 ser el 79%.. Respuesta.- El 79% de los usuarios consume 103.43 KW Hora. SESION # 10
EXAMEN PARCIAL
SESION # 11
40
Desarrollando esta sumatoria, obtenemos una forma ms simple para calcular la varianza:
41
O tambin:
42
O tambin:
Propiedades de la Varianza: 1. 2, 3. V(X) >= 0 (siempre la varianza es positiva igual a cero). Esto es si cada Xi = k (constante). si a cada Xi se le suma (o resta), entonces la varianza no varia. si a cada dato se multiplica (o por una constante K, entonces la constante sale elevada cuadrado).
4.
43
Representa la relacin que existe entre la desviacin standart y el promedio de un conjunto de observaciones. El C.V. como no tiene unidades se debe expresar en porcentaje y sirve como medios de comparacin con otras distribuciones de cualquier tipo de unidad. Se calcula:
Donde: S(x) = X =
CURSO: ESTADISTICA I CICLO III
44
F
Entonces, calculamos la varianza:
45
b) Es decir:
2. Dada la siguiente tabla de frecuencias, que representa el peso (grs), de 34 sobres de cartas: Intervalos [ 7 8> [ 8 9> [ 9 10> [10 11> [11 12> [12 13] Xi 7.5 8.5 9.5 10.5 11.5 12.5 fi 1 2 8 11 6 6 Fi 1 3 11 22 28 34
46
Gramos
Calculando la mediana:
Gramos
47
Solucin: Primero hay que tener en cuenta que no se puede comparar las desviaciones standares de cada nuestra, porque estn expresadas en diferente unidades, pero si podemos compararlas con sus C.V. respectivos:
Entonces, comprando ambos coeficientes nos damos cuenta que existe menor dispersin en los datos de la primera muestra.
48
SESION # 12
5.1. Clculo de la Covarianza: S (XY) La varianza, es la medida que estudia la dispersin de dos variables, se calcula teniendo en cuenta:
1er. Caso: Datos no agrupados en tablas de frecuencia: En este caso, las variables X Y se toman en forma simultnea; es decir se considera no agrupados porque se toman los valores
49
.......... XN .......... YN
N: nmero de observaciones total de pares de valores. De cada observacin se analiza dos variables Simultneamente. Las Covarianza; S (XY) se define:
............................. ( I )
.........................( II)
50
En forma tabular: X Y Donde: Xi Yj fij : : : marca de clase (variable X) marca de clase (variable Y) frecuencia absoluta conjunta, corresponde al nmero de observaciones que existe en el I-simo intervalo de X con el j-simo intervalo de Y. : : agrupado en K intervalos (y = 1... k) agrupado en m intervalos (j = 1.. m).
Observaciones: (1) Segn la definicin de la covarianza (tanto para datos agrupados como no agrupados), la covarianza puede ser negativa. La covarianza presenta unidades de cada una de las variables involucradas. La covarianza S(XY), tambin se denota: Cov (X,Y)
(2) (3)
51
X Y
8 5
9 7
11 8
14 9
=
2
b) S (Y)
52
(5.2)
Dada la siguiente tabla en el cual se estudia las alturas (pulg) y los pesos (libras) de 300 estudiantes hombres en una Universidad: X Y : : altura (pulgadas). peso (libras).
58-62
62-66
66-70
70-74
74-78
2 7 5 2
1 8 15 12 7 2
4 22 63 28 10 1 128
2 7 19 32 20 4 84
1 5 12 7 2 27
16
45
Calcular:
53
Solucin: Como la tabla es Bidimensional, podemos formar tablas de frecuencias para cada una de las variables por separado, a este proceso se le conoce como TABLAS MARGINALES.
54
Fi 16 45 128 84 27 300
Tabla Marginal para Yi: Intervalos Yj 90 110 100 110 130 120 130 150 140 150 170 160 170 190 180 190 210 200 210 230 220
55
Calculando la Covarianza:
56
57
* * * * * * * * *
58
59
Relacin lineal
Parbola o curva cadratica Curva Polinomial
Hiprbola
60
sea mnimo
Se conoce como la mejor curva de ajuste por el mtodo de mnimos cuadrados. Di= desviacin de cada punto con respecto ala lnea recta. Este mtodo consiste en minimizar la suma de los cuadrados de las desviaciones Di. Entonces para ajustar un diagrama de dispersin a la lnea recta, utilizaremos este mtodo de los MINIMOS CUADRADOS. Es decir una recta de aproximacin de mnimos cuadrados del conjunto de puntos (x1, y1), (x2,y2),......,(xn,yn), tiene la ecuacin: Y = a+b*X , donde a y b se determinan mediante el sistema de ecuaciones normales, son las siguientes:
61
Otras ecuaciones ms practicas para calcular los valores de a y b de la ecuacin aproximada Y = a +b*X son las siguientes:
1 1
4 4
6 4
8 5
9 7
11 8
14 9
a) Construye el diagrama de puntos b) Encuentra las ecuaciones normales c) Encuentra la ecuacin de la curva de ajuste.
62
DISPERSION
10 8 6 Y 4 2 0
0 2 4 6 8 10 12 14
b) Al observar el diagrama de puntos, notamos que se aproxima o ajusta a una lnea recta, cuya ecuacin es: Y = a+b*X c) Para encontrar las ecuaciones normales:
63
Entonces las ecuaciones normales son: 40 = 8*a +b* 56 364 = 56*a +b*524 Resolviendo el sistema (Mtodo de Mnimos Cuadrados) a= 6/11 = 0.545 b=7/11=0.636
d) La ecuacin resultante ser : Y = 0.545 + 0.636X nota : Si la ecuacin es Y = a +b*X entonces b mide la pendiente de la lnea recta.
64
Ejemplo : altura y peso 2) Correlacin o Asociacin Negativa (-), En este caso, a valores altos de una variable, corresponden valores bajos de la otra variable y viceversa. (Relacin inversamente proporcional). 3) Medidas no Correlacinales; No existe ninguna asociacin entre las variables. Caractersticas de Coeficiente de Correlacin Lineal Simple
65
3) - Si r es positivo (Correlacin Positiva), entonces las dos caractersticas tienden a variar en el mismo sentido. Si r es negativo (Correlacin Negativa), las dos caractersticas tienden a variar en sentido contrario.
4) Si r=+1 r=-1, entonces la asociacin es perfecta. 5) Si r = 0, no existe asociacin entre las variables: 6) La asociacin, tiende a ser ms estrecha, cuando r:
66
Interpretacin.- Existe una alta asociacin entre las variables estudiadas. (5.5) del ejemplo (5.2), donde: S(X)=3.929 pulgadas S(Y)=24.202 libras, S(XY)=51.370 pulg/lbs
Interpretacin.- Existe asociacin entre las alturas y pesos de los estudiantes de la Universidad dada, esta asociacin es directamente proporcional.
67
X Y
: :
III) Las dos estn influenciadas entre si: X Y X Y Ejemplo : precio y produccin de un articulo. Definicin: La regresin permite estudiar la dependencia de una caracterstica respecto a la otra, para establecer como vara el promedio de la primera caracterstica al variar la segunda en una unidad de su medida. Se dice regresin lineal, porque las variaciones de la variable independiente, pueden provocar variaciones proporcionales en las variables dependientes (ajuste a la lnea recta). Se dice que la regresin es simple, si una variable independiente influye sobre otra variable dependiente.
68
Ecuacin de Regresin Lineal Simple. Es una ecuacin para estimar una variable dependiente a partir de la variable independiente. Si X : Variable independiente Y : Variable dependiente
Donde :
Caractersticas del Coeficiente de R.L.S. (b) 1) b : indica el nmero de unidades en que vara la variable dependiente al variar la independiente en una unidad de su medida. 2) Si b es positivo los cambios son directamente proporcionales. Si b es negativo entonces los cambios son inversamente proporcional 3) b : mide la pendiente de la lnea de regresin. 4) b, esta dado en unidades de la variable dependiente. 5) b y r siempre tienen el mismo signo. 6) b se calcula:
69
S Y = f(X), entonces:
Y el valor de la constante a:
Si X= f (Y)
Lnea de Regresin.- consiste en el trazo o grfica de la ecuacin de regresin lineal simple, es decir el grfico de los puntos si la ecuacin es: Regresin de Y sobre X; o el grfico de los puntos (X,Y) si la ecuacin es X= a+ bY : Regresin de X sobre Y. Ejemplo: selecciona al azar cuatro meses de un ao y se registra tanto los ingresos como los gastos, en miles de dlares, de cierta empresa: Ingreso (miles de dlares) Egresos (miles de dlares) I. 10 4 11 5 12 9 13 10
Efectuar un estudio de Regresin Lineal Simple, asumiendo que los egresos estn en funcin de los Ingresos: 1) Calculando el coeficiente de Regresin b e interpretndolo 2) Calculando el coeficiente de interseccin a
70
Entonces:
Mil es
71
Para el trazo en el sistema de ejes cartesianos se tendr que reemplazar en la ecuacin de Regresin, los diferentes valores de X: Y=-18.30 +2.2. (10) = 3.7 Y=-18.30 +2.2 (11) = 5.9 Y=-18.30 +2.2 (12) = 8.1 Y=-18.30 +2.2 (13) =10.30 Tambin se puede estimar nuevos valores de los Egresos (Yi) a partir de un valor Xi. Ejemplo: Para un ingreso de 15mil dlares, se espera tener en promedio un Egreso de: Y =-18.30 + (2.2) (15) = 14.7 miles de dlares La lnea de Regresin: unin de puntos (Xi,Yi) II. Anlisis de Correlacin:
72
73
Po : precio de un bien en perodo base Pn : precio de un bien en perodo dado S Pa: precio de un bien en el perodo a Pb : precio de un bien en el perodo b
Ejemplo:
74
Es decir: en 1990 el precio de leche fue el 440% del que tena en el ao 89, es decir se increment en un 340% Observacin: IPR Simple es un bien en un perodo a (Pa), con respecto al mismo perodo a (Pa) =1 2) Indices de Cantidades (o volumen) Relativos.- En lugar de comparar precios de un bien, se puede tambin comparar cantidades de un bien (cantidad de produccin, consumo, exportacin, etc.) calculemos la cantidad o volumen relativo (suponiendo que las cantidades dentro de cualquier otro perodo son constantes). Indice de Cantidad Relativo: IQR
qn : cantidad de un bien en el perodo n qo : cantidad de un bien en el perodo base 3) Valor Relativo.- Si p es precio de un bien durante un perodo y la cantidad o volumen producido, vendido, etc., durante ese perodo. Valor total = p * q Ejemplo: Si se han vendido 1000 tarros de leche a $0.75 c/u Valor total = 0.75 * 1000 = $ 750
CURSO: ESTADISTICA I CICLO III
75
(6.2)
Indices Compuestos: En la prctica, no se esta tan interesada en comparaciones de precios, cantidades etc., de bienes individualmente considerados, como en comparaciones de grandes grupos de tales bienes, es decir es preferible considerar un grupo de bienes para medir los cambios respectivos. Los principales Indices compuestos se calculan teniendo en cuenta los siguientes mtodos: 1) Mtodo de Agregacin Simple.- Este mtodo de clculo de un ndice de precio (o cantidad), expresa el total de los precios (o cantidades) de bienes en el perodo dado, como porcentaje del total de los precios (o cantidades de bienes en el perodo base. Tenemos: Indice de Precios de Agregacin Simple: IPAS
76
Pn = suma total de precios de bienes empleados en el periodo dado. Po = suma total de precios de bienes empleados en el ao base. Desventaja: No tiene en cuenta la importancia relativa de las cantidades de los diferentes bienes. 2) mtodo de Media de Relativo Simple. En este mtodo existen varias posibilidades dependiendo del procedimiento empleado para promediar los precios relativos (o cantidades relativas), tal como la media aritmtica, media geomtrica, Mediana, etc.
Tenemos : Indice de precios de Media de Relativo Simple: IPMRS (Promedio de los precios relativos de cada uno de los bienes empleados):
Donde: (Pn/Po) = suma de los precios relativos de bienes. N = nmero total de bienes empleados.
77
Cuando los bienes empleados corresponden a la canasta familiar, el IPL se denomina ndice de Precios del Consumidor o Indice del Costo de Vida, y se utiliza para medir el nivel de inflacin. (II) Indice de Precios de Paasche (o mtodo del ao dado): IPP Pondera los precios de cada bien, considerando como factor de ponderacin a las cantidades del periodo dado.
78
(III). Indice Ideal de Fisher Representa la media geomtrica de los ndices de Laspeyres y Paasche (promedio de los ndices ponderados).
Ejemplo: (6.3) La tabla muestra los precios y cantidades consumidas de cierto pas de distintos productos frreos en los aos 79, 86 y 87. Precios ($/Lbs) 1979 1986 17.00 19.36 15.18 99.32 12.15 26.01 41.88 15.81 101.26 13.49
79
a) Calcular Indice de Precios de Agregacin Simple para el ao 86, considerando como ao base 1979 b) Calcular el IPL para el ao 87, con base en el ao 79 c) Calcular el IPP para el ao 87, con ao 86 Solucin
Esto significa, que los precios del conjunto de productos frreos, en el ao 86, representa el 121.7% de los precios que tenan en el ao 79, es decir se incrementaron en 21%.
Nota: Las frmulas descritas anteriormente para obtener nmeros ndice de precios se modifican fcilmente para obtener nmeros ndices de cantidad o volumen, con el simple intercambio de p y q.
80
(6.4)
Deflacin Aunque los ingresos de las personas pueden elevarse tericamente en un perodo de dos aos, su ingreso real puede netamente ser inferior, debido al incremento del costo de vida y por consiguiente su poder de adquisicin. Ejemplo (5.3) Si el ingreso de una persona en 1990 es el 150% de su ingreso en 1989 (es decir a aumentado en 50%) mientras que el ICV es el 500% del ao 89, el salario real de la persona ser en 1990
Salario Real
El salario real de la persona en 1990 es el 30% del que tena en 1989, es decir el poder adquisitivo de esta persona ha disminuido en 70%.
81
Se pide completar la tabla: Solucin Si la sumatoria de las hi = 1 Sabemos que : M/2 + 0.17 +2M +M +0.13 = 1
M = 0.2
sabemos que
hi
fi n
Por lo tanto fi = hi * n
Remplazando valores de hi
82
Completando el cuadro: Intervalos Xi [10.5 14.5> 12.25 [14.5 19.5> 17 [19.5 24.5> 22 [24.5 29.5> 27 [29.5 35> 32.25 30
fi 3 5 12 6 4
Fi 3 5 12 6 4 1.00
2)Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen de Estadstica I: 33, 50, 61, 69, 80, 35, 52, 64, 71, 81, 35, 53, 65, 73, 84, 39, 54, 65, 73, 85, 41, 55, 65, 74, 85, 41, 55, 66, 74, 88, 42, 57, 66, 76, 89, 45, 59, 66, 77, 91, 47, 60, 67, 77, 94, 48, 60, 68, 78, 97.
Clasificar estos datos convenientemente en intervalos de clase de igual amplitud y construir los grficos respectivos. Solucin I) Rango = 97-33 = 64 II) K = 1+3.32 * log (10) = 1+ 3.22 (1.699) = 6.47
83
III) La amplitud de Clase A = 64 / 7 = 9.14, aproximando al entero mayor (recuerda que la amplitud debe tener la caracterstica de los datos) A = 10 Para facilitar el conteo de las frecuencias, tomaremos como lmite inferior de la primera clase 30. clases [30, 40> [40, 50> [50, 60> [60, 70 > [70, 80> [80, 90> [90, 100> TOTAL xi 35 45 55 65 75 85 95 fi 4 6 8 13 9 7 3 50 Fi 4 10 18 31 40 47 50 hI 0.08 0.12 0.16 0.26 0.18 0.14 0.06 1.00 HI 0.08 0.20 0.36 0.62 0.80 0.94 1.00
Ntese que en el ultimo intervalo el lmite superior puede ser abierto ya que sobrepasa al valor ms alto de los datos.
GRAFICOS
84
85
2) El supervisor de una planta de produccin desea comprobar si los pesos netos de las latas de conserva de durazno tienen el peso reglamentario (18 onzas) para lo cual registra el peso de 36 latas obteniendo los siguientes datos:
17.5, 18.5, 18.1, 17.5, 18.0, 17.5, 17.3, 18.0, 18.0, 18.0, 18.2, 17.6, 18.4, 17.7, 17.7, 17.9, 18.3, 17.1, 17.8, 17.3, 17.6, 17.7, 18.2, 18.4, 18.0, 18.2, 17.1, 18.6, 18.1, 18.5, 17.9, 18.2.
Se pide : a) b) c) d) Presentar los datos en una tabla de frecuencia. Determine el peso promedio. Determine el peso central (la mediana). Determine el peso Modal.
86
ii)
iii)
A = 1.6 / 6 = 0.266 lo aproximamos a 0.3 (recuerden siempre se redondea A hacia el mayor respetando la caracterstica de los datos, en este caso con un digito decimal). A = 0.3
a) La tabla queda: Clases [17.0, 17.3> [17.3, 17.6> [17.6, 17.9> [17.9, 18.2> [18.2, 18.5> [18.5, 18.8> TOTAL Xi 17.15 17.45 17.75 18.05 18.35 18.65 fi 3 5 7 11 8 2 36 Fi 3 8 15 26 34 36 hi 0.08 0.14 0.19 0.31 0.22 0.06 1.00 Hi 0.08 0.22 0.42 0.72 0.94 1.00 Xi*fi 51 87 124 199 147 37 645.6
Clase mediana
b)
Clase modal
onzas
c) Para la mediana buscar en Fi aquel que sea igual o mayor que n/2, es decir
87
Onzas
Onzas
88
a) Muestra los lmites de cada intervalo de clase. b) Que tanto por ciento de los estudiantes tienen edades entre 12 y 26 aos. 2) Los siguientes datos son las velocidades en Km./h. De 30 carros que pasaron por un punto de control de velocidades. 60, 49, a) b) c) 30, 38, 60, 45, 20, 35, 20, 40, 54, 38, 35, 40, 10, 45, 60, 49, 30, 55, 46, 105, 29, 38, 80, 40, 28, 15, 82, 72. Calcular la media de los datos sin clasificar. Agrupa estos datos convenientemente. Calcule la media, mediana y moda.
3)Un grupo de 50 empleados de sistemas de una gran compaa recibe un curso intensivo de Programacin de Ordenadores. De los varios ejercicios distribuidos durante el curso, se muestra el nmero de ejercicios completados satisfactoriamente por los miembros del grupo: 13, 9, 8, 14, 16, 15, 6, 15, 11, 5, 3, 11, 11, 9, 18, 18, 5, 1,15, 12, 16, 12, 14, 9, 6, 10, 5, 12, 17, 11, 12, 13, 8, 19, 12, 11, 18, 15, 13, 9, 10, 9, 10, 7, 21, 16, 12, 9, 2, 13. a) Agrupar estas cifras en una tabla de distribucin de frecuencias, usando el mtodo de Sturges. b) Calcula la media, mediana y moda. c) Estima la desviacin tpica para datos no agrupados. 4) Sean los siguientes datos: f1=3, F2=8, F3=18, f5=2, x4=3, K=6, H4=0.875, A=2, n=24. Completa la tabla de distribucin de frecuencias y calcular la Varianza.
89
[0.5 [2.5 [4.5 [6.5 [8.5 [10.5 [12.5 a)Calcula h3% y h5% b)Calcula la Varianza.
7) Se tiene una distribucin simtrica de frecuencias con 7 intervalos de igual amplitud A =20 y considerando los siguientes datos: X3*f3 = 1260, f2 + f5 = 62, H6% = 96%, f1 = 8, h3% = 21%. a) Calcula la media, mediana y moda b) Calcula el C.V. 8) Se conocen los siguientes datos del peso de un grupo de estudiantes: Intervalos [20 30> [30 40> [40 50> [50 60> [60 70> fi Hi
fi = 50
5 0.96
Determina: a) La media, mediana y desviacin tpica. b) Presenta los datos en un Histograma y polgono de frecuencias.
90
Intervalo L0 L1 L1 L2 L2 L3 L3 L4 L4 L5 L5 50 50 L7
Xi
fi
Fi
hi
Hi
fi = 60
10) Una fabrica tiene dos departamentos uno de produccin y otro de ventas. Las siguientes tablas de frecuencias presentan los haberes percibidos hasta fines de abril en cada uno de los departamentos.
91
Haberes mensuales en N de trabajadores dlares Dpto. de Ventas [20 60> 0 [60 80> 5 [80 100> 5 [100 120> 15 [120 140> 20 [140 160> 5 total 50 Calcule: a) El haber promedio mensual y la desviacin tpica correspondiente a cada departamento. b) El haber promedio mensual y la desviacin tpica del conjunto de trabajadores de ambos departamentos. 11) Se ha recibido una muestra compuesta de 100 probetas de concreto con el objetivo de analizarlas. Una de las pruebas consisti en determinar la carga de rotura de dichas probetas, encontrndose los siguientes resultados:
92
Regresin lineal 1) La tabla muestra alturas con aproximacin de pulgadas y los pesos con aproximacin de libras de una muestra seleccionada al azar:
altura peso 70 155 63 150 72 180 60 135 66 156 70 168 74 178 65 160 62 132 67 145 65 139 68 152
a) Hallar la ecuacin de la recta de ajuste usando mnimos cuadrados. b) Estimar el peso de un estudiante cuya altura es de 61 pulgadas. c) Estimar la altura de un estudiante cuyo peso es de 170 libras.
93
Solucin: X 70 63 72 60 66 70 74 65 62 67 65 68 X = 802 Y 155 150 180 135 156 168 178 160 132 145 139 152 Y=1850 X*Y 10850 9450 12960 8100 10296 11760 13172 10400 8184 9715 9035 10336 X*Y 124258
4900 3969 5184 3600 4356 4900 5476 4225 3844 4489 4225 4624 = 53792
Calculando a y b:
94
a = -60.75
b = 3.22
a)
Y = -60.75 + 3.22 X
2) La produccin de acero en Estados Unidos en millones de toneladas cortas (una tonelada corta = 2000 libras), durante los aos 1946 1956 aparecen en la siguiente tabla:
95
Aos 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956
Produccin en Ton. cortas 66.6 84.9 88.6 78.0 96.8 105.2 93.2 111.6 88.3 117.0 115.2
a) Halla la ecuacin de ajuste (recta de mnimos cuadrados). b) Estima la produccin de acero durante los aos 1957 y 1958. c) Estima la produccin de acero durante los aos 1945 y 1944.
96
a = 75.30
97
X -2 -1 11 12
98
PROBLEMAS PROPUESTOS 1) Construir una lnea recta que aproxime los datos de la tabla: a) estimar los valores de y para: x= 11, x= 15, x=4, x= 6 b) estimar los valores de x para: y= 2, y=5, y= 18, y= 2)La produccin de acero en Estados Unidos en millones de 15 toneladas cortas(1 tonelada corta = 2000 libras) durante los aos 1986 1996 aparece en la tabla:
2 1
3 3
5 7
7 11
9 15
10 17
99
Ao 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996
66.6 84.9 88.6 78.0 96.2 105.2 93.2 111.6 88.3 117.0 115.2
a) Realiza el diagrama de dispersin. b) Determina la ecuacin de la recta de ajuste. c) Estima la produccin de acero durante los aos: 1997 y 1998. d) Estima la produccin de acero durante los aos: 1985 y1984 e) Halla r e interpreta.
3)Se desea encontrar una ecuacin que estime los ingresos anuales en funcin de los salarios mensuales,con este fin se ha recopilado los salarios mensuales e ingresos anuales de 8 trabajadores de una empresa.
Salarios mensuales Ingresos anuales 100 1200 150 1800 200 2400 275 3300 300 3600 325 3900 350 4200 375 4500
a) Crea el diagrama de dispersin respectivo. b) Determina la recta CURSO: ESTADISTICA I de mnimos cuadrados. CICLO III c) Estima los salarios mensuales para aquellos trabajadores cuyo ingreso anual es de 5700. d) Calcula el coeficiente de Correlacin (interpretar).
100
Ao
Ncigarrillos (millones)
1985 98.2
1986 92.3
1987 80.0
1988 89.1
1989 83.5
1990 68.9
1991 69.2
1992 7.1
a) b) c) d)
Representa el diagrama de dispersin con recta de aproximacin. Halla la ecuacin de mnimos cuadrados. Determina e interpretar el coeficiente de Correlacin Estima la produccin de cigarrillos para los aos 1995 y 1998.
Nmeros ndices Problemas propuestos: 1) La siguiente tabla muestra los precio y cantidades de alguno cereales en los aos 1989 y 1998.
101
1998
producto Cebada Maz Avena Arroz Centeno Trigo Precio 1.24 1.15 0.65 0.097 1.27 2.23 Cantidad 470 3800 1422 4702 32.5 1462
A) Tomando como base a 1989 hallar el ndice de Laspeyres, El ndice de Paashe, el ndice ideal de Fisher. Para el ao 1998. B) Tomando como base a 1989 hallar el ndice de Laspeyres, El ndice de Paashe, el ndice ideal de Fisher. Para el ao 1989. C) Determine el ndice de agregacin simple para los aos 1989 y 1998.
2) La tabla muestra los precios al por menor y producciones medias de antracita y gasolina en EE.UU. durante los aos 1949 y 1958.
precios
producto 1949 1958
102
cantidades
producto antracita gasolina 1949 1958 3559 millones de 1821 millones de toneladas cortas toneladas cortas 80.2 millones de barriles * 118.6 millones de barriles
*
Cada barril contiene 42 galones. a) Determina el ndice de agregacin simple para 1958 con base en 1949. b) Determina el ndice de agregacin simple para 1949 con base en 1958. c) Halla el ndice de Laspeyres, Paashe, Fisher para el ao 1958 con respecto a 1949. Interpretar.