Professional Documents
Culture Documents
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos,
y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto
estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de
interpretación de esa información.
TRABABJO # 1
Definición de estadística
Rama de las matemáticas que se refiere a un conjunto de métodos, normas, reglas y principios
para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo.
División de la estadística
Para ilustrar el uso inferencial ( estadística inferencial), pudiera haber interés en averiguar si es
más probable que las personas que conducen automóviles grandes sean más agresivas que
aquellas que conducen automóviles pequeños. Debido al gran numero de personas que habría
sondear, estaría fuera de consideración la investigación de cada conductor de automóvil. Seria
necesario estudiar una muestra de ellos, y usar los resultados de la muestra para hacer
inferencias que se espera serán aplicables a todos los conductores de automóviles. Sin
embargo, como solo sé esta estudiando una muestra, hay la posibilidad de que las
conclusiones pueden no ser del todo precisas y nunca puede tenerse la certeza de que se ha
hecho la inferencia correcta. Por esta razón el uso de la estadística inferencial puede
considerarse como una ayuda para tomar decisiones en condiciones de incertidumbre. No
obstante, es diferente de la conjeturacion, puesto que en la estadística se proporciona también
un método para estimar el grado de confiabilidad de las conclusiones. En cada proposición
estadística que se hace, se indica la probabilidad de que los descubrimientos como los hechos
podrían haber sido el resultado de factores casuales.
Que es población?
Que es muestreo?
Tipos de muestreo
De entre los primeros él mas utilizado es el llamado aleatorio o al azar, en el cual la muestra se
obtiene mediante sorteo de los individuos que la tienen que formar. El segundo puede ser de
dos clases: por cuotas, en el que solo se especifica el tamaño de la muestra y las
características que tienen que tener los individuos que la componen, y por juicio, en el que el
investigador selecciona los individuos de la muestra según su representatividad.
Tamaño muestral
Se le llama variable a cualquier cantidad medible que puede variar de un individuo a otro. Un
ejemplo en la población de palabras de la novela de Rex Stout, la variable en la que había
interés era la longitud de las palabras; cada palabra individual tiene una longitud particular y
esta puede variar de una palabra a otra.
• Variable cualitativa: esta constituida por la marca, el tipo, el color y el estado general;
que corresponde a aspectos que no se pueden medir sino observar, y por ello se
denominan variables cualitativas. Pueden ser nominales o ordinarias.
• Variable cuantitativa: esta constituida por el tiempo de uso, el precio, el tamaño del
marco y él numero de velocidades, que corresponden a aspectos que son medibles y
por ello se denominan cuantitativas. Puede ser discreta o continua.
• Variable aleatoria: Una variable aleatoria es una función que asigna un numero real a
cada resultado en el espacio muestral de un experimento aleatorio. Las variables
aleatorias se denotan con una letra mayúscula, tal como X, y con una letra minúscula,
como x, el valor posible de x. El conjunto de los posibles valores de la variable aleatoria
X recibe el nombre de rango de X.
Ejemplo: El sistema de comunicación por voz de una empresa tiene 48 líneas externas. En un
determinado momento, se observa el sistema y algunas líneas están ocupadas. Sea X la
variable aleatoria que denota él numero de líneas en uso. Entonces X puede tomar cualquier
valor entero de cero a 48.
• Variable aleatoria discreta uniforme: Una variable aleatoria X es una variable aleatoria
discreta uniforma si cada uno de los n valores que están en el rango de esta, x1, x2, …
x11, tiene la misma probabilidad.
En algunos ejemplos, la variable aleatoria en realidad es discreta, pero como el rango de todos
los valores posibles es muy grande, puede resultar más conveniente utilizar un modelo basado
en una variable aleatoria continua. Por ejemplo, una escala digital puede mostrar el peso de
una pieza redondeado hasta centésimos de gramo, tal vez sea conveniente pensar el peso de
la pieza como una variable aleatoria continua. Como otro ejemplo, es posible medir la corriente
hasta el microampere más cercano. Dado que solo es posible un numero entero de
microamperes, la variable aleatoria es discreta. Sin embargo, tal vez sea más conveniente
suponer que las mediciones de corriente corresponden a valores de una variable aleatoria
continua.
- Variable aleatoria normal estándar: Una variable aleatoria normal con = 0 y =1 y se denota
por Z.
Distribución de frecuencias
Los datos recogidos deben ser organizados, tabulados y presentados para que su análisis e
interpretación sean rápidos y útiles. Por ejemplo, para estudiar e interpretar la distribución de
las notas o calificaciones de un examen en una clase con 30 alumnos, primero se ordenan las
notas en orden creciente: 3,0; 3,5; 4,3; 5,2; 6,1; 6,5; 6,5; 6,5; 6,8; 7,0; 7,2; 7,2; 7,3; 7,5; 7,5; 7,6;
7,7; 7,8; 7,8; 8,0; 8,3; 8,5; 8,8; 8,8; 9,0; 9,1; 9,6; 9,7; 10 y 10. Esta secuencia muestra, a
primera vista, que la máxima nota es un 10, y la mínima es un 3; el rango, diferencia entre la
máxima y la mínima es 7.
ANOTACIONES
1º BACHILLERATO SOCIALES
PSICOLOGÍA
TRABAJO SOCIAL
ESTADÍSTICA DESCRIPTIVA
Estadística es la ciencia que utilizando las matemáticas y de modo particular el
cálculo estudia las leyes de comportamiento de aquellos fenómenos que no estando
sometidos a leyes rígidas dependen del azar y basándose en ella, se predicen resultados.
- Población son todos y cada uno de los elementos que se quieren analizar.
Puede ser finita o infinita( en realidad las poblaciones infinitas no existen,
pero cuando se trata de un número grande se trata como si lo fuera).
ESCALAS DE MEDIDA
Las representaciones gráficas tienen que estar hechas para que el simple
impacto visual nos dé información de la distribución
Diagrama de Barras
12
10
Frecuencias
8
6
4
2
0
x1 x2 x3 x4 x5
Datos X
Diagrama rectángulos
10
8
Frecuencias
0
x1 x2 x3 x4 x5
X
En datos agrupados el Histograma pone en el eje vertical las densidades de
frecuencia de cada intervalo de forma que el área de cada rectángulo es la frecuencia
absoluta del intervalo.
x1 x2 x3 xn
Datos
Intervalos clase
Histograma para datos agrupados en intervalos
El área de cada rectángulo nos da la frecuencia del intervalo, por tanto la base es
la amplitud y la altura la densidad de frecuencia de dada uno di
f5
Densidades
f3
f1 f4
f2
a1 a2 a3 a4 a5
Amplitudes
MEDIDAS DE POSICIÓN
1. Media
2. Mediana
3. Moda
• De tendencia no central
1. Cuantiles.
Las medidas de posición tienen que cumplir que intervengan todos los valores de la
variable, que se puedan calcular y que su valor sea único para cada distribución de
frecuencias.
1.- MEDIA
Se suman de todos los valores de la variable ponderados por sus frecuencias absolutas y
dividido todo ello por el número total de observaciones
n
− ∑x f i i
x=
i =1
N
La media aritmética es siempre el centro de gravedad de la distribución y es
siempre un valor que entra dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada
intervalo para su cálculo.
Propiedades
1.- Cuando a los valores de la variable se les suma una constante, la nueva media
es la antigua más la constante.
− −
x´= x + K ⇒ x´ = x + K
Demostración
x´ =
∑ x ´ f = ∑ ( x + K ) f = ∑ x f + k ∑ f = x + K puesto que la suma
i i i i i i i
−
N N N N
de las fi es N.
2.- Si a los valores de la variable se les multiplica por una constante, la nueva
media es la antigua multiplicada por la constante.
− −
x , ´= x i K ⇒ x´= K x
Demostración
x´=
∑ x ´ f = ∑ Kx f = K ∑ x f = k x
i i i i i i
−
N N N
3.- Como consecuencia de las dos anteriores si a los valores de una variable se
les multiplica por constante y se les suma un número, la media aritmética queda
multiplicada por la constante y sumado el número.
− −
Es decir si : Y = KX + B entonces Y = K X + B
Media cuadrática
∑x f
− 2
x2 = i i
N
Media Armónica
N
H =
f
∑ i
xi
Media Geométrica
Es la raíz N-ésima del producto de los valores de la variable elevado cada uno de ellos a
su frecuencia absoluta
G = N x1f .x 2f .......... x nf
1 2 n
2.- MEDIANA
Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la
variable de forma creciente, y escribir los valores de las frecuencias acumuladas Fi.
3.- MODA
Es el valor de la variable que más veces se repite. En algunos casos existen varias
modas, pero normalmente es una, si son dos se llama bimodal.
d i − d i −1
Mo = Li + .a i
( d i − d i −1 ) + (d i − d i +1 )
CUANTILES
Son medidas de posición que no tiene porqué ser central. Hay varios tipos de cuantiles:
1.- Cuartiles Son valores de la variable que dividen a la distribución en cuatro partes
iguales, por lo tanto los cuartiles son tres C1 que deja por detrás de él al 25% de la
población, C2 que divide a la población en dos partes iguales y C3 que deja dtrás de él al
75% de la población.
2.- Deciles Son valores e la variable que dividen a la distribución en diez partes iguales,
por lo tanto los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente
hasta D9 que deja al 90% antes y al 10% después de él.
3.- Percentiles.- Son valores de la variable que dividen a la distribución en cien
partes iguales, por lo tanto los percentiles son 99.
MEDIDAS DE DISPERSIÓN
Recorrido
Recorrido Intercuartílico
Desviación Media
Varianza
Desviación Típica
RECORRIDO
R = xn – x1
RECORRIDO INTERCUARTÍLICO
RI = Q 3 – Q 1
DESVIACIÓN MEDIA
∑ x − x f
i=n −
D =
i =1 i
i
−
x N
VARIANZA
S 2X =
∑( xi − x)2 fi
N
Propiedades:
1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y
es cuando todos los valores de la variable son iguales.
2.- Si a los valores de la variable le sumo una constante, la varianza de la nueva variable
es la misma que la que tenía antes.
Demostración:
− −
S x´2 =
∑( xi ´− x´) fi =
∑( xi + k − ( x + k )) 2 fi = S x2
N N
3.- Si a los valores de la variable se les multiplica por una constante, la varianza de la
nueva variable es la que tenía por el cuadrado de la constante.
Demostración
´− − −
S 2
´=
∑( x ´− x)
i
2
fi
=
∑(kx i − k x)2 fi
=k 2 ∑( x i − x) 2 f i
= k 2 S x2
x
N N N
S y2 = a 2 S x2
− −2
5.- Cálculo abreviado de la varianza
S = x − x que es la fórmula más utilizada.
2
x
2
Demostración
−2
−2 − −2 −
∑2 xi− x fi ∑ (xi2+ x− 2 i )fxx i ∑ i2fx i x∑ fi 2x∑ fx ii −2 −2 .
Sx = = = + − = x − x
N N N N N
DESVIACIÓN TÍPICA (Sx)
Tipificación de variables
Tipificar una variable es cambiarla por otra que tenga de media cero y
desviación típica 1. Se utiliza para comparar distribuciones .
MEDIDAS DE FORMA
−
−
x− M o
Ap =
Sx
Este coeficiente puede ser:
g1 =
∑( xi − x)3 fi
N .S x3
g2 =
∑(x i − x) 4 f i
−3
N .S x4
Este coeficiente puede ser:
Las medidas más utilizadas son el Índice de Gini y la curva de Lorentz, su cálculo se
basa en la siguiente tabla de distribución:
Li-1-Li mi fi Fi Fi u
ui = ∑f i .mi
pi = .100 qi i = i .100
N un
10-20 15 6 6 90 26,09 8,45
20-40 30 4 10 210 43,48 19,72
40-50 45 3 13 345 56,52 32,39
50-70 60 5 18 645 78,26 60,56
70-80 75 2 20 795 86,96 74,65
80-100 90 3 23 1065
N=23 291,31
Siempre pi > qi en caso de igualdad implica que todos perciben la misma cantidad, por
lo tanto hay nula concentración o total uniformidad en el reparto.
Indice de Gini
IG =
∑( p − q ) = 95,54 = 0,3280
i i
en nuestro ejemplo hay escasa
∑p i 291,31
concentración por lo tanto bastante uniformidad en el reparto.
xi fi
47 1
48 3
49 2
50 8
51 3
52 2
53 1
3.- Un hotel tiene cinco tipos de habitaciones cuyos precios así como los ingresos son:
3
2,8
2,6
2,4
2,2
2
1,8
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
0
25 50 75 100 125 150
Calcular:
• Tabla estadística
• Establecer nº de empresas con beneficios superiores a 75 millones
• Calcular media mediana y moda
• Coeficiente de variación y de asimetría de Pearson ( significado)
6.- Las calificaciones de 90 opositores en el primer ejercicio han sido:
xi fi
0 4
1 10
2 13
3 11
4 13
5 10
6 9
7 7
8 7
9 4
10 2
7.- La tabla adjunta muestra la distribución de los salarios/mes en Euros percibidos por
los 65 empleados de la empresa AVISO.
8.- Una variable estadística tiene una media igual a 7, y una desviación típica igual a 5.
Calcular la media y la varianza de las variables:
• Y = (X-2)/4
• Z= 5X+2
9.- Completar los datos que faltan en la siguiente tabla de distribución de frecuencias:
xi fi FI hi HI
70 2 - - -
60 - 12 - -
50 8 - - -
40 6 - - -
30 - 34 - -
20 4 - - -
10 3 - - -
Calcular:
• Media aritmética
• Varianza
• Coeficiente de variación
• Mediana
• Recorrido intercuartílico
10.- La puntuación que han obtenido 50 personas que se presentaron para ocupar un
puesto en la plantilla de una empresa, ha sido la siguiente:
Puntuación Nº personas
14.18 3
18.20 6
20.25 11
25.28 15
28.32 8
32.36 7
11.- Las últimas cien ventas facturadas por un establecimiento se habían agrupado en
cuatro intervalos de clase, recordamos tan sólo la siguiente información:
• El primer intervalo tiene seis semanas como extremo superior, una frecuencia
relativa de 0,2 y una amplitud de cuatro semanas.
• La marca de clase del segundo y cuarto intervalo son ocho y cincuenta semanas
respectivamente.
• Hasta el segundo intervalo se acumulan sesenta ventas.
• El tercer intervalo presenta una frecuencia de treinta ventas y una amplitud de
treinta semanas.
13.- Durante la última semana dos librerías han vendido los libros que ocupan los tres
primeros puestos en las listas de ventas a los siguientes precios
Librería 1 Librería2
Precio Nº Ejemplares Precio Nº Ejemplares
18 10 15 25
21 13 19 18
23 15 20 25
14.- Una empresa automovilística ha abierto una nueva factoría en un país del este. En
este año en dicha factoría se han obtenido unas ventas medias mensuales de 100
automóviles con una desviación típica de 10, mientras que en España por término medio
se han vendido 75 coches con una desviación típica de 8.
Se pide a los alumnos de la clase las notas de la evaluación en las dos asignaturas y
se anotan los resultados. Una vez anotados los resultados en dos filas, se pide:
16.- Con los datos de la siguiente tabla obténgase las medias, varianzas y covarianza de
las variables X e Y
yj 1 2 4 ni
xi
5 1 0 2 3
10 2 1 0 3
15 0 1 3 4
nij 3 2 5 10
xi yj nij
2 1 6
2 4 7
3 2 4
3 5 2
5 4 1
20.- Calcular las rectas de regresión de una variable bidimensional (X,Y) sabiendo los
siguientes datos :
x = 1 4 y = 7 S x2 = 3 S y2 = 1 r = 0,9 5
• ¿ Qué valor asignaría a X para un valor Y=5
21.- Dada la recta de regresión Y = - 0,25 + 3,2X ¿ Puede ser Sy< 6,4 si Sx = 2?
22.- En una región de España se observó el precio del vino y la cantidad de producción
durante algunos años , obteniéndose los siguientes datos :
X 35 31 42 60 52 49 61 50 55 58
Y 100 140 120 110 200 200 110 160 160 200
• Distribuciones marginales
• Media, mediana, desviación típica y coeficiente de variación de Pearson
de X
• Covarianza entre las variables
• Porcentaje de años en los que el precio del vino fue inferior a 48
céntimos
• Recta de regresión de Y/X
• Coeficiente de correlación y de determinación , significado.
23.- La recta de regresión entre dos variables viene dada por Y = 5 + b.X. Sabiendo que
las medias de las variables son respectivamente 5 y 20. Calcular el coeficiente de
regresión .
• El ajuste es bueno
• El coeficiente de correlación es 0,9
• El 10% de los valores no se explican por la regresión
25.- Media aritmética y varianza. Tipos de medida que son. Utilidad, importancia y
propiedades que cumple cada una de ellas.
IES LEÓN FELIPE
Dpto Matemáticas
Examen ESTADÍSTICA 1º
19 de Mayo 2005
TEORÍA
PROBLEMAS
En todos los apartados ponga en un recuadro el resultado final
5.10 20
10.15 15
15.20 25
20.30 40
2.- ( 2 puntos ) Halle las rectas de regresión de una variable bidimensional (X,Y)
− −
sabiendo x = 20 y = 10 S x = 4 S y = 2 , siendo el coeficiente de correlación lineal r =
0,95.
En cual de las dos variables la media es más representativa?. ¿ Qué valor asignaría
a Y = 6? Sería la predicción fiable?
3.- ( 2 puntos ) En una muestra de 20 empresas del sector metalúrgico se
obtuvieron los siguientes datos sobre el número de empleados X y sus ingresos anuales
Y en miles de Euros
TEORÍA
1.- ( 2 puntos ) Conteste a la pregunta que mejor sepa de entre las propuestas por el
profesor en clase.
PROBLEMAS
En todos los apartados ponga en un recuadro el resultado final
1.-(2 puntos ) Una empresa quiere realizar un estudio sobre la influencia de las
campañas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a
publicidad y sus ventas en los últimos cinco años:
Xi fi
2 8
3 10
8 12
12 6
15 3
Li-1-Li fi
5-10 6
10-15 7
15-20 10
20-30 9