Professional Documents
Culture Documents
ESTADISTICA
Es una ciencia que usa un conjunto de métodos y/o técnicas que son necesarias para
RECOLECTAR, RESUMIR, CLASIFICAR, ANALIZAR e INTERPRETAR, el
comportamiento de los datos con respecto a una característica materia de estudio.
Es decir que se encarga de obtener información para describirla y luego la usa para
predecir "algo" de ella.
División de la Estadística:
1.- Estadística Descriptiva
2.- Estadística Inferencial
1.- ESTADISTICA DESCRIPTIVA.-
Se conoce como el conjunto de métodos usados para la RECOLECCIÓN,
PRESENTACIÓN Y CARACTERIZACIÓN de un conjunto de datos.
En conclusión la estadística descriptiva, ANALIZA Y DESCRIBE los datos.
2.- ESTADISTICA INFERENCIAL.-
Es la encargada de la PREDICCIÓN DE ALGO. Es la que posibilita la toma de decisiones
en base a una información parcial obtenida mediante técnicas descriptivas.
Usa el cálculo de la probabilidad, en las decisiones.
1.- POBLACION
Es el conjunto total de individuos, objetos u entes que tienen determinadas características
que se puede estudiar.
Ejemplo: todas las personas (tienen razas, sexo, religión, edad, talla, idiomas, peso,
nacionalidad etc.)
Todos los estudiantes de la URP. (¿Que tienen en común?)
La Población puede ser:
Finita.- cuando los elementos se pueden contar, o el número de elementos que la
conforman se puede determinar. Ejemplo:
- Todos los alumnos de la URP
- Toda la producción de tornillos durante un mes
Infinita.- cuando el número de elementos que la conforman no se puede determinar.
Ejemplo:
- Todas las estrella del firmamento
- Todos los árboles de la selva peruana.
Lic. América Paula Campomanes Morán 1
UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
2.- MUESTRA.-
Es una parte relativamente pequeña de la población, o también se define como un
subconjunto de la población.
Ejemplo: Un grupo de 500 alumnos de la URP
3.- UNIDAD ESTADISTICA.-
Es un solo elemento de la población o muestra.
Ejemplo: un alumno de la URP
4.-CARACTERISTICA (VARIABLE)
Es lo que le interesa al investigador para su estudio o trabajo
La característica es la propiedad de los fenómenos y puede tomar diferentes valores
Ejemplo: Edad, sexo, peso, cociente intelectual, ventas.
LA VARIABLE.-Está relacionada con la características y se denota con letras
mayúsculas del alfabeto, X, Y, Z.
Las variables pueden ser:
- CUALITATIVA.-
Se refiere a la cualidad que presenta un fenómeno (se expresa en palabras)
- DISCRETA.-
Son valores enteros.
- CONTINUA.
Son infinitos valores que se encuentran entre dos números.
5.- TIPOS DE DATOS
Depende de la característica (variable) y se dividen en:
Datos cualitativos
Datos cuantitativos.
Datos Cualitativos.-
Son atributos o cualidades que solo se expresan en forma literal.
Ejemplo: Especialidad, lugar de origen, etc.
Estos se dividen en nominales y ordinales.
Datos Cuantitativos.-
Son expresiones numéricas, y se dividen en:
1.- Cuantitativo Discreto.- Cuando los valores de los datos son enteros, y se obtiene
por medio del conteo.
Ejemplo: número de hermanos, números de hijos, números de cursos matriculados,
números de créditos aprobados, etc.
2.- Cuantitativo Continuo.-Los valores que toman, pueden ser enteros y/o fraccionario,
es decir entre dos números pueden tomar infinitos valores. Se obtienen por medio de la
medición, duración o tiempo.
Ejemplos: estatura, edad, peso, etc.
DISTRIBUCION DE FRECUENCIAS.
Frecuencia absoluta (fi).- se obtiene de contar cuantas veces se repite cada valor de la
variable. Como se obtiene por conteo, siempre es un valor entero.
La suma de las frecuencias absolutas es igual al número total de datos (n) (∑fi = n)
Frecuencia Relativa acumulada (Hi).- se obtiene de sumar las frecuencias relativas (hi)
hasta un determinado valor de la variable.
La primera frecuencia relativa (H1) es igual a la primera frecuencia relativa simple (h1)
La última frecuencia relativa (Hm) es igual a la unidad.
Frec. Frec.
Variable Absoluta Relativa FRECUENCIAS ACUMULADAS
Xi fi hi Fi Hi F´i H'i
X1 f1 h1 F1 H1 F’1 H’1
X2 f2 h2 F2 H2 F’2 H’2
X3 f3 h3 F3 H3 F’3 H’3
X4 f4 h4 F4 H4 F’4 H’4
X5 f5 h5 F5 H5 F’5 H’5
Xm fm hm Fm Hm F’m H’m
TOTALES n= 1.00
C E C C M M I M E M M E E M M I I C C C
C C M C E C I I C E F F F E I F F I C E
C M M H E C M E I F M M I E F I I C C C
Gráficos adecuados: Barras o bastones para (fi y hi) y las escaleras para las
acumuladas (Fi, Hi, F’i, H’i)
Frec. Frec.
Variable Absoluta Relativa FRECUENCIAS ACUMULADAS
Xi fi hi Fi Hi F´i H'i
X1 f1 h1
X2 f2 h2
X3 f3 h3
Xm fm hm
TOTALES n = ∑ fi 1.00
3 2 3 5 6 1 3 2 5 6 4 6 1 2 3 4
2 3 6 4 2 4 2 4 5 2 3 3 4 2 3 2
5 5 4 3 3 4 6 1 2 3 4 3 5 4 6 4
TOTAL n = ∑ fi 1.0000
INTERVALOS
Tipos de intervalos:
- cerrados [ ]
- semicerrados: por la derecha ( ]
Por la izquierda [ )
Tipos de Límites.-
- Límites Aparentes (cuando los intervalos son cerrados)
- Límites Reales de Clase (cuando los intervalos son semicerrados)
60 75 68 76 70 72 78 58 65 73 79 67 67 59 62
67 53 68 72 90 75 79 87 83 85 69 69 72 79 71
72 75 61 63 74 63 73 81 75 79 59 71 84 73 84
Son tablas donde se presenta en forma ordenada dos características de cada individuo
o elementos que se desee estudiar o investigar.
Por ejemplo: edad y peso; estatura y peso; número de hijos y nivel educativo de los
padres; edad y estado civil; producción y venta etc.
Cada frecuencia es un par ordenado (X, Y)
Una variable es independiente y se le denota con (X)
y la otra variable es dependiente y se le denota con ( Y )
Y \ X X1 X2 ... XJ f .y
y1 f11 f21 ... fj1 fy1
y2 f12 f22 ... fj2 fy2
f13 f23 fj3 fy3
f14 f24 fj4 fy4
yk f1k f2k ... fjk fyk
f x. fx1 fx2 fxj n
Donde:
(f x .) Se denota a la marginal de la variable X
(f . y) se denota a la marginal de la variable Y
´n = es el número total de pares ordenados
Y \ X X2 X2 ….. Xj h .y
Y1 h11 h21 ….. hj1 hy1
Y2 h12 h22 ….. hj2 hy2
h13 h23 ….. hj3 hy3
h14 h24 ….. hj4 hy4
Yk h1k h2k ….. hjk hyk
hx. hx1 hx2 ….. hxk 1
3 7 6 2 5 4 4 5 7 2 3 3
Calcular la media aritmética del número de cursos matriculados y exprese su significado
e indique el tipo de variable y el tipo de dato.
PROPIEDADES
P1.- La unidad de medida de la Media Aritmética es la misma que la unidad de las
observaciones.
P2.- La Media Aritmética es influenciada por todos los valores de la serie de datos.
P3.- Si a cada valor de los datos, se le suma o resta una constante, la media aritmética
del nuevo conjunto es igual a la media aritmética original más ó menos la constante.
_____ __
Es decir: X±K = X±K
P4.- Si a cada valor del conjunto de datos, se le multiplica por una constante, la media
aritmética del nuevo conjunto es igual la Media Aritmética original multiplicado por la
constante.
_____ _
Es decir: X*K = K* X
P5.- La suma algebraica de las desviaciones de cada valor de la variable con la media
aritmética es igual a cero.
_
∑ (Xi - X) = 0
P6.- Dado dos (2) conjuntos de datos, cada uno con un número de observaciones, se
puede obtener la Media Total, mediante la siguiente formula.
_ __
XT = ∑ ni* xi.
∑ni
2.- MEDIANA
Es un valor central, ya que divide a la distribución en dos partes iguales, cada parte tiene
el valor de 50%.
Se denota: Md
a) SIN INTERVALOS
1.- Calcular la Frecuencia Acumulada ( FJ )
2.- Posición de la mediana ( n/2)
3.- Hallar el FJ (que es el valor inmediatamente superior a la posición de la mediana)
4.- Hallar el FJ-1 (valor anterior al FJ)
5.- Comparar el FJ-1 con n/2
Y se tiene 2 condiciones: (<) o (=)
Entonces: Md = X J cuando el FJ-1 < n/2
b) CON INTERVALOS
1.- Calcular la Frecuencia Acumulada (FJ)
2.- Posición de la mediana (n/2)
3.- Hallar el FJ
4.- Hallar el FJ-1
5.- Hallar el lJ (es el límite real inferior de la recta del FJ)
6.- Calcular la amplitud ( CJ ) del intervalo de la recta de FJ
7.- Aplicar la FORMULA.- Md = lj + (n/2 – Fj-1) * Cj
( Fj – Fj-1 )
Ejemplo: El tiempo que demoran un grupo profesores en llegar a la universidad (en minutos), se
muestra en la siguiente distribución de frecuencia acumulada.
Tiempo(min.) 10 – 14 15 - 20 21 - 28 29 – 35 36 - 43
Profesores 1.00 0.87 0.52 0.29 0.12.
3.- MODA
DATOS NO TABULADOS
Es el valor de la variable que se repite más veces
Ejemplo:
DATOS TABULADOS:
a) SIN INTERVALOS
Es el valor de la variable que tiene la frecuencia más alta
Ejemplo: a) 3, 9, 8, 7, 4, 4, 4,3, 9, 2
Lic. América Paula Campomanes Morán 9
UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
b)23, 27, 54, 38, 40, 29, 10
b) CON INTERVALOS
Es el valor de la variable donde tiende a concentrarse más la información y se obtiene
con la siguiente FORMULA. Mo = lmo + ( ∆1 ) *Cmo
(∆1 + ∆2 )
Ejemplo: hoja adicional de problemas
4.- CUANTILAS
4.1- CUARTILES
Se denota “Qi ”
Son tres ( 3 ) números que dividen a la distribución en cuatro partes iguales.
Valor de cada parte es de 25 %.
FORMULAS
1.- DATOS NOTABULADOS:
Qi = i(n+1)/4
4.2.- DECILES
Se denota “Di”
Son nueve (9 ) números que dividen a la distribución en 10 partes iguales.
El valor de cada parte es de 10 %
FORMULAs
1.- DATOS NOTABULADOS:
Di = i(n+1)/10
4.3-PERCENTILES
Se denota Pi
Son noventa y nueve (99) números que dividen a la distribución en 100 partes iguales.
El valor de cada parte es 1 %
FORMULAs
MEDIDAS DE DISPERSION
PROPIEDADES
1.- La varianza siempre es un número NO NEGATIVO
V (X) ≥ 0
2.- La varianza de una constante es igual a cero
V (K) = 0 donde K = constante
3.- Si a cada valor de la serie de datos se le SUMA O RESTA una constante; la varianza
de la nuevas serie de datos, es igual a la varianza original.
V ( Xi ± K ) = V(X) ± V (K) = V(X)
4.- Si a cada valor de la serie de datos se le multiplica una constante; la varianza de la
nueva serie de datos es igual a la varianza original multiplicado por la constante al
cuadrado.
V ( Xi *K ) = K2 V(X)
5.- Dado dos series de datos donde se conoce la media aritmética y la varianza de cada
serie se puede calcular la varianza de las dos series mediante la siguiente formula:
VT = ∑ni*Vi.
∑ni
PROPIEDADES
1.- Es siempre un valor positivo
2.- Es influenciado por todos los valores de la serie de datos.
3.- Mayor influencia ejerce los valores extremos que los que están cerca del promedio.
4.- Si la distribución es normal o ligeramente asimétrica se cumple la siguiente relación:
_
X ± S = 68.23% = 68%
_
X ± 2S = 95.46% = 95%
_
X ± 3S = 99.73% = 99.7
CORRECCION DE SHEPPARD
Se usa solo para datos agrupados con intervalos de amplitudes iguales.
El factor de corrección es (C2 / 12)
FORMULA
V corregida = V(x) – C2
12
Ejemplo: Hoja adicional de Problemas
RS = ( Q3 – Q1)
2
Ejemplo: Hoja adicional de Problemas
C.V. = ( S )*100
_
X
MEDIDAS DE ASIMETRIA
Propiedades:
A1 = 0 la distribución es simétrica
A1 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha.
A1 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda.
Propiedades:
A2 = 0 la distribución es simétrica
A2 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha.
A2 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda.
Formula:
Asq = Q1 + Q3 – 2*Q2
Q3 – Q1
TIPOS DE RELACION.-
a) Relación directa
A medida que aumenta los valores de “x” también aumentan los valores de “y” (es decir
tiene una forma ascendente). Gráfico:
b) Relación Inversa
A medida que los valores de “x” son pequeños los valores de “y” son grandes y viceversa.
(Su forma es descendente).Gráfico:
c) Relación nula
Cuando los valores de “X” e “Y” están dispersos sin coordinación. Gráfico:
Es el estadígrafo que mide el grado de relación que existe entre dos variables que están
relacionadas entre si, se denota por “ r ”
El coeficiente de correlación siempre está dentro de un intervalo:
-1 ≤ r ≤ +1
PROPIEDADES:
r = . n∑XY - ∑X∑Y .
√[n∑X – (∑X) ][n∑Y – (∑Y) ]
2 2 2 2
___
r= C(X , Y) donde C(X,Y) = ∑XY - XY
V(x) V(y) n
LA COVARIANZA,
Mide el grado de dispersión o variación cuando se usan 2 variables (X,Y) que están
relacionadas.
Sus valores pueden ser positivos, negativos o cero
___
C(X,Y) = ∑XYfxy - XY
n
Nos permite estimar o predecir valores futuros o anteriores o aquellos valores que no
están definidos dentro de la serie de datos.
Existen dos rectas de regresión:
1.- Recta de Regresión de Y sobre X
2.- Recta de Regresión de X sobre Y
La ecuación es ŷ = a + b (x)
Donde:
´b =. n∑XY - ∑X∑Y
[n∑X2 – (∑X)2]
´a = Y – (b ) X
O también b = C(X , Y)
S(x)
La ecuación es X* = a + b (y)
Donde:
´b = . n∑XY - ∑X∑Y
[n∑Y2 – (∑Y)2]
´a = X – (b) Y
b = C(X , Y)
S(y)