You are on page 1of 17

UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA

CURSO: ESTADISTICA Y PROBABILIDADES


ESTADISTICA E INGENIERIA

LA ESTADÍSTICA se ha hecho sentir en todos los campos y/o especialidades como en


la ingeniería, en la administración, y en la industria. Se aplica en la producción, en el uso
de materiales y fuerza de trabajo, en el desarrollo de nuevos productos, etc.
LA ESTADÍSTICA se considera como una herramienta de la ingeniería ya que sin ella
no se puede apreciar, entender, comprender o aplicar parte de los trabajos que se
realizan en su campo.
El método estadístico en ingeniería se puede utilizar de diferentes formas. Como para:
 estimar el coeficiente de dilatación térmica de un metal
 Comparar la resistencia de dos aleaciones.
 En el control de calidad, con sus respectivos diagramas (medias, desviaciones),
calidad de producción de masa, problemas de inspección muestral, etc.
 En la aplicación de la confiabilidad de los productos.
 En el área de la investigación de operaciones usan la teoría de probabilidad y
estadística en forma general.

ESTADISTICA

Es una ciencia que usa un conjunto de métodos y/o técnicas que son necesarias para
RECOLECTAR, RESUMIR, CLASIFICAR, ANALIZAR e INTERPRETAR, el
comportamiento de los datos con respecto a una característica materia de estudio.
Es decir que se encarga de obtener información para describirla y luego la usa para
predecir "algo" de ella.
División de la Estadística:
1.- Estadística Descriptiva
2.- Estadística Inferencial
1.- ESTADISTICA DESCRIPTIVA.-
Se conoce como el conjunto de métodos usados para la RECOLECCIÓN,
PRESENTACIÓN Y CARACTERIZACIÓN de un conjunto de datos.
En conclusión la estadística descriptiva, ANALIZA Y DESCRIBE los datos.
2.- ESTADISTICA INFERENCIAL.-
Es la encargada de la PREDICCIÓN DE ALGO. Es la que posibilita la toma de decisiones
en base a una información parcial obtenida mediante técnicas descriptivas.
Usa el cálculo de la probabilidad, en las decisiones.

CONCEPTOS BASICOS DE LA ESTADISTICA

1.- POBLACION
Es el conjunto total de individuos, objetos u entes que tienen determinadas características
que se puede estudiar.
Ejemplo: todas las personas (tienen razas, sexo, religión, edad, talla, idiomas, peso,
nacionalidad etc.)
Todos los estudiantes de la URP. (¿Que tienen en común?)
La Población puede ser:
Finita.- cuando los elementos se pueden contar, o el número de elementos que la
conforman se puede determinar. Ejemplo:
- Todos los alumnos de la URP
- Toda la producción de tornillos durante un mes
Infinita.- cuando el número de elementos que la conforman no se puede determinar.
Ejemplo:
- Todas las estrella del firmamento
- Todos los árboles de la selva peruana.
Lic. América Paula Campomanes Morán 1
UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES

2.- MUESTRA.-
Es una parte relativamente pequeña de la población, o también se define como un
subconjunto de la población.
Ejemplo: Un grupo de 500 alumnos de la URP
3.- UNIDAD ESTADISTICA.-
Es un solo elemento de la población o muestra.
Ejemplo: un alumno de la URP
4.-CARACTERISTICA (VARIABLE)
Es lo que le interesa al investigador para su estudio o trabajo
La característica es la propiedad de los fenómenos y puede tomar diferentes valores
Ejemplo: Edad, sexo, peso, cociente intelectual, ventas.
LA VARIABLE.-Está relacionada con la características y se denota con letras
mayúsculas del alfabeto, X, Y, Z.
Las variables pueden ser:
- CUALITATIVA.-
Se refiere a la cualidad que presenta un fenómeno (se expresa en palabras)
- DISCRETA.-
Son valores enteros.
- CONTINUA.
Son infinitos valores que se encuentran entre dos números.
5.- TIPOS DE DATOS
Depende de la característica (variable) y se dividen en:
 Datos cualitativos
 Datos cuantitativos.
Datos Cualitativos.-
Son atributos o cualidades que solo se expresan en forma literal.
Ejemplo: Especialidad, lugar de origen, etc.
Estos se dividen en nominales y ordinales.
Datos Cuantitativos.-
Son expresiones numéricas, y se dividen en:
1.- Cuantitativo Discreto.- Cuando los valores de los datos son enteros, y se obtiene
por medio del conteo.
Ejemplo: número de hermanos, números de hijos, números de cursos matriculados,
números de créditos aprobados, etc.
2.- Cuantitativo Continuo.-Los valores que toman, pueden ser enteros y/o fraccionario,
es decir entre dos números pueden tomar infinitos valores. Se obtienen por medio de la
medición, duración o tiempo.
Ejemplos: estatura, edad, peso, etc.

DISTRIBUCION DE FRECUENCIAS.

Es la presentación de la información de forma ordenada, en una tabla que contiene en


forma general lo siguiente:
I.- Variable o característica
II.- Frecuencias que son seis (6): 1.- frecuencia absoluta (fi), 2.- frecuencia relativa (hi),
3.- frecuencia absoluta acumulada (Fi), 4.- frecuencias relativa acumulada (Hi), 5.-
frecuencia absoluta acumulada decreciente (F’i), 6.- frecuencias relativa acumulada
decreciente (H’i).

Frecuencia absoluta (fi).- se obtiene de contar cuantas veces se repite cada valor de la
variable. Como se obtiene por conteo, siempre es un valor entero.
La suma de las frecuencias absolutas es igual al número total de datos (n) (∑fi = n)

Lic. América Paula Campomanes Morán 2


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
Frecuencias Relativa (hi).- se obtiene usando la operación de división (fi/n) y sus valores
son expresados en forma decimal.
La suma de las (hi) por definición es igual a 1.0000. (∑ hi = 1.0000)

Frecuencia Absoluta acumulada (Fi).- se obtiene de sumar las frecuencias absolutas


(fi) hasta un determinado valor de la variable.
La primera frecuencia absoluta (F1) es igual a la primera frecuencia absoluta simple (f1)
La última frecuencia absoluta (Fm) es igual al número total de datos (n). (Fm = n)

Frecuencia Relativa acumulada (Hi).- se obtiene de sumar las frecuencias relativas (hi)
hasta un determinado valor de la variable.
La primera frecuencia relativa (H1) es igual a la primera frecuencia relativa simple (h1)
La última frecuencia relativa (Hm) es igual a la unidad.

Frecuencia Absoluta acumulada decreciente (F’i).- se obtiene de restar las


frecuencias absolutas simples (fi)
La primera frecuencia absoluta acumulada (F’1) es igual a “n” (Donde n = número total de
datos) (F’1 = n)
La última frecuencia absoluta acumulada (F’m) es igual a “fm”

Frecuencia Relativa acumulada decreciente (H’i).- se obtiene de restar las frecuencias


relativas simple (hi).
La primera frecuencia relativa acumulada (H’1) es igual a “1.000” (H’1 = 1.0000)
La última frecuencia relativa acumulada (H’m) es igual a “hm”

DISTRIBUCION DE FRECUENCIAS EN FORMA GENERAL

Frec. Frec.
Variable Absoluta Relativa FRECUENCIAS ACUMULADAS
Xi fi hi Fi Hi F´i H'i
X1 f1 h1 F1 H1 F’1 H’1
X2 f2 h2 F2 H2 F’2 H’2
X3 f3 h3 F3 H3 F’3 H’3
X4 f4 h4 F4 H4 F’4 H’4
X5 f5 h5 F5 H5 F’5 H’5
Xm fm hm Fm Hm F’m H’m
TOTALES n= 1.00

TIPOS DE DISTRIBUCIONES DE FRECUENCIAS

Está relacionada con los tipos de datos y son tres (3)

I.-DISTRIBUCION DE FRECUENCIAS PARA DATOS CUALITATIVOS

La distribución de frecuencias para este tipo de datos contiene :


1.- variable o característica
2.- Frecuencia absoluta, frecuencia relativa y porcentaje.

Grafico adecuado es el circular, aunque también se puede graficar el de barra o


bastones.

Lic. América Paula Campomanes Morán 3


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES

Frecuencia Frecuencia Relativa


Variable (Xi) Absoluta (fi) (hi) Porcentajes ( % )
X1 f1 h1 %
X2 f2 h2 %
X3 f3 h3
:
:
Xm fm hm %
TOTALES n = ∑ fi 1.0000 100%

Ejemplo: Se seleccionan 60 estudiantes de la facultad de Ingeniería y se le pregunta su


especialidad, las respuestas que se obtienen son las siguientes:

C E C C M M I M E M M E E M M I I C C C
C C M C E C I I C E F F F E I F F I C E
C M M H E C M E I F M M I E F I I C C C

Leyenda: C= Civil, E= Electrónica, I= Industrial, F= Informática, M= Mecatrónica.

a) Se pide formar la distribución de frecuencias.


b) Grafico circular de frecuencia absoluta y frecuencia relativa
c) Dar el valor y significado de f2 y h4
d) Graficar una barra porcentual
e) Graficar una barra de frecuencia absoluta.

II. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO


DISCRETO.-

Gráficos adecuados: Barras o bastones para (fi y hi) y las escaleras para las
acumuladas (Fi, Hi, F’i, H’i)

Frec. Frec.
Variable Absoluta Relativa FRECUENCIAS ACUMULADAS
Xi fi hi Fi Hi F´i H'i
X1 f1 h1
X2 f2 h2
X3 f3 h3

Xm fm hm
TOTALES n = ∑ fi 1.00

Ejemplo.- A un grupo de estudiantes de ingeniería se le pregunta sobre el número de


cursos aprobados y las respuestas son las siguientes:

3 2 3 5 6 1 3 2 5 6 4 6 1 2 3 4
2 3 6 4 2 4 2 4 5 2 3 3 4 2 3 2
5 5 4 3 3 4 6 1 2 3 4 3 5 4 6 4

Lic. América Paula Campomanes Morán 4


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
a) Se pide formar la distribución de frecuencias.
b) Graficar la frecuencia absoluta y frecuencia relativa.
c) Formar la distribución de frecuencias relativas.
d) Graficar una escalera porcentual
e) Formar la distribución de frecuencias absolutas
f) Graficar una escalera decreciente de frecuencia absoluta
g) Dar valor y significado de f2 , h4, F3 , F´4. H`3.
h) Graficar la frecuencia absoluta acumulada creciente

III. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO


CONTINUO.-
Gráficos adecuados:
1.-Histogramas, 2.- polígonos de frecuencias. (Para las frecuencias simples (fi y hi))
3.-Ojivas (Para las frecuencias acumuladas crecientes y decrecientes (Fi , Hi, F´i , H´i ))

marca Frec. Frec.


Intervalos clase Absoluta Relativa Frecuencias Acumuladas
X'i-1 - X'i Xi fi hi Fi Hi F'i H'i

TOTAL n = ∑ fi 1.0000

INTERVALOS
Tipos de intervalos:
- cerrados [ ]
- semicerrados: por la derecha ( ]
Por la izquierda [ )
Tipos de Límites.-
- Límites Aparentes (cuando los intervalos son cerrados)
- Límites Reales de Clase (cuando los intervalos son semicerrados)

Proceso de obtención de los intervalos:

I.- Determinar: El número menor (X min.)


El número mayor (X máx.)

II.- Calcular el Rango o Recorrido ( R )


R = X max - X min
III.- Determinar el número de intervalos (m )
 Regla de Sturgen: m = 1 + 3.322 lóg.n
 Empírico: m = √ n
Propiedad.- “m” siempre es un número entero

IV.- Calcular la Amplitud ( C ) de cada intervalo


También se le conoce como distancia de cada intervalo C = R
m

Lic. América Paula Campomanes Morán 5


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
Propiedad.- La magnitud de la amplitud debe de ser igual al de los datos
originales. (X min. y X máx.)

V.- Corrección (D)


D = (m)*(C) – R
 D > 0. Satisface la amplitud (C) y el número de intervalos (m) y la diferencia se
reparte equitativamente en los extremos ( X min y X máx.)
 D < 0. Se tiene que efectuar 2 correcciones.
En D1 solo se corrige la amplitud (C corregido)
En D2 solo se corrige el número de intervalo (m corregido)
De los 2 se escoge el que tiene el valor menor.
 D = 0. Satisface la amplitud (C) y el número de intervalos (m) y se forma los
intervalos con los X min. y X máx. iniciales.

Ejemplo.-Los siguientes datos corresponden a los pesos de 45 alumnos y los resultados


se muestran a continuación:

60 75 68 76 70 72 78 58 65 73 79 67 67 59 62
67 53 68 72 90 75 79 87 83 85 69 69 72 79 71
72 75 61 63 74 63 73 81 75 79 59 71 84 73 84

a) Elaborar la distribución de frecuencias (usando la regla de sturgen)


b) Graficar un histograma de frecuencia absoluta
c) Graficar un polígono de frecuencia absoluta
d) Graficar un polígono porcentual
e) Formar una distribución de frecuencias absolutas
f) Graficar una ojiva porcentual creciente
g) Graficar una ojiva de frecuencia relativa decreciente
h) graficar una ojiva de frecuencia absoluta decreciente
i) Dar valor y significado a f3, h5, H4, H´2

DISTRIBUCIONES CON DOS ( 2) VARIABLES

Cuando se trabajan con 2 variables (o Características) toman el nombre de


DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS

Son tablas donde se presenta en forma ordenada dos características de cada individuo
o elementos que se desee estudiar o investigar.
Por ejemplo: edad y peso; estatura y peso; número de hijos y nivel educativo de los
padres; edad y estado civil; producción y venta etc.
Cada frecuencia es un par ordenado (X, Y)
Una variable es independiente y se le denota con (X)
y la otra variable es dependiente y se le denota con ( Y )

Existen 4 cuadros de distribución bidimensional de frecuencias

1.- Distribución Bidimensional de frecuencias absolutas (fxy). (Tiene marginales)


2.- Distribución Bidimensional de frecuencias relativas (hxy). (Tiene marginales)
3.- Distribución Bidimensional de frecuencia absoluta acumulada (Fxy), no tiene
marginales

Lic. América Paula Campomanes Morán 6


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
4.- Distribución Bidimensional de frecuencias relativa acumulada (Hxy), No tiene
marginales

1.- Distribución Bidimensional de frecuencias absolutas (fxy). (Tiene marginales)

Y \ X X1 X2 ... XJ f .y
y1 f11 f21 ... fj1 fy1
y2 f12 f22 ... fj2 fy2
f13 f23 fj3 fy3
f14 f24 fj4 fy4
yk f1k f2k ... fjk fyk
f x. fx1 fx2 fxj n

Donde:
(f x .) Se denota a la marginal de la variable X
(f . y) se denota a la marginal de la variable Y
´n = es el número total de pares ordenados

2.- Distribución Bidimensional de frecuencias relativas (hxy). (Tiene marginales)

Y \ X X2 X2 ….. Xj h .y
Y1 h11 h21 ….. hj1 hy1
Y2 h12 h22 ….. hj2 hy2
h13 h23 ….. hj3 hy3
h14 h24 ….. hj4 hy4
Yk h1k h2k ….. hjk hyk
hx. hx1 hx2 ….. hxk 1

MEDIDAS DE TENDENCIA CENTRAL

1.- MEDIA ARITMÉTICA.-


Es el promedio de un conjunto de datos (o Punto de Equilibrio).
Se denota por “x raya” = ( X )

PARA DATOS NO TABULADO.-


La media aritmética es la suma de todos los valores de los datos de la muestra dividida
por el número total de datos (n)
_
FORMULA: X = ∑Xi
N

Lic. América Paula Campomanes Morán 7


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
Ejemplo: los valores que se detallan corresponden a las cantidades cursos matriculados
de 12 alumnos de la facultad de Ingeniería.

3 7 6 2 5 4 4 5 7 2 3 3
Calcular la media aritmética del número de cursos matriculados y exprese su significado
e indique el tipo de variable y el tipo de dato.

PARA DATOS TABULADOS.-


Es la sumatoria del producto de la variable con la frecuencia dividida por el número total
de datos (n).
_
FORMULA: X = ∑ Xifi
n
Ejemplo: En la siguiente distribución de frecuencias con seis intervalos de clase se muestran las
ganancias en miles de soles, de un grupo de empresas de Lima.
Ganancias 12.5 – 17.5 17.5 – 22.5 22.5 – 27.5 … … …
Empresas 8 12 10 14 18 13
a) Calcule la media aritmética y exprese su significado

PROPIEDADES
P1.- La unidad de medida de la Media Aritmética es la misma que la unidad de las
observaciones.
P2.- La Media Aritmética es influenciada por todos los valores de la serie de datos.
P3.- Si a cada valor de los datos, se le suma o resta una constante, la media aritmética
del nuevo conjunto es igual a la media aritmética original más ó menos la constante.
_____ __
Es decir: X±K = X±K
P4.- Si a cada valor del conjunto de datos, se le multiplica por una constante, la media
aritmética del nuevo conjunto es igual la Media Aritmética original multiplicado por la
constante.
_____ _
Es decir: X*K = K* X
P5.- La suma algebraica de las desviaciones de cada valor de la variable con la media
aritmética es igual a cero.
_
∑ (Xi - X) = 0
P6.- Dado dos (2) conjuntos de datos, cada uno con un número de observaciones, se
puede obtener la Media Total, mediante la siguiente formula.
_ __
XT = ∑ ni* xi.
∑ni

2.- MEDIANA

Es un valor central, ya que divide a la distribución en dos partes iguales, cada parte tiene
el valor de 50%.
Se denota: Md

PARA DATOS NO TABULADOS (pocos datos)


Se obtiene de la siguiente forma:
1) Ordenar los valor de menor a mayor
2) Hay que determinar si el número de datos es par o impar entonces si:

Lic. América Paula Campomanes Morán 8


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
 IMPAR.- ( n = impar). Entonces Md = X(n+1)/2

 PAR.- ( n = par ) Entonces Md =1/2( Xn/2+ X(n+2)/2 )

Ejemplos: los pesos de ciertas cajas de un almacén se detallan a continuación:

55 62 72.5 48 60 68 44 82 79 64.5 55.3 49.7


Calcule su mediana y exprese su significado.

PARA DATOS TABULADOS

a) SIN INTERVALOS
1.- Calcular la Frecuencia Acumulada ( FJ )
2.- Posición de la mediana ( n/2)
3.- Hallar el FJ (que es el valor inmediatamente superior a la posición de la mediana)
4.- Hallar el FJ-1 (valor anterior al FJ)
5.- Comparar el FJ-1 con n/2
Y se tiene 2 condiciones: (<) o (=)
Entonces: Md = X J cuando el FJ-1 < n/2

Entonces: Md = ½ (X J + X J-1) cuando el FJ-1 = n/2


Ejemplo: hoja adicional de problemas

b) CON INTERVALOS
1.- Calcular la Frecuencia Acumulada (FJ)
2.- Posición de la mediana (n/2)
3.- Hallar el FJ
4.- Hallar el FJ-1
5.- Hallar el lJ (es el límite real inferior de la recta del FJ)
6.- Calcular la amplitud ( CJ ) del intervalo de la recta de FJ
7.- Aplicar la FORMULA.- Md = lj + (n/2 – Fj-1) * Cj
( Fj – Fj-1 )

Ejemplo: El tiempo que demoran un grupo profesores en llegar a la universidad (en minutos), se
muestra en la siguiente distribución de frecuencia acumulada.
Tiempo(min.) 10 – 14 15 - 20 21 - 28 29 – 35 36 - 43
Profesores 1.00 0.87 0.52 0.29 0.12.

Calcule la mediana y exprese su significado

3.- MODA

Se denota “Mo” y se define de acuerdo a como se presente los datos:

DATOS NO TABULADOS
Es el valor de la variable que se repite más veces
Ejemplo:

DATOS TABULADOS:

a) SIN INTERVALOS
Es el valor de la variable que tiene la frecuencia más alta

Ejemplo: a) 3, 9, 8, 7, 4, 4, 4,3, 9, 2
Lic. América Paula Campomanes Morán 9
UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
b)23, 27, 54, 38, 40, 29, 10

b) CON INTERVALOS
Es el valor de la variable donde tiende a concentrarse más la información y se obtiene
con la siguiente FORMULA. Mo = lmo + ( ∆1 ) *Cmo
(∆1 + ∆2 )
Ejemplo: hoja adicional de problemas

4.- CUANTILAS

4.1- CUARTILES
Se denota “Qi ”
Son tres ( 3 ) números que dividen a la distribución en cuatro partes iguales.
Valor de cada parte es de 25 %.
FORMULAS
1.- DATOS NOTABULADOS:

Qi = i(n+1)/4

2.- DATOS TABULADOS:


Para datos tabulados la posición es: (in/4) donde (i = 1, 2,3)
1.- Tabulados sin Intervalos.-
Cuando Fj-1 < in/4 entonces Qi = Xj
Cuando Fj-1 = in/4 entonces Qi = (Xj + Xj-1)
2
2.- Tabulados con Intervalos.-
Qi = lj + (n/4 – Fj-1) * Cj
( Fj – Fj-1 )
Ejemplo: hoja adicional de problemas

4.2.- DECILES
Se denota “Di”
Son nueve (9 ) números que dividen a la distribución en 10 partes iguales.
El valor de cada parte es de 10 %
FORMULAs
1.- DATOS NOTABULADOS:
Di = i(n+1)/10

2.- DATOS TABULADOS:


Para datos tabulados la posición es: (in / 10) donde ( i = 1,2,......,9)
1.- Tabulados sin Intervalos.-
Cuando Fj-1 < in/10 Di = Xj
Cuando Fj-1 = in/10 Di = (Xj + Xj-1)/2
2.- Tabulados con Intervalos
Di = lj + (n/10 – Fj-1) * Cj
( Fj – Fj-1 )
Ejemplo: : hoja adicional de problemas

4.3-PERCENTILES
Se denota Pi
Son noventa y nueve (99) números que dividen a la distribución en 100 partes iguales.
El valor de cada parte es 1 %
FORMULAs

Lic. América Paula Campomanes Morán 10


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
1.- DATOS NOTABULADOS:
Pi = i(n+1)/100
2.- DATOS TABULADOS:

Para datos tabulados la posición es: (in / 100 ) donde ( i= 1,2,....., 99 )


1.- Tabulados sin Intervalos.-
Cuando Fj-1 < in/100 Pi = X j
Cuando Fj-1 = in/100 Pi = ½ (Xj + Xj-1)
2.- Tabulados con Intervalos
Pi = lj + (in/100 – Fj-1) * Cj
(Fj – Fj-1 )
Ejemplo: hoja adicional de problemas

MEDIDAS DE DISPERSION

(También conocida como medidas de Variación).


Tiende a medir el grado en que los datos numéricos que se encuentran alrededor de un
valor central.
I.- VARIANZA
Se denota con “ V(X)”
se define: “COMO LA MEDIA ARITMÉTICA DEL CUADRADO DE LAS DESVIACIONES DE
LOS DATOS CON RESPECTO A LA MEDIA ARITMÉTICA DE ESOS DATOS”.
Es el grado promedio de dispersión al cuadrado.
FORMULAS:
1.- DATOS SIN TABULAR
__
V(x) = ∑(Xi – X)2
n
2.- DATOS TABULADOS
__
V(x) = ∑(Xi – X)2 * fi
n
Ejemplo: hoja adicional de problemas

PROPIEDADES
1.- La varianza siempre es un número NO NEGATIVO
V (X) ≥ 0
2.- La varianza de una constante es igual a cero
V (K) = 0 donde K = constante
3.- Si a cada valor de la serie de datos se le SUMA O RESTA una constante; la varianza
de la nuevas serie de datos, es igual a la varianza original.
V ( Xi ± K ) = V(X) ± V (K) = V(X)
4.- Si a cada valor de la serie de datos se le multiplica una constante; la varianza de la
nueva serie de datos es igual a la varianza original multiplicado por la constante al
cuadrado.
V ( Xi *K ) = K2 V(X)
5.- Dado dos series de datos donde se conoce la media aritmética y la varianza de cada
serie se puede calcular la varianza de las dos series mediante la siguiente formula:
VT = ∑ni*Vi.
∑ni

Lic. América Paula Campomanes Morán 11


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
II.- DESVIACION Estándar

Se define como la raíz cuadrada positiva de la varianza.


Da un grado promedio simple de variación o dispersión.
La unidad de media es la misma que la de los datos observados
FORMULAS:
a) DATOS SIN TABULAR
__
S(x) = √ ∑(Xi – X)2
n
b) DATOS TABULADOS
__
S(x) = √ ∑(Xi – X)2 * fi
n
Ejemplo: Hoja adicional de Problemas

PROPIEDADES
1.- Es siempre un valor positivo
2.- Es influenciado por todos los valores de la serie de datos.
3.- Mayor influencia ejerce los valores extremos que los que están cerca del promedio.
4.- Si la distribución es normal o ligeramente asimétrica se cumple la siguiente relación:
_
X ± S = 68.23% = 68%
_
X ± 2S = 95.46% = 95%
_
X ± 3S = 99.73% = 99.7

CORRECCION DE SHEPPARD
Se usa solo para datos agrupados con intervalos de amplitudes iguales.
El factor de corrección es (C2 / 12)
FORMULA

V corregida = V(x) – C2
12
Ejemplo: Hoja adicional de Problemas

III.- RANGO (DESVIACION) SEMIINTERCUARTILICA

Mide la dispersión entre el 50% de los valores centrales


No está afectada por los valores extremos
Una desviación semiintercuartilica baja, indica una pequeña variación entre el 50% de
los datos centrales
Se denota con RS

RS = ( Q3 – Q1)
2
Ejemplo: Hoja adicional de Problemas

IV.- COEFICIENTE DE VARIACIÓN ( C.V.)

SE USA PARA COMPARAR DOS O MÁS MUESTRAS.


Significa el número de veces que supone la desviación típica (estándar) con respecto a
la media aritmética.
Generalmente se expresa en porcentaje
Lic. América Paula Campomanes Morán 12
UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
Es independiente de la unidad de medida en que están expresados los datos.
Es mejor o aceptable la tiene menor coeficiente de variación.

C.V. = ( S )*100
_
X

Ejemplo: Hoja adicional de Problemas

MEDIDAS DE ASIMETRIA

Nos indica la deformación horizontal de la distribución de frecuencia.

- La distribución es simétrica cuando su curva es igual a una campana, la media


aritmética, la mediana y la moda coinciden. Grafico.

- La distribución tiene asimetría positiva (a la derecha).- si su ramificación es


extendida hacia la derecha o hacia los valores mayores. Grafico:

- La distribución tiene asimetría negativa (a la izquierda) la ramificación extendida


hacia la izquierda o hacia los valores pequeños. Grafico:

I.- PRIMER COEFICIENTE DE PEARSON

Se denota A1, nos indica el sesgo de la distribución


Se usa cuando la distribución es unimodal.
Formula: _
A1 = (X – Mo)
S

Propiedades:
A1 = 0 la distribución es simétrica
A1 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha.
A1 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda.

Ejemplo: Hoja adicional de Problemas

II.- SEGUNDO COEFICIENTE DE PEARSON.

Se denota con A2, nos indica el sesgo de la distribución


Se usa cuando se tiene más de una moda o cuando no exista moda.
Formula:
_
A2 = 3 * (X – Md)
S

Propiedades:
A2 = 0 la distribución es simétrica
A2 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha.
A2 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda.

Lic. América Paula Campomanes Morán 13


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
Ejemplo: Hoja adicional de Problemas

III.- MEDIA ASIMETRICA


Se denota con ¨Asq¨
Se usa cuando los intervalos no tienen definidos los límites de los intervalos. Casos
especiales de distribuciones.

Formula:

Asq = Q1 + Q3 – 2*Q2
Q3 – Q1

Propiedades: Asq. = 0 la distribución es simétrica


Asq. > 0 la distribución tiene sesgo positivo ó esta sesgada a la
derecha.
Asq. < 0 la distribución tiene sesgo negativo ó está sesgada a la
izquierda.

Ejemplo: Hoja adicional de Problemas

MEDIDAS DE ANALISIS PARA 2 VARIABLE

I.- DIAGRAMAS DE DISPERSIÓN.-


Es la representación gráfica de los datos en el sistema de coordenadas (x , y), además
de determinar la relación que existe entre las dos variables, también nos puede indicar el
tipo de tendencia de los elementos.

TIPOS DE RELACION.-
a) Relación directa
A medida que aumenta los valores de “x” también aumentan los valores de “y” (es decir
tiene una forma ascendente). Gráfico:

b) Relación Inversa
A medida que los valores de “x” son pequeños los valores de “y” son grandes y viceversa.
(Su forma es descendente).Gráfico:

c) Relación nula
Cuando los valores de “X” e “Y” están dispersos sin coordinación. Gráfico:

Lic. América Paula Campomanes Morán 14


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES

d) Relación Directa Perfecta


Cuando los valores de “X” e “Y” todos caen en una recta ascendente. Gráfico

e) Relación Inversa Perfecta


Cuando los valores de “X” e “Y” todos caen en una recta descendente. Gráfico:

II. COEFICIENTE DE CORRELACION

Es el estadígrafo que mide el grado de relación que existe entre dos variables que están
relacionadas entre si, se denota por “ r ”
El coeficiente de correlación siempre está dentro de un intervalo:

-1 ≤ r ≤ +1

PROPIEDADES:

a) Si r>0 existe relación directa


b) Si r<0 existe relación inversa
c) Si r=0 existe relación nula
d) Si r=1 existe relación directa perfecta
e) Si r = -1 existe relación inversa perfecta

FORMULA PARA DATOS NO TABULADOS

r = . n∑XY - ∑X∑Y .
√[n∑X – (∑X) ][n∑Y – (∑Y) ]
2 2 2 2

___
r= C(X , Y) donde C(X,Y) = ∑XY - XY
V(x) V(y) n

Donde C (X,Y) ES LA COVARIANZA

LA COVARIANZA,
Mide el grado de dispersión o variación cuando se usan 2 variables (X,Y) que están
relacionadas.
Sus valores pueden ser positivos, negativos o cero

Lic. América Paula Campomanes Morán 15


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES

FORMULA PARA DATOS TABULADOS

___
C(X,Y) = ∑XYfxy - XY
n

Ejemplo: Hoja adicional de Problemas

III.-RECTA DE REGRESION DE MINIMOS CUADRADOS

Nos permite estimar o predecir valores futuros o anteriores o aquellos valores que no
están definidos dentro de la serie de datos.
Existen dos rectas de regresión:
1.- Recta de Regresión de Y sobre X
2.- Recta de Regresión de X sobre Y

a) Recta de Regresión de Y sobre X

La ecuación es ŷ = a + b (x)

Donde:
´b =. n∑XY - ∑X∑Y
[n∑X2 – (∑X)2]

´a = Y – (b ) X

O también b = C(X , Y)
S(x)

b) Recta de Regresión de X sobre Y

La ecuación es X* = a + b (y)

Donde:
´b = . n∑XY - ∑X∑Y
[n∑Y2 – (∑Y)2]

´a = X – (b) Y

O también se puede la siguiente formula

b = C(X , Y)
S(y)

Ejemplo: Hoja adicional de Problemas

Lic. América Paula Campomanes Morán 16


UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA
CURSO: ESTADISTICA Y PROBABILIDADES
ESTIMAR DATOS QUE SIGUEN SERIE DE TIEMPO
Se tiene que cambiar las variables tiempos (años, meses o días) por números
naturales en forma consecutiva. (Ejem: 1, 2, 3, 4,…, etc.).
La variable tiempo se considera como variable independiente(X).

Ejemplo: la siguiente tabla nos muestra las ventas de equipos mecánicos


durante 6 años

Años 2010 2011 2012 2013 2014 2015


Ventas 3.3 3.9 4.7 4.1 4.9 5.2

a) Estime la venta para el año 2016


b) Estime en que año la venta será de 6.1 miles de dólares.
c) Grafique las 2 rectas. Sobre el diagrama de dispersión.
d) Grado de relación que existe entre los años y la venta
e) Calcular el valor promedio de la venta
f) Use el diagrama de dispersión, para determinar la relación existe entre
los años y la venta.

Lic. América Paula Campomanes Morán 17

You might also like