You are on page 1of 20

VARIABLE ALEATORIA

(PRUEBAS CHI-CUADRADA Y KOLMOGOROV – SMIRNOV)


Presentado por:
Shirly Lazcano Guzmán, Brenda Moreno Ramirez, Laura Padilla Ariza, Brianys Salcedo
Arrieta, Kevin Sánchez Carrillo, Daniela Vidal Riaño
Presentado a:
Ing. Yunellis Burgos
Asignatura:
Simulación

Escuela de Ingeniería industrial – IX Semestre


Universidad Del Sinú Elías Bechara Zainum – Seccional Cartagena
VARIABLE ALEATORIA

 Son aquellas variables que tienen un comportamiento probabilístico en realidad. Por


ejemplo el numero de clientes que llegan cada hora a un banco depende del momento
del día, del día de la semana y de otros factores; por lo general , la afluencia de clientes
será mayor a medio día, que muy temprano por la mañana; la demanda será mas alta
un viernes que un miércoles; habrá mas clientes un día de pago que un día normal, etc.
DISTRIBUCIÓN DE PROBABILIDAD Y TIPOS
DE VARIABLES ALEATORIAS

 La distribución de probabilidad de una variable aleatoria es una función que asigna a cada
suceso definido sobre la variable la probabilidad de que dicho suceso ocurra. La distribución
de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos
es el rango de valores de la variable aleatoria.

 Las variables aleatorias discretas: Son las que sólo pueden tomar resultados enteros, en este
caso corresponderá una distribución discreta, de las cuales existen: Distribución binomial
(eventos independientes), Distribución de Poisson (eventos independientes), Distribución
hipergeométrica (eventos dependientes).
 Las variables aleatorias continuas: pueden tomar cualquier valor real dentro de su intervalo.
Distribución exponencial en este caso corresponderá una distribución continua, de las cuales
existen: Distribución Exponencial, Distribución Chi – cuadrado, distribución normal, entre otras.
DETERMINACION DEL TIPO DE DISTRIBUCION
DE UN CONJUNTO DE DATOS

 La distribución de probabilidad de los datos históricos pueden determinarse


mediante las pruebas Chi – cuadrada, de kolmogorov – smirnov y de Anderson –
Darling. En esta sección se revisaran los procedimientos de dos de estas pruebas, asi
como la forma de realizarlas a través de stat: :fit, una herramienta complementaria
de promodel.
PRUEBA CHI - CUADRADA

 Se trata de una prueba de hipótesis a partir de datos, basada en el calculo de un valor llamado estadístico
de prueba, al cual suele comparársele con un valor conocido como valor cítrico, mismo que se obtiene,
generalmente, de tablas estadísticas. El procedimiento general de la prueba es:

1. Obtener al menos 30 datos de la variable aleatoria a analizar.


2. Calcular la media y varianza de los datos.
3. Crear un histograma de m: 𝑛 intervalos, y obtener la frecuencia observada en cada intervalo 𝑂𝑖
4. Establecer explícitamente la hipótesis nula, proponiendo una distribución de probabilidad que se ajuste a la
forma del histograma.
5. Calcular la frecuencia esperada 𝐸𝑖 , a partir de la función de probabilidad propuesta.
(𝐸𝑖 𝑂𝑖 )2
6. Calcular el estadístico de prueba C = σ𝑚
𝑖−1 𝐸𝑖
7. Definir el nivel de significancia de la prueba , y determinar el valor critico de la prueba 𝑥 2 a,m-k-1 (k es el
numero de parámetros estimados en la distribución propuesta).
8. Comparar el estadístico de prueba con el valor critico. Si el estadístico de prueba es menor que el valor
critico no se puede rechazar la hipótesis nula
EJEMPLO DE PRUEBA CHI - CUADRADA

Estos son los datos del numero de automóviles que entran a una gasolinera cada hora:

HISTOGRAMA
12

10

14 7 13 16 16 13 14 17 15 16 8

Frecuencia
13 15 10 15 16 14 12 17 14 12
6
13 20 8 17 19 11 12 17 9 18
20 10 18 15 13 16 24 18 16 18 4
12 14 20 15 10 13 21 23 15 18
2

0
0.7 8 . 9 10 . 11 12 . 13 14 . 15 16 . 17 18 . 19 20 . 21 22 . 23 24 . 25
Automoviles/h

Determinar la distribución de la probabilidad con un nivel de significancia =5%


HIPOTESIS

El histograma de los n= 50 datos, considerando m= 11 intervalos, la media muestral de 15,04


y la varianza muestral de 13,14 permite establecer las siguientes hipótesis.

𝐻𝑜 = Poisson (λ=15) automóviles/ hora


𝐻𝑖 = Otra distribución
CALCULO DE PROBABILIDAD
150 𝑒 −15 151 𝑒 −15 152 𝑒 −15 153 𝑒 −15 154 𝑒 −15
P (0-7) = + + + + +
0! 1! 2! 3! 4!
155 𝑒 −15 156 𝑒 −15 157 𝑒 −15
+ + = 0.0180
5! 6! 7!
158 𝑒 −15 159 𝑒 −15
P (8-9) = + = 0.0519
8! 9!
Comenzamos por calcular la probabilidad de P (10-11) =
1510 𝑒 −15
10!
+
1511 𝑒 −15
11!
= 0.1149
cada intervalo a partir de la función de P (12-13) =
1512 𝑒 −15
+
1513 𝑒 −15
= 0.1785
probabilidad de poisson. 12!
1514 𝑒 −15
13!
1515 𝑒 −15
P (14-15) = + = 0.2049
14! 15!
1516 𝑒 −15 1517 𝑒 −15
P (16-17) = + = 0.1808
16! 17!
1518 𝑒 −15 1519 𝑒 −15
λ𝑥 𝑒 −λ P (18-19) = + = 0.1264
P(X) = 𝑥!
x= 0,1,2…… 18!
1520 𝑒 −15
19!
1521 𝑒 −15
P (20-21) = + = 0.0717
20! 21!
1522 𝑒 −15 1523 𝑒 −15
P (22-23) = + = 0.0336
22! 23!
1524 𝑒 −15 1525 𝑒 −15
P (24-25) = + = 0.0133
24! 25!
P (25-∞) = 1 − 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑑𝑒 𝑃 = 0,006

Total = 1
CALCULO DE FRECUENCIA ESPERADA
𝐸𝑖 = 50 ∗ 0.0180 = 0.9

 Calculamos la frecuencia 𝐸𝑖 = 50 ∗ 0.0519 = 2.595


esperada en cada 𝐸𝑖 = 50 ∗ 0.1149 = 5.745
intervalo, multiplicando la
𝐸𝑖 = 50 ∗ 0.1785 = 8.925
probabilidad p(x) por el
total de datos de la 𝐸𝑖 = 50 ∗ 0.2049 =10.245
muestra, en este caso 50.
𝐸𝑖 = 50 ∗ 0.1808 =9.04
𝐸𝑖 = 50 ∗ 0.1264 =6.32
𝐸𝑖 = 50*p(x) 𝐸𝑖 = 50 ∗ 0.0717 =3.585
𝐸𝑖 = 50 ∗ 0.0336 =1.68
Quedando así: 𝐸𝑖 = 50 ∗ 0.0133 = 0.665
𝐸𝑖 = 50 ∗ 0.006 = 0.3
Total = 50
CALCULO DEL ESTADISTICO DE PRUEBA

(0.9−1) 2
C= σ𝑚
𝑖−1 = 0.0111 C= σ𝑚
(6.32 −6) 2
= 0.0162
0.9 𝑖−1 6.32
 Para calcular el (2.595 − 2) 2
estadístico de C= σ𝑚
𝑖−1 = 0.1364 C= σ𝑚
(3.585− 4) 2
= 0.0480
2.595 𝑖−1 3.585
prueba, se utiliza la (5.745−4) 2
siguiente formula: C= σ𝑚
𝑖−1 = 0.5300 C= σ𝑚
(1.68 −1) 2
= 0.2752
5.745 𝑖−1 1.68
(8.925−10) 2
C= σ𝑚
𝑖−1 = 0.1294 C= σ𝑚
(0.665− 1) 2
= 0.1687
8.925 𝑖−1
(𝐸𝑖 − 𝑂𝑖 )2 0.665
C = σ𝑚
𝑖−1 (10.245−11)2
𝐸𝑖 C = σ𝑚
𝑖−1 = 0.0556 C= σ𝑚
(0.3− 0) 2
= 0.3
10.245 𝑖−1 0.3
(9.04 − 10)2
C = σ𝑚
𝑖−1 = 0.1019 Total = 1.7725
9.04
SOLUCION

 El valor de la Prueba C= 1.7725, comparado con el valor de tablas critico, 𝑥0.05,11−0−1


2
= 18.307

Indica que no podemos rechazar la hipótesis de que la variable aleatoria se comporta de


acuerdo con una distribución de Poisson, con una media de 15 automóviles/hora.
PRUEBA KOLMOGOROV SMIRNOV

 Desarrollada en la década de los treinta del siglo xx, esta prueba permite al igual que la prueba chi-cuadrada determina la distribución
de probabilidad de una serie de datos.

Una limitante de la prueba kolmogorov estriba en que solamente se puede aplicar el análisis de variables continuas . El procedimiento general
de la prueba es:

1. Obtener al menos 30 datos de variables aleatorias a analizar


2. Calcular la media y varianza de los datos
3. Crear un histograma de m: 𝑛 intervalos, y obtener la frecuencia observada en cada intervalo 𝑂𝑖
4. Calcular la probabilidad observada 𝑃𝑂𝑖 = 𝑂𝑖 /n, esto es dividir la frecuencia observada entre el numero total de datos
5. Acumular las probabilidades 𝑃𝑂𝑖 para obtener la probabilidad observada hasta el i-esimo intervalo POA
6. Establecer explícitamente la hipótesis nula, proponiendo una distribución de probabilidad que se ajuste a la forma del histograma
7. Calcular la probabilidad esperada acumulada para cada intervalo 𝑃𝐸𝐴𝑖 a partir de la función de probabilidad propuesta
8. Calcular el estadístico de prueba C= max 𝑃𝐸𝐴𝑖 − 𝑃𝑂𝐴𝑖 i= 1,2,3……..k……m…
9. Definir el nivel de significancia de la prueba , y determinar el valor critico de la prueba D, a,n (consulte la tabla de valores críticos de la
prueba Kolmogorov Smirnov)
10. Comparar el estadístico de prueba con el valor critico. Si el estadístico de prueba es menor que el valor critico no se puede rechazar la
hipótesis nula
EJEMPLO DE PRUEBA KOLMOGOROV
SMIRNOV

Un estudio del comportamiento del tiempo entre roturas de cierto filamento, medido en
minutos/rotura, se muestra a continuación:
HISTOGRAMA
14
4,33 1,61 2,16 2,88 0,70 0,44 1,59 2,15 8,59 7,36
12
9,97 7,86 5,49 0,98 4,52 2,12 4,44 0,82 6,96 3,04
10

Frecuencia
2,81 14,39 3,44 9,92 4,38 8,04 2,18 6,19 4,48 9,66
8
4,34 1,76 2,30 5,24 11,65 10,92 12,16 6,60 0,85 4,82
6
1,36 3,53 6,58 1,45 8,42 3,69 2,44 0,28 1,90 2,89
4

0
0 .2 2.4 4.6 6.8 8 . 10 10 . 12 12 . 14 14 . ∞
Minutos/rotura

Determinar la distribución de la probabilidad con un nivel de significancia =5%


HIPOTESIS

El histograma de los n= 50 datos, considerando m= 8 intervalos, la media muestral de 4,7336


y la varianza muestral de 12,1991 permite estimar un parámetro de escala de 5,19 y
establecer la siguiente hipótesi.

𝐻𝑜 = Weibull ( = 1,38) (β=5,19) minutos/ rotura


𝐻𝑖 = Otra distribución
CALCULO DE PROBABILIDAD OBSERVADA

12
𝑃𝑂𝑖 = 50= 0,24
13
𝑃𝑂𝑖 = 50= 0,26
9
𝑃𝑂𝑖 = 50= 0,18
Teniendo en cuenta que: 6
𝑃𝑂𝑖 = 50= 0,12
𝑂𝑖
𝑃𝑂𝑖 = 6
𝑛
𝑃𝑂𝑖 = 50= 0,12
2
𝑃𝑂𝑖 = 50= 0,04
1
𝑃𝑂𝑖 = 50= 0,02
1
𝑃𝑂𝑖 = 50= 0,02
Total = 1
CALCULO DE PROBABILIDAD OBSERVADA
ACUMULADA HASTA EL INTERVALO i

12
𝑃𝑂𝐴𝑖 = 50= 0,24
25
𝑃𝑂𝐴𝑖 = 50= 0,5
 Para calcular la probabilidad
observada acumulada hasta el 34
𝑃𝑂𝐴𝑖 = 50= 0,68
intervalo i se realiza la siguiente
40
formula: 𝑃𝑂𝐴𝑖 = 50= 0,8
46
𝑃𝑂𝐴𝑖 = 50= 0,92
σ𝑂𝑖
𝑃𝑂𝐴𝑖 = 48
𝑛 𝑃𝑂𝐴𝑖 = 50= 0,96
49
𝑃𝑂𝐴𝑖 = 50= 0,98
50
𝑃𝑂𝐴𝑖 = 50= 1
CALCULO DE PROBABILIDAD ESPERADA
ACUMULADA DE CADA INTERVALO
2 1,38
− 5,19
𝑃𝐸𝐴2 = 𝐹 2 = 1 − 𝑒 = 0,23526
4 1,38

Esto se realiza a partir de la 𝑃𝐸𝐴4 = 𝐹 4 = 1 − 𝑒 5,19 = 0,50246
función de probabilidad −
6 1,38
acumulada de weibull: 𝑃𝐸𝐴6 = 𝐹 6 = 1 − 𝑒 5,16 = 0.70523
8 1,38

𝑃𝐸𝐴8 = 𝐹 8 = 1 − 𝑒 5,16 = 0,83747
10 1,38

𝑃𝐸𝐴10 = 𝐹 10 = 1 − 𝑒 5,16 = 0,91559
𝑥 𝛼 12 1,38
− −
𝑃𝐸𝐴𝑖 = 𝐹 𝑥 = 1 −𝑒 𝛽 𝑃𝐸𝐴12 = 𝐹 12 = 1 − 𝑒 5,16 = 0,95838
14 1,38
− 5,16
𝑃𝐸𝐴14 = 𝐹 14 = 1 −𝑒 = 0,98041
14,∞ 1,38

𝑃𝐸𝐴14,∞ = 𝐹 14, ∞ = 1 − 𝑒 5,16 =1
CALCULO DEL ESTADISTICO DE PRUEBA

𝐶𝑚𝑎𝑥 = 0,24 − 0,23526 =0,0047


𝐶𝑚𝑎𝑥 = 0,5 – 0,50246 =0,0025
𝐶𝑚𝑎𝑥 = 0,68 – 0.70523 =0,0252
𝐶𝑚𝑎𝑥 = 0,8 – 0,83747 = 0,0375
 La formula utilizada es:
𝐶𝑚𝑎𝑥 = 0,92 – 0,91559 =0,0044
𝐶𝑚𝑎𝑥 = 0,96 – 0,95838 =0,0016
𝐶𝑚𝑎𝑥 = 𝑃𝑂𝐴𝑖 − 𝑃𝐸𝐴𝑖
𝐶𝑚𝑎𝑥 = 0,98 – 0,98041 =0,0004
𝐶𝑚𝑎𝑥 = 1 – 1 =0

Entonces se ecoge el máximo valor, en este


caso
Cmax= 0,0375
SOLUCION

 El valor estadístico de Prueba C= 0,0375, comparado con el valor de tablas critico,


𝐷0.05,50 = 0,1923

Indica que no podemos rechazar la hipótesis de que la variable aleatoria se comporta de


acuerdo con una distribución de Weibull, con parámetro de escala 5,19 y de forma 1,38.
GRACIAS

You might also like