You are on page 1of 32

Ciencia Econmica

ESTADSTICA DESCRIPTIVA

Marzo 2010

1- QUE ES LA ESTADSTICA?
LA ESTADSTICA Y LAS ESTADISTICAS

El objeto de estudio de la Estadstica, que es una rama de las matemticas,


es el conjunto de los mtodos que permiten el anlisis y la comprensin de
los fenmenos ms diversos, a partir de una recoleccin y de un
procesamiento de los datos.

Las estadsticas son los datos ellos mismos.

UN POCO DE HISTORIA

La Estadstica , tal como se acaba de definir, se fundamenta en el clculo


de las probabilidades y se desarroll a partir del inicio de este siglo. A
veces se denomina Estadstica matemtica en oposicin a la Estadstica
estatal, cuya misin es el registro de las estadsticas de los estados:
poblacin, empleo, consumo, etc. La Estadstica estatal remonta a las
primeras civilizaciones conocidas (5000 aos A.C:, Sumer, Mesopotamia,
Egipto ).

LOS CAMPOS DE APLICACIN

La investigacin en ciencias fsicas y mdicas

La industria

Las ciencias econmicas y las ciencias humanas

2. INTRODUCCIN

Un ejemplo:
2
El Sr. Mark, gerente general de la empresa ARCOR S.A. desea informacin
acerca de determinadas LNEAS DE PRODUCTOS de la empresa. a efectos
de reestructurar algunos procesos como as tambin, tomar decisiones en
cuanto al personal, en caso de ser necesario.

El rea de inters abarca la fabricacin de Caramelos, Dulces y Chocolates.

Mark pidi a los gerentes de cada una de las LNEAS una Proyeccin de las
ventas para el segundo semestre, tomando como base el MONTO de ventas
del primer semestre.

Objetivo:

Cmo estn distribuidas los productos segn las lneas.


Comparar las proyecciones realizadas por los tres gerentes.
Verificar si existe relacin entre el proceso y la lnea
Cual es la relacin entre las ventas reales y las estimadas.

Para ello rene la siguiente informacin:

PRODUCTO PROC LNE MONT LNEA LNEA LNEA 3 PROM.


. A O 1 2 L.

3
Choc. Semia S B 10,00 10,00 7,75 6,00 7,92

Choc. Taza S B 15,00 11,00 9,25 12,00 10,75

Choc. Man S B 15,00 12,00 11,00 7,00 10,00

Choc. c/Alm. N B 16,00 14,00 13,25 12,00 13,08

Choc. c/DLC S B 12,00 11,00 9,25 9,00 9,75

Dulce Memb. S C 12,00 10,00 7,75 11,00 9,58

Dulce Batata N C 14,00 15,00 13,75 10,00 12,92

Merm.Comn S C 10,00 10,00 9,75 11,00 10,25

Merm. Diet S C 12,00 11,00 10,75 12,00 11,25

Pasti.Rellenas N A 11,00 7,00 6,00 10,00 7,67

Pasti menta S A 11,00 7,00 5,00 9,00 7,00

Caram.Duros N A 12,00 7,00 5,75 7,00 6,58

Caram.Blandos N A 9,00 7,00 5,50 10,00 7,50

Caram.Diet N A 10,00 8,00 6,00 9,00 7,77

4
Caram.cidos N A 13,00 8,00 6,25 10,00 8,08

Donde:

PROC. S: Terceriz N: No Terceriz


LNEA A: Caramelos B: Chocolates C: Dulces
MONTO Monto de Ventas en millones de pesos durante el primer semestre
LNEA 1, LNEA 2, LNEA 3: Monto de Ventas proyectado por cada uno de los
gerentes de las tres lneas

3. LOS DATOS ESTADSTICOS: Anlisis de datos ciertos

TABLA DE INDIVIDUOS x VARIABLES

La recoleccin de datos estadsticos, es decir, para los cuales se puede realizar


un procesamiento estadstico, debe conducir a la constitucin de una tabla de :

n lneas, que corresponden a los individuos o unidades estadsticas,

p columnas, que corresponden a las variables ( o caracteres) observadas


sobre los individuos.

Se trata de la tabla inicial de datos individuos x variables

Cmo podemos elegir entonces a los individuos? Cmo construir las


variables?

En general, la estructura de una Tabla se dibuja del siguiente modo:


5
Eleccin de los instrumentos de medida:
const. cuestionario, etc.

Variables

A1 A2 .. Aj .. Ap

1 .

i.. ... ..xij.. .

Individuos o
Unidades estad.

Eleccin de la poblacin y,
tal vez, de la muestra

3.1- DATOS CUALITATIVOS

a) Procesamiento ( Tablas

LINEA Frecuencia Porcentaje

6
A CARAM. 6 40,0

B CHOCOL. 5 33,3

C DULCES 4 26,7

Total 15 100,0

b) Representacin grfica: diagramas en barras o en sectores

Diagrama en barras de las frecuencias absolutas de la variable LINEA

Diagrama de Sector de las frecuencias relativas de la variable LINEA

LINEA

DULCES

CARAM.

7
CHOCOL.
3.2- DATOS CUANTITATIVOS
Procesamiento de una variable real ( Distribuciones de Frecuencias
Absolutas y Relativas.
a) Distribucin simple

Monto (millones de $) Frecuencia Frecuencia Relativa %

Absoluta
9,00 1 6.7
10,00 3 20
11,00 2 13.3
12,00 4 26.6
13,00 1 6.7
14,00 1 6.7
15,00 2 13.3
16,00 1 6.7
15 100

Distribucin de Frecuencia Absoluta y Relativa de la variable MONTO

8
Grfico de barras de Frecuencias Relativas

MONTO
30

20

10
Porcentaje

0
9,00 10,00 11,00 12,00 13,00 14,00 15,00 16,00

MONTO

b) Valores agrupados en clases

Clases Punto medio Frec. Absolutas Frec. Relativas


9 ( monto ( 11 10 4 26,7
11 ( monto ( 13 12 6 40,0
13 ( monto ( 15 14 2 13,3
15 ( monto ( 17 16 3 20,0

15 100

9
40,0000
40

30 26,6667
Percent

20,0000
20
13,3333

10

9 11 13 15 17
Monto

Grfico para datos agrupados: histograma y polgono de frecuencias

3.3- RESMENES NUMERICOS: ndices de posicin, dispersin y forma

Amplitud: es la diferencia entre el mayor valor y el menos valor de la


variable.

Media , varianza y desviacin estndar

La media

10
n

fx i i fx i i
i 1
i

N f i
i

La varianza es el promedio de los cuadrados de los desvos respecto a la


media

f (x ) fx
2 2
i i i i
2 i 1
i
2
f i
i N

La desviacin estndar

CLCULO DE LA MEDIA Y LA VARIANZA


Variable Monto

X fi X. fi X-( (X-()2. fi (X-()/(


9 1 9 -3,13 9,82 -1,54
10 3 30 -2,13 13,65 -1,04
11 2 22 -1,13 2,57 -0,55
12 4 48 -0,13 0,07 -0,06
13 1 13 0,87 0,75 0,42
14 1 14 1,87 6,97 0,92
15 2 30 2,87 16,44 1,39
16 1 16 3,87 14,95 1,96

11
182 65,12

Resumen de Indicadores

Variable MONTO LINEA 1 LINEA 2 LINEA 3


Medias 12,13 9,87 8,47 9,67
Varianzas 4,12 6,12 7,44 3,97
Desv.Est. 2,03 2,47 2,73 1,99
CV 0,167 0,25 0,322 0,213

Mediana, cuartiles y rango intercuartlico

MONTO RANGO
9,00 1
10,00 2
10,00 3
10,00 4
11,00 5
11,00 6
12,00 7
mediana( 12,00 8
12,00 9
12,00 10
13,00 11
14,00 12
15,00 13
15,00 14
16,00 15

La mediana es el valor que parte la poblacin en dos sub-poblaciones de


igual frecuencia : 50% y 50%. Es tambin el valor que toma el (N+1)/2-
simo individuo. Si el tamao de la poblacin es un nmero par el valor
de la mediana que se elige es igual a la mitad de la suma de los valores de
rangos N/2 y (N/2)/2.
12
Los cuartiles , llamados Q1 , Q2 y Q3 , son los valore de la variable que
dividen a la poblacin en cuatro sub-poblaciones de igual frecuencia, 25%
cada una. El segundo cuartil Q2 es la mediana.

El rango intercuartlico es igual al tercer cuartil menos el primero.

En el ejemplo, el nmero total de observaciones es pequeo, por lo tanto


es defcil precisar los cuartiles; puede considerarse que tenemos:

Me = 12, Q1= 10, Q3 = 14 y Q3 Q1 = 4


REPRESENTACIN GRAFICA: Caja con Patillas (box plot)

a) La Variable MONTO
18

16

14

16
12

14
10

12
8
N= 15

MONTO
10

b) Las Variables LINEA 1, LINEA 2 y LINEA 3


8

6 1

13
4
N= 15 15 15

LINEA1 LINEA2 LINEA3


3.4- PROCESAMIENTO ESTADISTICO DE DOS VARIABLES

a) Variables Reales

Representacin en el plano

14

12

10

6
LINEA2

4
6 8 10 12 14 16
14
LINEA1
Grfica de las variables LINEA 1 y LINEA 2

RESMENES NUMRICOS

Covarianza y coeficiente de correlacin lineal

La Covarianza entre dos variables cuantitativas o rales X e Y es igual a la


media de los productos de las diferencias a la media o de las variables
centradas.

1
Cov( X , Y ) fi ( xi x )( yi y )
N i

La covarianza tambin se puede expresar como la media de los productos


menos el producto de las medias

1
Cov( X , Y ) fi xi yi x y
N i

RESUMEN
Clculo de Covarianzas y Coeficientes de Correlacin

Monto Lnea 1 Lnea 2 Lnea 3

15
Monto 4,12

Lnea 1 3,48 6,12

Lnea 2 3,74 6,58 7,44

Lnea 3 0,98 1,22 1,66 3,97

Covarianzas de variables 2 a 2

Pero la covarianza de un distribucin bivariada depende de:

las unidades de medida de las variables que la componen y


de la variabilidad de cada una de las variables

Definicin del Coeficiente de Correlacin

1 n xi x yi y Cov ( X , Y )
xy (
N i 1 x
)(
y
)
x y
Correlacin(x,y):

Monto Lnea 1 Lnea 2 Lnea 3

Monto 1

Lnea 1 0,695 1

Lnea 2 0,676 0,975 1

Lnea 3 0,266 0,273 0,335 1

16
Coeficientes de Correlacin Lineal de las Variables 2 a 2

La correlacin no depende de las unidades de medida de cada variable

Relacin lineal positiva : xy > 0

Relacin lineal negativa: xy < 0

Relacin lineal perfecta: xy = 1 o 1 (la nube de puntos se encuentra


ubicada sobre una recta

RECTA DE REGRESION LINEAL

Para simplificar llamaremos X a la variable LINEA 1 e Y a la variable


LINEA 2.

Sea Y= (0 + (1X, se buscan (0 y (1 tales que la expresin

(Y X
i 1 i 0 )2
i sea mnima

La solucin es entonces:

COV ( X , Y ) N xy x y
1
2(X ) N x 2 ( x ) 2 0 y 1 x

La recta conseguida se llama recta de regresin lineal de Y en X . Se


obtiene asi: Y= -2,14 + 1,08X. El coeficiente de correlacin es 0,975.

17
LINEA2 = -2,14753 + 1,07576 LINEA1

S = 0,647388 R-Sq = 95,1 % R-Sq(adj) = 94,7 %

14

13

12

11
LINEA2

10

7 8 9 10 11 12 13 14 15

LINEA1

b) PROCESAMIENTO DE DOS VARIABLES CUALITATIVAS

Proc./Prod. B C A TOTAL
N 1 1 5 7

S 4 3 1 8
TOTAL 5 4 6 15
Distribuciones Conjunta y Marginales de Frec. Absolutas de las Var. PROCESO Y
PRODUCTO

Proc./Prod. B C A TOTAL
N 7% 7% 33% 47%

S 26% 20% 7% 53%


TOTAL 33% 27% 40% 100%

18
Distribuciones Conjuntas y Marginales de Frec. Relativas de las Var. PROCESO Y
PRODUCTO

DISTRIBUCIONES CONDICIONALES: Perfiles Lneas y Columnas


Proc./Prod. B C A TOTAL
N 14% 14% 72% 100%

S 50% 38% 12% 100%


TOTAL 33% 27% 40% 100%
Distribuciones Condicionales a la Var. PROCESO de Frecuencias de la Var.
PRODUCTO

Proc./Prod. B C A TOTAL
N 20% 25% 83% 47%

S 80% 75% 17% 53%


TOTAL 100% 100% 100% 100%
Distribuciones Condicionales a la Var. PRODUCTO de Frecuencias de la Var.
PROCESO

Vnculo entre dos variables categricas: la distancia ji-cuadrado

A/B b1 bj bq Total
a1
....
ai Nij . N i.
....
ap

Total N. j N

Tabla de contingencia observada

A/B b1 bj bq Total A/B b1 bj bq Total


a1 1 a1

19
.... ....
ai Nij / Ni. 1 ai Ni j / N . j N i./ N
.... ....
ap 1 ap

Total N. j / N 1 Total 1 1 1 1

Perfiles Lneas Perfiles Columnas

La ausencia de vnculo se traduce po una de las tres propiedades a


continuacin equivalentes:

N ij
N. j

1. Igualdad de los perfiles lneas Ni. N para cada i, j
N ij N
i.
2. Igualdad de los perfiles columnas N . j N para cada i, j
Ni.N . j
N ij
3. N para cada i , j

(2 = 5.42 (2= (2 / N = 0,36

c) PROCESAMIENTO ESTADSTICO DE UNA VARIABLE REAL Y


UNA CATEGRICA

Descomposicin DE la varianza

Ejemplo:
PROD. Frec. Absoluta Media Varianza
A 6 7,33 0,22
B 5 11,60 1,84
C 4 11,50 4,25
Total 15 9,87 6,12

La media de la variable sobre el conjunto de los Productos es la media de


las medias de los grupos, ponderados por las frecuencias absolutas de los
grupos:

9,87 = 1/15 (6 x 7 33 + 5 x 11,60 + 4 x 11,50)


20
La varianza entre los grupos (o entre las clases) es la varianza de las
medias:

Ventre = 1 / 15 (6 x 7,332 + 5 x 11,602 + 4 x 112 ) 9,872 = 4,28

La varianza dentro de los grupos (o dentro de las clases) es la media de las


varianzas :

Vdentro = 1 / 15 (6 x 0,22 + 5 x 1,84 + 4 x 4,25) = 1,84

La varianza de una variable es igual a la suma de las varianzas entre y


dentro:

6,12 = 4,28 + 1,84

En smbolos:

1
N Nk
N
Nk k

1 1
Ventre
N
N
k
2
k 2 Vdentro
N
Vk

V Ventre Vdentro

Indice de correlacin entre una variable categrica y una real

Se define como:

21
Ventre

V

Los valores de este ndice estn evidentemente comprendidos entre


0 y 1.
Este ndice vale 0 cuando la varianza entre es nula (ausencia de
vnculo entre ambas variables.
Vale 1 cuando la varianza entre es igual a la varianza total (fuerte
vnculo entre ambas variables.

En el ejemplo: ( = 0,84

El ndice (2 se denomina poder discriminante.

Cmo manejarse frente a incertidumbre?


4- NECESIDAD DE LAS PROBABILIDADES

1- El gerente de mercado de una empresa de gaseosas esta considerando


la introduccin de un nuevo producto para lo cual deber realizar una
promocin especial. Si el producto tiene xito la Ca. obtendr una
utilidad de $ 4.000.000, en cambio si el producto fracasa, se estima una
prdida de $ 2.500.000. Qu decisin deber tomar el gerente?.

2- El Sr. Prez es mayorista de frutas y verduras. Una de las frutas


preferidas por sus clientes son las frutillas. Este producto tiene una vida
til muy breve y si no se vende el mismo da de la entrega, pierde todo su
22
valor. Una caja de frutillas cuesta $20 y el mayorista recibe $50 por ella.
Como no puede especificar el nmero de cajas que los clientes adquirirn
en da, cul ser el nmero ptimo a almacenar para que las prdidas
sean mnimas?.

3- Un jugador tira un dado, la banca pagar tantos pesos como puntos


obtenga el jugador. Cunto debe pagar el jugador a la banca para que el
juego resulte equitativo?

4- Una lotera vende 10.000 billetes de $10; se dar un premio de $ 5.000


al favorecido con el primer premio. Supongamos que Ud. ha comprado un
billete. cunto debe esperar ganar?.

Cmo asignar probabilidades ?

1- En el caso del jugador ( Escuela Clsica


2- En el caso del Sr. Prez ( Escuela de la Frecuencia Relativa

N de cajas vendidas N de das


10 15
11 20
12 40
13 25
100

4- En el caso del nuevo producto ( Escuela Subjetiva


21. En el caso el jugador > Escuela clsica1. En el caso el jugador > Escuela clsica

4.1-ALGUNAS REGLAS DE PROBABILIDAD

23
1- Los empleados de la Empresa MMM S.A, estn clasificados segn
jerarqua y estudios cursados , como sigue:

Universidad No Universidad Total


Gerenciales 25 5 30
No Gerenciales 75 195 270
Total 100 200 300

Supongamos que se hace una eleccin al azar de los empleados, para


asistir a una conferencia:

a) Cual es la probabilidad de que resulte beneficiado un empleado


Gerencial?

b)Qu posibilidad tiene de asistir un graduado Universitario?

c)Qu posibilidad tiene de asistir un Gerencial o un Universitario?

d) Supongamos que de la eleccin resulta graduado Universitario, cul es


la probabilidad de que sea gerencial?

4.1-REVISION DE ESTIMACIONES DE PROBABILIDAD:

El Teorema de BAYES

El gerente de ventas de una fbrica de juguetes est planeando introducir


al mercado un nuevo juguete. En el pasado el 40% de los juguetes creados
por la compaa han tenido xito y el 60% no ha sido exitoso. Antes de
que se llegue a comercializar realmente el juguete, se lleva a cabo una
investigacin de mercado y se prepara un informe, favorable o
desfavorable. En el pasado el 80% de los juguetes exitosos recibieron
informes favorables y el 30% de los que no tuvieron xito recibieron
informes favorables. El gerente de mercadotecnia querra conocer la
probabilidad de que el nuevo juguete tenga xito en el caso de que reciba
un informe favorable.
24
Tabla resumen:

Eventos Prob. Prob. Prob. Prob.


Anterior Condicional Conjunta Revisada
P[Ei] P[F/Ei] P[Ei y F] P[Ei/F]
E 0.40 0.80 0.32 0.64
E 0.60 0.30 0.18 0.36

5- VARIABLE ALEATORIA

v.a: ganancia del jugador 1 2 3 4 5 6


p(x) 1/6 1/6 1/6 1/6 1/6 1/6

Esperanza Matemtica:

E[X] = 1.1/6 + 2.1/6 + 3.1/6 + 4.1/6 + 5.1/6 + 6.1/6 = $3,5


E X xp( x)
x

Varianza:

V X ( x E x ) 2 p ( x) x 2 p ( x) E X
2

x x =2,85$2

6- ALGUNAS VARIABLES ALEATORIAS CON NOMBRE PROPIO O


LEYES DE PROBABILIDAD O MODELOS
25
6.1-Ley o Modelo BINOMIAL

P ( x; n, p ) P ( X x ) C nx p x q n x

siendo:
n: No de pruebas
x : No de xitos
p : probabilidad de xito en una prueba
q: probabilidad de fracaso en una prueba / p+q=1

n y p: parmetros de la distribucin binomial

Condiciones:
El nmero de repeticiones del experimento debe ser finito
En cada repeticin del experimento pueden ocurrir solamente dos
resultados, que llamaremos xito (E) y fracaso (F)
Los resultados deben ser independientes
Las probabilidades de xito (p) y de fracaso (q) permanecen
constantes prueba a prueba
Esperanza y varianza

E[ X ] np
V [ X ] npq

6.2- Ley o Modelo HIPERGEOMTRICO

C mx1 C Nn xm1
P ( x; n,......)
C Nn

donde:
N: total de la poblacin
n: tamao de la muestra
m1: elementos con una determinada caracterstica
x: No de xitos

N, n y m1: parmetros de la distribucin hipergeomtrica

26
Condiciones:
El nmero de repeticiones del experimento debe ser finito
En cada repeticin del experimento pueden ocurrir solamente dos
resultados, que llamaremos xito (E) y fracaso (F)
Los resultados deben ser dependientes
Las probabilidades de xito (p) y de fracaso (q) no permanecen
constantes prueba a prueba

Esperanza y varianza

E[ X ] np
N n
V [ X ] npq
N 1

6.3- Ley o Modelo NORMAL

1 x 2
1 ( )
f ( x) e 2
para x
2

Veamos el siguiente ejemplo:

Tenemos un programa de capacitacin para mejorar las habilidades de


los supervisores de una lnea de produccin. El programa es autoaplicable
y por eso los supervisores requieren un nmero de horas para terminarlo.
Un estudio de participantes anteriores revela que el tiempo medio
dedicado al programa es de 500hs, con una dispersin de 100hs y que
dicho tiempo (requerido para terminarlo) se distribuye normalmente.

a) Cul es la probabilidad de que un participante elegido de manera


aleatoria tarde ms de 500hs. en terminar el programa?

b) Cul es la probabilidad de que tarde entre 500 y 650 horas?

c) Cul es la probabilidad de que tarde ms 630 horas?

27
d)Cul la de que tarde ms de 700hs?

6.3.1- Estimacin de la suposicin de normalidad

Para determinarse una variable aleatoria X ~ N(, ) , consideraremos


por el momento dos enfoques exploratorios:

Comparacin de las caractersticas del conjunto de datos con las


propiedades siguientes, de una distribucin normal subyacente:

a) grfico
b) calculo de , me, mo y cuatiles. Recordar que Q1 Q2 = 1,33
c) verificar si se cumple la proporcin comprendida en el intervalo
k

Construir un grfico P P (probabilidades acumuladas tericas vs.


probabilidades acumuladas empricas).

28
El OBJETIVO de esta parte del curso es proporcionar una introduccin
acerca de la idea de cmo llevar a cabo una Investigacin Estadstica
aplicada a los Negocios o la Economa.

ETAPAS DE UNA INVESTIGACIN ESTADSTICA

I DEFINICIN DE LA INVESTIGACIN

II PLANTEAMIENTO DE UNA TABLA DE DATOS

29
III DISEO DE MUESTREO

IV RECOLECCIN Y PROCESAMIENTO DE LOS DATOS

V ANLISIS DE LA INFORMACIN

I. DEFINICIN DE LA INVESTIGACIN

La definicin de la investigacin es una exposicin lo ms precisa posible de


la informacin que se necesita.

TEORA

DEFINICIN DE OBJETIVO DE LA EXPERIENCIA HIPTESIS


INVESTIGACIN
LA INVESTIGACIN

30
INVESTIGACIN
EXPLORATORIA

DISEO DE LA
INVESTIGACIN
POR MUESTREO

El objetivo de la investigacin pregunta qu informacin se requiere de


acuerdo a la definicin de la investigacin planteada.

Una hiptesis es una respuesta posible a los objetivos de una investigacin


estadstica.

I.1. FUENTES DE INFORMACIN PARA DESARROLLAR LA


HIPTESIS

la teora estadstica y secundariamente la proveniente del rea de


formacin especfica del investigador.

Investigacin exploratoria: sobre el tema de inters particular.

31
Experiencia: anterior del investigador con problemas similares, es quizs la
fuente ms importante de informacin para el desarrollo de la hiptesis.

Una vez establecida la hiptesis viene la etapa de diseo de la investigacin


por muestreo que contempla las siguientes cuestiones:

consideraciones sobre la POBLACIN a estudiar

origina los siguientes etapas de una investigacin estadstica.

32

You might also like