You are on page 1of 68

Estadística

Dr. Antonio Landa


Análisis Estadístico para la
toma de decisiones
Antonio Landa, PhD
Antonio.landa@iies.du.mx
Uso de Minitab
Bibliografía:
○ Levin, Rubin, Balderas, Del Valle,
Gómez. Estadística para
Administración y economía. Pearson –
Prentice Hall. México. 2004.
2
Objetivo
○ Al finalizar el curso, el estudiante de la
maestría en administración analizará y
aplicará los fundamentos teórico-
metodológicos del análisis estadístico, y
desarrollará habilidades para utilizarlo como
herramienta para la toma de decisiones en
la empresa.
3
¿Conversión o patada?
○ According to ESPN Stats & Information Group, there
have been 1,045 two-point conversion attempts since
2001,1 with teams converting 501 of those tries.
That’s a 47.9 percent conversion rate; given that a
successful attempt yields 2 points, that means the
expected value from an average 2-point try is 0.96
points.
○ Interestingly, that’s almost exactly what the expected
value is from an extra point these days. Since the NFL
moved extra-point kicks back to the 15-yard line last
season, teams have a 94.4 percent success rate,
which means that an extra point has an expected
value of between 0.94 and 0.95 points.

4

5

6
Un caso más…
Sally Clark, fue acusada en el Reino Unido de asesinar a sus
hijos cuando dos de ellos sufrieron sucesivamente de muerte
súbita en el recién nacido. Sally fue separada de su familia y
estuvo en prisión durante tres años, hasta que un juez
decidió revisar todos los casos de muerte súbita y observó
que cada año en el Reino Unido aproximadamente 50
matrimonios que habían perdido un hijo por muerte súbita,
perdían un segundo. Sally Clark fue entonces declarada
inocente, aunque nadie le pudo devolver los tres años de
vida familiar perdida.
7
Las estadísticas de un Penalty…

8
Rankings…
Puntuación
Calidad de
Puesto País o territorio
Vida
(de 10)
1 Suiza 8,068
2 Noruega 8,051
3 Luxemburgo 8,015
4 Suecia 7,937
5 Australia 7,925
6 Islandia 7,911
7 Italia 7,810
8 Eslovaquia 7,797
9 Finlandia 7,618
10 Australia 7,599

9
Netflix
○ As of July 2018, Netflix has 130 million worldwide streaming subscribers. Having this large user base allows Netflix
to gather a tremendous amount of data. With this data, Netflix can make better decisions and ultimately make
users happier with their service.
○ When you pause, rewind, or fast forward
○ What day you watch content (Netflix has found people watch TV shows during the week and movies during the
weekend.)
○ The date you watch
○ What time you watch content
○ Where you watch (zip code)
○ What device you use to watch (Do you like to use your tablet for TV shows and your Roku for movies? Do people
access the Just for Kids feature more on their iPads, etc.?)
○ When you pause and leave content (and if you ever come back)
○ The ratings given (about 4 million per day)
○ Searches (about 3 million per day)
○ Browsing and scrolling behavior
10
UBER

11
Usos de estadística en la vida diaria
* Los Censos de Población * Estudios de la Canasta Básica
* Determinación de la Inflación * Aumentos de salarios
* Accidentes más frecuentes * Enfermedades más frecuentes
* Pagos de Seguros de Vida * Tarifas de buses
* Tarifas de hoteles y taxis * Causas de muertes infantiles
* Preferencias de candidatos * Anuncios en radio y TV
* Necesidades de escuelas * Ventas de productos

12
○ Estadística Descriptiva se refiere a la recolección,
presentación, descripción, análisis e interpretación de
una colección de datos, esencialmente consiste en
resumir éstos con uno o dos elementos de
información (medidas descriptivas) que caracterizan
la totalidad de los mismos. La estadística Descriptiva
es el método de obtener de un conjunto de datos
conclusiones sobre si mismos y no sobrepasan el
conocimiento proporcionado por éstos. Puede
utilizarse para resumir o describir cualquier conjunto
ya sea que se trate de una población o de una
muestra, cuando en la etapa preliminar de la
Inferencia Estadística se conocen los elementos de
una muestra.

○ La estadística Inferencial, es el proceso por el cual se


deducen (infieren) propiedades o características de
una población a partir de una muestra significativa.
○ Rama de la estadística que se ocupa del uso de los
conceptos de probabilidad para manejar la
incertidumbre en la toma de decisiones.
○ Se basa en la estimación y en l
Agrupación y Presentación de Datos
○ Los datos son colecciones de cualquier cantidad de observaciones
relacionadas.
○ Podemos recopilar el número de teléfonos que diferentes empleados
instalan en un día dado o el número de teléfonos que instala un
trabajador dado durante un día en un periodo de varios días, y podemos
llamar datos a estos resultados.
○ Una colección de datos se conoce como conjunto de datos
○ Una sola observación es un dato puntual.

14
Tipos de Datos
○ El conjunto de los datos recogidos para llevar a cabo un estudio estadístico, recibirán el nombre
de variable aleatoria que normalmente se denotará X. Los datos correspondientes pueden ser,
básicamente, de dos tipos:
○ Variable cualitativa: los datos que forman la variable no son numéricos. Por ejemplo, religión a
la que se pertenece, tipo de automóvil, color de los ojos,...
○ Variable cuantitativa: los datos que forman la variable sí son numéricos. Por ejemplo, saldo de
una cuenta corriente, velocidad de los coches,... Dentro de este grupo de variables podemos
distinguir otras dos categorías. Por una parte, tendríamos las variables discretas que serían
aquellas que sólo pueden asumir ciertos valores (por ejemplo, número de automóviles/h. en
una autopista, número de estudiantes en la asignatura de estadística,...) y por otra parte, las
variables continuas que pueden tomar cualquier valor dentro de un rango específico (por
ejemplo, alturas de los alumnos de una clase, tiempo transcurrido en el vuelo de Barcelona a
Madrid,...)
○ Por último, una vez tenemos recogidos los datos, agrupamos éstos de forma excluyente dando
a cada uno de ellos el número de observaciones, es decir, el número de veces que se repite
cada valor, este número tomará el nombre de frecuencia.
15
Recolección de datos
○ Diferencia entre muestras y poblaciones
○ Representatividad
○ Datos tendenciosos
○ Patrones en los datos

Ordenamiento de datos

16
Distribución de Frecuencias
¿Qué observan de las tiendas?
¿Cuál es la cantidad que más se repite en
inventarios?

17
Distribución de Frecuencias Relativas

18
Distribución de Frecuencias Relativas

19
Ejercicio

20
Histogramas
○ Un histograma consiste en una serie de
rectángulos, cuyo ancho es proporcional al
rango de los valores que se encuentran dentro
de una clase, y cuya altura es proporcional al
número de elementos que caen dentro de la
clase.

21
Polígonos de Frecuencias

22
Ojivas

23
Medidas de
Tendencia Central y
Dispersión
Definiciones
○ Tendencia central La tendencia central se
refiere al punto medio de una distribución. Las
medidas de tendencia central se conocen
también como medidas de posición
○ Dispersión La dispersión se refiere a la
separación de los datos en una distribución, es
decir, al grado en que las observaciones se
separan.

25
Medidas de Tendencia Central y Dispersión

26
Sesgo y Curtosis

Curtosis Cuando medimos la curtosis de una distribución,


estamos midiendo qué tan puntiaguda
Sesgo Las curvas que representan los datos puntuales de un
conjunto de datos pueden ser simétricas o sesgadas. Las curvas
simétricas tienen una forma tal que una línea vertical que pase
por el punto más alto de la curva dividirá su área en dos partes
27
iguales.
Población
○ Población: Conjunto de todos los casos

“ ○
que concuerdan con una serie de
especificaciones.
Ej: Nuestra población comprende a todos
aquellos directores generales de empresas
industriales y comerciales que en 1983
tienen un capital social superior a 30
millones de presos, con ventas superiores
a los 100 millones de pesos y/o con más
de 300 personas empleadas.
Media Aritmética

29
Ejemplo

30
Otro ejemplo

31
Ventajas y desventajas
○ Cuáles serán las ventajas y desventajas de la
media aritmética?

32
Media Ponderada
○ Toma en cuenta niveles de importancia
en el cálculo

Cuál es el costo promedio de mano de obra?

W = peso asignado a cada observación


33
Mediana

34
La Moda
Es el valor que más se repite en el conjunto de datos.

35
Dsitribuciones
Multimodales

36
Comparaciones

37
Dispersión

38
39
Rangos

Fácil de calcular
Solo toma en cuenta los datos extremos e ignora el resto
No da una buena medida de la variación relativa

40
Rango intercuartil

41
Medidas de desviación promedio

○ Las descripciones más completas de la dispersión son aquellas que manejan la


desviación promedio respecto a alguna medida de tendencia central. Dos de estas
medidas son importantes para nuestro estudio de la estadística: la varianza y la
desviación estándar. Ambas medidas nos dan una distancia promedio de cualquier
observación del conjunto de datos respecto a la media de la distribución.

42
Varianza de la Población

43
Desviación Estándar
○ Es la raíz cuadrada de la varianza

44
Ejemplo

45
Uso de desviación std
Para una distribución normal:

En cualquier distribución, el teorema de Chebyshev dice que al menos 75% de los valores caen dentro de +/- 2σ

46
Desviación Estándar en una Muestra

47
Dispersión Relativa: Coeficiente de Variación

48
1.3
Probabilidad
Probabilidad
○ Probabilidad es la posibilidad de que algo pase
○ Las probabilidades se expresan como fracciones (1/6, 1/2, 8/9) o como
decimales (0.167, 0.500, 0.889) que están entre cero y uno
○ Evento es uno o más de los posibles resultados de hacer algo
○ Se dice que los eventos son mutuamente excluyentes si uno y sólo uno de
ellos puede tener lugar a un tiempo
○ La actividad que origina uno de dichos eventos se conoce como experimento

50
Tipos de Probabilidad
1. El planteamiento clásico.
2. El planteamiento de frecuencia relativa.
3. El planteamiento subjetivo.

51
Eventos con diagramas de Venn

52
Reglas de
probabilidad
○ La mayoría de los administradores que
utiliza la probabilidad se preocupan por
dos condiciones:
○ 1. El caso en que un evento u otro se
presente.
○ 2. La situación en que dos o más
eventos se presenten al mismo tiempo.

53
El caso en que un evento u otro se presente.

Cinco estudiantes por igual capaces esperan la fecha en que


se les hará una entrevista para trabajar en el verano. La
compañía solicitante ha anunciado que contratará
a sólo uno de los cinco, mediante una elección aleatoria. El
grupo está formado por los estudiantes
siguientes: Bill, Helen, John, Sally y Walter.
¿cuál es la probabilidad de que John o Sally sean
elegidos? 54
El caso en que un evento u otro se presente
○ Regla de adición para eventos que no
son mutuamente excluyentes Si dos
eventos no son mutuamente
excluyentes, es posible que ambos se
presenten al mismo tiempo.

55
Independencia Estadística
○ Cuando se presentan dos eventos, el resultado del primero puede, o no, tener un
efecto en el resultado del segundo. Esto es, los eventos pueden ser dependientes o
independientes. En esta sección examinaremos los eventos que son estadísticamente
independientes, es decir, aquellos en donde la presentación de uno no tiene efecto
sobre la probabilidad de presentación de cualquier otro. Existen tres tipos de
probabilidades que se presentan bajo la independencia estadística:
○ 1. Marginal - lanzar una moneda (cada lanzamiento es indenpendiente)
○ 2. Conjunta
○ 3. Condicional

56
Probabilidad conjunta

¿Cuál es la probabilidad de obtener sol en dos lanzamientos sucesivos?


57
Arbol de probabilidad

58
Probabilidad Condicional

¿cuál es la probabilidad de que en el segundo lanzamiento de una


59
moneda se obtenga cara, dado que el resultado del primero fue cara?
Resumen - Independencia

60
Ejemplo

61
Dependencia Estadística

62
Probabilidad Condicional bajo dependencia

63
Probabilidad Condicional bajo dependencia

C= Color
D = Puntos (dots)
S = Franjas (stripes)

P(D|C)=P(DC)/P(C)

P(D|C)=P(DC)/P(C) = .3 / .4 = 0.75

P(S|C)=P(DC)/P(C) = ?
64
Ejemplo

65
Probabilidad Marginal con dependencia

66
Teorema de Bayes
○ El teorema de Bayes vincula la probabilidad de A dado B con la
probabilidad de B dado A.
○ Es decir, por ejemplo, que sabiendo la probabilidad de tener un
dolor de cabeza dado que se tiene gripe, se podría saber (si se
tiene algún dato más), la probabilidad de tener gripe si se tiene
un dolor de cabeza.
○ Muestra este ejemplo que tiene vinculación íntima con la
comprensión de la probabilidad de aspectos causales dados los
efectos observados.

67
Teorema de Bayes - Ejemplo
○ Unos psicólogos especializados en el tratamiento de trastornos de personalidad están
interesados en diagnosticar el trastorno que afecta un paciente, en el que observan un
conjunto de síntomas que indican que el paciente podría sufrir el trastorno A o el
trastorno B. Además saben que los porcentajes de individuos afectados por los
trastornos A, B o ningún trastorno son 10, 30 y 70. También saben que el porcentaje de
individuos afectados por el trastorno A y que muestran el síntoma X es igual al 60%, el
porcentaje de individuos que sufren el trastorno B y muestran el síntoma X es el 30% y
el porcentaje de individuos no afectados que muestran los síntomas de trastorno es el
10%. Resumiendo, la información que disponemos es:

68

You might also like