Professional Documents
Culture Documents
4
“
5
“
6
Un caso más…
Sally Clark, fue acusada en el Reino Unido de asesinar a sus
hijos cuando dos de ellos sufrieron sucesivamente de muerte
súbita en el recién nacido. Sally fue separada de su familia y
estuvo en prisión durante tres años, hasta que un juez
decidió revisar todos los casos de muerte súbita y observó
que cada año en el Reino Unido aproximadamente 50
matrimonios que habían perdido un hijo por muerte súbita,
perdían un segundo. Sally Clark fue entonces declarada
inocente, aunque nadie le pudo devolver los tres años de
vida familiar perdida.
7
Las estadísticas de un Penalty…
8
Rankings…
Puntuación
Calidad de
Puesto País o territorio
Vida
(de 10)
1 Suiza 8,068
2 Noruega 8,051
3 Luxemburgo 8,015
4 Suecia 7,937
5 Australia 7,925
6 Islandia 7,911
7 Italia 7,810
8 Eslovaquia 7,797
9 Finlandia 7,618
10 Australia 7,599
9
Netflix
○ As of July 2018, Netflix has 130 million worldwide streaming subscribers. Having this large user base allows Netflix
to gather a tremendous amount of data. With this data, Netflix can make better decisions and ultimately make
users happier with their service.
○ When you pause, rewind, or fast forward
○ What day you watch content (Netflix has found people watch TV shows during the week and movies during the
weekend.)
○ The date you watch
○ What time you watch content
○ Where you watch (zip code)
○ What device you use to watch (Do you like to use your tablet for TV shows and your Roku for movies? Do people
access the Just for Kids feature more on their iPads, etc.?)
○ When you pause and leave content (and if you ever come back)
○ The ratings given (about 4 million per day)
○ Searches (about 3 million per day)
○ Browsing and scrolling behavior
10
UBER
11
Usos de estadística en la vida diaria
* Los Censos de Población * Estudios de la Canasta Básica
* Determinación de la Inflación * Aumentos de salarios
* Accidentes más frecuentes * Enfermedades más frecuentes
* Pagos de Seguros de Vida * Tarifas de buses
* Tarifas de hoteles y taxis * Causas de muertes infantiles
* Preferencias de candidatos * Anuncios en radio y TV
* Necesidades de escuelas * Ventas de productos
12
○ Estadística Descriptiva se refiere a la recolección,
presentación, descripción, análisis e interpretación de
una colección de datos, esencialmente consiste en
resumir éstos con uno o dos elementos de
información (medidas descriptivas) que caracterizan
la totalidad de los mismos. La estadística Descriptiva
es el método de obtener de un conjunto de datos
conclusiones sobre si mismos y no sobrepasan el
conocimiento proporcionado por éstos. Puede
utilizarse para resumir o describir cualquier conjunto
ya sea que se trate de una población o de una
muestra, cuando en la etapa preliminar de la
Inferencia Estadística se conocen los elementos de
una muestra.
14
Tipos de Datos
○ El conjunto de los datos recogidos para llevar a cabo un estudio estadístico, recibirán el nombre
de variable aleatoria que normalmente se denotará X. Los datos correspondientes pueden ser,
básicamente, de dos tipos:
○ Variable cualitativa: los datos que forman la variable no son numéricos. Por ejemplo, religión a
la que se pertenece, tipo de automóvil, color de los ojos,...
○ Variable cuantitativa: los datos que forman la variable sí son numéricos. Por ejemplo, saldo de
una cuenta corriente, velocidad de los coches,... Dentro de este grupo de variables podemos
distinguir otras dos categorías. Por una parte, tendríamos las variables discretas que serían
aquellas que sólo pueden asumir ciertos valores (por ejemplo, número de automóviles/h. en
una autopista, número de estudiantes en la asignatura de estadística,...) y por otra parte, las
variables continuas que pueden tomar cualquier valor dentro de un rango específico (por
ejemplo, alturas de los alumnos de una clase, tiempo transcurrido en el vuelo de Barcelona a
Madrid,...)
○ Por último, una vez tenemos recogidos los datos, agrupamos éstos de forma excluyente dando
a cada uno de ellos el número de observaciones, es decir, el número de veces que se repite
cada valor, este número tomará el nombre de frecuencia.
15
Recolección de datos
○ Diferencia entre muestras y poblaciones
○ Representatividad
○ Datos tendenciosos
○ Patrones en los datos
Ordenamiento de datos
16
Distribución de Frecuencias
¿Qué observan de las tiendas?
¿Cuál es la cantidad que más se repite en
inventarios?
17
Distribución de Frecuencias Relativas
18
Distribución de Frecuencias Relativas
19
Ejercicio
20
Histogramas
○ Un histograma consiste en una serie de
rectángulos, cuyo ancho es proporcional al
rango de los valores que se encuentran dentro
de una clase, y cuya altura es proporcional al
número de elementos que caen dentro de la
clase.
21
Polígonos de Frecuencias
22
Ojivas
23
Medidas de
Tendencia Central y
Dispersión
Definiciones
○ Tendencia central La tendencia central se
refiere al punto medio de una distribución. Las
medidas de tendencia central se conocen
también como medidas de posición
○ Dispersión La dispersión se refiere a la
separación de los datos en una distribución, es
decir, al grado en que las observaciones se
separan.
25
Medidas de Tendencia Central y Dispersión
26
Sesgo y Curtosis
“ ○
que concuerdan con una serie de
especificaciones.
Ej: Nuestra población comprende a todos
aquellos directores generales de empresas
industriales y comerciales que en 1983
tienen un capital social superior a 30
millones de presos, con ventas superiores
a los 100 millones de pesos y/o con más
de 300 personas empleadas.
Media Aritmética
29
Ejemplo
30
Otro ejemplo
31
Ventajas y desventajas
○ Cuáles serán las ventajas y desventajas de la
media aritmética?
32
Media Ponderada
○ Toma en cuenta niveles de importancia
en el cálculo
34
La Moda
Es el valor que más se repite en el conjunto de datos.
35
Dsitribuciones
Multimodales
36
Comparaciones
37
Dispersión
38
39
Rangos
Fácil de calcular
Solo toma en cuenta los datos extremos e ignora el resto
No da una buena medida de la variación relativa
40
Rango intercuartil
41
Medidas de desviación promedio
42
Varianza de la Población
43
Desviación Estándar
○ Es la raíz cuadrada de la varianza
44
Ejemplo
45
Uso de desviación std
Para una distribución normal:
En cualquier distribución, el teorema de Chebyshev dice que al menos 75% de los valores caen dentro de +/- 2σ
46
Desviación Estándar en una Muestra
47
Dispersión Relativa: Coeficiente de Variación
48
1.3
Probabilidad
Probabilidad
○ Probabilidad es la posibilidad de que algo pase
○ Las probabilidades se expresan como fracciones (1/6, 1/2, 8/9) o como
decimales (0.167, 0.500, 0.889) que están entre cero y uno
○ Evento es uno o más de los posibles resultados de hacer algo
○ Se dice que los eventos son mutuamente excluyentes si uno y sólo uno de
ellos puede tener lugar a un tiempo
○ La actividad que origina uno de dichos eventos se conoce como experimento
50
Tipos de Probabilidad
1. El planteamiento clásico.
2. El planteamiento de frecuencia relativa.
3. El planteamiento subjetivo.
51
Eventos con diagramas de Venn
52
Reglas de
probabilidad
○ La mayoría de los administradores que
utiliza la probabilidad se preocupan por
dos condiciones:
○ 1. El caso en que un evento u otro se
presente.
○ 2. La situación en que dos o más
eventos se presenten al mismo tiempo.
53
El caso en que un evento u otro se presente.
55
Independencia Estadística
○ Cuando se presentan dos eventos, el resultado del primero puede, o no, tener un
efecto en el resultado del segundo. Esto es, los eventos pueden ser dependientes o
independientes. En esta sección examinaremos los eventos que son estadísticamente
independientes, es decir, aquellos en donde la presentación de uno no tiene efecto
sobre la probabilidad de presentación de cualquier otro. Existen tres tipos de
probabilidades que se presentan bajo la independencia estadística:
○ 1. Marginal - lanzar una moneda (cada lanzamiento es indenpendiente)
○ 2. Conjunta
○ 3. Condicional
56
Probabilidad conjunta
58
Probabilidad Condicional
60
Ejemplo
61
Dependencia Estadística
62
Probabilidad Condicional bajo dependencia
63
Probabilidad Condicional bajo dependencia
C= Color
D = Puntos (dots)
S = Franjas (stripes)
P(D|C)=P(DC)/P(C)
P(D|C)=P(DC)/P(C) = .3 / .4 = 0.75
P(S|C)=P(DC)/P(C) = ?
64
Ejemplo
65
Probabilidad Marginal con dependencia
66
Teorema de Bayes
○ El teorema de Bayes vincula la probabilidad de A dado B con la
probabilidad de B dado A.
○ Es decir, por ejemplo, que sabiendo la probabilidad de tener un
dolor de cabeza dado que se tiene gripe, se podría saber (si se
tiene algún dato más), la probabilidad de tener gripe si se tiene
un dolor de cabeza.
○ Muestra este ejemplo que tiene vinculación íntima con la
comprensión de la probabilidad de aspectos causales dados los
efectos observados.
67
Teorema de Bayes - Ejemplo
○ Unos psicólogos especializados en el tratamiento de trastornos de personalidad están
interesados en diagnosticar el trastorno que afecta un paciente, en el que observan un
conjunto de síntomas que indican que el paciente podría sufrir el trastorno A o el
trastorno B. Además saben que los porcentajes de individuos afectados por los
trastornos A, B o ningún trastorno son 10, 30 y 70. También saben que el porcentaje de
individuos afectados por el trastorno A y que muestran el síntoma X es igual al 60%, el
porcentaje de individuos que sufren el trastorno B y muestran el síntoma X es el 30% y
el porcentaje de individuos no afectados que muestran los síntomas de trastorno es el
10%. Resumiendo, la información que disponemos es:
68