Professional Documents
Culture Documents
Introducción.
La Estadística es la ciencia encargada de recolectar, organizar, resumir e
interpretar datos de un proyecto o estudio, en los últimos años ha cobrado gran
relevancia en todas las disciplinas ya que suministra los mejores instrumentos en
el propósito de toda investigación cuyo fin es el de probar mediante la observación
de los hechos empíricos la implicación teórica que establecemos entre los
mismos.
RESUMEN
GLOSARIO
Población: Cuando se dispone de todos los elementos de un objeto de
estudio (Censo)
Muestra: Subconjunto de la población.
Marco de Muestreo: Listado de unidades muéstrales de la población.
Página 1 de 55
Variable : Característica que al ser medida en diferentes individuos adopta
resultados heterogéneos.
Estadístico: Medida cuantitativa de una muestra cuyo objetivo es inferir
acerca de la población objetivo.
Parámetro : Medida cuantitativa de una población.
Desarrollo temático.
1.1 El método científico y conceptos básicos en estadística.
1.2 Recolección, organización, resumen e interpretación en variables cualitativas,
pictogramas y tablas de contingencia.
1.3 Resumen e interpretación en variables cuantitativas, histogramas , diagramas
de tallos y hojas , diagrama de caja y bigotes ,
1.4 Medidas de tendencia central
1.5 Medidas de dispersión
1.6 Sesgo y curtosis .
1.7 Autoevaluación
1.7 Referencias bibliográficas
Página 2 de 55
UNIDAD 1: Estadística Descriptiva
El problema 1
Todos los problemas se inician por una pregunta que debe tener los siguientes
componentes: Una descripción ( El que) , Unas discriminación ( El cual ) , un
registro histórico y bibliográfico (El cuándo y dónde hay información ) , El proceso (
como se puede resolver) , la explicación (el por que) y una aplicación (el para
que).
Página 3 de 55
Conceptos Básicos en Estadística.
Variables en Estadística.
Tipos de Variables:
Se tiene básicamente dos: Cualitativas que son aquellas que no se les puede
asignar valor numérico y Cuantitativas en las cuales su escala de medición es
numérica. En el siguiente cuadro sinóptico se describen los tipos de variables
según su clasificación:
Página 4 de 55
No min al : No hay diferencias entre sus clases (opciones que toma la var iable)
Ejemplos : EstadoCivil , Raza, genero, etc
Ordinal : Existe una jerarquia entre las clases
Cualitativas Ejemplo : Estructura organica de la iglesia : Papa, arsovispos ovispos ,
sacerdotes.
Razon : Se le asigna una escala de medicion a las clases
Ejemplo : En una escala de 0 a 100 establesca su gusto por las suguientes
bebidas Coca cola y Colombiana
Variables
Discretas : Son aquellas que toman valores enteros
Ejemplo : Numero de hijos
Cuantitativas
Continuas : Son aquellas que toman los reales
Ejemplo : Estatura, Fuerza, Re sistencia en P.S .I .
Problema
¿Existe una relación entre la actitud y aptitud con el desempeño académico en
Matemáticas?
Población Objetivo
Estudiantes de ingeniería Universidad “X” Grupo 15 de Probabilidad 2013-1.
Variables Independientes
Actitud: Definida de modo básico como el gusto por una actividad
Aptitud: Del latín “ aptus = capaz para” en el lenguaje común la aptitud se refiere a
la capacidad de una persona para realizar adecuadamente una tarea, en
psicología engloba tanto capacidades cognitivas como procesos.
Para la valoración de estas variables se utilizara como instrumento de medición
una encuesta
Variable Dependiente
Página 5 de 55
Desempeño académico en Matemáticas.
Objetivo General
Realizar un diagnostico de las posibles causas de la mortalidad académica en
Matemáticas con el fin de formular planes de acción y prevención.
Objetivos específicos
Recopilar, organizar y resumir información del desempeño académico y del
gusto por la matemáticas
Realizar una encuesta donde se trate de medir las causas de la mortalidad
académica.
Con base a los resultados obtenidos, formular planes de acción y
socializarlos con los docentes de las asignaturas.
Referentes teóricos2:
Actitud
“En esencia, las actitudes son percepciones acerca de las personas, las
cosas o los hechos ambientales; asimismo, en la medida en que dirigen la
conducta, tienen cualidades motivacionales. Al definir las actitudes debe
tomarse en cuenta, fundamentalmente, el modo en que “disponen” al
individuo para que conciba el mundo y reaccione ante él de determinadas
maneras”. Los expertos en psicología mencionan por lo menos cuatro
componentes para las actitudes. Así, una actitud hacia la matemática que
refleje aprecio e interés por esta ciencia, hace referencia a una componente
afectiva de la actitud hacia esta disciplina. Mientras que referencias hacia la
organización, modo de empleo de las capacidades generales y hábitos de
trabajo hacia esta disciplina, evidencian un componente cognitivo de la
actitud hacia las matemáticas.
Desde los comienzos de la psicología social, en 1924, se han propuesto
muchas definiciones para el termino actitud, desde simples, como la
enunciada por Bem en 1972, como “lo que gusta y lo que no gusta”, hasta
mas elaboradas: “como medio de la experiencia, que ejerce una influencia
rectora o dinámica en la respuesta del individuo a todos los objetos y
situaciones con los que se relaciona”, dada por Allport (1935); pasando por
definiciones variadas que obedecen a los momentos históricos de la
psicología
Página 6 de 55
Medición de actitudes
La actividad científica durante los años 1920 y 1940, inspirada en el modelo
experimental de la física, hizo que los científicos sociales asumieran como único
procedimiento para validar el conocimiento las reglas metodológicas de esta
corriente. Esta tendencia cuantificadora, el uso de las encuestas y el aumento de
las investigaciones psicológicas llevaron al desarrollo de las escalas de actitud
como un instrumento en la medición de actitudes.
Escalas de actitud
Elejabarrieta e Iñiguez, 1984, se pueden definir técnicamente como: Instrumentos
de medición que permiten acercarse a la variabilidad afectiva de las personas
respecto a cualquier objeto psicológico.
Tipos de Escala
Clásicamente se consideran 3 tipos de escalas:
Escalas tipo Thurstone
La consideración en 1928 de Louis Thurstone: de la opinión como un
indicador indirecto de la expresión verbal de la actitud de los sujetos hacia
las cosas, lo llevó a diseñar junto a E. J. Chave, un instrumento para medir
actitudes, conocido hoy en día como escala de actitud tipo Thurstone. En
esta escala se presenta a una muestra representativa de la población una
serie de enunciados que, se cree, son pertinentes para medir el grado de
acuerdo/desacuerdo, favorabilidad/desfavorabilidad hacia cierto objeto; es
decir los sujetos no expresan su opinión sino que manifiestan su grado de
favorabilidad a cada enunciado.
Escala tipo Likert
En 1932, Likert plantea un proceso de elaboración más breve y sencillo que
Thurstone; su técnica acepta expresamente que las actitudes pueden
medirse a través de manifestaciones verbales. Los individuos pueden
situarse en la variable de actitud desde el polo más favorable al más
desfavorable, de tal manera que la variación de las respuestas será debida
a diferencias individuales de los sujetos.
Thurstone – Likert
Considerando las respuestas: En las escalas Thurstone se pide a los
sujetos que emitan sus respuestas con dos alternativas Si/No; mientras
que, en Likert se presentan distintas alternativas desde la más favorable a
la más desfavorable. Los modelos más habituales varían entre dos y siete
respuestas, siendo el número más común el de cinco.
Desde el punto de vista de la medición: La técnica Likert asume un nivel de
medida ordinal, mientras Thurstone considera una escala de intervalo.
Página 7 de 55
En la actualidad, de entre las múltiples técnicas de observación que se conocen
(entrevistas, cuestionarios, test proyectivos, observaciones de la conducta, etc.), el
instrumento de medida de actitudes es la escala de actitud, porque como indica
Gairín 1987, presentan las ventajas que citamos a continuación:
Permiten el anonimato.
Proporcionan tiempo al encuestado para pensar acerca de
las respuestas antes de responder.
2 Tomado
de:http://ima.usergioarboleda.edu.co/pelusa/pelusa%282%29/documento
s/Cursillo_Cali.pdf
APTITUD.
JUSTIFICACION
PROCEDIMIENTO
Página 8 de 55
que, en Likert se presentan distintas alternativas desde la más favorable a
la más desfavorable. Las de tipo Likert fueron: Como fue su desempeño
académico ( notas) para las matemáticas durante el bachillerato ( Bueno ,
Regular, Malo) y Como ha sido su desempeño académico ( notas) para las
matemáticas desde su ingreso a la facultad ( Bueno , Regular, Malo) . Las
de tipo Thurstone fueron: Le gustaron las matemáticas durante el
bachillerato ( si, no) y Le han gustado las matemáticas en la Universidad ( si
, no)
Para la verificación de la variable de respuesta se trabajo con una escala
Thurstone : Considera usted que debido a las anteriores razones se da el
bajo desempeño en matemáticas en los estudiantes de su facultad ( si , no)
Una vez aplicado el instrumento se organizo la información en una base de
datos así:
Página 9 de 55
Nota : Se codificaron las clases asi: Sexo : Femenino 1 , Masculino 2;
Estudio en colegio: Privado 2, Publico 1 ; Como fue su desempeño
académico ( notas) para las matemáticas durante el bachillerato ( Bueno
“1” , Regular “2”, Malo”3”) ; Como ha sido su desempeño académico (
notas) para las matemáticas desde su ingreso a la facultad (Bueno “1” ,
Regular “2”, Malo”3”) ; Le gustaron las matemáticas durante el bachillerato (
si “1”, no”2”) y Le han gustado las matemáticas en la Universidad ( si”1” ,
no”2”) y por ultimo: Considera usted que debido a las anteriores razones se
Página 10 de 55
da el bajo desempeño en matemáticas en los estudiantes de su facultad ( si
“1”, no “2”)
Femenino
12
33%
Masculino
24
67%
De la misma forma
Oficial
10
28%
Privado
26
72%
Página 11 de 55
El resumen de las preguntas para todo el grupo fue:
Aptitud
Desmpeño Academico ( Notas)
Desempeño Academico
durante el Bachillerato (Notas) En la Universidad
Malo
Malo
11% 11%
Regular Bueno
31% Bueno Regular 50%
58% 39%
Actitud
No
No
22%
36%
Si Si
64% 78%
No
17%
Si
83%
Página 12 de 55
Tablas de Contingencia
Consiste en realizar la relación entre dos o más variables, por ejemplo si se desea
analizar el desempeño académico en el bachillerato por género tendríamos:
Como se observa a los hombres les fue un poco mejor en el buen desempeño
(63%) contra las damas ( 50%) .
Página 13 de 55
Tambien podemos analizar la relacion para la pregunta desempeño academico
que han tenido en la universidad por generos .
1.3.1 Histograma
Se refiere a un diagrama de barras donde se observa la distribución de la variable,
su construcción se ilustrara mediante un ejemplo:
Página 14 de 55
Primer paso
Se calcula el rango de los datos mediante la diferencia entre el mayor y el menor.
Segundo Paso
Se establece el numero de clases o intervalos donde se va a distribuir el rango,
existen muchas formas de calcularlo pero en general puede ser a criterio del
profesional que este evaluando, se recomienda que no se exceda de 15 intervalos
de clase así se tengan bastantes observaciones, un criterio aproximado puede ser
la raíz cuadrada de la cantidad de observaciones aproximándola al entero mayor,
en este caso:
n 50
N º deIntervalos 50 7.07107 8
Tercer paso
Establecemos el intervalo de clase, mediante el cociente entre el rango y el
número de intervalos así:
Rango
Intervalo de clase
N º de Intervalos
679
Intervalo de clase 84,875
8
Cuarto paso
Construimos una tabla de distribución de frecuencias contando los datos de cada
intervalo así:
Página 15 de 55
Nota: Hay que tener en cuenta que por ejemplo en el primer intervalo se deben
contar los datos entre 2395 y 2479 y en el segundo intervalo desde 2480 y 2564 ,
es decir no realizar doble conteo.
Histograma
12
10 10
10
9
8
Nº de Muestras
7 7
4
4
2
2
1
La línea negra que une los centros de cada clase se denomina polígono de
frecuencias.
Podemos concluir que los mayores porcentajes se encuentra en los rangos de:
2395 a 2564 con un 34% de las cincuenta observaciones y entre 2650 a 2819
tenemos un 38% , es claro que la variable tiene una distribución bastante irregular.
Página 16 de 55
Frecuencia Absoluta Acumulada
60 100%
86% 50
50
74% 78% 43
39
40 37
54%
30 27
34% 36%
17 18
20
20%
10
10
Página 17 de 55
Es de anotar que la mayor concentración de datos se encuentra el rango de 2400
y 2473 P.S.I.
Cuartiles
Se trata de dividir la muestra ordenada en cuatro partes donde la posición para el
primer cuartil es:
n 1
Q1
4 4
Donde
n N º de datos
En este caso
50 1
Q1
4 4
51
Q1 12,75
4
Es decir entre la posición 12 y 13 la cuarta parte o el primer 25% será
(interpolando):
Página 18 de 55
Por lo tanto el primer 25% de las muestras están entre 2395 y 2533.
El segundo cuartil
n 1
Q2 2 *
4 4
Q2 2 *12,75 25,5
El segundo cuartil que también se llama la mediana e indica que el 50% de los
datos está por debajo de este valor y el otro 50% de los datos son mayores.
La mitad de las observaciones están por debajo de 2714.5 (P.S.I) y las muestras
restantes son mayores.
El Tercer cuartil
n 1
Q3 3 *
4 4
Q3 3 *12,75 38,25
Página 19 de 55
El 75% de las muestras o las tres cuartas partes de las muestras están entre 2395
y 2852,5.
Página 20 de 55
1.4.1 Media aritmética o promedio : Se refiere al fiel de la balanza es decir si
colocáramos los datos ordenados del menor al mayor el fulcro es el promedio:
Es la medida de tendencia central más usada, sus ventajas son: la suma de las
desviaciones ( datos menos la media ) es igual a cero , la media de una muestra
es igual a la media ponderada de las submuestras y la más importante la suma de
los cuadrados de las desviaciones es mínima , con respecto a otras medidas de
tendencia central , la desventaja : ser muy sensible a valores extremos.
Formula
n
x i
x i 1
n
Donde
x Media Aritmetica o promedio
xi Datos
n Tamaño de la muestra
Página 21 de 55
Ejemplo:
Si tomamos los datos del ejemplo de: Para la aceptación por parte de la
interventoría de una placa de entrepiso se tomaron muestras que al fallarlas su
resistencia a compresión en ( P.S.I) fue:
El promedio es:
50
x
x c * Fi
n
Donde
x Media Aritmetica o promedio
xc Intervalo Medio de clase
Fi Frecuencia Absoluta
n Tamaño de la muestra
Página 22 de 55
Frecuencia
Intervalos de Clase XC XC*Fi
Absoluta Fi
2395_2479,875 2437,4375 10 24.374,38
2479,875_2564,75 2522,3125 7 17.656,19
2564,75_2649,625 2607,1875 1 2.607,19
2649,625_2734,5 2692,0625 9 24.228,56
2734,5_2819,375 2776,9375 10 27.769,38
2819,375_2904,25 2861,8125 2 5.723,63
2904,25_2989,125 2946,6875 4 11.786,75
2989,125_3074 3031,5625 7 21.220,94
Σ= 50 135.367,00
20%
135367
x 2707 .34
50 14%
Como se observa es similar a la media tomando todos los datos (2711.56) , pero
hay que tener en cuenta que la media de los datos agrupados es una
aproximación a la de desagrupados.
Media Ponderada 4%
2%
A partir del concepto de la media para datos agrupados podemos extenderlo con
esta medida en la que básicamente se le asigna un peso o ponderación a cada
dato.
Formula
x * p i i
xp i 1
p i
Donde
x p Media Ponderada
xi Datos
pi Ponderacion o peso para cada dato
Ejemplo :
Página 23 de 55
Para la asignación de una licitación se tendrá en cuenta el proponente que se
encuentre más cerca del promedio del pecio propuesto, ponderado con los años
de experiencia certificada en obras similares. Una vez abiertas las propuestas se
tienen los siguientes datos:
AÑOS DE
PROPONENTE PRECIO ( Miles) "xi" EXPERIENCIA xi*pi
"Pi"
Compañía "A" 15328 5 76640
Compañía "B" 13890 8 111120
Compañía "C" 17326 15 259890
Compañía "D" 16280 12 195360
Σ= 40 643010
643010
xp 16075 ,25
40
La tabla de diferencias
PRECIO ( Miles)
PROPONENTE Dif con la xp
"xi"
1.4.2 Mediana: Se define como el valor central de los datos ordenados, tenemos
dos situaciones:
20%
a) Si el numero de datos es impar tendremos una sola posición que ocupara la
mediana y se tomara el valor de esta posición.
b) Si el número de datos es par la mediana será ocupada por dos posiciones y se 20%
tomara el promedio aritmético de los valores en dichas posiciones. 18%
Página 24 de 55
4%
2%
n 1
P
2 2
Donde
n N º de datos
La ventaja que tiene esta medida de tendencia central es que no se deja sesgar
por valores extremos.
Ejemplo.
Página 25 de 55
Que se puede interpretar como que el 50% de las muestras están por debajo de
este valor y el restante por encima del mismo.
Ejemplo:
Con el mismo ejemplo de las resistencias:
M O 3004
Como se aprecia si tomáramos este dato como valor representativo de la muestra
tendría un sesgo altísimo.
1.3.5.4 Media Geométrica: Se define como la raíz enésima del producto de los
datos así:
n
Mg n
x
i 1
i
Donde
M g Media geometrica
n Tamañode la muestra
Pr oducto
xi Datos
Las ventajas que tiene no es muy influenciable por datos extremos y se usa
generalmente cuando los valores que se están trabajado siguen una progresión
geométrica o aproximadamente geométrica, ( por ejemplo el cálculo de un valor
representativo a una serie de porcentajes : tasas ) , sus desventajas es que si uno
de los datos es cero su calculo dará cero.
Ejemplo:
Con el mismo ejemplo de las resistencias aunque no sería del todo acertado tomar
como valor representativo de estos datos la media geométrica, se ilustrara para
demostrar que en general da más bajo que la media aritmética:
M g 50 2395 * 2413 * ................* 3074
M g 2704 .11
Si la comparamos con la media aritmética (2711,56) efectivamente es menor.
Página 26 de 55
1.4.5 Media Armónica: Es otro estadígrafo de posición se debe utilizar cuando las
variables medidas son de proporción inversa (velocidades, aceleración, tiempos
que demoran trabajadores en realizar una actividad etc).
n
xA n
1
i 1 xi
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura aunque no sería del todo
acertado tomar como valor representativo de estos datos la media armonica , se
ilustrara para demostrar que en general da el estadígrafo más bajo:
50
xA 50
1 1 1
2395 2413 .............. 3074
i 1
50
xA
0,00041753 7 0,00041442 2 ............ 0,00032530 9
50
xA 2696,70
0,01854117 3
Como se observa da más bajo que el promedio y la media geométrica.
1.5.1 Rango
Simplemente es la diferencia entre el mayor valor y el menor , si este intervalo es
alto existirá bastante dispersión entre los datos de la muestra.
Página 27 de 55
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos:
Formula de la Varianza
x
n
2
i x
S2 i 1
n 1
Donde
S 2 : Varianza
xi : Datos
x : Media Artimetica
n : Numero de datos
Tiene el inconveniente que las unidades ( de la variable) quedan al cuadrado , por
lo tanto su interpretación no es clara , simplemente si es muy alta existirá gran
dispersión, y si es baja los datos estarán bastante agrupados respecto al
promedio. Para evitar el inconveniente tenemos la desviación estándar que es la
raíz de la varianza.
x
n
2
i x
S i 1
n 1
Donde
S : Desviacion Es tan dar
xi : Datos
x : Media Artimetica
n : Numero de datos
Página 28 de 55
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos:
xi x x x x
i i
2
x 2711,56
Sumas 0 2023922,32
Página 29 de 55
2023922 ,32
S2
50 1
S 2 41304,54
S 41304,54
S 203,24
Cuya interpretación es : el valor representativo de la muestra es de 2711.56 P.S.I.
con una dispersión de todos los datos con respecto a la media de 203.24 ( P.S.I).
Página 30 de 55
Formula
3
n
n x x
CA i
n - 1n - 2 i 1 s
Donde
CA : Coeficient e de Asimetria
n : Numero de Datos
xi : Datos
x Pr omedio
s : Deviacion Es tan dart
Página 31 de 55
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos la siguiente tabla:
xi x x
i
3
xi x
s
2395 -316,56 -3,77895284
2413 -298,56 -3,17028442
2422 -289,56 -2,89213835
2425 -286,56 -2,80317406
2435 -276,56 -2,51983126
2445 -266,56 -2,25625561
2454 -257,56 -2,03534769
2458 -253,56 -1,94198374
2468 -243,56 -1,72116005
2473 -238,56 -1,61732105
2509 -202,56 -0,99006664
2512 -199,56 -0,946725
2540 -171,56 -0,60152194
2545 -166,56 -0,55044698
2553 -158,56 -0,47488043
2561 -150,56 -0,40656705
2562 -149,56 -0,39851964
2576 -135,56 -0,296755
2664 -47,56 -0,0128153
2675 -36,56 -0,00582133
2679 -32,56 -0,00411203
2696 -15,56 -0,00044878
2702 -9,56 -0,00010408
2703 -8,56 -7,4718E-05
2714 2,44 1,7305E-06
2715 3,44 4,8493E-06
2723 11,44 0,00017835
2737 25,44 0,00196135
2759 47,44 0,01271854
2769 57,44 0,02257598
2770 58,44 0,02377574
2788 76,44 0,05320659
2801 89,44 0,08523123
2806 94,44 0,10033935
2813 101,44 0,12434579
2815 103,44 0,13184659
2816 104,44 0,13570753
2847 135,44 0,29596762
2868 156,44 0,45608604
2909 197,44 0,91687216
2910 198,44 0,93087425
2917 205,44 1,03290024
2989 277,44 2,54396181
3004 292,44 2,97929622
3004 292,44 2,97929622
3023 311,44 3,59854164
3040 328,44 4,22057372
3045 333,44 4,41627849
3057 345,44 4,91044934
3074 362,44 5,67168008
x 2711,56
S= 203,2351769
Sumas 0 6,21936346
Página 32 de 55
50
CA * 6,21936346
50 - 150 - 2
CA 0,13221435 9
Como el coeficiente dio mayor que cero podemos interpretar como, que en la
distribución existen más datos ponderados por debajo del promedio (2711.56)
tiene cola izquierda.
1.6.1 Curtosis.
Formula
n n 1 3n 1
4
n
xi x
2
n - 1n - 2n 3
Cu
s n 2 n 3
i 1
Donde
Cu : Curtosis
n : Numero de Datos
xi : Datos
x Pr omedio
s : Deviacion Es tan dart
Página 33 de 55
Si el coeficiente de curtosis da negativo se dice que la distribución de la variable
es plana ( platicurtica) , y el caso contrario apuntada ( leptocurtica) , si da cero se
dice que la distribución es mesocurtica.
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos la siguiente tabla:
Página 34 de 55
xi x x
i
s
4
xi x
2395 -316,56 5,88611346
2413 -298,56 4,6572652
2422 -289,56 4,12058381
2425 -286,56 3,95245336
2435 -276,56 3,42895627
2445 -266,56 2,95926869
2454 -257,56 2,57939674
2458 -253,56 2,42285516
2468 -243,56 2,0626633
2473 -238,56 1,89843173
2509 -202,56 0,98677749
2512 -199,56 0,92960502
2540 -171,56 0,50777186
2545 -166,56 0,45111506
2553 -158,56 0,37049217
2561 -150,56 0,30119163
2562 -149,56 0,2932691
2576 -135,56 0,1979387
2664 -47,56 0,00299897
2675 -36,56 0,0010472
2679 -32,56 0,00065878
2696 -15,56 3,4359E-05
2702 -9,56 4,8959E-06
2703 -8,56 3,147E-06
2714 2,44 2,0776E-08
2715 3,44 8,208E-08
2723 11,44 1,0039E-05
2737 25,44 0,00024551
2759 47,44 0,00296882
2769 57,44 0,00638061
2770 58,44 0,00683668
2788 76,44 0,02001185
2801 89,44 0,03750867
2806 94,44 0,04662603
2813 101,44 0,06206424
2815 103,44 0,06710556
2816 104,44 0,06973839
2847 135,44 0,19723876
2868 156,44 0,35107161
2909 197,44 0,89072789
2910 198,44 0,90891099
2917 205,44 1,04410579
2989 277,44 3,47280808
3004 292,44 4,28698122
3004 292,44 4,28698122
3023 311,44 5,51444797
3040 328,44 6,82069538
3045 333,44 7,24561526
3057 345,44 8,34631901
3074 362,44 10,1146059
x 2711,56
S= 203,235177
Sumas 0 91,8109017
Página 35 de 55
El coeficiente de curtosis será:
5050 1 350 - 1
2
Cu * 91,8109017 4 -
50 - 150 - 250 3 50 250 3
Cu -1,0749493 46
Página 36 de 55
UNIDAD ACADÉMICA No. 02.
Introducción:
RESUMEN
GLOSARIO
Página 37 de 55
Probabilidad1: Se define como el grado La probabilidad es la posibilidad
que existe entre varias posibilidades, que un hecho o condición se
produzcan. La probabilidad, entonces, mide la frecuencia con la cual se
obtiene un resultado en oportunidad de la realización de un experimento
sobre el cual se conocen todos los resultados posibles gracias a las
condiciones de estabilidad que el contexto supone de antemano.
1Tomadode
http://www.definicionabc.com/general/probabilidad.php#ixzz2TCUO6
Axioma: Proposición clara y evidente que no necesita demostración
Sucesos: Cada uno de los posibles resultados que no se pueden
descomponer en otros más simples en un experimento aleatorio.
Espacio Muestral: Conjunto total de sucesos elementales.
Desarrollo temático.
2.1 Conceptos de probabilidad y sus propiedades.
2.2 Axiomas de Probabilidad
2.3Técnicas de Conteo
2.4 Teorema de Bayes
N º de Exitos
p
N º de Posibilidades
Ejemplo 1:
Página 38 de 55
Si lanzamos tres monedas equilibradas cual es la probabilidad de obtener:
a) Dos caras y un sello en cualquier orden
b) Dos caras y un sello este orden estricto.
El numero de posibilidades (Espacio Muestral se designa con “S” ) es:
cara, cara, cara ; cara, cara, sello ; cara, sello , cara ; cara, sello , sello
S
sello , cara, cara ; sello , cara, sello ; sello , sello , cara ; sello , sello , sello
Como observamos existen ocho posibilidades Fermat consideraba que estos ocho
casos (sucesos) eran recíprocamente simétricos, o, en otras palabras, igualmente
posibles.
N º de Exitos 3
p 0.375 38%
N º de Posibilidades 8
Que se puede interpretar como: si realizamos el experimento cien veces en
aproximadamente 38 obtendremos alguno de estos resultados (dos caras y un
sello en cualquier orden).
N º de Exitos 1
p 0.125 13%
N º de Posibilidades 8
Ejemplo 2.
Página 39 de 55
1,1; 1,2; 1,3; 1,4; 1,5; 1,6
2,1; 2,2 ; 2,3; 2,4 ; 2,5; 2,6
3,1; 3,2; 3,3; 3,4 ; 3,5; 3,6
S
4,1; 4, 2 ; 4,3 ; 4, 4 ; 4,5 ; 4, 6
5,1; 5,2; 5,3; 5,4; 5,5; 5,6
6,1; 6,2; 6,3; 6,4; 6,5; 6,6
N º de Exitos 3
p 0.083 8%
N º de Posibilidades 36
Que se puede interpretar como: si realizamos el experimento cien veces en
aproximadamente 8 obtendremos este resultado.
N º de Exitos 6
p 0.16 17%
N º de Posibilidades 36
Es decir en 100 lanzamientos se obtienen aproximadamente 17 éxitos.
Página 40 de 55
2.1.2.1 Escala de Probabilidad
P A P A 1
P A 1 P A
N º de exitos 2
p 1
N º Posibilidades 2
Por otra parte si un suceso es imposible su probabilidad es cero, un ejemplo
análogo al anterior podría ser con la misma moneda obtener sello.
N º de exitos 0
p 0
N º Posibilidades 2
2.1.2.2 Reglas Aditivas
Si representamos por A y B dos sucesos que solamente uno de ellos puede ocurrir
en un solo ensayo, se dice que son mutuamente excluyentes, en otras palabras si
ocurre uno no puede suceder el otro. La probabilidad conjunta de que se den los
dos sucesos está dada por :
Página 41 de 55
A B
P A B P A P B
Si tenemos más sucesos se puede extender este concepto
Ejemplo 1:
AS 2-10 J,K,Q
Diamantes 1 9 3
Corazones 1 9 3
Picas 1 9 3
Tréboles 1 9 3
N=26 FR=18
Página 42 de 55
PN FR PN PFR
PN FR
26 18 44
0.846 85%
52 52 52
PN FR 1 PN FR
PN FR 1
44 8
0.154 15%
52 52
Ejemplo 2:
Si tenemos una caja con seis bolas rojas, cuatro negras y tres rojas si extraemos
una al azar, determinar la probabilidad de que sea negra o roja.
B=6 B=4
R=3
P N R P N P R
PN FR
4 3 7
0.538 54%
13 13 13
Si tenemos sucesos que comparten alguna característica o que no son
mutuamente excluyentes es decir cuando la posibilidad de que ocurra un suceso
no impide la ocurrencia del otro. En este caso la probabilidad de los dos sucesos
se determina asi:
Página 43 de 55
P A B P A P B P A B
Ejemplo :
PT A
13 4 1
52 52 52
PT A
16
0.308 31%
52
Ejemplo :
Página 44 de 55
PC As R
13 4 26 1 13 2 1
52 52 52 52 52 52 52
PC As R
28
0.538 54%
52
Sucesos Independientes
Dos sucesos son independientes si la probabilidad de presentación de uno no se
ve afectada por el otro, hay que anotar que el enlace en este tipo de sucesos es
“ i “ es decir que se den el uno y el otro, también hay que tener en cuenta que en
estos experimentos el muestreo se hace con reposición. El axioma es:
PN FR
26 3 78
* 0.0288 2.88%
52 52 2704
Página 45 de 55
P F F A P F * P F * P A
PN FR
12 12 4 576
* * 0,0040965 4,09 / 1000
52 52 52 140608
Ejemplo 3
Si tenemos una caja con seis bolas blancas cuatro negras y dos rojas al
extraer al azar tres de ellas con reposición (extraemos la primera anotamos
cual es y nuevamente vuelve a la caja para extraer la segunda) ¿la
probabilidad de obtener: una blanca , una no blanca y otra negra?
PN FR
6 6 4 144
* * 0,08333333 8%
12 12 12 1708
Ejemplo 4
Página 46 de 55
Sucesos Dependientes
Los sucesos se consideran dependientes si la probabilidad en un segundo suceso
se ve afectado por el primero y en el tercero por lo que haya sucedido en el
primero y el segundo. Es de anotar que en este tipo de experimentos el muestreo
se realiza sin reposición. El axioma es:
P A B C.......N P A * PB A* PC B A* * * *P N . * * * * * C B A
Que se lee: El primer suceso será el numero de éxitos sobre el espacio muestral ,
para el segundo suceso será la probabilidad del segundo dado que ya se evaluó la
probabilidad del primero y así sucesivamente.
Ejemplo 1
PN FR
26 3 78
* 0,02941176 2.9%
52 51 2652
Que fue un poco mayor que si el experimento fuera con reposición, aunque no se
puede afirmar que en sucesos dependientes necesariamente la probabilidad es
mayor.
Ejemplo 2
PN FR
12 11 4 528
* * 0,0039819 3,98 / 1000
52 51 50 132600
Que fue un poco menor que si el experimento fuera con reposición, lo que
comprueba que no se puede afirmar que en experimentos con reposición la
probabilidad sea mayor o menor , es necesario evaluarla en cada caso.
Página 47 de 55
Ejemplo 3
Si tenemos una caja con seis bolas blancas cuatro negras y dos rojas al
extraer al azar cuatro de ellas sin reposición ¿la probabilidad de obtener: una
blanca , una no blanca , una negra y otra roja?
Probabilidad Condicional
P A B
P B A
P A
Ejemplo:
Supongamos que se realizo una encuesta donde se les pregunto a hombres y
mujeres sobre su situación de empleo obteniéndose:
Una de estas personas se seleccionara al azar para que realizar un viaje con
todos los gastos pagos.
Página 48 de 55
Si llamamos el evento elegir hombre dado que tiene empleo
PH E
490
0,75384615 75%
650
A partir del espacio muestral podemos deducir la probabilidad que tenga empleo.
P E
650
0,67708333 68%
960
Y de la misma manera la probabilidad de que en todo el grupo sea elegido un
hombre empleado
P E H
490
0,51041667 51%
960
Al aplicar probabilidad condicional
490
PE H 960 490
PH E 0.75384615 75%
P E 650 650
960
2.3 Técnicas de Conteo
Uno de los principales retos de la estadística es establecer el tamaño del
espacio muestral de los sucesos en un experimento, como también el número
de veces que ocurrirá un evento de una forma rápida. En este aparte se
trabajaran las técnicas para contar sucesos.
Ejemplo 1
Una persona desea construir su casa, para lo cual considera que puede
construir los cimientos de su casa de cualquiera de dos maneras (concreto o
block de cemento), mientras que las paredes las puede hacer de adobe, o
ladrillo y el techo puede ser de concreto o lámina galvanizada ¿cuántas
maneras tiene esta persona de construir su casa?
Página 49 de 55
Concreto, adobe, Concreto ; Concreto, Ladrillo, Concreto
Concreto, Ladrillo, La min a Galvanizada ; Concreto, adobe, La min a Galvanizada
S
Block Cemento, adobe , Concreto ; Block Cemento, Ladrillo, Concreto
Block Cemento, Ladrillo, La min a Galvanizada ; Block Cemento, adobe, La min a Galvanizada
Tamaño S n1 * n 2 * n3
Donde
n1 : Cimientos
n 2 : Muros
n3 : Techo
Tamaño S 2 * 2 * 2 8
Ejemplo 2
Cuántas placas para automóvil pueden ser diseñadas si deben constar de tres
letras seguidas de cuatro números, si las letras deben ser tomadas del
abecedario español (26 Letras) y los números de entre los dígitos del 0 al 9?,
a. Si es posible repetir letras y números, b. No es posible repetir letras y
números, c. Cuántas de las placas diseñadas en el inciso b empiezan por la
letra D y empiezan por el cero
Página 50 de 55
Permutación simple
Se define como el número de arreglos posibles de un conjunto donde no se repiten los
elementos y no se puede replicar así mismo un evento , es de anotar que se cuenta el
orden de los elementos .
Formula
P n!
Donde
n= Numero de elementos
!= Factorial
Ejemplo 1
Si tenemos la siguiente palabra AMO de cuantas formas se pueden generar palabras (
sin sentido ortográfico) .
P=3! =1*2*3 =6
Ejemplo 2
¿De cuantas formas se pueden sentar a la mesa una familia de seis personas?
n= 6
P=6!=1*2*3*4*5*6=720
Formula
n!
n Pr1 , r2 , r3, .....rk
r1!*r2!*r3!*........... * rk !
Donde
n= Numero de elementos
r1,r2,r3,……rn = Repeticiones
!= Factorial
Ejemplo 1
Si tenemos la siguiente palabra AMA de cuantas formas se pueden generar palabras (
sin sentido ortográfico) .
Página 51 de 55
S AMA; AAM ; MAA
Son tres mediante la fórmula:
3! 1* 2 * 3
3P2 3
2! 1* 2
Ejemplo 2
Si tenemos la siguiente palabra CARRASQUIL LA de cuantas formas se pueden generar
palabras ( sin sentido ortográfico) . La letra A , se repite tres veces , la letra R, dos veces y
la L dos veces.
12! 479001600
12 P3 , 2 , 2 19´958.400
3!*2!*2! 6*2*2
Variación
Se define como una permutación donde de un conjunto con “n” elementos , se
selecciona un subconjunto “r” y se establece el numero de arreglos posibles.
Formula
n!
n Pr
n r !
Ejemplo 1
Si tenemos la siguiente palabra AMO de cuantas formas se pueden generar arreglos de
dos letras (sin sentido ortográfico).
3! 3!
3P 2 6
3 2! 1!
Ejemplo 2
En una urna que contiene 46 balotas numeradas se extraen 6 al azar ¿cuantos
resultados son posibles si me interesa el orden?.
n=46
r=6
46! 46! 5,5026E 57
46 P6 6.744´109. 680,00
46 6! 40! 8,1592E 47
Combinatoria
Página 52 de 55
Se define como el número posible de arreglos de un conjunto con “n” elementos ,
del cual se selecciona un subconjunto “r” sin contar el orden.
Formula
n!
nCr
r !n r !
Ejemplo 1
Si tenemos la siguiente palabra AMO de cuantas formas se pueden generar arreglos de
dos letras sin contar el orden y sin sentido ortográfico.
S AM ; OM ; AO
Son tres mediante la fórmula:
3! 3!
3C 2 3
2!3 2! 2!*1!
Ejemplo 2
En una urna que contiene 46 balotas numeradas se extraen 6 al azar ¿cuantos
resultados son posibles si no me interesa el orden?
n=46
r=6
46! 46! 5,5026E 57
46C 6 9´366.819
6!*46 6! 6!*40! 720 * 8,1592E 47
Página 53 de 55
PBR A
PBR A k
P B A
i 1
i
Ejemplo
Cierta fabrica de tornillos dispone de tres maquinas para su producción , la
proporción de tornillos por maquinas es : La maquina A el 35% , La maquina B
el 40% y La maquina C el 25% , debido a la calibración y vetustez algunos
tornillos resultan defectuosos, se han realizado conteos y se determino que el
porcentaje de tornillos defectuosos por maquina es: La maquina A el 5% , La
maquina B el 4% y La maquina C el 2% , toda la producción llega a un mismo
sitio, donde el encargado de control de calidad selecciona un tornillo al azar
que resulta ser defectuoso. ¿Cuál es la maquina donde está la mayor
probabilidad?
P(D)=0.05
P´(D)=0.95
P(A)=0.35
P(D)=0.04
P(B)=0.40
P´(D)=0.96
P(C)=0.25
P(D)=0.02
P´(D)=0.98
Página 54 de 55
Para la maquina B
PB D PB * PD 0.40 * 0.04 0,016
PB D PB * PD 0.40 * 0.96 0,384
0.40
Para la maquina C
PC D PB * PD 0.25 * 0.02 0,005
PC D PB * PD 0.25 * 0.98 0,245
0.25
P A D
PD A
P A D PB D PC D
PD A
0.0175
0,45454545 5 45%
0.0175 0.016 0.005
P B D
PD B
P A D PB D PC D
PD B
0.016
0,41558442 42%
0.0175 0.016 0.005
La probabilidad de que el tornillo defectuoso provenga de la maquina C es:
PC D
PD C
P A D PB D PC D
PD C
0.005
0,12987013 13%
0.0175 0.016 0.005
Por lo tanto la maquina donde existe más probabilidad de que provenga el tornillo
defectuoso es la Maquina A
Página 55 de 55