Professional Documents
Culture Documents
Para la elaboracin del presente ensayo, segu el temario conceptual de la materia que
se encuentra en la pagina de internet, sin embargo, con el objeto de no ser tan
especifico en los temas tratados, inclu algunos otros que encontr afines o
complementarios en los libros que consulte, por tal motivo, el ndice varia un poco del
antes sealado.
Tambin cabe sealar que los temas tratados en este ensayo, solo son los elementales
de esta materia, sin embargo, considero que son muy interesantes y afines en el campo
de la investigacin, tanto de la psicologa, como de cualquier otro campo.
INDICE.
Estadstica.
INTRODUCCION................................................................................................................... 1
5 MUESTREO ALEATORIO............................................................................................................. 36
Probabilidad
INTRODUCCIN................................................................................................................ 41
8 PROBABILIDADES Y POSIBILIDADES..............................................................................52
9 PROBABILIDAD CONDICIONAL........................................................................................ 57
10 TEOREMA DE BAYES........................................................................................................ 62
Bibliografa................................................................................................................86
Mtodos estadsticos 1
Introduccin.
Estadstica n. f. ,
1. Ciencia cuyo objeto es reunir una informacin cuantitativa
concerniente a individuos, grupos, series de hechos, etc., y deducir de
ella, gracias al anlisis de estos datos, unos significados precisos o
unas previsiones para el futuro.
2. Cuadro numrico de un hecho que se presta a la estadstica:
estadstica de natalidad.
EJEMPLO En la tabla 1.2 se presentan los lmites exactos de clase y los puntos
medios de clase de la distribucin de frecuencias de la tabla 1.1.
Para efectos de clculo, por lo general es deseable que todos los intervalos de
clase de una distribucin de frecuencias dada sean iguales. La siguiente frmula
puede emplearse para determinar el intervalo de clase aproximado por usar:
Mtodos estadsticos 4
Fig. 1-1
Mtodos estadsticos 5
Fig. 1-2
Fig. 1-3
Fig. 1-4
Fig. 1-5
Mtodos estadsticos 7
Fig.1-6
Mtodos estadsticos 8
5 y menor que 8
8 y menor que 11
Fig. 1-8
Una grfica de lneas contiene cantidades de series de tiempo unidas entre s por
segmentos lineales.
Mtodos estadsticos 12
Una medida de posicin es un valor calculado de un grupo de datos que sirve para
describir a stos de alguna manera. Lo comn es que nos interese que este valor
sea representativo de todos los valores del grupo, motivo por el cual es de desear
cierto tipo de promedio. En sentido estadstico, un promedio es una medida de la
tendencia - central de una serie de valores. Este captulo trata de los diversos
procedimientos estadsticos relativos a las medidas de posicin.
EJEMPLO Durante uno de los meses del verano, los ocho vendedores de una
empresa de servicios de calefaccin y 2 acondicionado vendieron el siguiente
Mtodos estadsticos 16
nmero de unidades centrales de aire acondicionado: 8, 11, 5, 14, 8, 11, 16, 11.
-Considerando ese mes como la poblacin estadstica de inters, el nmero medio
de unidades vendidas es
Nota: Para efectos de reporte, las medidas de posicin contienen por lo general un
dgito adicional al nivel original de medicin.
Pero como las ventas de los cuatro productos no son iguales, este promedio no
ponderado es incorrecto. Partiendo de los totales de ventas de la tabla 2.1, la
media ponderada describe correctamente el promedio global.
Mtodos estadsticos 17
2.4 MEDIANA
El valor de la mediana se halla entre el cuarto y quinto valores del grupo ordenado.
Dado que en este caso ambos valores son de " 11 ", la mediana es igual a 11.0.
2.5 MODA
Fig. 2-1
Consideremos ahora el uso de las tres medidas de posicin en relacin con datos
muestrales. El propsito de la inferencia estadstica con datos muestrales es
producir enunciados de probabilidad sobre la poblacin de la que fue seleccionada
la muestra. La moda no es una medida aceptable de posicin respecto de datos
muestrales, porque su valor puede variar ampliamente de una muestra a otra. La
mediana es mejor que la moda, porque su valor es ms estable entre muestra y
muestra. No obstante, el valor de la media es el ms estable de estas tres
medidas. La razn de la relativa estabilidad de la media muestral de una muestra
a otra es que se trata de la medida de posicin que satisface el criterio de mnimos
cuadrados. En consecuencia, la mejor medida de posicin en el caso de datos
muestrales es generalmente la media aritmtica.
EJEMPLO Se han recopilado los ndices salariales de los 650 empleados por
horade una empresa manufacturera. La medida ms representativa del ndice
salarial tpico es la mediana, porque en este caso est implicada una poblacin y
la mediana no se ve relativamente afectada por la posible falta de simetra de los
ndices salariales. Efectivamente, es probable que datos como ndices salariales y
montos de sueldos sean de asimetra positiva, con relativamente pocos montos
salariales o de sueldos excepcionalmente elevados y ubicados por lo tanto en la
cola derecha de la distribucin.
La posicin del primer cuartil se halla a medio camino entre el segundo y tercer
valores de la serie ordenada. Puesto que ambos valores son de 8, el valor del
primer cuartil es de 8.0. El valor del tercer cuartil se halla a medio camino entre el
sexto y sptimo valores de la serie, o a medio camino entre 11 y 14, lo que
equivale a 12.5.
Las medidas de tendencia central descritas en el captulo anterior son tiles para
la identificacin del valor "representativo" de un grupo de valores. Por su parte, las
medidas de variabilidad, o dispersin, se ocupan de la descripcin de la
variabilidad entre los valores. Se dispone de diversas tcnicas para medir el grado
de variabilidad en conjuntos d datos. Las que describiremos en este captulo son
el rango, los rangos modificados, la desviacin media, la varianza, la desviacin
estndar y el coeficiente de variacin.
3.2 RANGO
R = My - Mn
RIC = Q3 Q1,
Otros rangos modificados de uso comn son el 80% central, el 90% central y el
95% central.
Las "barreras externas" de la figura 3-1 se extienden a 3.0 unidades del rango
intercuartil en cada direccin a partir de Q1 Y Q3 o a -5.5 y 25.5 para las barreras
externas inferior y superior, respectivamente. Advirtase en este ejemplo que la
barrera externa inferior se halla para efectos prcticos en el valor de 0, ya que es
imposible que existan unidades negativas de ventas. Todos los valores ubicados
entre las barreras interna y externa se consideran datos anmalos moderados,
mientras que los valores localizados ms all de las barreras externas son datos
anmalos extremos. Para el caso de todos los datos anmalos, investigamos si
tales valores fueron recolectados en las mismas circunstancias que los dems
valores y si pudo ocurrir un error de medicin. Es evidente que nuestro reducido
grupo de ocho valores carece de datos anmalos, puesto que todos los valores de
ventas enlistados en el ejemplo anterior se hallan dentro de las barreras internas.
Fig. 3-1
Tabla 3.1 Hoja de trabajo para el clculo de la desviacin media de los datos de
venta (m = 10.5)
En general, es difcil interpretar el significado del valor de una varianza, porque las
unidades en las que se le expresa son valores elevados al cuadrado. Debido en
parte a esta razn, es ms frecuente el uso de la raz cuadrada de la varianza,
representada por la letra griega a (o por s en el caso de una muestra) y llamada
desviacin estndar. Las frmulas son:
Varianza de la poblacin:
Varianza de la muestra:
Fig. 3-2
Poblacin:
Muestra:
4 POBLACIONES Y MUESTRAS
A pesar de que somos libres de designar cualquier grupo de artculos como una
poblacin, lo que se hace en la prctica depende del contexto en el que se deben
considerar los artculos. Por ejemplo, suponga que se nos ofrece un lote de 400
losetas cermicas, que podemos comprar o no dependiendo de su dureza. Si
medimos el esfuerzo de ruptura de 20 de estas losetas para estimar la fuerza de
ruptura promedio de todas las piezas, estas 20 medidas son una muestra de la
poblacin que consiste del esfuerzo de ruptura de las 400 losetas. Sin embargo,
en otro contexto, si consideramos la celebracin de un contrato a largo plazo para
la entrega de decenas de miles de dichas losetas, observaramos los esfuerzos de
ruptura de las 400 piezas originales slo como muestra. De modo similar,
podemos observar como una poblacin o una muestra las cifras completas de un
ao reciente, considerando los intervalos entre las solicitudes y los mandatos de
las demandas de divorcio del Condado de San Diego. Si slo nos interesaran el
Mtodos estadsticos 35
Condado de San Diego y ese ao particular, observaramos los datos como una
poblacin; por otro lado, observaramos. los datos como una muestra si
deseramos generalizar el tiempo que se requiere para el mandato de divorcio en
todo Estados Unidos, en algn otro condado o en algn otro ao.
Como la hemos aplicado aqu, la palabra "muestra" tiene en gran medida el mismo
significado que en el lenguaje coloquial. Un peridico considera que las actitudes
de 150 lectores hacia una fianza escolar propuesta son una muestra de las
actitudes de todos sus lectores hacia la fianza. Un consumidor considera un
paquete de dulces Mrs. See como una muestra del producto de la empresa. Ms
tarde, debemos usar la palabra "muestra" slo para referirnos a datos que pueden
servir razonablemente como la base para generalizar acerca de las poblaciones
de su origen; en este sentido ms tcnico, muchos conjuntos de datos que por lo
regular se conocen como muestras no lo son en absoluto.
5 MUESTREO ALEATORIO
compuesto de silicio, ni para el nmero de veces que podemos tomar una muestra
de una poblacin finita y reemplazarla antes de tomar la siguiente.
Para presentar la idea del muestreo aleatorio de una poblacin finita, primero
veamos cuntas muestras diferentes de tamao n podemos tomar de una
poblacin finita de tamao N. Refirindonos a la regla para el nmero de
combinaciones de n objetos tomando r a la vez, encontramos que, con un cambio
de las letras,
La respuesta es
Mtodos estadsticos 37
Por fortuna, podemos tomar una muestra aleatoria de una poblacin finita sin
hacer una lista de todas las muestras posibles, que hemos mencionado aqu slo
para enfatizar el punto de que la seleccin de una muestra aleatoria debe
depender por completo del azar. En vez de hacer una lista de todas las muestras
posibles, podemos escribir cada uno de los N elementos de la poblacin finita en
una tira de papel y retirar n de stas a la vez sin reemplazo, asegurndonos de
que cada vez que retiremos otro papel todos los elementos restantes de la
poblacin tengan la misma posibilidad de ser seleccionados.
046 230 079 022 119 150 056 064 193 232 040 146
donde ignoramos los nmeros mayores que 247; si cualquier nmero se hubiera
repetido, tambin lo habramos ignorado. Los doce nmeros que tenemos aqu
son los nmeros asignados a las farmacias; las cifras de impuestos sobre las
ventas correspondientes constituyen la muestra aleatoria deseada.
El procedimiento que usamos en este ejemplo fue bastante sencillo, pero lo habra
sido ms si hubiramos tenido el software que deja la mayor parte del trabajo a
una computadora. Por ejemplo, la impresin de la figura 5.1 presenta una muestra
aleatoria generada por computadora de tamao n = 12 de la poblacin finita que
consta de los nmeros 1, 2, 3,..., 246 y 247. Los valores de la muestra son 197,
147, 82, 171, 60, 39, 51, 129, 71, 45, 86 y 224.
Mtodos estadsticos 39
Hasta ahora hemos analizado el muestreo aleatorio slo en relacin con las
poblaciones finitas. Para las poblaciones infinitas, decimos que
Para dar otro ejemplo de una muestra aleatoria de una poblacin infinita, suponga
que ocho estudiantes obtuvieron las siguientes lecturas del punto de ebullicin de
un compuesto de silicio: 136, 153, 170, 148, 157, 152, 143 y 150 grados Celsius.
De acuerdo con la definicin, estos valores constituyen una muestra aleatoria si
son valores de variables aleatorias independientes que tienen la misma
distribucin, digamos, la distribucin normal con m = 152 y o = 10. Para juzgar si
en realidad ste es el caso, tendramos que cerciorarnos, entre otras cosas, de
que las tcnicas de medida de los ocho estudiantes sean igualmente precisas (de
modo que sea la misma para cada una de las variables aleatorias), que no haya
colaboracin (que pueda hacer que las variables aleatorias sean dependientes) y
que no haya impurezas en las materias primas. En la prctica, no es fcil decidir si
un conjunto de datos se puede considerar como una muestra aleatoria.
Mtodos estadsticos 41
PROBABILIDAD
Introduccin.
En el estudio de la probabilidad hay tres tipos fundamentales de preguntas:
S = { 0, 1, 2, 3, 4, ... , 30, 31 }
S = { a, b, c, d, e, f, g, h }
(b) Trace una figura que demuestre los puntos correspondientes del
espacio muestral.
Mtodos estadsticos 43
Solucin
(a) Los seis resultados posibles son (0,0), (1,0), (0,1), (2, 0), (1, 1) y
(0, 2).
Solucin
(b) D es el evento de que el primer vendedor vender uno y slo uno de los
dos automviles.
Solucin
(c) Ya que G' contiene todos los elementos del espacio muestral
que no pertenecen a G, encontramos que
EJEMPLO Cules son los eventos que se representan mediante las zonas
sombreadas de los cuatro diagramas de Venn de la figura 6.2 si X es el evento de
que el seor Green es un ciudadano naturalizado y Y es el evento de que su
esposa es una ciudadana naturalizada?
Solucin
Cuando trabajamos con tres eventos, trazamos crculos como en la figura 6.3. En
este diagrama, los crculos dividen el espacio muestra en ocho zonas numeradas
de 1 a 8 y es sencillo determinar si los eventos correspondientes pertenecen a X o
X', a Y o Y' y a Z o Z'
(a) zona 3;
(b) zonas 1 y 2;
(c) zonas 4, 6, 7 y 8.
Solucin
Solucin
Solucin
8 PROBABILIDADES Y POSIBILIDADES
(a) 5/9 ;
(b) 0.85?
solucin
Solucin
Mtodos estadsticos 53
EJEMPLO Los registros demuestran que 1/12 de los camiones que se pesan en
cierto punto de revisin en Nevada transportan una carga excesiva. Son justas
estas posibilidades de apuesta si alguien ofrece apostar $40 contra $4 a que el
siguiente camin que se pese en este punto de revisin no tendr una carga
excesiva?
Solucin
Dado que Bob piensa que eljuego esjusto, est dispuesto a apostar
$25 a cualquier equipo para ganar $25.
Si Al y Bob en realidad analizan juntos el juego, quiz hagan una apuesta del
orden de $27 a $23. En este ejemplo, Al apostar $27 a los Magpies y Bob
apostar $23 a los Wildcats. Ambos piensan que es una buena apuesta. (Los
importes verdaderos en dlares dependen de la habilidad de negociacin. Los
importes de la apuesta bien podran ser de $29 a $2 l.)
Solucin
Solucin
o aproximadamente 0.64.
De este modo, tenemos el tercer postulado solo, -P(A B) = P(A) + P(B), para dos
eventos mutuamente excluyentes A y B cualesquiera que sean; y esta regla no se
satisface necesariamente cuando se aplica a las probabilidades subjetivas. De
hecho, los
Solucin