You are on page 1of 167

NOMBRE:

JAIRO HERNANDEZ GUTIERREZ



CARRERA:
ING. CIVIL

CATEDRATICO:
OSCAR GARIZURIETA CASTILLO


SEMESTRE:
2


1.1 Conjuntos, sus operaciones, leyes y su representacin.
DEFINICIN Y NOTACIN DE CONJUNTOS
El trmino conjunto juega un papel fundamental en el desarrollo de las
matemticas modernas;
Adems de proporcionar las bases para comprender con mayor claridad algunos
aspectos de la teora
de la probabilidad. Su origen se debe al matemtico alemn George Cantor (1845
1918).
Podemos definir de manera intuitiva a un conjunto, como una coleccin o listado
de objetos con
caractersticas bien definidas que lo hace pertenecer a un grupo determinado.
Para que exista un conjunto debe basarse en lo siguiente:
La coleccin de elementos debe estar bien definida.
Ningn elemento del conjunto se debe contar ms de una vez, generalmente,
estos elementos
deben ser diferentes, si uno de ellos se repite se contar slo una vez.
El orden en que se enumeran los elementos que carecen de importancia.
NOTACIN
A los conjuntos se les representa con letras maysculas A, B, C, ... y a los
elementos con letras
minsculas a, b, c, ..., por ejemplo, el conjunto A cuyos elementos son los
nmeros en el
lanzamiento de un dado.
A = { 1, 2, 3, 4, 5, 6 }
En base a la cantidad de elementos que tenga un conjunto, estos se pueden clasificar
en conjuntos finitos e infinitos.
FINITOS: Tienen un nmero conocido de elementos, es decir, se encuentran
determinados por su longitud o cantidad.
El conjunto de das de la semana
INFINITOS: Son aquellos en los cuales no podemos determinar su longitud.
El conjunto de los nmeros reales
Existen dos formas comunes de expresar un conjunto y la seleccin de una forma
particular d e expresin depende de la conveniencia y de ciertas circunstancias
siendo:
EXTENSIN: Cuando se describe a cada uno de los elementos.
A = {a, e, i, o, u}
Para describir si un elemento pertenece o no a un conjunto, se utiliza el smbolo de
pertenencia o es elemento de, con el smbolo , en caso contrario .
A = {1, 2, 3}
2 A; 5 A
TIPOS DE CONJUNTOS
CONJUNTO VACI O NULO: Es aquel que no tiene elementos y se simboliza por
o { }.
A = {x2 + 1 = 0 | x R}
El conjunto A, es un conjunto vaco por que no hay ningn nmero real que satisfaga a
x2+1 = 0
CONJUNTO UNIVERSAL: Es el conjunto de todos los elementos considerados en una
poblacin
o universo, en un problema en especial. No es nico, depende de la situacin, denotado
por U o .

RELACIONES ENTRE CONJUNTOS

IGUALDAD DE CONJUNTOS
Considerando el conjunto A y el conjunto B, si ambos tienen los mismos elementos, es
decir, si cada elemento que pertenece a A tambin pertenece a B y si cada
elemento que pertenece a B pertenece tambin a A.
A = B
SUBCONJUNTO
Si todo elemento de un conjunto A es tambin elemento de un conjunto B, entonces
se dice que A es un subconjunto de B. Representado por el smbolo .
A B o B A
SUBCONJUNTOS PROPIOS
Se dice que es un subconjunto propio de A s todos los elementos de un conjunto B se
encuentran
incluidos en l A, denotado por .
A B o B A
La familia de todos los subconjuntos de un conjunto se llama conjunto potencia. Si un
conjunto es finito con n elementos, entonces el conjunto potencia tendr 2n
subconjuntos.
A = {1, 2 }
El total de subconjuntos es:
22 = 4
{1,2}, {1}, {2}, { }
CONJUNTOS DISJUNTOS
Son aquellos que no tienen elementos en comn, es decir, cuando no existen elementos que
pertenezcan a ambos.
F = {1, 2, 3, 4, 5, 6}
G = {a, b, c, d, e, f}
PARTICIN
Cuando un conjunto es dividido en subconjuntos mutuamente excluyentes y exhaustivos,
se le denomina particin.
*OPERACIONES DE CONJUNTOS
-Unin.
-Interseccin.
-Diferencia.
-Complemento.
-Producto cartesiano.
UNIN DE CONJUNTOS. Sean A y B dos subconjuntos cualesquiera del conjunto
universal. La unin de A y B, expresada por A B, es el conjunto de todos los
elementos que pertenecen a A o pertenecen a B.
A B = {x | x A o x B}
DIFERENCIA DE CONJUNTOS O COMPLEMENTO RELATIVO. Sean A y B dos
conjuntos cualesquiera del conjunto universal. La diferencia o complemento relativo
de B con respecto a A, es
el conjunto de los elementos que pertenecen a A, pero no pertenecen a B.
A - B = {x | x A, x B}
Nota: A - B B - A
COMPLEMENTO ABSOLUTO O SIMPLEMENTE COMPLEMENTO. Sea A un
subconjunto cualesquiera del conjunto universal. El complemento de A es el
conjunto de elementos que perteneciendo al universo y no pertenecen al conjunto
A, denotado por A o Ac.
A = {x | x U, x A}
Nota: A = U - A
PRODUCTO CARTESIANO. Sean A y B dos conjuntos, el conjunto producto o
producto cartesiano expresado por A x B est formado por las parejas
ordenadas (a, b) donde a A y b B.
A x B = {(a, b) | a A y b B}
LEYES DE CONJUNTOS DE IDEMPOTENCIA
*A A = A A A = A
ASOCIATIVA
*(A B) C = A (B C )
*(A B) C = A (B C)
CONMUTATIVA
-A B = B A A B = B A
DISTRIBUTIVA
-A (B C) = (A B) (A C)
-A (B C) = (A B) (A C)
DE IDENTIDAD
*A U = U A U = A
*A = A A =
DE INVOLUCIN
-(A) = A
* DE COMPLEMENTO
A A = U A A =
U= = U

1.2 INTRODUCCIN A LA PROBABILIDAD
El concepto de probabilidad nace con el deseo del hombre de conocer con
certeza los eventos futuros. Es por ello que el estudio de probabilidades
surge como una herramienta utilizada por los nobles para ganar en los
juegos y pasatiempos de la poca. El desarrollo de estas herramientas fue
asignado a los matemticos de la corte.
Con el tiempo estas tcnicas matemticas se perfeccionaron y encontraron
otros usos muy diferentes para la que fueron creadas. Actualmente se
contino con el estudio de nuevas metodologas que permitan maximizar el
uso de la computacin en el estudio de las probabilidades disminuyendo,
de este modo, los mrgenes de error en los clculos.
A travs de la historia se han desarrollado tres enfoques conceptuales diferentes
para definir la probabilidad y determinar los valores de probabilidad


El enfoque clsico
Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z
posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son
igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo
tiempo), entonces la probabilidad de que ocurra A es:
El enfoque clsico de la probabilidad se basa en la suposicin de que cada resultado
sea igualmente posible.

1.2.1PROBABILIDAD DE EVENTOS ALEATORIOS
Un evento aleatorio se define como un fenmeno que en la realizacin
experimental su observacin ocurre o no ocurre.
Por ejemplo, la posicin de la molcula A en un determinado
instante se encuentre dentro del volumen ubicado al interior de la caja (Fig. 1.1).
Si la molcula A pudiese ser fotografiada, la fotografa obtenida determinar dos
posibles
resultados, que se encuentre al interior de , en cuyo caso consideramos que el evento
ha ocurrido, o que la molcula se encuentre fuera de , entonces el evento no ha
ocurrido.
Un experimento que determina la observacin de un evento aleatorio es llamado una
prueba.





Habitualmente, se entiende por probabilidad de un evento aleatorio como la razn entre
el nmero de pruebas m en que el evento ha ocurrido y el nmero totalMde pruebas, de tal
manera que Msea suficientemente grande. Si designamos la probabilidad de que el evento
A ocurra por W(A), tenemos que
W(A) = - m/M

o W(A) = lim m/M
M

Por qu se impone el requerimiento de que el nmero de pruebas M sea suficientemente
grande? Y cun grande debe ser? El hecho de que M debe ser grande es obvio
conforme a la precisin para determinar el valor de la probabilidad. Supongamos que
fotografiamos
la molcula en la caja y paramos despus de obtener la primera fotografa
mostrando a la molcula dentro de la regin . Si el nmero total de fotografas fue de
127, podra ser prematuro concluir que W(A) = 1/127.

De la primera forma, fotografamos la molcula en la caja consecutivamente en diferentes
instantes. No resulta difcil ver que que estos instantes deben estar separados en
intervalos de tiempo suficientemente grandes. Si una serie de fotografas es tomada a una
velocidadmuy alta, durante ese tiempo lamolcula no lograrmoverse a una distancia
considerable;
al evaluar la razn m/M sobre la base de tal serie, inevitablemente llegaremos
a un resultado impropio. Los intervalos de tiempo entre fotografas deben ser, por ejemplo,
de tal forma que la molcula tenga tiempo para viajar a cualquier punto de la caja.
Desde el punto de vista experimental, el criterio de eleccin del intervalo de tiempo entre
fotografas consiste en que en series repetidas de pruebas a intervalos ms grandes que el
original deben converger al mismo valor lmite m/M.
1.2.2. DIAGRAMAS DE RBOl
Un diagrama de rbol es una representacin grfica de un experimento que consta de r pasos,
donde cada uno de los pasos tiene un nmero finito de maneras de ser llevado a cabo
Ejemplos propuestos de diagrama de rbol.

1. Un mdico general clasifica a sus pacientes de acuerdo a su sexo (masculino o femenino),
tipos de sangre (A, B, AB u O) y en cuanto a la presin sangunea (normal, alta y baja).
Mediante un diagrama de rbol indique en cuantas clasificaciones pueden estar los pacientes
de este mdico. R = 24

2. Un hombre tiene tiempo de jugar ruleta cinco veces como mximo, l empieza a jugar con
un dlar, apuesta cada vez un dlar. El se va a retirar de jugar si: pierde todo su dinero, si gana
tres dlares (esto si completa un total de cuatro dlares), o si completa los cinco juegos.
Mediante un diagrama de rbol indique:
a) Cuntas maneras hay de que se efectu el juego de este hombre? R = 11
b) Cul es la probabilidad de que pierda todo su dinero? R = 0.3636
c) Cul es la probabilidad de que gane cuatro dlares? R = 0.2727
Sea el experimento de lanzar dos dados bien balanceados al aire una sola vez, mediante la
utilizacin de un diagrama de rbol, enliste todos los elementos que componen el espacio
muestral de este experimento. R = 36
3. Un millonario excntrico clasifica sus autos por marca, color y polarizado y sin polarizar.
Teniendo este Ferrari, Alfa Romeo, Porche, desea pintarlos en color rojo, gris, blanco, polarizarlos
o no, mediante un diagrama de rbol indique en cuantas formas pueden quedar sus autos.
R = 18

4. Una pareja planea tener tres hijos y desean saber la probabilidad de que los tres sean nios
en tres partos, mediante un diagrama de rbol obtenga la probabilidad correspondiente.
R = 0.125




Para la construccin de un diagrama en rbol se partir poniendo
una rama para cada una de las posibilidades, acompaada de su
probabilidad.
En el final de cada rama parcial se constituye a su vez, un nudo del
cual parten nuevas ramas, segn las posibilidades del siguiente
paso, salvo si el nudo representa un posible final del experimento
(nudo final).
Hay que tener en cuenta: que la suma de probabilidades de las
ramas de cada nudo ha de dar 1.

EJEMPLO:
1.2.3 PERMUTACIONES Y COMBINACIONES.
P E R M U T A C I O N E S
El nmero de permutaciones de n objetos es el nmero de formas en los que pueden
acomodarse esos objetos en trminos de orden.
Permutaciones En n Objetos
Permutaciones de n elementos tomando n a la vez es igual a:
nPn = n! = (n) x (n-1) x x (2) x (1)
Hay dos tipos de permutaciones:
Se permite repetir: como la cerradura de arriba, podra ser "333".
Sin repeticin: por ejemplo los tres primeros en una carrera. No puedes quedar primero y
segundo a la vez.
PERMUTACIONES CON REPETICIN
Son las ms fciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las permutaciones
posibles son:
n n ... (r veces) = n
r

(Porque hay n posibilidades para la primera eleccin, DESPUS hay n posibilidades para la
segunda eleccin, y as.)
Por ejemplo en la cerradura de arriba, hay 10 nmeros para elegir (0,1,...,9) y eliges 3 de ellos:
10 10 ... (3 veces) = 10
3
= 1000 permutaciones
As que la frmula es simplemente:
n
r
donde n es el nmero de cosas que puedes elegir, y eliges r de ellas
(Se puede repetir, el orden importa)





PERMUTACIONES SIN REPETICIN
En este caso, se reduce el nmero de opciones en cada paso.
Por ejemplo, cmo podras ordenar 16 bolas de billar?
Despus de elegir por ejemplo la "14" no puedes elegirla otra vez.
As que tu primera eleccin tiene 16 posibilidades, y tu siguiente eleccin tiene 15
posibilidades, despus 14, 13, etc. Y el total de permutaciones sera:

C O M B I N A C I O N E S
En el caso de las combinaciones, lo importante es el nmero de agrupaciones
diferentes de objetos que pueden incurrir sin importar su orden.
Por lo tanto en las combinaciones se busca el nmero se subgrupos diferentes
que pueden tomarse a partir de n objetos.

16 15 14 13 ... = 20,922,789,888,000
Pero a lo mejor no quieres elegirlas todas, slo 3 de ellas, as que sera solamente:
16 15 14 = 3360
Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.
Pero cmo lo escribimos matemticamente? Respuesta: usamos la "funcin factorial"
La funcin factorial (smbolo: !) significa que se multiplican nmeros descendentes.
Ejemplos:
4! = 4 3 2 1 = 24
7! = 7 6 5 4 3 2 1 = 5040
1! = 1
Nota: en general se est de acuerdo en que 0! = 1. Puede que parezca curioso que no
multiplicar ningn nmero d 1, pero ayuda a simplificar muchas ecuaciones.
As que si quieres elegir todas las bolas de billar las permutaciones seran:
16! = 20,922,789,888,000
Pero si slo quieres elegir 3, tienes que dejar de multiplicar despus de 14. Cmo lo
escribimos? Hay un buen truco... dividimos entre 13!...
16 15 14 13 12 ...
= 16 15 14 = 3360 13 12 ...
Lo ves? 16! / 13! = 16 15 14
La frmula se escribe:
donde n es el nmero de cosas que puedes elegir, y eliges r de ellas
(No se puede repetir, el orden importa)

COMBINACIONES CON REPETICIN
En realidad son las ms difciles de explicar, as que las dejamos para luego.
2. COMBINACIONES SIN REPETICIN
As funciona la lotera. Los nmeros se eligen de uno en uno, y si tienes los nmeros de
la suerte (da igual el orden) entonces has ganado!
La manera ms fcil de explicarlo es:
imaginemos que el orden s importa (permutaciones),
despus lo cambiamos para que el orden no importe.
Volviendo a las bolas de billar, digamos que queremos saber qu 3 bolas se eligieron,
no el orden.
Ya sabemos que 3 de 16 dan 3360 permutaciones.
Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.
Por ejemplo, digamos que se tomaron las bolas 1, 2 y 3. Las posibilidades son:
El orden importa El orden no importa
1 3 2 1 2 3
2 1 3
2 3 1
3 1 2
3 2 1
As que las permutaciones son 6 veces ms posibilidades.
De hecho hay una manera fcil de saber de cuntas maneras "1 2 3" se pueden
ordenar, y ya la sabemos. La respuesta es:
3! = 3 2 1 = 6
(Otro ejemplo: 4 cosas se pueden ordenar de 4! = 4 3 2 1 = 24 maneras distintas,
prueba t mismo!)
As que slo tenemos que ajustar nuestra frmula de permutaciones para reducir por
las maneras de ordenar los objetos elegidos (porque no nos interesa ordenarlos):

EJEMPLO:
1.2.4. Espacio muestral y eventos

El uso de conjuntos representados por diagramas de Venn, facilita la
compresin de espacio muestral y evento, ya que el espacio muestral S, se
puede equiparar con el conjunto universo, debido a que S contiene la
totalidad de los resultados posibles de un experimento, mientras que los
eventos E contienen solo un conjunto de resultados posibles del
experimento, mientras que los puntos muestrales se equiparan con los
elementos.
Vamos a suponer que el experimento que se realiza es el lanzamiento de
un dado y queremos conocer cul es la probabilidad de que caiga un 3 o
un 5? Si S contiene la totalidad de los resultados posibles, entonces S = {1, 2,
3, 4, 5, 6} puesto que el dado tiene 6 caras y si buscamos la probabilidad P
de que caiga 3 o 5, esto constituye un evento entonces, E = {3, 5}.
El espacio muestral S, est representado por un rectngulo, este contiene eventos E
representados a travs de crculos y puntos muestrales. Dado que en E existen dos
elementos y en S seis, la probabilidad P de que ocurra E es 2 de 6 y se obtiene al dividir el
nmero de elementos en E sobre el nmero de elementos en S.
Espacio Muestral.- Se llama espacio muestral (E) asociado a un experimento aleatorio, el
conjunto de todos los resultados posibles de dicho experimento. Al lanzar una moneda, el
espacio muestral es E = {sale cara, sale sello} E = {c, s}.
Al lanzar un dado de seis caras, el espacio muestral es E = {sale 1, sale 2, sale 3, sale 4,
sale 5, sale 6} E = {1, 2, 3, 4, 5, 6}
Al lanzar dos monedas, el espacio muestral es E = (c,c), (c,s), (s,c), (s,s).

Por ejemplo, cuando se toma una carta de un mazo normal de 52 cartas, una
posibilidad del espacio de muestreo podra ser el nmero (del as al rey), mientras
que otra posibilidad sera el palo (diamantes, trboles, corazones y picas). Una
descripcin completa de los resultados, sin embargo, especificara ambos
valores, nmero y palo, y se podra construir un espacio de muestreo que
describiese cada carta individual como el producto cartesiano de los dos
espacios de muestreo descritos.
Los espacios de muestreo aparecen de forma natural en una aproximacin
elemental a la probabilidad, pero son tambin importantes en espacios de
probabilidad. Un espacio de probabilidad (, F, P) incorpora un espacio de
muestreo de resultados, , pero define un conjunto de sucesos de inters, la -
lgebra F, por la cul se define la medida de probabilidad P.
Podemos diferenciar entre dos tipos de espacios muestrales: discretos y
continuos.
Discretos
Son aquellos espacios donde el nmero de sucesos elementales es finito o infinito
numerable.
En la teora de probabilidades se llama espacio muestral o espacio de muestreo
al conjunto de todos los posibles resultados individuales de un experimento
aleatorio.
Por ejemplo, si el experimento consiste en lanzar dos monedas, el espacio de
muestreo es el conjunto {(cara, cara), (cara, cruz), (cruz, cara) y (cruz, cruz)}. Un
evento o suceso es cualquier subconjunto del espacio muestral, llamndose a los
sucesos que contengan un nico elemento sucesos elementales. En el ejemplo,
el suceso "sacar cara en el primer lanzamiento", o {(cara, cara), (cara, cruz)},
estara formado por los sucesos elementales {(cara, cara)} y {(cara, cruz)}.

Para algunos tipos de experimento puede haber dos o ms espacios de muestreo
posibles. Por ejemplo, cuando se toma una carta de un mazo normal de 52 cartas, una
posibilidad del espacio de muestreo podra ser el nmero (del as al rey), mientras que
otra posibilidad sera el palo (diamantes, trboles, corazones y picas). Una descripcin
completa de los resultados, sin embargo, especificara ambos valores, nmero y palo, y
se podra construir un espacio de muestreo que describiese cada carta individual como
el producto cartesiano de los dos espacios de muestreo descritos.
Los espacios de muestreo aparecen de forma natural en una aproximacin elemental a
la probabilidad, pero son tambin importantes en espacios de probabilidad. Un espacio
de probabilidad (, F, P) incorpora un espacio de muestreo de resultados, , pero define
un conjunto de sucesos de inters, la -lgebra F, por la cul se define la medida de
probabilidad P.
Podemos diferenciar entre dos tipos de espacios muestrales: discretos y continuos.
Discretos
Son aquellos espacios donde el nmero de sucesos elementales es finito o infinito
numerable.
Espacio Probabilstico discreto
Es aquel cuyo espacio muestral es discreto.Podemos diferenciar varios tipos de espacio
probabilstico discreto:
Espacio Probabilistico Discreto Equiprobable
Su espacio muestral es finito de tamao n.
La probabilidad de cualquier suceso elemental E es
, de aqu se deduce que para todo suceso A la probabilidad es
Espacio Probabilistico Finito
Su espacio muestral es discreto finito.
Hay al menos 2 sucesos elementales que cumplen.
Procesos Estocasticos Finitos Y Diagramas de rbol
Un proceso estocstico es una sucesin finita de experimentos aleatorios, cada uno de
ellos con un n finito de resultados posibles. Se representan con diagrama de rbol.

Ejemplo
Imaginemos que se lanzan una moneda y un dado
La probabilidad de un camino es la multiplicacion de sus probabilidades.
La probabilidad de sacar una cara y un tres ser ---->

La probabilidad de un suceso cualquiera es la suma de las probabilidades de los caminos
La probabilidad de sacar impar ser ---->


1.3. DEFINICIONES DE PROBABILIDAD.
Definicin 1. Dado un experimento aleatorio con un espacio de n sucesos elementales , la probabilidad
del suceso A, que designamos mediante P(A),es la razn entre la cantidad de casos favorables para la
ocurrencia de A y la de casos posibles. En otros trminos P(A) = Na, n donde na es la cantidad de casos
favorables de A.

1.3.1. DEFINICIN CLSICA.
Esta definicin clsica de probabilidad fue una de las primeras que se dieron (1900) y se
atribuye a Laplace; tambin se conoce con el nombre de probabilidad a priori pues,
para calcularla, es necesario conocer, antes de realizar el experimento aleatorio, el
espacio muestral y el nmero de resultados o sucesos elementales que entran a formar
parte del suceso.

La aplicacin de la definicion clsica de probabilidad puede presentar dificultades
de aplicacin cuando el espacio muestral es infinito o cuando los posibles
resultados de un experimento no son equiprobables. Ej: En un proceso de
fabricacin de piezas puede haber algunas defectuosas y si queremos
determinar la probabilidad de que una pieza sea defectuosa no podemos
utilizar la definicin clsica pues necesitaramos conocer previamente el
resultado del proceso de fabricacin.
Para resolver estos casos, se hace una extensin de la definicin de
probabilidad, de manera que se pueda aplicar con menos restricciones,
llegando as a la definicin frecuentista de probabilidad.

Definicin Frecuentista de la Probabilidad

La definicin frecuentista consiste en definir la probabilidad como el lmite
cuando n tiende a infinito de la proporcin o frecuencia relativa del suceso.

Es imposible llegar a este lmite, ya que no podemos repetir el experimiento un
nmero infinito de veces, pero si podemos repetirlo muchas veces y observar
como las frecuencias relativas tienden a estabilizarse.

Esta definicin frecuentista de la probabilidad se llama tambin probabilidad a
posteriori ya que slo podemos dar la probabilidad de un suceso despus de
repetir y observar un gran nmero de veces el experimento aleatorio
correspondiente. Algunos autores las llaman probabilidades tericas.



Definicin Subjetiva de la Probabilidad

Tanto la definicin clsica como la frecuentista se basan en las
repeticiones del experimento aleatorio; pero existen muchos
experimentos que no se pueden repetir bajo las mismas
condiciones y por tanto no puede aplicarse la interpretacin
objetiva de la probabilidad.
En esos casos es necesario acudir a un punto de vista
alternativo, que no dependa de las repeticiones, sino que
considere la probabilidad como un concepto subjetivo que
exprese el grado de creencia o confianza individual sobre la
posibilidad de que el suceso ocurra.
Se trata por tanto de un juicio personal o individual y es posible
por tanto que, diferentes observadores tengan distintos grados
de creencia sobre los posibles resultados, igualmente vlidos.


Definicin Axiomtica de la Probabilidad

La definicin axiomtica de la probabilidad es quizs la ms simple de
todas las definiciones y la menos controvertida ya que est basada en
un conjunto de axiomas que establecen los requisitos mnimos para dar
una definicin de probabilidad.

La ventaja de esta definicin es que permite un desarrollo riguroso y
matemtico de la probabilidad. Fue introducida por A. N. Kolmogorov y
aceptada por estadsticos y matemticos en general.

1.3.2. Con base en la frecuencia relativa.
Los conceptos de frecuencia absoluta y relativa de un suceso y las propiedades de
las frecuencias relativas tienen una gran importancia como base para el estudio de
la probabilidad y la estadstica por tres motivos, ntimamente relacionados:
Las propiedades de las frecuencias relativas, que pueden observarse empricamente,
son la base de la definicin axiomtica de la probabilidad, ya que los axiomas son
abstracciones de estas propiedades. El clculo de probabilidades que se deriva de
estos axiomas no determina el contenido especfico del trmino probabilidad en
cada aplicacin particular, sino que su funcin principal es descubrir, a partir de
ciertas probabilidades iniciales dadas, otras probabilidades implicadas por ellas. Sin
embargo, los axiomas pueden usarse para definir implcitamente lo que es la
probabilidad, limitando as las posibles interpretaciones de este trmino. Adems,
dichos axiomas han contribuido a establecer una base satisfactoria del Clculo de
Probabilidades, dando respuestas a las paradojas e inconsistencias observadas con
anterioridad.
La idea de frecuencia relativa es la base de la concepcin frecuencial de la
probabilidad y sirve de puente entre la estadstica y la probabilidad. La inferencia
estadstica tiene como fin principal la obtencin de conclusiones sobre poblaciones
a partir de datos obtenidos de muestras de las mismas. Gran parte de los
procedimientos estadsticos estn basados en hiptesis sobre las distribuciones de
probabilidad de las poblaciones subyacentes y su aplicacin requiere la estimacin
del valor particular de los parmetros de dichas distribuciones en los casos
particulares. Es precisamente la acepcin frecuencial de la probabilidad la que
permite justificar esta estimacin.


1.Los teoremas de lmite, de tanta importancia en el Clculo de Probabilidades, estn basados en admitir
la posibilidad de repeticin de un experimento y en las frecuencias relativas o en la distribucin de
frecuencias. Estos teoremas permiten precisar la idea de convergencia estocstica y proporcionan
aproximaciones para distribuciones de probabilidad que de otro modo seran difciles de calcular. Ms
recientemente, los teoremas de lmite, combinados con las posibilidades informticas, proporcionan una
base para la utilizacin de la simulacin como mtodo de resolucin de problemas probabilsticos
complejos.
En Batanero y Serrano (1995) hemos analizado cmo el concepto de aleatoriedad lleva implcitas dos
ideas matemticas: repetibilidad de un experimento aleatorio e independencia de los ensayos sucesivos.
En el estudio de las frecuencias relativas se encuentran implcitas estas dos exigencias, por lo que su
comprensin precisa la de experimento aleatorio. Este ha sido tambin un aspecto analizado en los libros
de texto, cuyos resultados han sido publicados en Ortiz de Haro (1995) y Ortiz de Haro y cols. (1996).
Otro punto importante es el desarrollo del razonamiento proporcional en el alumno, puesto que la
frecuencia relativa se define precisamente mediante una proporcin.
Respecto al estudio de las frecuencias relativas y sus propiedades. Malara (1989) seala los siguientes
objetivos que deberan contemplarse para el nivel no universitario:
Conocimiento del hecho de que puede observarse empricamente una estabilizacin gradual de las
frecuencias relativas en series de ensayos suficientemente largas. Esto se observa en datos socio-
econmicos, biolgicos, atmosfricos, mdicos, etc. que pueden obtenerse en distintos anuarios
estadsticos
En consecuencia, consideramos que este tema es lo suficientemente fundamental, para que sea
deseable su anlisis en los libros de texto. En primer lugar hemos diferenciado el tipo de tratamiento que
en los textos se da a este tema, pudindose encontrar explcito, implcito o no tratarse. Hemos hallado un
tratamiento explcito en [A], [C], [D], [F], [G], [I] y [K] y un tratamiento implcito en [B], [E] y [H]. En [J] no se
trata este tema.
Significados personales e institucionales de los objetos matemticos
1.3.3. AXIOMTICA.
Un axioma es una premisa que se considera evidente y es aceptada sin requerir
una demostracin previa. En un sistema hipottico-deductivo, es toda
proposicin que no se deduce de otras, sino que constituye una regla general de
pensamiento lgico, por oposicin a los postulados.
[1]

En matemtica, un axioma es una premisa que, por considerarse evidente, se
acepta sin demostracin, como punto de partida para demostrar otras frmulas.
Tradicionalmente, los axiomas se eligen de entre las consideradas verdades
evidentes porque permiten deducir las dems frmulas.
En lgica matemtica, un postulado es un proposicin, no necesariamente
evidente: una frmula bien formada de un lenguaje formal utilizada en una
deduccin para llegar a una conclusin.
En matemtica se distinguen dos tipos de proposiciones: axiomas lgicos y
postulados.
Los axiomas son ciertas frmulas en un lenguaje que son universalmente vlidas,
esto es, frmulas que son satisfechas por cualquier estructura y por cualquier
funcin variable. En trminos coloquiales, son enunciados que son verdaderos en
cualquier mundo posible, bajo cualquier interpretacin posible y con cualquier
asignacin de valores. Usualmente se toma como axiomas un conjunto mnimo
de tautologas que son suficientes para probar una teora.
Axiomtica
Conjunto de proposiciones deducidas lgicamente de algunos principios no
demostrables, y que, segn algunos, puede fundar el anlisis geogrfico. Varios
tipos de aximtica han sido propuestos:
una axiomtica geomtrica, que define al espacio geogrfico como un
conjunto de lugares localizables por coordenadas, separados por una distancia,
y provistos de atributos (Bguin, Thisse, 1979; ver tambin Bunge (1962);
una axiomtica gentica, introducida por G. Nicolas (axioma corolgico:
"puede ser geogrfico todo objeto que, en el sentido estadstico del trmino,
diferencia al espacio terrestre"; axioma de situacin: "puede ser geogrfico todo
objeto (material o inmaterial) en relacin espacial con un objeto situado (total o
parcialmente) en otro lugar de la superficie terrestre"; axioma de sucesin;
1.4. PROBABILIDAD CONDICIONAL E INDEPENDENCIA
Eventos independientes: dos eventos A y B son independientes sis la ocurrencia o no
ocurrencia afecta la probabilidad asignada a la ocurrencia del otro.
Algunas veces es sencillo determinar la independencia por ejemplo los dos eventos
considerados se refieren a ensayos no relacionados tales como el lanzamiento de dos
monedas de diferente denominacin en consecuencia los resultados con ambas monedas
son independientes. La falta de independencia o sea la dependencia es demostrada por la
siguiente ilustracin considrese el experimento donde se lanzan dos dados y se observa
los dos eventos la suma es igual a 10 y nmero doble que se establece P(10)=3/36=1/12,
P(doble)=6/36=1/6 la ocurrencia de 10 afecta la probabilidad de doble? Considrese esta
pregunta de la manera siguiente: a ocurrido una suma igual a 10 debe de ser uno de los
resultados siguientes [(4,6),(5,5),(6,4)] una de estas tres posibilidades es nmero doble.
En consecuencia debe concluirse que P (doble sabiendo que ha ocurrido un diez), escrita
P(doble/10), es igual a 1/3 ya que un tercio es distinta a la probabilidad de un doble puede
concluirse que el evento 10 afecta la probabilidad de un nmero doble as un doble y 10
son eventos dependientes. El smbolo P(A/B)=P(B/A)=PB.
Considrese la probabilidad condicional. Tmese, por ejemplo, el experimento donde se
lanza un dado: S=[1,2,3,4,5,6] en este experimento pueden definirse dos eventos como A
=ocurre un 4, y B=ocurre un nmero par. Entonces P(A)=1/6, el evento A se satisface
exactamente por uno de los seis mustrales igualmente probables en S. La probabilidad
condicional de A dado B, P(A/B), se encuentra de manera similar, pero S ya no es este
caso el espacio muestral. Esto puede verse de la manera siguiente: se lanza un dado sin
que se pueda ver, aunque recibe la informacin de que el nmero obtenido sea par, es
decir que ha ocurrido el evento B. Esta es la condicin dada, conocindola a uno se la pide
asignar la probabilidad del evento ocurre un 4. Slo haqy tres posibilidades en el nuevo
espacio muestral (reducido), [2,4,6]. Cada uno de los tres resultados es igualmente
probable: en consecuencia P(A B)=1/3.
1.5. TEOREMA DE BAYES
En la teora de la probabilidad el teorema de Bayes es un
resultado enunciado por Thomas Bayes en 1763
[1]
que expresa la
probabilidad condicional de un evento aleatorio A dado B en trminos
de la distribucin de probabilidad condicional del evento B dado A y la
distribucin de probabilidad marginal de slo A.
En trminos ms generales y menos matemticos, el teorema de Bayes
es de enorme relevancia puesto que vincula la probabilidad de A dado
B con la probabilidad de B dado A. Es decir que sabiendo la
probabilidad de tener un dolor de cabeza dado que se tiene gripe, se
podra saber -si se tiene algn dato ms-, la probabilidad de tener gripe
si se tiene un dolor de cabeza, muestra este sencillo ejemplo la alta
relevancia del teorema en cuestin para la ciencia en todas sus ramas,
puesto que tiene vinculacin ntima con la comprensin de la
probabilidad de aspectos causales dados los efectos observados.
Sea {A
1
,A
3
,...,A
i
,...,A
n
} un conjunto de sucesos mutuamente excluyentes
y exhaustivos, y tales que la probabilidad de cada uno de ellos es
distinta de cero. Sea B un suceso cualquiera del que se conocen las
probabilidades condicionales P(B | A
i
). Entonces, la probabilidad P(A
i
|
B) viene dada por la expresin:
donde:
P(A
i
) son las probabilidades a priori.
P(B | A
i
) es la probabilidad de B en la hiptesis A
i
.
P(A
i
| B) son las probabilidades a posteriori.

Frmula de Bayes



UNIDAD II

2. VARIABLES ALEATORIAS Y DISTRIBUCIONES


2.1VARIABLE ALEATORIA Y FUNCIONES DE DENSIDAD DE PROBABILIDAD Y DE DISTRIBUCIN
Conceptos bsicos
Una variable aleatoria es una funcin que cuantifica los resultados de un experimento
aleatorio. Una variable aleatoria discreta X slo puede asumir una cantidad de valores
susceptible de contarse. En estadstica la distribucin de probabilidad para una variable
aleatoria discreta X es una tabla, grfica o frmula que da la probabilidad P(X = x)
asociada a cada posible valor de X. Si consideremos el experimento de lanzar dos veces
una moneda balanceada y se observa el nmero X de caras. Calculemos la distribucin
de
probabilidad para X. Sean Ci y Si la observacin de una cara y un sello, respectivamente,
en el i simo lanzamiento, para i = 1, 2.
ESPACIO MUESTRAL. El conjunto de todos los resultados posibles de un experimento
estadstico
denotado por S o
VARIABLE. Se denomina variable a la entidad que puede tomar un valor
cualesquiera durante la
duracin de un proceso dado. Si la variable toma un solo valor durante el proceso
se llama constante.
VARIABLE ALEATORIA: Es una funcin que asocia un nmero real a cada elemento
del espacio muestral.
2.2. VALOR ESPERADO Y MOMENTOS.
Es decir son aquellas que pueden diferir de una respuesta a otra.
Una variable aleatoria se puede clasificar en:
Variable aleatoria discreta.
Variable aleatoria continua.
Variable aleatoria discreta. Una variable discreta proporciona datos
que son llamados datos
cuantitativos discretos y son respuestas numricas que resultan de
un proceso de conteo.
La cantidad de alumnos regulares en un grupo escolar.
El nmero de guilas en cinco lanzamientos de una moneda.
Nmero de circuitos en una computadora.
El nmero de vehculos vendidos en un da, en un lote de autos
Variable aleatoria continua. Es aquella que se encuentra dentro de
un intervalo comprendido entre dos
valores cualesquiera; sta puede asumir infinito nmero de valores y
stos se pueden medir.
La estatura de un alumno de un grupo escolar.
El peso en gramos de una moneda.
La edad de un hijo de familia.
Las dimensiones de un vehculo.



Segn las matemticas el valor esperado se define como la suma de los
productos de las probabilidades de los diferentes sucesos y sus respectivos
beneficios. Veamos un ejemplo prctico de ello.
Tenemos un dado, si lo tiramos y sacamos un numero par nos pagan $2, si tiramos
y sacamos 1 o 3, pagamos $3, si sale un 5 no pagamos ni nos pagan.
Como sabremos si bajo estas condiciones, jugar nos es rentable o no, para ello
utilizares el concepto de Valor Esperado.
Suceso A = {2,4,6}, suceso B = {1,3}, suceso C = {5}.
Probabilidad de que pase cada suceso: Sa {3/6}, Sb {2/6), Sc {1/6}, si
simplificamos nos queda Sa {1/2} Sb {1/3} Sc {1/6}.
Valor de Cada Suceso. Sa = +2 Sb = -3 Sc = 0, para que entienda este calculo
cuando ocurra el suceso A ganaremos $2 por eso es +2, cuando ocurra B
pagaremos $3 por lo cual nuestro valor esperado es -3, cuando ocurra C no
pagaremos ni ganaremos es igual a 0.
Valor Esperado para este juego: P
A
V
A
+ P
B
V
B
+ P
C
V
C
= 1/2 2 + 1/3 (-3) +
1/6 0 = 1 1 + 0 = 0
Esta claro que ante estas regla de juego no ganaremos ni perderemos. Esto no
quiere decir que de 20 tiros ganemos 15 y perdamos 5, lo que quiere decir que a
largo plazo nuestra ganancia o prdida media ser nula.
Pero bien llevemos este concepto al campo que nos compete, EL POKER. El valor
esperado es la ganancia/perdida media en una accin particular. Es decir el
beneficio que se espera obtener de una apuesta. Se abrevia mediante siglas en
Ingles EV, + cuando nuestra esperanza es positiva y cuando es negativa.
Nuestro objetivos como jugadores de poker es intentar que cada uno de nuestro
movimientos tenga EV +. Para ello debemos jugar concentrados y analizar cada
ronda de apuestas.

En principio un par de cartas no tiene ni buena ni mala EV, para arribar a esta
conclusin debemos evaluar el contexto en el que estamos jugando dicha
mano.
Bien veamos un ejemplo sencillo, AA Vs mano aleatoria en All-in pre-flop. Sabes
que el par de hacer gana el 85% de las veces contra manos al azar
aleatoriamente. Suponiendo que nosotros tenemos un stack de $50 y que nuestro
oponente tambin tiene $50 dlares, en el bote en ese momento hay $100 y
nosotros decidimos ir all in. Cual es nuestro valor esperado. Bien hagamos los
clculos.
Suceso A (85/100), suceso B (15/100), valor de cada suceso Sa ($150) Sb(-$50),
Valor Esperado para este juego: P
A
V
A
+ P
B
V
B
= 85/100 (150) + 15/100 (-50)
= $120
Por lo tanto tendremos una EV + de $120. En trminos generales cada vez que tu
ganes ganaras $150 y cuando pierdas perders $50, pero si repitiramos la
jugada un milln de veces, tu ganancia promedio se acercaran cada vez mas al
valor esperando. La representacin mas obvia de valor esperado es la teora de
los pot odds, que ya la eh explicado en un post anterior. Bsicamente los pot
odds nos ayudan a elegir las manos o proyectos que tienen un valor esperado
positivo.
Vemos otros ejemplos de valor esperado, recibimos AJ de pick, estamos en el
ciega pequea, ocho jugadores entran a al mano, el flop nos trae 2 5 8 (corazn,
pick, pick).
Distribucin de probabilidad. Es una distribucin terica de frecuencias que describe cmo se
espera que varen los resultados de un experimento. Existen diferentes tipos de modelos que
permiten describir el comportamiento de fenmenos estadsticos que permiten hacer
inferencias y
tomar decisiones en condiciones de incertidumbre.
Se pueden clasificar en:
Distribuciones discretas. Son aquellas donde las variables asumen un nmero limitado de
valores,
por ejemplo el nmero de aos de estudio.
Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir cualquier
valor dentro de determinados lmites; por ejemplo, la estatura de un estudiante.
Distribuciones
Continuas
x1 xn
x
P(x)
x1 x2 xn
x
P(x)
Discretas
Uniforme
Continuas
Exponencial
Normal
FUNCIONES DE PROBABILIDAD DISCRETAS
La distribucin de probabilidad para una variable aleatoria discreta
puede ser:
1.- Una relacin terica de resultados y probabilidades que se
puede obtener de un modelo
matemtico y que representa algn fenmeno de inters.
2.- Una relacin emprica de resultados y sus frecuencias relativas
observadas.
3.- Una relacin subjetiva de resultados relacionados con sus
probabilidades subjetivas o artificiales
que representan el grado de conviccin del encargado en tomar
decisiones sobre la probabilidad
de posibles resultados.
Sabemos que una variable aleatoria discreta o discontinua es
aquella en la que existe una distancia
bien definida entre dos de los valores consecutivos que asume; y
dichos valores son numerables.
Existen varios modelos matemticos que representan diversos
fenmenos discretos de la vida real.
Las ms tiles son:
1.- La distribucin uniforme discreta.
1.- La distribucin de probabilidad Binomial o de Bernoulli.
2.- La distribucin de probabilidad Hipergeomtrica.
3.- La distribucin de probabilidad de Poisson.
2.3 UNIFORME DISCRETA
Si la variable aleatoria X asume valores de X1, X2, ..., Xk con iguales
probabilidades, entonces la
distribucin uniforme es: f(x,k)= 1/ k
Tenemos esta distribucin cuando el resultado de una experiencia aleatoria
puede ser un conjunto finito de n posibles resultados, todos ellos igualmente
probables.
Un ejemplo puede ser la variable X, puntuacin en el lanzamiento de un
dado regular. Esta variable toma seis valores posibles, todos con la misma
probabilidad p = 1/6. La funcin de densidad de esta variable ser:
f(k) = P[X = k] = 1/6 k = 1, 2, 3, 4, 5, 6


2.3.1. BERNOULLI

Experimento de Bernoulli: solo son posibles dos resultados: xito o
fracaso. Podemos definir una variable aleatoria
discreta X tal que:
xito 1
fracaso 0
Si la probabilidad de xito es p y la de fracaso 1 - p,
podemos construir una funcin de probabilidad:
1 , 0 ) 1 ( ) (
1
= =

x p p x P
x x
Un tpico experimento de Bernoulli es el
lanzamiento de
una moneda con probabilidad p para cara y
(1-p) para
cruz.
Funcin de distribucin:
La distribucin de Bernuilli es el modelo que sigue un experimento que se realiza una sola
vez y que puede tener dos soluciones: acierto o fracaso:
Cuando es acierto la variable toma el valor 1
Cuando es fracaso la variable toma el valor 0
Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale);
p robabilidad de ser admitido en una universidad (o te admiten o no te admiten);
p robabilidad de acertar una quiniela (o aciertas o no aciertas)
Al haber nicamente dos soluciones se trata de sucesos complementarios:
A la probabilidad de xito se le denomina "p"
A la probabilidad de fracaso se le denomina "q"
Verificndose que:
p + q = 1
Veamos los ejemplos antes mencionados :
Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire:
Probabilidad de que salga cara: p = 0,5
Probabilidad de que no salga cara: q = 0,5
p + q = 0,5 + 0,5 = 1
Ejemplo 2: Probabilidad de ser admitido en la universidad:
Probabilidad de ser admitido: p = 0,25
Probabilidad de no ser admitido: q = 0,75
p + q = 0,25 + 0,75 = 1
Ejemplo 3: Probabilidad de acertar una quiniela:
Probabilidad de acertar: p = 0,00001
Probabilidad de no acertar: q = 0,99999
p + q = 0,00001 + 0,99999 = 1

=
=
=
1 para , 1
0 para , 1
) (
x
x p
x F
Ejercicio: Calcular la esperanza y la varianza
de la distribucin de Bernoulli.
p X P X P
x X P x X E
x
= = + =
= = = =

=
) 1 ( 1 ) 0 ( 0
) ( ] [
1
0

) 1 (
) 1 ( 1 ) 0 ( 0
) ( ]) [ ( ] [ ) (
2
2 2 2
1
0
2 2 2 2
p p p p
p X P X P
p x X P x X E X E X Var
x
=
= = + = =
= = =

=
2.3.2. BINOMIAL
La distribucin binomial aparece cuando estamos interesados en el nmero de veces que un suceso A
ocurre (xitos) en n intentos independientes de un experimento.

P. ej.: # de caras en n lanzamientos de una moneda.
Si A tiene probabilidad p (probabilidad de xito) en un intento, entonces 1-p es la probabilidad
de que A no ocurra (probabilidad de fracaso).


Experimento aleatorio: n = 3 lanzamientos de una moneda.
Probabilidad de xito en cada lanzamiento (cara) = p.
Probabilidad de fracaso en cada lanzamiento (cruz) = 1- p = q.
Supongamos que el experimento consta de n
intentos y definamos la variable aleatoria:

X = Nmero de veces que ocurre A.

En nuestro ejemplo: X = Nmero de veces que sale cara.

Entonces X puede tomar los valores 0, 1, 2, ... N

Si consideramos uno de estos valores, digamos el valor x , i.e. en x de los n intentos ocurre A
y en n - x no. Entonces la probabilidad de cada posible ordenacin es p
x
q
n-x
y existen
idnticas ordenaciones.

La funcin de probabilidad P(X = x) ser
la distribucin binomial:

x n x x n x
p p
x n x
n
p p
x
n
x p p n B

=
|
|
.
|

\
|
= = ) 1 (
)! ( !
!
) 1 ( ) ( ) , (
Distribucin binomial para n = 5 y
distintos valores de p, B(5, p)
Ejercicio:
Cul es la probabilidad de que en una familia de 4 hijos exactamente 2 sean nias?
2 4 2
5 0 1 5 0
2
4
2
2 4 5 0
1
-
x n x
) . - ( ) . ( ) p(
x ; n ; . p
p) ( p
x
n
p(x)
|
|
.
|

\
|
=
= = =

|
|
.
|

\
|
=

Caractersticas de la distribucin binomial


Media
= E(X) = n p
= 5 0.1 = 0.5
= 5 0.5 = 0.25
n = 5 p = 0.1
0
.2
.4
.6
0 1 2 3 4 5
X
P(X)
Desviacin estndar
1 . 1 ) 5 . 0 1 ( 5 . 0 5
67 . 0 ) 1 . 0 1 ( 1 . 0 5
) 1 (
= =
= =
=
o
o
o p np
n = 5 p = 0.5
.2
.4
.6
0 1 2 3 4 5
X
P(X)
0
2.3.3. POISSON.
Las distribucin de Poisson parte de la distribucin binomial:
Cuando en una distribucin binomial se realiza el experimento un nmero "n"
muy elevado de veces y la probabilidad de xito "p" en cada ensayo es
reducida, entonces se aplica el modelo de distribucin de Poisson:
Se tiene que cumplir que:
" p " < 0,10
" p * n " < 10
La distribucin de Poisson sigue el siguiente modelo:
Vamos a explicarla:
El nmero "e" es 2,71828
" l " = n * p (es decir, el nmero de veces " n " que se realiza el experimento
multiplicado por la probabilidad " p " de xito en cada ensayo)
" k " es el nmero de xito cuya probabilidad se est calculando
Veamos un ejemplo:
La probabilidad de tener un accidente de trfico es de 0,02 cada vez que
se viaja, si se realizan 300 viajes, cual es la probabilidad de tener 3
accidentes?
Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor
que 10, entonces aplicamos el modelo de distribucin de Poisson.
Luego,
P (x = 3) = 0,0892
Por lo tanto, la probabilidad de tener 3 accidentes de trfico en 300 viajes
es del 8,9%


Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de
rea, tiempo, pieza, etc, etc,:
- # de defectos de una tela por m
2

- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc, etc.
- # de bacterias por cm
2
de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo,
rea, o producto, la frmula a utilizar sera:

donde:
p(x, ) = probabilidad de que ocurran x xitos, cuando el nmero promedio de
ocurrencia de ellos es
= media o promedio de xitos por unidad de tiempo, rea o producto
c = 2.718
x = variable que nos denota el nmero de xitos que se desea que ocurra

Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren
por unidad de tiempo, rea o producto es totalmente al azar y que cada
intervalo de tiempo es independiente de otro intervalo dado, as como cada
rea es independiente de otra rea dada y cada producto es independiente de
otro producto dado.


2.3.4 GEOMETRIA
La distribucin geomtrica es un modelo adecuado para aquellos procesos en los que se
repiten pruebas hasta la consecucin del xito a resultado deseado y tiene
interesantes aplicaciones en los muestreos realizados de esta manera . Tambin implica
la existencia de una dicotoma de posibles resultados y la independencia de las
pruebas entre s.
Proceso experimental del que se puede hacer derivar
Esta distribucin se puede hacer derivar de un proceso experimental puro o de Bernouilli en
el que tengamos las siguientes caractersticas
El proceso consta de un nmero no definido de pruebas o experimentos separados o
separables. El proceso concluir cuando se obtenga por primera vez el resultado
deseado (xito).
Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A
La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un
resultado no A es q
siendo (p + q = 1).
Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las pruebas ,son
independientes (si se trata de un proceso de "extraccin" ste se llevar a , cabo con
devolucin del individuo extrado) .
(Derivacin de la distribucin). Si en estas circunstancias aleatorizamos de forma que
tomemos como variable aleatoria X = el nmero de pruebas necesarias para obtener
por primera vez un xito o resultado A , esta variable se distribuir con una distribucin
geomtrica de parmetro p.


Obtencin de la funcin de cuanta
De lo dicho anteriormente , tendremos que la variable X es el nmero de pruebas
necesarias para la consecucin del primer xito. De esta forma la variables aleatoria toma
valores enteros a partir del uno ; 1,2,

dado que se trata de sucesos independientes y
conocemos las probabilidades
luego la funcin de cuanta quedara
2.4. DISTRIBUCIONES CONTINUAS.
Saber: Definir el concepto de distribucin continua de
probabilidad, Explica el mtodo de clculo de varianza y
valor esperado de una probabilidad con variables continuas.
Describir las propiedades de:
- Distribucin normal
- Chi cuadrada
- t de Student.
- Distribucin F.
Hacer: Calcular la probabilidad y varianza de una
distribucin continua utilizando tablas.
Distribucin normal
La distribucin normal de probabilidad es una distribucin continua y su
mayor aplicacin se relaciona en investigaciones, donde se utilizan
muestras que se interesa analizar probabilidades, referentes al peso,.
estatura, ingresos, gastos Algunas observaciones o puntos a considerar
en esta distribucin pudieran ser las siguientes:
1. Hay diferentes formas y tamaos de las distribuciones pero todas
se distinguen por tener media y desviacin estndar.
2. El punto ms alto de la campana o curva normal es la media.
3. La media puede tomar cualquier valor positivo, cero o negativo.
4. La distribucin es simtrica, esto quiere decir que lo que hay a la
derecha de la media es una imagen de lo que hay a la izquierda.
5. La desviacin estndar determina el ancho de la curva. Cuando la
desviacin es mayor se tienen curvas ms amplias y achaparradas,
y cuando la desviacin es menor son ms altas y delgadas.
6. El rea bajo la curva es igual a la probabilidad y siempre es igual a
La distribucin normal es continua en vez de discreta. La media de una
variable aleatoria normal puede tener cualquier valor y la varianza
cualquier valor positivo. La funcin de densidad de probabilidad de una
variable aleatoria normal con media y varianza 2 est dada por
Donde:

x = Variable aleatoria continua que se desea investigar.
= Promedio poblacional que toma la variable aleatoria continua.
= Desviacin estndar poblacional.
La relacin de la campana de gauss con la media y la desviacin estndar
est indicada en la siguiente grfica:
Funcin de densidad de probabilidad de una variable aleatoria normal con
media y varianza
2.El eje horizontal se conoce con la variable z y es una variable
Funcin de densidad de probabilidad de una variable aleatoria normal con
media y varianza
2.El eje horizontal se conoce con la variable z y es una variable
normalizada o estandarizada.
Ejemplo 1. El gerente de produccin de una fbrica de telas tiene como
estndar que la merma de la tela sea en promedio 300 metros y se sabe que
la desviacin estndar normalmente se encuentra en 50 metros.
En caso de que la merma de la fbrica llegara a 362 metros ese valor sera
inaceptable para los dueos del negocio, determine que tan probable es que
esto llegue a ocurrir.

2.4.1. UNIFORME
La distribucin Uniforme es el modelo (absolutamente) continuo ms
simple. Corresponde al caso de una variable aleatoria que slo puede
tomar valores comprendidos entre dos extremos a y b, de manera que
todos los intervalos de una misma longitud (dentro de (a, b)) tienen la
misma probabilidad. Tambin puede expresarse como el modelo
probabilstico correspondiente a tomar un nmero al azar dentro de un
intervalo (a, b).
De la anterior definicin se desprende que la funcin de densidad debe
tomar el mismo valor para todos los puntos dentro del intervalo (a, b) (y
cero fuera del intervalo). Es decir,

Grficamente:
La funcin de distribucin se obtiene integrando la funcin
de densidad.
Grficamente:
La distribucin exponencial es el equivalente continuo de la distribucin geomtrica
discreta. Esta ley de distribucin describe procesos en los que:
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en
un instante t
f
, no depende del tiempo transcurrido anteriormente en el que no ha
pasado nada.
Ejemplos de este tipo de distribuciones son:
El tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento de la ley
que sigue este evento se utiliza en Ciencia para, por ejemplo, la datacin de fsiles o
cualquier materia orgnica mediante la tcnica del carbono 14, C
14
;
El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un
paciente;
En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de
tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos
consecutivos sigue un modelo probabilstico exponencial. Por ejemplo, el tiempo que
transcurre entre que sufrimos dos veces una herida importante.
Concretando, si una v.a. continua X distribuida a lo largo de , es tal que su funcin de
densidad es

El trmino crecimiento exponencial se aplica generalmente a una
magnitud M tal que su variacin en el tiempo es proporcional a su valor,
lo cual implica que crece muy rpidamente en el tiempo de acuerdo
con la ecuacin:
Donde:
M
t
es valor de la magnitud en el instante t > 0;
M
0
es el valor inicial de la variable, valor en t = 0, cuando empezamos a
medirla;
r es la llamada tasa de crecimiento instantnea, tasa media de
crecimiento durante el lapso transcurrido entre t = 0 y t > 0;

e = 2,718281828459...
El nombre naturalmente se refiere al crecimiento de una funcin exponencial de la
forma y = a
x
con r = ln(a). Se puede ilustrar el crecimiento exponencial tomando en
la ltima ecuacin a = 2 y x un valor entero. Por ejemplo, si x = 4, entonces y =
2x2x2x2 = 16. Si x = 10 entonces y = 1.024. Y as sucesivamente.
2.4.3 NORMAL Y NORMAL ESTNDAR
N(0, 1)
La distribucin normal estndar, o tipificada o reducida, es aquella que tiene por media el valor
cero, = 0, y por desviacin tpica la unidad, =1.
Su funcin de densidad es:

Su grfica es:

La probabilidad de la variable X depender del rea del
recinto sombreado en la figura. Y para calcularla utilizaremos
una tabla.
Tipificacin de la variable
Para poder utilizar la tabla tenemos que transformar la variable X
que sigue una distribucin N(, ) en otra variable Z que siga una
distribucin N(0, 1).

La probabilidad de la variable X depender del rea del recinto
sombreado en la figura. Y para calcularla utilizaremos una tabla.
Tipificacin de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue
una distribucin N(, ) en otra variable Z que siga una distribucin N(0, 1).

2.4.4. APROXIMACIONES CON LA NORMAL.
Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio
nombre indica su extendida utilizacin, justificada por la frecuencia o normalidad con la
que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica
tiene forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo
valor de p y valores de n cada vez mayores, se ve que sus polgonos de frecuencias se
aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribucin normal se debe principalmente a que hay
muchas variables asociadas a fenmenos naturales que siguen el modelo de la normal
Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una especie,
p.ejm. tallas, pesos, envergaduras, dimetros, permetros,...
Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o de
una misma cantidad de abono.
Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo
de individuos, puntuaciones de examen.

Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a un medio,...
Errores cometidos al medir ciertas magnitudes.
Valores estadsticos muestrales, por ejemplo : la media.
Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...
Y en general cualquier caracterstica que se obtenga como suma de muchos factores.
FUNCIN DE DENSIDAD
Empleando clculos bastante laboriosos, puede demostrarse que el
modelo de la funcin de densidad que corresponde a tales
distribuciones viene dado por la frmula:

La distribucin normal queda definida por dos parmetros, su media y su desviacin
tpica y la representamos as
FUNCIN DE DISTRIBUCIN
Puede tomar cualquier valor (- , + )
Son ms probables los valores cercanos a uno central que llamamos media
Conforme nos separamos de ese valor , la probabilidad va decreciendo de igual forma a derecha e
izquierda (es simtrica).
Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma ms o menos
rpida dependiendo de un parmetro o , que es la desviacin tpica.

TIPIFICACIN

Por tanto su funcin de densidad es
UNIDAD 3
3. ESTADSTICA DESCRIPTIVA Y LA
TEORA DEL MUESTREO
CONCEPTOS BSICOS
INTRODUCCIN
La investigacin cuya finalidad es: el anlisis o experimentacin de situaciones para el
descubrimiento de nuevos hechos, la revisin o establecimiento de teoras y las
aplicaciones prcticas de las mismas, se basa en los principios de Observacin y
Razonamiento y necesita en su carcter cientfico el anlisis tcnico de Datos para
obtener de ellos informacin confiable y oportuna. Este anlisis de Datos requiere de la
Estadstica como una de sus principales herramientas, por lo que los investigadores de
profesin y las personas que de una y otra forma la realizan requieren adems de los
conocimientos especializados en su campo de actividades, del manejo eficiente de
los conceptos, tcnicas y procedimientos estadsticos.
ESTADSTICA
Es el conjunto de procedimientos y tcnicas empleadas para recolectar, organizar y
analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de
incertidumbre que plantean las ciencias sociales o naturales.
ESTADSTICA INDUCTIVA Y DEDUCTIVA
Uno de los problemas fundamentales de la Estadstica es el estudio de la relacin
existente entre una poblacin y sus muestras. Segn la direccin de tal relacin la
Estadstica puede ser:
Deductiva, cuando a partir del conocimiento de la poblacin se trata de caracterizar
cada muestra posible.

Deductiva, cuando a partir del conocimiento de la poblacin se trata de
caracterizar cada muestra posible.
Inductiva, cuando a partir del conocimiento derivado de una muestra se
pretende caracterizar la poblacin.
ESTADSTICA DESCRIPTIVA E INFERENCIAL
Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin,
anlisis e interpretacin de una coleccin de datos, esencialmente consiste en
resumir stos con uno o dos elementos de informacin (medidas descriptivas)
que caracterizan la totalidad de los mismos. La estadstica Descriptiva es el
mtodo de obtener de un conjunto de datos conclusiones sobre si mismos y no
sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para
resumir o describir cualquier conjunto ya sea que se trate de una poblacin o
de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se
conocen los elementos de una muestra.
Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca
de las propiedades del todo, poblacin, partiendo de lo especfico, muestra.
las cuales llevan implcitos una serie de riesgos. Para que stas generalizaciones
sean vlidas la muestra deben ser representativa de la poblacin y la calidad
de la informacin debe ser controlada, adems puesto que las conclusiones
as extradas estn sujetas a errores, se tendr que especificar el riesgo o
probabilidad que con que se pueden cometer esos errores. La estadstica
inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones
que sobrepasan los lmites del conocimiento aportado por los datos, busca
obtener informacin de un colectivo mediante un metdico procedimiento
del manejo de datos de la muestra.
Deductiva, cuando a partir del conocimiento de la poblacin se trata de caracterizar
cada muestra posible.
Inductiva, cuando a partir del conocimiento derivado de una muestra se pretende
caracterizar la poblacin.
ESTADSTICA DESCRIPTIVA E INFERENCIAL
Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin, anlisis e
interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con
uno o dos elementos de informacin (medidas descriptivas) que caracterizan la
totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un
conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento
proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya
sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar
de la Inferencia Estadstica se conocen los elementos de una muestra.
Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las
propiedades del todo, poblacin, partiendo de lo especfico, muestra. las cuales llevan
implcitos una serie de riesgos. Para que stas generalizaciones sean vlidas la muestra
deben ser representativa de la poblacin y la calidad de la informacin debe ser
controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se
tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos
errores. La estadstica inferencial es el conjunto de tcnicas que se utiliza para obtener
conclusiones que sobrepasan los lmites del conocimiento aportado por los datos,
busca obtener informacin de un colectivo mediante un metdico procedimiento del
manejo de datos de la muestra.

ANALISIS ESTADSTICO
El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e
interpretacin de datos para realizar inferencias.
DATOS Y VARIABLES
Cuando se consideran los mtodos de organizacin, reduccin y anlisis de datos
estadsticos, se hace necesario aclarar los siguientes conceptos.
Variables: es toda caracterstica que vara de un elemento a otro de la poblacin.
Datos: son medidas o valores de las caractersticas susceptibles de observar y contar, se
originan por la observacin de una o ms variables de un grupo de elementos o
unidades
CLASIFICACIN DE VARIABLES
Las variables pueden clasificarse en: categricas o cualitativas (atributos), no tienen
ningn grado de comparacin numrica, ejemplo: sexo, estado civil; y numricas o
cuantitativas, son caractersticas factibles de expresar por medio de nmeros, estas
pueden ser Discretas, que solo pueden tomar ciertos valores aislados en un intervalo, y
Continuas, que pueden tomar cualquier valor en un intervalo.
REPRESENTACIN DE DATOS
Los datos son colecciones de un nmero cualquiera de observaciones relacionadas
entre si, para que sean tiles se deben organizar de manera que faciliten su anlisis, se
puedan seleccionar tendencias, describir relaciones, determinar causas y efectos y
permitan llegar a conclusiones lgicas y tomar decisiones bien fundamentadas; por esa
razn es necesario conocer lo mtodos de Organizacin y Representacin, la finalidad
de stos mtodos es permitir ver rpidamente todas las caractersticas posibles de los
datos que se han recolectado.

Representacin Tabular:
Presenta las variable y las frecuencias con que los valores de stas se encuentran
presentes en el estudio.
Representacin Grfica :
Se llaman grficas a las diferentes formas de expresar los datos utilizando los medios de
representacin que proporciona la geometra.

METODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS
Arreglo de Datos. Es una forma de presentar los datos en un arreglo ascendente o
descendente. Ofrece las ventajas siguientes: describe los valores mnimos y mximos, en
l se pueden dividir los datos fcilmente en secciones, permite darse cuenta de los
valores que aparecen ms de una vez, se puede observar la distancia entre valores
consecutivos.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los valores

REPRESENTACIN DE DATOS
Los datos son colecciones de un nmero cualquiera de observaciones relacionadas
entre si, para que sean tiles se deben organizar de manera que faciliten su anlisis, se
puedan seleccionar tendencias, describir relaciones, determinar causas y efectos y
permitan llegar a conclusiones lgicas y tomar decisiones bien fundamentadas; por esa
razn es necesario conocer lo mtodos de Organizacin y Representacin, la finalidad
de stos mtodos es permitir ver rpidamente todas las caractersticas posibles de los
datos que se han recolectado.

MEDIA ARITMTICA
Es una medida matemtica, un nmero individual que representa razonablemente el
comportamiento de todos los datos.
Para datos no agrupados X = S xi / n
Para datos agrupados X = S fi Xi / S fi
donde Xi es la marca de clase para cada intervalo y fi es la frecuencia de clase
Caractersticas de la Media:
1. En su clculo estn todos los valores del conjunto de datos por lo que cada uno afecta la
media.
2. La suma algebraica de las desviaciones de los valores individuales respecto a la media es
cero.
3. La suma del cuadrado de las desviaciones de una serie de datos a cualquier nmero A
es mnimo si A = X
4. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser
afectada por los valores extremos, y de esa forma llegar a ser una medida menos
representativa, por lo que si la distribucin es asimtrica, la media aritmtica no constituye
un valor tpico.
LA MODA
Es el valor de un conjunto de datos que ocurre ms frecuentemente, se considera como el
valor ms tpico de una serie de datos.
Para datos agrupados se define como Clase Modal el intervalo que tiene ms frecuencia.
La moda puede no existir o no ser nica, las distribuciones que presentan dos o ms
mximos relativos se designan de modo general como bimodales o multimodales.
Caractersticas de la Moda.
1. Representa ms elementos que cualquier otro valor
2. No est afectada por los valores extremos pero para datos continuos es dudoso su
clculo.
3.1. DISTRIBUCIONES DE FRECUENCIA, DE FRECUENCIA
RELATIVA Y ACUMULADA.
DISTRIBUCION DE FRECUENCIA Si se renen grandes cantidades de datos sueltos es til
distribuirlos en clases o categoras y determinar el nmero de individuos que pertenecen a
cada categora, a lo que se le llama frecuencia de clase. A una disposicin tabular de los
datos por clases, con sus correspondientes frecuencias de clase, se le conoce como
distribucin de frecuencia o tabla de frecuencias.
INTERVALOS DE CLASE Y LMITES DE CLASE
El smbolo que define una clase, como el 6062 se llama intervalo de clase. A los nmeros
60 y 62 se les conoce como limites de clase; el numero mas pequeo (60) es el limite
inferior de clase, mientras que el numero mas grande (62) es el limite superior de clase. Se
acostumbra usar los trminos clase e intervalo de clase indistintamente, aunque el
intervalo de clase es en realidad un smbolo de la clase.
A un intervalo de clase que, por lo menos tericamente, no tiene lmite de clase inferior o
lmite de clase superior se le llama intervalo de clase abierto. Por ejemplo, en grupos de
edades de individuos, el intervalo de clase 65 aos a mas es un intervalo de clase
abierto.
FRONTERAS DE CLASE
Si se miden estaturas con exactitud de 1 pulg., en teora el intervalo de clase 6062 incluye
todas las medidas desde 59.5000 hasta 62.5000 pulg. Estos nmeros, indicados
brevemente por los nmeros exactos 59.5 y 62.5 se llaman fronteras de clase o limites
verdaderos de clase; el numero menor (59.5) es la frontera inferior de clase y el numero
mayor (62.5), la frontera superior de clase.
En la prctica, las fronteras de clase se obtienen promediando los lmites superior e inferior
de un intervalo de clase. Algunas veces se emplean las fronteras para simbolizar clases.
Por ejemplo, las clases en la primera columna de la tabla 21 se podran indicar mediante
59.562.5, 62.565.5, etctera.



MARCA DE CLASE
La marca de clase, que es el punto medio del intervalo de clase, se
obtiene promediando los lmites inferior y superior de clase. De este
modo, la marca de clase del intervalo 6062 es (60+62)/ 2 = 61. A la
marca de clase tambin se le denomina punto medio de clase.
REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIA.
1. Determinar el nmero mayor y el menor en los datos sueltos con el
fin de especificar el rango (la diferencia entre ambos). 2. Dividir el
rango en un nmero adecuado de intervalo de clase del mismo
tamao. Si esto no es posible, usar intervalos de clase de distintos
tamaos
2. o intervalos de clase abiertos. Se suelen tomar entre 5 y 20
intervalos de clase, segn los datos. Los intervalos de clase se eligen
tambin de modo tal que las marcas de clase (o puntos medios)
coincidan con los datos realmente observados. Ello tiende a
disminuir el llamado
3. error de agrupamiento que se produce en anlisis matemticos
posteriores. No obstante, las fronteras de clase no debieran
coincidir con los datos realmente observados. 3. Determinar el
nmero de observaciones que corresponden a cada intervalo de
clase; es decir,

3.2. MEDIDAS DE TENDENCIA CENTRAL: MEDIA,
MEDIANA, MODA, PROMEDIO (PONDERADO,
MVIL), MEDIA GEOMTRICA, MEDIA ARMNICA,
CUANTILES (CUARTELES, DECILES Y PERCENTILES).
La estadstica descriptiva en su funcin bsica de reducir datos,
propone una serie de indicadores que permiten tener una percepcin
rpida de lo que ocurre en un fenmeno.
La primera gama de indicadores corresponde a las Medidas de
Tendencia Central. Existen varios procedimientos para expresar
matemticamente las medidas de tendencia central, de los cuales,
los ms conocidos son: la media aritmtica, la moda y la mediana.
Medidas de tendencia central: Son indicadores estadsticos que
muestran hacia que valor (o valores) se agrupan los datos.
Esta primera parte la dedicaremos a analizar tres medidas de tendencia central:
La media aritmtica
La moda
La mediana
En el suplemento de este capitulo incluiremos otras medidas de tendencia central
Equivale al clculo del promedio simple de un conjunto de datos. Para diferenciar
datos muestrales de datos poblacionales, la media aritmtica se representa con
un
smbolo para cada uno de ellos: si trabajamos con la poblacin, este indicador
ser ; en el caso de que estemos trabajando con una muestra, el smbolo ser
X.
Media aritmtica ( o X): Es el valor resultante que se obtiene al dividir
la sumatoria de un conjunto de datos sobre el nmero total de datos. Solo es
aplicable para el tratamiento de datos cuantitativos.
Hay que entender que existen dos formas distintas de trabajar con los datos tanto
poblacionales como muestrales: sin agruparlos o agrupndolos en tablas de
frecuencias. Esta apreciacin nos sugiere dos formas de representar la media
aritmtica.
Media aritmtica para datos no agrupados
Podemos diferenciar la frmula del promedio simple para datos poblaciones y
muestrales:

MODA
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es
decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el
nmero 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se
presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros
casos ms de dos valores, lo que se conoce como multimodal.

En conclusin las Medidas de tendencia central, nos permiten identificar los valores
ms representativos de los datos, de acuerdo a la manera como se tienden a
concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el
valor que obtendra cada uno de los individuos si se distribuyeran los valores en partes
iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos
partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los
datos. Por ltimo la Moda nos indica el valor que ms se repite dentro de los datos.

3.3. MEDIDAS DE DISPERSIN: RANGO O AMPLITUD DE
VARIACIN, DESVIACIN MEDIA, VARIANZA,
DESVIACIN ESTNDAR, MOMENTOS Y KURTOSIS.
Se llama dispersin de un conjunto de datos al grado en que los diferentes valores
numricos de los datos tiende a extenderse alrededor del valor medio utilizado.
Este grado de dispersin se mide por medio de los indicadores estadsticos llamados
medidas de dispersin, entre ellas tenemos el rango, la varianza, y la desviacin tpica.
A pesar de la gran importancia de las medidas de tendencia central y de la cantidad
de informacin que aportan individualmente, no hay que dejar de sealar que en
muchas ocasiones esa informacin, no slo no es completa, sino que puede inducir a
errores en su interpretacin. Veamos algunos ejemplos.


Consideremos dos grupos de personas extrados como muestras respectivas de dos
poblaciones distintas: el primero est compuesto por 100 personas que asisten a la
proyeccin de una pelcula para nios, y el segundo por 100 personas elegidas entre
los asistentes a una discoteca juvenil. Pudiera ocurrir que, aun siendo las distribuciones
de las edades de ambos grupos muy distinta, la media y la mediana coincidieran para
ambas. (Da un ejemplo concreto en que esto ocurra).

Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes
entradas en miles de pesos, a lo largo de dos semanas correspondientes a pocas
distintas del ao

1 semana 2 semana
10 30
20 40
30 50
50 50
60 60
80 60
100 60
350 350
La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los
dos casos) y, sin embargo, las consecuencias que se podran derivar de una y otra tabla
son bien distintas.
Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras
medidas, aparte de los valores de centralizacin, que nos indiquen la mayor o menor
desviacin de cada observacin respecto de aquellos valores.
Las medidas de desviacin, variacin o dispersin que estudiaremos a continuacin son:
Rango o amplitud, desviacin media y desviacin tpica.

RANGO, AMPLITUD TOTAL O RECORRIDO
El rango se suele definir como la diferencia entre los dos valores extremos que toma la
variable. Es la medida de dispersin ms sencilla y tambin, por tanto, la que proporciona
menos informacin. Adems, esta informacin puede ser errnea, pues el hecho de que
no influyan ms de dos valores del total de la serie puede provocar una deformacin de la
realidad.
Comparemos, por ejemplo, estas dos series:
Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18
Ambas series tienen rango 16, pero estn desigualmente agrupadas, pues mientras la
primera tiene una mayor concentracin en el centro, la segunda se distribuye
uniformemente a lo largo de todo el recorrido.
El uso de esta medida de dispersin, ser pues, bastante restringido.

DESVIACIN MEDIA

En teora, la desviacin puede referirse a cada una de las medidas de tendencia central:
media, mediana o moda; pero el inters se suele centrar en la medida de la desviacin
con respecto a la media, que llamaremos desviacin media.

Puede definirse como la media aritmtica de las desviaciones de cada uno de los
valores con respecto a la media aritmtica de la distribucin, y de indica as:

x
2 -3 3
2 3 3
4 -1 1
4 -1 1
4 -1 1
5 0 0
6 1 1
7 2 2
8 3 3
8 3 3
N
x x
DM

=
Ntese que se toman las desviaciones en valor absoluto, es decir, que la frmula no distingue
si la diferencia de cada valor de la variable con la media es en ms o en menos.
Ya se habr advertido que esta expresin sirve para calcular la desviacin media en el caso
de datos sin agrupar. Veamos un ejemplo:
Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacin media de estos valores.

x
2 -3 3
2 3 3
4 -1 1
4 -1 1
4 -1 1
5 0 0
6 1 1
7 2 2
8 3 3
8 3 3
x x
x
DM = 1,8
Veamos ahora cmo se calcula la desviacin media en el caso de datos agrupados en intervalos.

N
x n
DM
i

=
N
x x n
DM
m i

=
) (
donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de los intervalos correspondientes.
Adems, las desviaciones son de cada centro, o marca de clase, a la media aritmtica. Es decir,
Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los 100 empleados de una cierta empresa: Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los 100 empleados de una cierta empresa:
Clase n
i

16-20 2
20-24 8
24-28 8
28-32 18
32-36 20
36-40 18
40-44 15
44-48 8
48-52 3
Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los 100 empleados
de una cierta empresa:

Clase n
i

16-20 2
20-24 8
24-28 8
28-32 18
32-36 20
36-40 18
40-44 15
44-48 8
48-52 3
Clase n
i
x
m
n
i
x
m
n
i

16-20 2 18 36 16,72 33,44
20-24 8 22 176
24-28 8
28-32 18
32-36 20
36-40 18
40-44 18
44-48 8
48-52 3
100
x x
veamos cmo se procede:
DM = 6,09
La desviacin media viene a indicar el grado de concentracin o de dispersin de los valores de
la variable. Si es muy alta, indica gran dispersin; si es muy baja refleja un buen agrupamiento y
que los valores son parecidos entre s.
La desviacin media se puede utilizar como medida de dispersin en todas aquellas
distribuciones en las que la medida de tendencia central ms significativas haya sido la media.
Sin embargo, para las mismas distribuciones es mucho ms significativa la desviacin tpica,
que estudiaremos a continuacin, y eso hace que el uso de la desviacin media sea cada vez
ms restringido.

DESVIACIN TPICA

Es sin duda la medida de dispersin ms importante, ya que adems sirve como medida
previa al clculo de otros valores estadsticos.

La desviacin tpica se define como la raz cuadrada de la media de los cuadrados de las
desviaciones con respecto a la media de la distribucin. Es decir,

para datos sin agrupar, o bien:

N
x x
S

=
2
Clculo de la desviacin tpica para datos no agrupados en clases
Veamos la frmula anterior aplicada a un caso concreto.
Hallar la desviacin tpica de la serie: 5, 8, 10, 12, 16.
x
2

5 -5,2 27,04
8 -2,2 4,84
10 -0,2 0,04
12 1,8 3,24
16 5,8 33,64
Clculo de la desviacin tpica para datos agrupados en clases y agrupados por frecuencias
Mtodo largo: Se aplica la siguiente frmula
N
f x
S

=
2
3.4. MUESTREO ALEATORIO: SIMPLE, SISTEMTICO,
ESTRATIFICADO, POR CONGLOMERADOS.
Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el p
roceso de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la
misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de seleccin
muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
Sin reposicin de los elementos;
Con reposicin.
Muestreo aleatorio sin reposicin
Consideremos una poblacin E formada por N elementos. Si observamos un elemento
particular, , en un muestreo aleatorio sin reposicin se da la siguiente circunstancia:
La probabilidad de que e sea elegido en primer lugar es ;
Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de ), la
probabilidad de que sea elegido en el segundo intento es de .
en el (i+1)-simo intento, la poblacin consta de N-i elementos, con lo cual si e no ha
sido seleccionado previamente, la probabilidad de que lo sea en este momento es de .
Si consideramos una muestra de elementos, donde el orden en la eleccin de los
mismos tiene importancia, la probabilidad de eleccin de una muestra cualquiera es



Muestreo aleatorio con reposicin
Sobre una poblacin E de tamao N podemos realizar extracciones de n elementos, pero
de modo que cada vez el elemento extrado es repuesto al total de la poblacin. De esta
forma un elemento puede ser extrado varias veces. Si el orden en la extraccin de la
muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es:
Si el orden no interviene, la probabilidad de una muestra cualquiera, ser la suma de
la anterior, repitindola tantas veces como manera de combinar sus elementos sea
posible. Es decir,
sea n
1
el nmero de veces que se repite cierto elemento e
1
en la muestra;
sea n
2
el nmero de veces que se repite cierto elemento e
2
;
sea n
k
el nmero de veces que se repite cierto elemento e
k
,
de modo que . Entonces la probabilidad de obtener la muestra



El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio
simple, que como hemos mencionado se caracteriza por que
cada elemento de la poblacin tiene la misma probabilidad de ser elegido, y
las observaciones se realizan con reemplazamiento. De este modo, cada
observacin es realizada sobre la misma poblacin (no disminuye con las
extracciones sucesivas).
Sea X una v.a. definida sobre la poblacin E, y f(x) su ley de probabilidad.


Adems todos las observaciones de la v.a. son independientes, es decir
Las relaciones(7.1)-(7.2) caracterizan a las muestras aleatorias simples.
La seleccin de una muestra aleatoria puede realizarse con la ayuda de #.#>
3.5. MUESTREO NO ALEATORIO: DIRIGIDO, POR CUOTAS,
DELIBERADO.
En general, el muestreo no aleatorio es aquel que elige cada uno de los elementos de la
muestra sin entervencion del azar. Es decir, los elementos se seleccion bajo algun critero,
donde no interviene la casualidad.

Su principal debilidad es que sus resultados no tienen propieades para hacer inferencia
estadistica acerca de la poblacion.Entre los mas conocidos esta el muestreo sistematico,
que no se incluye aqui, el muestreo por cuotas, etc.

En el muestreo sistematico se ordenan los elementos bajo algun criterio, estatura, promedio,
tamao de ingreso, poblacion, etc. y se van eligiendo los elementos, bajo una
discriminacion sistematica.

El muestreo por cuotas se asienta generalmente sobre la base de un buen conocimiento
de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados
para los fines de la investigacin
Entre los tipos comunes de muestras no aleatorias se incluyen:
1. Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una reunin,
2. podra ser designado como muestra. Este es un mtodo fcil y barato, pero el sesgo
3. suele ser imposible de estimar. El mtodo es popular en las demostraciones de cursos
4. sobre mtodos, donde los datos obtenidos de la muestra no se usarn. Asimismo, esto
5. es un mtodo posible cuando usted necesita a algunos clientes potenciales asistir al
6. desarrollo de producto, a condicin de que los resultados obtenidos sean probados
7. ms adelante con una muestra mejor escogida de la clientela-objetivo.
2. Muestra de voluntarios es creada cuando todos los miembros de la poblacin tienen la
oportunidad de participar en la muestra. Si usted inserta una forma de cuestionario en un
peridico o en una pgina del Internet y pide que la gente d sus opiniones sobre un asunto,
usted conseguir una muestra de voluntarios. Un otro ejemplo es la respuesta de los clientes
que llega a una empresa.
Una muestra de voluntarios puede ser una alternativa prctica cuando no hay lista de los
miembros de la poblacin de quien una muestra aleatoria se podra escoger, o cuando es
difcil de contactar a la gente en una muestra porque sus direcciones no se saben.
La desventaja es que es difcil determinar la presencia del sesgo, es decir si las opiniones
u otras caractersticas interesantes de los voluntarios se desvan de sos de la poblacin.
Cuando en vista de esta pregunta, hay dos cuestiones que plantearse:
Qu es la poblacin que usted apunta? Es cierto que todos los miembros de la poblacin
concernida tenan las mismas oportunidades de ser incluidos en la muestra?
Hay cualquier razn por qu puedan diferir los voluntarios del resto de la poblacin?
Por ejemplo, tienen ellos, o por lo menos algunos de ellos, una razn especial para ofrecerse?

Muestra - bola de nieve. Cuando se entrevista a miembros de un grupo,
podemos pedir a las personas que nos indiquen otros individuos en ese grupo
que podran dar informacin sobre ese tema; podramos tambin pedirles que
nos indicasen personas que compartan sus puntos de vista y tambin otras que
sean de opinin opuesta. Entonces entrevistaremos a nuevos individuos y
continuaremos del mismo modo hasta que no obtengamos nuevos puntos de
vista de nuevos entrevistados. Este es un buen mtodo por ejemplo para
recoger los distintos puntos de vista existentes en un grupo, pero su i
nconveniente es que no obtenemos una idea exacta de la distribucin
de las opiniones.
Una muestra que consiste en todos los casos disponibles.
A veces el investigador es interesado en una poblacin de que slo unos pocos
casos o especmenes estn disponibles para el estudio, y estos entonces deben
servir como una muestra de la poblacin. Tales muestras tpicas son:
4a. Casos restantes
4b. Casos permitidos.

UNIDAD 4
4. -INFERENCIA ESTADSTICA
La Inferencia Estadstica es aquella rama de la Estadstica mediante la cual se trata de
sacar conclusiones de una poblacin en estudio, a partir de la informacin que
proporciona una muestra representativa de la misma. Tambin es denominada
Estadstica Inductiva o Inferencia Inductiva ya que es un procedimiento para generar
nuevo
conocimiento cientfico.
La muestra se obtiene por observacin o experimentacin. La necesidad de obtener
un subconjunto reducido de la poblacin es obvia si tenemos en cuenta los costes
econmicos de la experimentacin o el hecho de que muchos de los mtodos de
medida son destructivos.
Toda inferencia inductiva exacta es imposible ya que disponemos de informacin
parcial, sin embargo es posible realizar inferencias inseguras y medir el grado de
inseguridad si el
experimento se ha realizado de acuerdo con determinados principios. Uno de los
propsitos de la inferencia Estadstica es el de conseguir tcnicas para hacer
inferencias
inductivas y medir el grado de incertidumbre de tales inferencias. La medida de la
incertidumbre se realiza en trminos de probabilidad.
La inferencia Estadstica puede dividirse en dos apartados de acuerdo con el
conocimiento sobre la distribucin en la poblacin.
De acuerdo con la forma en que se estudian los parmetros o caractersticas
desconocidas, la inferencia puede dividirse en dos apartados:
Estimacin:
Se intenta dar estimaciones de los parmetros desconocidos sin hacer hiptesis previas
sobre posibles valores de los mismos.
Estimacin puntual: Un nico valor para cada parmetro.
Estimacin por intervalos: Intervalo de valores probables para el parmetro.
Contraste de Hiptesis:
Se realizan hiptesis sobre los parmetros desconocidos y se desarrolla un procedimiento
para comprobar la verosimilitud de la hiptesis planteada.
Veamos los conceptos con un ejemplo concreto tomado de un estudio de investigacin
real. El estudio pertenece a otro ms amplio llevado a cabo en colaboracin por los
Departamentos de Qumica Analtica, Nutricin y Bromatologa , y Estadstica y
Matemtica Aplicada.
El objetivo original del trabajo consiste en estudiar los vinos jvenes embotellados de dos
Inferencia.

4.1 ESTIMACIN PUNTUAL Y POR INTERVALOS DE CONFIANZA.
Si a partir de las observaciones de una muestra se calcula un solo valor como
estimacin de un parmetro de la poblacin desconocido, el procedimientos se
denomina estimacin puntual.
Por ejemplo queremos estimar la nota media de los alumnos de bachiller en la
asignatura de matemticas que notaremos . Sea X la variable aleatoria que indica
la nota obtenida por cada estudiante.

Tomamos una muestra de tamao n y denotamos la nota media de la muestra. Si al
tomar una muestra de 100 estudiantes o obtenemos que la media es 62, este nmero lo
tomaramos como estimativo de . Decimos que 62 es una estimacin puntual de Un
estimador puntual T de un parmetro es cualquier estadstica que nos permita a partir de
los datos mustrales obtener valores aproximados del parmetro .
Para indicar que T es un estimador del parmetro escribimos =T .
Con esto queremos decir que empleamos la expresin dada mediante T para obtener
valores prximos al valor del parmetro.
Es muy probable que haya error cuando un parmetro es estimado. Es cierto que si el
nmero de observaciones al azar se hace suficientemente grande, stas proporcionaran
un valor
que casi sera semejante al parmetro; pero a menudo hay limitaciones
de tiempo y de recursos y se tendr que trabajar con unas cuntas observaciones. Para
poder utilizar la informacin que se tenga de la mejor forma posible, se necesita
identificar las estadsticas que sean buenos estimadores. Hay cuatro criterios que se
suelen aplicar para determinar si una estadstica es un buen estimador: Insesgamiento,
eficiencia, consistencia y suficiencia.


ESTIMACION POR INTERVALOS
Nos proponemos determinar dos nmeros entre los cuales se halla el parmetro estudiado
con cierta certeza.
El procedimiento para obtener un intervalo (de confianza) para un parmetro, la media ,
por ejemplo, requiere de la determinacin de un estimador del parmetro y de la
distribucin del estimador.

Ejemplo
Tratamos de obtener un intervalo de confianza para la media de una
poblacin normal.
Sabemos que si X sigue una normal de media y varianza entonces la
media muestral sigue una normal de la misma media y de varianza la
varianza poblacional partida por n, tamao de la muestra.
Vamos a determinar a y b tales que P[a< <b]=095.
Para calcular estos valores es necesario estandarizar X:
= 095.
Por lo tanto = 095.
En realidad hay infinitos pares de nmeros para los que se cumple la ecuacin
anterior. De stos vamos a escoger el par de nmeros que se hallan situados
simtricamente respecto de cero en la distribucin normal. Llegamos a que
y A partir de estas ecuaciones obtenemos a = y b = .
Con lo que obtendramos .
O lo que es lo mismo .
El intervalo se llama intervalo (aleatorio) de confianza para .
A partir de los datos muestrales podemos determinar el valor de y obtenemos
as un intervalo numrico. El valor 196 se debe a que pedamos una
probabilidad de 095. Para indicar el intervalo para cualquier valor de
probabilidad podemos utilizar la expresin . Expresin que puede simplificarse .
, se llama longitud del intervalo

Un intervalo de confianza para un parmetro es un intervalo construido alrededor del estimador del parmetro de tal
manera que podemos esperar que el verdadero valor del parmetro quede incluido en dicho intervalo.
El nivel de confianza de un intervalo es una probabilidad(expresada en porcentaje) que representa la seguridad de
que el intervalo encierra el verdadero valor del parmetro .
NORMAL DISTRIBUCIN T JI CUADRADO DISTRIBUCIN F
PARA CADA NIVEL DE CONFIANZA EXISTE UN VALOR DE TABLA ( NORMAL, T , , F)
ASOCIADO AL NIVEL DE CONFIANZA DADO. ESTE VALOR SE LLAMA COEFICIENTE DE
CONFIABILIDAD Y SE DENOTA:



si queremos un intervalo con un nivel de confianza de 100(1- )%, en la tabla
correspondiente buscaremos un valor de variable para el que el rea de
cola superior(tambin inferior) sea del 100(1- /2)% ya que la porcin de rea
que no ser cubierta por el intervalo debe tener una medida de tamao y
se toma como norma general de procedimiento que se reparta en partes
iguales entre las dos colas.
tenemos las siguientes propiedades sobre la longitud del intervalo:
propiedad 1. para un tamao de muestra y una varianza dada a medida que aumenta
el nivel de confianza tambin lo hace la longitud del intervalo
propiedad 2. para un nivel de confianza y una varianza dadas cuando
el tamao de la muestra aumenta la longitud del intervalo disminuye.
4.2. ESTIMACIN DE LA MEDIA, DE LA DIFERENCIA DE MEDIAS, DE LA
PROPORCIN Y DE LA DIFERENCIA DE PROPORCIONES.
En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar
un valor aproximado de un parmetro de una poblacin a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimacin de la media de una
determinada caracterstica de una poblacin de tamao N podra ser la media de esa
misma caracterstica para una muestra de tamao n.
[1]

La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:
Estimacin puntual:
[2]

Mtodo de los momentos;
Mtodo de la mxima verosimilitud;
Mtodo de los mnimos cuadrados;
Estimacin por intervalos.
Estimacin bayesiana.
Un estimador de un parmetro poblacional es una funcin de los datos muestrales, tambin llamado
estadstico.
En pocas palabras, es una frmula que depende de los valores obtenidos de una muestra, para
realizar estimaciones.
Formalmente, si es un parmetro poblacional, se dice que es un estimador puntual de si ,
donde x
1
,x
2
,...,x
n
son las variables aleatorias que integran una muestra aleatoria de tamao n
de la poblacin en cuestin.
Por ejemplo, un estimador de la media poblacional, , puede ser la media muestral,
segn la siguiente frmula:
donde (x
1
, x
2
, ..., x
n
) sera el conjunto de de datos de la muestra. -- xXx ---

El estimador es una variable aleatoria que asigna a cada posible valor de la muestra un valor numrico.
Como tal, t iene sentido calcular su esperanza, su varianza y otras caractersticas propias de las
variables aleatorias.
Estimador insesgado
Por supuesto, cualquier funcin de la muestra, con la definicin anterior, podra ser un estimador,
pero es deseable que las estimaciones que surjan a partir de un estimador "se parezcan",
en cierto modo, al parmetro que se desea estimar.
Con este propsito, se dice que un estimador de un parmetro es insesgado si
su esperanza es el propio .
Estimador eficiente
Un estimador de un parmetro es eficiente si su varianza es mnima. Esto hace que haya
menos variabilidad entre las distintas estimaciones que podemos obtener (cada muestra
dar una estimacin diferente). De esta forma, la estimacin ser ms fiable. Hay una cota
mnima dentro de las varianzas que se puede obtener para cualquier estimador con un
sesgo determinado. Esta cota se llama cota de Cramr-Rao. Si la varianza de un estimador
es igual a esta cota, sabremos que su varianza es mnima, y por tanto, estaremos seguros
de que es eficiente. Sin embargo, no siempre esta cota es alcanzable, por lo que no
siempre podremos saber si el estimador que hemos utilizado es el ms eficiente de todos.
Para ello, cuando dudamos entre dos estimadores diferentes, y ninguno de ellos tiene una
varianza igual a la cota de Cramr-Rao se utiliza el coeficiente de eficiencia relativa.
[
Estimacin puntual
Consiste en la estimacin del valor del parmetro mediante un slo valor,
obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la
talla media de un determinado grupo de individuos, puede extraerse una
muestra y ofrecer como estimacin puntual la talla media de los individuos.
Lo ms importante de un estimador, es que sea un estimador eficiente.
Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mnima)

Estimacin por intervalos
Consiste en la obtencin de un intervalo dentro del cual estar el valor del
parmetro estimado con una cierta probabilidad. En la estimacin por
intervalos se usan los siguientes conceptos:

Intervalo de confianza
El intervalo de confianza es una expresin del tipo [
1
,
2
]
1

2
,
donde es el parmetro a estimar. Este intervalo contiene al parmetro
estimado con una determinada certeza o nivel de confianza. Pero a veces
puede cambiar este intervalo cuando la muestra no garantiza un axioma o
un equivalente circustancial.

Variabilidad del Parmetro
Si no se conoce, puede obtenerse una aproximacin en los datos aportados
por la literatura cientfica o en un estudio piloto. Tambin hay mtodos para
calcular el tamao de la muestra que prescinden de este aspecto.
Habitualmente se usa como medida de esta variabilidad la desviacin tpica
poblacional y se denota .

4.3. DETERMINACIN DEL TAMAO DE LA MUESTRA.
Qu tan grande debe ser una muestra si la media muestral se va a usar para estimar
la media poblacional?. La respuesta depende del error estndar de la media, si este
fuera cero, entonces se necesitara una sola media que ser igual necesariamente a la
media poblacional desconocida , porque = 0. Este caso extremo no se encuentra en
la prctica, pero refuerza el hecho de que mientras menor sea el error estndar de la
media, menor es el tamao de muestra necesario para lograr un cierto grado de precisin.
Se estableci antes que una forma de disminuir el error de estimacin es aumentar el
tamao de la muestra, si ste incluye el total de la poblacin, entonces sera igual
a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo,
sea posible determinar un tamao de la muestra tal que el error de estimacin sea
tan pequeo como queramos, para ser mas preciso, dado un nivel de confianza y
un error fijo de estimacin , se puede escoger un tamao de muestra n tal que

P( ) = Nivel de confianza. Con el propsito de determinar n.


El error mximo de estimacin esta dado por:
Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin
resultante, obtenemos:
Como n debe de ser un nmero entero, redondeamos hacia arriba todos los
resultados fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error
de estimacin se convierte en
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:
Ejemplos:
1.Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de
Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin
estndar de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra
para que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo
ms de 4 libras?
Solucin:


En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de
confianza en que difiere en menos de 4 libras de
La experiencia sobre el comportamiento de algn ndice de un proceso, o la exigencia
del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de
algn parmetro estadstico.
Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de
datos) para tomar una decisin entre aceptar o rechazar la proposicin
Estas proposiciones se denominan Hiptesis y el procedimiento para decidir si se
aceptan o se rechazan se denomina Prueba de Hiptesis
UMSNH -
FIE
La experiencia sobre el comportamiento de algn ndice de un proceso,
o la exigencia del cumplimiento de alguna norma nos lleva a realizar
proposiciones sobre el valor de algn parmetro estadstico.
Estas proposiciones se deben contrastar con la realidad (mediante el
muestreo de datos) para tomar una decisin entre aceptar o rechazar
la proposicin
Estas proposiciones se denominan Hiptesis y el procedimiento para
decidir si se aceptan o se rechazan se denomina Prueba de Hiptesis
Una prueba de hiptesis es una herramienta de anlisis de datos que
puede en general formar parte de un experimento comparativo ms
completo
UMSNH -
FIE
Una hiptesis Estadstica es un proposicin sobre los parmetros de una
poblacin o sobre la distribucin de probabilidad de una variable
aleatoria
Ejemplo: Se tiene inters en la rapidez de combustin de un
agente propulsor para los sistemas de salida de emergencia en
aeronaves. (esta rapidez es una variable aleatoria con alguna
distribucin de probabilidad). Especialmente interesa la rapidez
de combustin promedio (que es un parmetro () de dicha
distribucin). De manera ms especfica, interesa decidir si esta
rapidez promedio es o no 50 cm/seg.
El planteamiento formal de la situacin se realiza en trminos de
una Hiptesis Nula (que es la proposicin que se quiere poner a
prueba) y una Hiptesis Alternativa, la cual se aceptar si se
rechaza la hiptesis nula:
Hiptesis Nula: H
0
: = 50 cm/seg
Hiptesis Alternativa: H
1
: = 50 cm/seg
En el ejemplo se tiene una Hiptesis Alternativa Bilateral, ya
que se verifica para valores de a ambos lados de 50 cm/seg.
UMSNH -
FIE
En ocasiones interesa una Hiptesis Alternativa Unilateral, Por ejemplo:
H
0
: = 50 cm/seg H
0
: = 50 cm/seg
H
1
: < 50 cm/seg H
1
: > 50 cm/seg
De donde puede surgir una Hiptesis Nula sobre un parmetro?
Cul sera el inters dependiendo del origen de la hiptesis?
1) Origen: Experiencia, pruebas pasadas o conocimiento del
proceso. Inters: averiguar si ha cambiado el parmetro
2) Origen: Alguna teora o modelo sobre el funcionamiento del
proceso. Inters: Verificar la valids de dicha teora
3) Origen: Especificaciones de diseo, obligaciones
contractuales, normas a cumplir o solicitudes del cliente.
Inters: probar el cumplimiento o incumplimiento de las
especificaciones.
La verdad o falsedad de la hiptesis NO puede conocerse con total
seguridad a menos que pueda examinarse toda la poblacin

UMSNH -
FIE
Procedimiento General para la prueba de una hiptesis
Tomar un muestra aleatoria
Calcular un estadstico basado en la muestra
Usar el estadstico y sus propiedades para tomar una decisin sobre la
Hiptesis Nula
UMSNH -
FIE
Ejemplo: Consideremos el ejemplo anterior de la rapidez de combustin.
Aqu se tena: H
0
: = 50 cm/seg
H
1
: = 50 cm/seg
Aceptacin de H
0
.- Un valor de la media muestral x muy cercano a 50
cm/seg es una evidencia que apoya a la hiptesis nula, sin embargo es
necesario introducir un criterio para decidir que tanto es muy cercano,
para el ejemplo este criterio pudiera ser: 48.5 s x s 51.5, si esto ocurre se
acepta H
0

De lo contrario, es decir, si x < 48.5 o x >51.5, se acepta H
1
_
_
_ _
48.5 50 51.5

Regin Crtica Regin de aceptacin Regin
Crtica
Se acepta H
1
Se acepta H
0
Se acepta H
1

= 50 = 50 = 50
Valores Crticos
UMSNH -
FIE
El procedimiento anterior puede llevarnos a una de dos conclusiones
errneas:
Error Tipo I.- Se rechaza H
0
cuando sta es verdadera
En el ejemplo se cometer un error de tipo I cuando =50, pero x para
la muestra considerada cae en la regin crtica
Y se cometer un error de tipo II cuando = 50 pero x para la muestra
considerada cae en la regin de aceptacin
Error Tipo II.- Se acepta H
0
cuando sta es falsa
_
_
Condicin real
Decisin
H
0
verdadera H
0
falsa
Rechazar H
0
Error Tipo I ok
Aceptar H
0
ok Error Tipo II
UMSNH -
FIE
A la probabilidad de cometer un error de Tipo I se denota por o, y se le
llama el nivel o tamao de significancia de la prueba es decir
o = P(error Tipo I)= P(rechazar H
0
| H
0
es verdadera)
Ejemplo: Calcular o para el ejemplo de la rapidez de
combustin para una muestra de N=10 datos, suponiendo que
la desviacin estndar de la rapidez de combustin es o=2.5
cm/seg. _
o = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))
= 0.288+ 0.288 = 0.0576

Esto significa que el 5.76% de las muestras de tamao 10
conducirn al rechazo de la Hiptesis H
0
: =50 cm/seg,
cuando sta es verdadera.
Solucin: en este caso o = P( x caiga en la regin crtica | =50),
es decir:
o = P( x < 48.5) + P( x > 51.5)
Recordando que La distribucin de x es Normal con media =50
y desviacin estndar o/\N =0.79, por lo tanto, usando Matlab:
_ _
_
UMSNH -
FIE
Es claro que o se puede reducir de dos maneras:
- Aumentando la regin de aceptacin
- Aumentando el tamao de la muestra
Ejemplo: recalcular o del ejemplo anterior para a) los nuevos
lmites de la regin de aceptacin 48 y 52. b) Para N=16 con los
lmites originales c) con ambas modificaciones
Solucin:
a) o = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) =
0.0114
b) o = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) =
0.0164
c) o = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = 0.0014
UMSNH -
FIE
Para evaluar un experimento de prueba de hiptesis tambin se
requiere calcular la probabilidad del error de Tipo II, denotada por |, es
decir
| = P(error Tipo II) = P(aceptar H
0
| H
0
es falsa)
Sin embargo, no es posible calcular | si no se tiene una hiptesis
alternativa especfica, es decir, un valor particular del parmetro bajo
prueba en lugar de un rango de valores
Por ejemplo, supongamos que es importante rechazar H
0
si la rapidez
promedio de combustin es mayor que 52 cm/seg o menor que 48
cm/seg. Dada la simetra slo se requiere evaluar la probabilidad de
aceptar H
0
: =50 cuando el valor verdadero es =52.
UMSNH -
FIE
45 46 47 48 49 50 51 52 53 54 55
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
H0:
=50
H1:
=52
Usando Matlab:
| = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643
De acuerdo a la figura: | = P(48.5 s x s 51.5 | =52)
_
UMSNH -
FIE
Usando Matlab:
| = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.8923
La probabilidad de obtener un error de tipo II aumenta muy rpido a
medida que el valor verdadero tiende al valor hipottico, por
ejemplo, si suponemos que =50.5, y recalculamos |, obtenemos
| tambin depende del tamao de la muestra, por ejemplo, si N=16
obtenemos en el ejemplo cuando =52: o=0.625, por lo tanto
| = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.2119

Es decir, | disminuye cuando N aumenta, excepto si el valor real de
est muy cerca del hipottico
UMSNH -
FIE
Es por eso que el rechazo de H
0
siempre se considera como una
Conclusin Fuerte. (los datos aportan fuerte evidencia de que H
0
es
falsa)
Como uno puede elegir los valores crticos del intervalo de aceptacin
uno controla el valor de o. Uno puede entonces controlar la
probabilidad de rechazar de manera errnea H
0
.
La decisin de aceptar H
0
se considera una Conclusin Dbil, a menos
que se sepa que | es considerablemente pequeo.

Por esto en lugar de decir se acepta H
0
se prefiere decir incapaz de
rechazar H
0
, es decir, no se ha encontrado evidencia suficiente para
rechazar H
0
. O sea, no quiere decir que exista gran evidencia de que H
0

sea cierta sino que no hay gran evidencia de que sea falsa.

UMSNH -
FIE
H
0
: =50 cm/seg
H
1
: <50 cm/seg
En el ejemplo supongamos que si la rapidez media de combustin es
menor que 50 cm/seg se desea demostrar esto con una conslusin
fuerte. cmo deben plantearse las hiptesis?
Ntese que aunque H
0
est planteada como una igualdad, se sobre-
entiende que incluye cualquier valor de no especificado por H
1
, es
decir, la incapacidad de rechazar H
0
no significa que =50, sino que no
se tiene evidencia fuerte que apoye a H
1
, es decir, pudiera ser que
=50 o que >50
UMSNH -
FIE
Ejemplo: Un embotellador de refresco desea estar seguro de que las
botellas que usa tienen en promedio un valor que supera el mnimo de
prsin de estallamiento de 200 psi. El embotellador puede formular
una prueba de hiptesis de dos maneras:
Con el planteamiento (1) Como el rechazo de H
0
es una conclusin
fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que
las botellas soportan mayor presin que 200 psi
H
0
: =200 psi H
0
: =200 psi
H
1
: >200 psi H
1
: <200 psi
(1) (2)
Con el planteamiento (2) si se rechaza H
0
se concluye que las botellas
no soportan los 200 psi, es decir, se concluye que las botellas son
satisfactorias a menos que halla evidencia fuerte en sentido contrario

cul planteamiento es el correcto?
UMSNH -
FIE
Es decir, en la Hiptesis alternativa se debe
poner la proposicin sobre la cual es
importante llegar a una conclusin fuerte:
H
0
: =200 psi H
0
: =200 psi
H
1
: >200 psi H
1
: <200 psi
(1) (2)
UMSNH -
FIE
Antes de Examinar los datos muestrales:
1. Identificar el parmetro de inters
2. Establecer la Hiptesis Nula H
0

3. Especificar una Hiptesis alternativa adecuada H
1

4. Seleccionar un nivel de significancia o
Usando los datos muestrales:
5. Establecer un estadstico de prueba adecuado
6. Establecer una regin de rechazo
7. Calcular todas las cantidades muestrales necesarias para el
estadstico
8. Decidir si debe o no rechazarse H
0

UMSNH -
FIE
Si se desea probar la Hiptesis:
H
0
: =
0
H
1
: s
0
Se puede usar el estadstico de prueba Z siguiente




El cual tiene una distribucin Normal con media cero y varianza 1 (si se
cumplen las suposiciones del teorema del lmite central)
N /

X
Z
0
__

=
UMSNH -
FIE
Entonces, para una o dada podemos establecer las siguientes regiones
de aceptacin y crtica:
-z
o/2
z
o/2
Z
o/2 o/2
Regin de aceptacin regin crtica regin crtica
Conclusiones:
Rechazar H
0
si: z < -z
o/2
o z > z
o/2

No rechazar H
0
si: - z
o/2
s z s z
o/2
UMSNH -
FIE
Ejemplo: Se ilustrarn los 8 pasos del procedimiento general para el
ejemplo del combustible slido para sistemas de escape de aeronaves.
En este caso se conoce o=2 cm/seg, se desea probar si la media es de
50 cm/seg. Se selecciona una muestra aleatoria de tamao N=25,
obteniendo x=51.3 cm/seg. Se especifica un nivel de sginificancia o=0.05
A qu conclusiones se debe llegar?
1) El parmetro de inters es (rapidez promedio de combustin)
2) H
0
: = 50 cm/seg
3) H
1
: = 50 cm/seg
4) o = 0.05
_
UMSNH -
FIE
5) La estadstica de prueba es

6) Rechazar H
0
si z>1.96 o si z<-1.96 (consecuencia del paso 4)
7) clculos


8) Conclusin como z = 3.25 > 1.96, se rechaza H
0
: = 50 cm/seg con un
nivel de significancia o = 0.05
8) Es decir, Se concluye que en base a una muestra de 25 mediciones la
rapidez promedio de combustin es diferente de 50 cm/seg, de
hecho, existe evidencia fuerte de que sta es mayor.
N /

X
Z
0
__

=
25 . 3
25 2/
50 3 . 51
Z =

=
UMSNH -
FIE
Una manera de notificar los resultados de una prueba de hiptesis es
establecer si la hiptesis nula fue o no rechazada con un nivel
especificado o de significancia
Una alternativa es especificar el nivel de significancia o ms pequeo
que conduce al rechazo de la hiptesis nula. A este se le llama el Valor
P
Este valor P slo depende de la muestra tomada, es decir, para una
muestra y un estadstico calculado se puede obtener su valor P y
comparar con un o especificado. Entonces, si P<o, H
0
se rechaza.
UMSNH -
FIE
En el caso de la distribucin normal para la pureba sobre la media es
fcil calcular el valor P. Si z
0
fue el valor calculado del estadstico de
prueba, entonces:
Donde u(z) = P(Zsz) (Funcin de distribucin normal N(0,1))
Para el ejemplo z
0
= 3.25, entonces P=2(1-u(3.25))=0.0012. Es decir, H
0

ser rechazada con cualquier nivel de significancia o > 0.0012
P =
2 [ 1- u(|z
0
|) ] Prueba de dos colas: H
0
:=
0
, H
1
: =
0
1- u(z
0
) Prueba de cola superior: H
0
:=
0
, H
1
: >
0

u(z
0
) Prueba de cola inferior: H
0
:=
0
, H
1
: <
0

Si se usa el enfoque del valor P el paso 6 del procedimiento general de
prueba de hiptesis ya no es necesario.
UMSNH -
FIE
Consideremos la hiptesis bilateral H
0
:=
0
, H
1
: =
0.
Si H
0
es falsa y la media verdadera es =
0
+ o (con o>0). El estadstico
de prueba

se puede escribir como
Es decir, Si H
1
es verdadera Z tiene distribucin Normal con media
y varianza 1.
Por lo tanto, el error Tipo 1 (|) se puede calcular como
N /

X
Z
0
__

N
N /
) (
X
Z
0
__
+
+
=

N
|
|
.
|

\
|
+ ~

N
z
/2

Y si definimos | = u(-z
|
), obtenemos

) z (z
N
/2
+
~
UMSNH -
FIE
Para el ejemplo del combustible slido. Si al analista le interesa disear la
prueba de hiptesis de manera que si el valor verdadero de es 51
cm/seg se rechace H
0
con una probabilidad alta (por ejemplo 90%) y
con el mismo valor anterior de o=0.05
En este caso o=1, o=2, o=0.05 por lo tanto, mediante Matlab:

N= 4*(norminv(0.025) + norminv(0.1))^2 ~ 42
Observacin: Debe tenerse cuidado cuando se interpretan los
resultados basados en una muestra muy grande, ya que es muy
probable que se detecte cualquier alejamiento (muy pequeo)
respecto al valor hipottico
o
. Esta diferencia podra no tener ninguna
importancia prctica pero conducir al rechazo de H
0
UMSNH -
FIE
Se tienen dos poblaciones de inters. La primera con media
1
y
varianza o
1
2
conocidas y la segunda con media
2
y varianza o
2
2

conocidas. Interesa saber si las dos medias son iguales. Se plantean las
hiptesis H
0
:
1
=
2

H
1
:
1
=
2
Por lo tanto el siguiente estadstico de prueba

Es N(0,1) si H
0
es verdadera.

Por lo tanto se rechazar H
0
si z
0
>z
o/2
o z<z
-o/2


Suposiciones: Las dos poblaciones son normales o se cumplen las
condiciones del teorema del lmite central. Entonces el estadstico X
1
-X
2

es una variable Normal con media
1
-
2
y varianza o
1
2
/N
1
+ o
2
2/
/N
2
_ _
2
2
2
1
2
1
2
___
1
___
N

X X
Z
+

=
UMSNH -
FIE
Ejemplo: Un diseador quiere reducir el tiempo de secado de una
pintura. Se prueban dos frmulas de pintura. La frmula 1 es la normal y
la frmula 2 posee un ingrediente secante que se espera reduzca el
tiempo de secado. Se sabe que el tiempo de secado tiene una
desviacin estndar de 8 min y que sta no se afecta con la adicin del
nuevo ingrediente. Se pintan 10 especmenes con la frmula 1, y 10 con
la frmula 2, obtenindose tiempos promedio de secado de x
1
=121 min,
y x
2
=112 min. respectivamente. A qu conclusin se llega sobre la
eficacia del nuevo ingrediente utilizando o=0.05.?

1) Cantidad de inters:
1
-
2
2) H
0
:
1
=
2

3) H
1
:
1
>
2
(se busca evidencia fuerte que indique que el tiempo de
secado promedio de la muestra 2 es menor)
_
_
UMSNH -
FIE
4) o=0.05
5) El estadstico de prueba es

6) H
0
se rechazar si z>z
0.05
= 1.645
7) Sustituyendo los datos, obtenemos z=(121-112)/(12.8)
1/2
=2.52
8) Conclusin: Puesto que z = 2.52 > 1.645 se rechaza H
0
con un nivel
de significancia o=0.05 concluyndose el nuevo ingrediente s
disminuye el tiempo de secado.

Alternativamente puede calcularse un valor P =1-u(2.52) = 0.0059, es
decir, se rechazar H
0
para cualquier nivel de significancia o>0.0059
2
2
2
1
2
1
2
___
1
___
N

/ )
X X
( Z + =
UMSNH -
FIE
En el ejemplo anterior se supone que fueron asignados de manera
aleatoria 10 especmenes a una frmula (tratamiento) y 10 especmenes
a la otra luego se aplic la pintura en un orden aleatorio a cada
especmen hasta pintar los 20. Este es un Experimento Completamente
Aleatorizado.

En un estudio estadstico sobre la incidencia del cncer pulmonar entre
personas que fuman normalmente se hace un seguimiento en el tiempo
de los individuos a prueba. Este es un Experimento Observacional
En este caso no se puede asignar de manera aleatoria un tratamiento u
otro (fumar o no fumar) a una porcin de los individuos. Por otro lado, el
hbito de fumar no es el nico factor que influye en el desarrollo de
cncer pulmonar.
UMSNH -
FIE
Si la poblacin tiene una distribucin Normal con media y varianza o
2

desconocidas pudiera utilizarse el estadstico S
2
y el procedimiento
descrito anteriormente para varianza conocida (esto es vlido para N
grande), pero si la muestra es pequea, tendremos que usar el
estadstico siguiente,


el cual tiene una distribucin t con N-1 grados de libertad,

As, para la prueba de Hiptesis bilateral
H
0
: =
0

H
1
: =
0
Se rechazar H
0
si t>t
o/2,N-1
o si t<t
-o/2,N-1

N S/

X
T
0
__

=
UMSNH -
FIE
Ejercicio: Los siguientes son datos de pruebas de resistencia a la
adhesin, los siguientes datos presentan la carga (en Mpa) a la cual 22
especmenes fallaron






Sugieren los datos que la carga promedio de falla es mayor que
10Mpa? Supngase que la carga de falla tiene una distribucin Normal
y utilice o=0.05. Desarrolle los 8 pasos del procedimiento general y
encuentre un valor P para la prueba.

19.8 18.5 17.6 16.7 15.8 15.4
14.1 13.6 11.9 11.4 11.4 8.8
7.5 15.4 15.4 19.5 14.9 12.7
11.9 11.4 10.1 7.9
UMSNH -
FIE
El valor P es el ms pequeo nivel de significancia para el que H
0
debe
rechazarse, esto es el rea de la cola (de la curva de densidad de
probabilidad) que est ms all del valor del estadstico (en este caso t).
o el doble de esta rea en pruebas bilaterales.

Seleccin del Tamao de la Muestra
En todas las pruebas de hiptesis estadsticas se puede calcular el
tamao de la muestra (N) adecuada en funcin de la magnitud del
error de tipo I que se permite. En cada tipo de prueba se encuentran
frmulas diferentes para N.

UMSNH -
FIE
En forma similar a como se describi el caso de la media y la diferencia
de medias, se pueden realizar diferentes pruebas de hiptesis para estos
mismos u otros parmetros, lo nico que cambia en cada caso es:

- Las suposiciones sobre la distribucin de la poblacin
- El estadstico elegido y por consiguiente
- La distribucin del estadstico.

En la siguiente tabla se resumen algunas de las pruebas de hiptesis ms
utilizadas

UMSNH -
FIE
Prueba sobre Hiptesis Nula Suposiciones
Estadstico
de Prueba
La media
=
0
o
2
conocida Normal
=
0
o
2
desconocida T
Igualdad de
medias

1
=
2
o
1
2
= o
2
2
conocidas Normal

1
=
2
o
1
2
= o
2
2
desconocidas T

1
=
2
o
1
2
= o
2
2
conocidas T
La varianza
o
2
= o
0
2
dist. Normal, N pequea Ji
2
o
2
= o
0
2
N grande Normal
Igualdad de dos
varianzas
o
1
2
= o
2
2
F
Una proporcin p = p
0
Normal
Igualdad de dos
proporciones
p
1
= p
2
Normal
UMSNH -
FIE
Las pruebas de hiptesis anteriores se llaman paramtricas porque
suponen conocida la distribucin de la poblacin y la hiptesis es
acerca de los parmetros de dicha distribucin.

Otra clase de hiptesis es: No se sabe cual es la distribucin de la
poblacin y se desea probar la hiptesis de que cierta distribucin en
particular ser un modelo satisfactorio. Por ejemplo, tal vez se requiera
probar si la distribucin es Normal

Hiptesis bilateral

Una prueba de cualquier hiptesis, tal
como:
H
0
: =
0

H
1
:
0


recibe el nombre de prueba bilateral.
Hiptesis unilateral.
Muchos problemas de prueba de hiptesis
involucran de manera natural hiptesis
alternativas unilaterales, tales como:
H
0
: =
0

H
1
: >
0

O bien:
H
0
: =
0

H
1
: <
0


Si la hiptesis alternativa es H
1
: >
0
, la
regin crtica debe encontrase en la
cola superior de la distribucin del
estadstico de prueba.
Si la hiptesis alternativa es H
1
: <
0
, la
regin crtica debe encontrarse en la
cola inferior de la distribucin.
Si el objetivo es hacer una afirmacin
donde aparezcan proposiciones tales
como mayor que, menor que,
superior a, excede a, al menos y
otras similares, entonces la alternativa
unilateral es la ms apropiada.
4.4.2. PRUEBAS PARA MEDIA Y PARA DIFERENCIA DE MEDIAS.
Prueba para diferencia de medias, muestras grandes y
pequeas
En algunos diseos de investigacin, el plan muestral requiere
seleccionar dos muestras independientes, calcular las medias
muestrales y usar la diferencia de las dos medias para estimar o probar
una diferencia entre dos medias poblacionales.
Por ejemplo si dos empresas en Tabasco que ofrecen servicios de
encuestas y anlisis estadstico indica que la calificacin promedio que
le asigna la poblacin al gobierno es de 6 y la otra empresa dice que es
de 5.5; podemos notar que hay una diferencia estarn bien tomadas
las muestras de las dos empresas? Si creemos que si la hiptesis nula
ser que la diferencia entre las dos medias poblacionales es igual a
cero ya que estamos hablando de la misma poblacin.
El estadstico Z para estos casos se calcula de la siguiente
manera:
( 1 2 ) ( 1 2 )
2 2
1 2
1 2

z =
n n
x x
s s

+
Donde:
x1 Promedio de la muestra 1
x2 Promedio de la muestra 2
1 Media de la poblacin 1
2 Media de la poblacin 2
s1 Varianza de la poblacin 1
s 2 Varianza de la poblacin 2
1 n Nmero de elementos de la muestra 1
2 n Nmero de elementos de la muestra 2
muestras pequeas (es decir, menor a 30 elementos) en cambio si no se
conocen las varianzas poblacionales se pueden aproximar con las
varianzas muestrales; pero en dicho caso no es posible usar muestras
pequeas, solo para estudios de 30 o ms elementos muestreados.
Aunque el tema en el plan de estudios abarca muestras grandes y
pequeas, dado que las varianzas poblacionales raramente se conocen
en estudios sociales y polticos, este tema solo desarrollar mediante
ejemplos las aplicaciones para muestras grandes con varianzas
poblacionales desconocidas; solo conoceremos las varianzas
muestrales.
Solo se insiste en que el procedimiento para muestras pequeas
(menores a 30 elementos) es exactamente el mismo pero debe
conocerse la varianza poblacional.
Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales
mostr que la cantidad promedio que pagan a un fondo de pensin
privado es de $3,352 con una desviacin estndar muestral de $1,100.
Una muestra de 76 hombres trabajadores profesionales muestra que la
cantidad que paga a un fondo de pensin privado es de $5,727 con una
desviacin estndar de $1,700. Un grupo activista de mujeres desea
demostrar que las mujeres no pagan tanto como los hombres en fondos
de pensin privados. Si se usa alfa = 0.01 Se confirma lo que el grupo
activista de mujeres desea demostrar o no?
4.4.3. Pruebas para proporcin y diferencia
de proporciones
Prueba para diferencia de proporciones
En algunos diseos de investigacin, el plan muestral requiere
seleccionar dos muestras independientes, calcular las proporciones
muestrales y usar la diferencia de las dos proporciones para estimar o
probar una diferencia entre las mismas.
Las aplicaciones son similares a la diferencia de medias, por ejemplo si
dos empresas consultoras ofrecen datos de proporciones de personas
que van a votar por el PRI y al hacer dos estudios diferentes salen
resultados ligeramente diferentes pero qu tanta diferencia se requiere
para que sea estadsticamente significativo? De eso se tratan las
pruebas estadsticas de diferencias de proporciones.
El estadstico Z para estos casos se calcula de la siguiente manera:
( ) ( )
( )
1 2 1 2
1 2
1 1 2 2
1 2
p -p p -p
z =
1 1
p q
n n
Donde:
n p n p
p
n n
q = 1 - p


+

+
=
+
1 p = proporcin de la muestra 1.
2 p = proporcin de la muestra 2.
1 p = proporcin de la poblacin 1.
2 p = proporcin de la poblacin 2.
1 n = tamao de la muestra 1.
2 n = tamao de la muestra 2.
Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales
mostr que la cantidad promedio que pagan a un fondo de pensin
privado el 5% de su sueldo. Una muestra de 76 hombres trabajadores
profesionales muestra que la cantidad que paga a un fondo de pensin
privado es el 6.1% de su sueldo. Un grupo activista de mujeres desea
demostrar que las mujeres no pagan tanto como los hombres en fondos
de pensin privados. Si se usa alfa = 0.01 Se confirma lo que el grupo
activista de mujeres desea demostrar o no?
4.5. MUESTRAS PEQUEAS
En probabilidad y estadstica, la distribucin-t o distribucin t de Student es una
distribucin de probabilidad que surge del problema de estimar la media de una
poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. sta es
la base del popular test de la t de Student para la determinacin de las diferencias entre
dos medias muestrales y para la construccin del intervalo de confianza para la
diferencia entre las medias de dos poblaciones. La distribucin t surge, en la mayora de
los estudios estadsticos prcticos, cuando la desviacin tpica de una poblacin se
desconoce y debe ser estimada a partir de los datos de una muestra
Supongamos que //A// es tal que {teoria_pequena_muestras
donde// T// sigue una distribucin t con n 1 grados de libertad (lo que equivale a
{teoria_pequena_muestras
por lo que //A// es el punto que determina el 95% de la probabilidad de la distribucin).
Entonces
{teoria_pequena_muestras
y esto es equivalente a
{teoria_pequena_muestras
Por lo tanto, el intervalo cuyos extremos son
{teoria_pequena_muestras
es un intervalo para al 90% de confianza. As, si encontramos que la media de un
conjunto de observaciones puede razonablemente seguir una distribucin normal,
podemos usar la distribucin t para examinar si los lmites del intervalo incluyen algn
valor predecible (tal como el valor predicho en una hiptesis nula.
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las
medias de muestras de dos distribuciones normales se distribuye tambin normalmente,
la distribucin t puede usarse para examinar si esa diferencia puede razonablemente
suponerse igual a cero.
Supngase que se toma una muestra de una poblacin normal con media y varianza
. Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces
la distribucin



es una distribucin normal estndar. Supngase que la varianza de
la poblacin
es desconocida. Qu sucede con la distribucin de esta estadstica si se reemplaza por
La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son = 0 y para >2, respectivamente.

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la distribucin t es similar a
la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada se
alcanza en la media = 0. Sin embargo, la distribucin t tiene colas ms amplias que la normal; esto es, la
probabilidad de las colas es mayor que en la distribucin normal.
A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin
normal estndar.
Propiedades de las distribuciones t
1.Cada curva t tiene forma de campana con centro en 0.
2.Cada curva t, est ms dispersa que la curva normal estndar z.
3.A medida que aumenta, la dispersin de la curva t correspondiente disminuye.
4.A medida que , la secuencia de curvas t se aproxima a la curva normal estndar,
5.por lo que la curva z recibe a veces el nombre de curva t con gl =
La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con grados de libertad.
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes que son todas normales
con media y desviacin estndar . Entonces la variable aleatoria tiene una
distribucin t con = n-1 grados de libertad.
La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo
de W. S. Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa
que desaprobaba la publicacin de investigaciones de sus empleados. Para evadir
esta prohibicin, public su trabajo en secreto bajo el nombre de "Student".
En consecuencia, la distribucin t normalmente se llama distribucin t de Student,
o simplemente distribucin t. Para derivar la ecuacin de esta distribucin, Gosset
supone que las muestras se seleccionan de una poblacin normal. Aunque esto
parecera una suposicin muy restrictiva, se puede mostrar que las poblaciones no
normales que poseen distribuciones en forma casi de campana an proporcionan
valores de t que se aproximan muy de cerca a la distribucin t.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la
muestra y siempre es mayor a uno. Unicamente cuando el tamao de la muestra
tiende a infinito las dos distribuciones sern las mismas.
UMSNH -
FIE
La aproximacin mejora a medida que N es ms grande
La hiptesis debe rechazarse si el valor del estadstico de prueba es
_
2
> _
2
1-o,k-p-1
Precaucin: Si las frecuencias esperadas son muy pequeas el
estadstico _
2
no reflejar el alejamiento entre lo observado y lo
esperado. (Se considera que valores menores de 5 son pequeos)
Si en una prueba resultan frecuencias esperadas pequeas, se pueden
combinar intervalos de clase adyascentes para aumentar estos valores,
ya que no es necesario que los anchos de clase sean del mismo tamao
UMSNH -
FIE
Ejemplo 1.- Un algoritmo para generar enteros pseudoealeatorios de 0 a
9 se prueba para determinar si tiene una distribucin uniforme, para ello
se generan 1000 nmeros, obteniendo la siguiente tabla de frecuencia.
Existe evidencia de que el generador funciona de manera correcta?.
Utilice o=0.05
Como E
i
se puede calcular sin estimar ningn parmetro a partir de la
muestra, entonces p=0 y el estadstico ser ji
2
con k-p-1=10-0-1=9 grados
de libertad.
0 1 2 3 4 5 6 7 8 9
O
i
94 93 112 101 104 95 100 99 108 94
E
i
100 100 100 100 100 100 100 100 100 100
4.5.2. DISTRIBUCIN DE JI-CUADRADA. CUADROS
DE CONTINGENCIA, LIMITACIONES DE LA
PRUEBA.
UMSNH -
FIE
1) Variable de inters: distribucin de los nmeros pseudoaleatorios
2) H
0
: La distribucin es uniforme en el intervalo de 0 a 9
3) H1: La distribucin No es uniforme en ese intervalo
4) o = 0.05
5) El estadstico de prueba es
6) Se rechazar H
0
si _
2
> _
2

0.05,9
=16.92
7) Clculos
_
2
= 0.01*( (94-100)
2
+(93-100)
2
+...+(94-100)
2
)=3.72
8) Conclusiones: como 3.72 < 16.92 No es posible rechazar la hiptesis.
Por lo tanto parece ser que el generador de nmeros aleatorios
trabaja bien.
Cual es el valor P de la prueba ?

=
k
1 i i
2
i i
2
E
) E (O

UMSNH -
FIE
Ejemplo 2.- Se propone que el nmero de defectos en tarjetas de
circuito impreso sigue una distribucin de Poisson. Se obtiene una
muestra de 60 tarjetas y se observa el nmero de defectos, con los
siguientes resultados:
defectos 0 1 2 3 4 o ms
O
i
32 15 9 4 0
Distribucin de Poisson. Es una distribucin discreta cuya funcin de
probabilidad es


Definida para x=0,1,2,3,.... Donde es la media de X
x!
e
f(x)
x -
=
UMSNH -
FIE
Clculo de las frecuencias Esperadas E
i
:
Un estimador para la media de la distribucin de Poisson es la media
muestral, es decir, (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando
este valor de m obtenemos la siguiente tabla de frecuencias esperadas:
x 0 1 2 3 4 o ms
F(x) 0.472 0.354 0.133 0.033 0.0073
E
i
28.32 21.24 7.98 1.98 0.44
Para evitar que las ltimas dos frecuencias esperadas sean menores que
5 combinamos las ltimas tres celdas para obtener:
x 0 1 2 o ms
E
i
28.32 21.24 10.44
O
i
32 15 13
UMSNH -
FIE
1) Variable de inters: La forma de distribucin de los defectos en
tarjetas de circuito impreso
2) H
0
: La distribucin es de Poisson
3) H1: La distribucin No es Poisson
4) o = 0.05
5) El estadstico de prueba es , el cual tiene una
distribucin _
2
con k-p-1=3-1-1=1 grado de libertad
6) Se rechazar H
0
si _
2
> _
2

0.05,1
=3.84
7) Clculos
_
2
= (94-100)
2
/28.32+(93-100)
2
/21.24+(94-100)
2
/10.44 = 2.94
8) Conclusiones: como 2.94 < 3.84. No es posible rechazar la hiptesis.
Por lo tanto parece ser que la distribucin de defectos en las placas
de circuito impreso es Poisson
El valor P de la prueba es P=0.9861

=
k
1 i i
2
i i
2
E
) E (O

UMSNH -
FIE
Ejemplo 3.- Se desea determinar con o=0.05 si el voltaje de salida de una
fuente de alimentacin est descrito por una distribucin Normal. Se
toma una muestra aleatoria de N=100 fuentes, determinndose los
siguientes valores muestrales x = 5.04, s = 0.08.

Para evitar valores de frecuencias esperadas muy pequeos, de
antemano se elige el ancho de los intervalos de clase de manera que la
frecuencia esperada sea constante F
i
= N / k.

As, si k=8 clases, se buscarn 8 intervalos de clase que dividan la curva
de densidad normal en 8 reas iguales, como se muestra en la siguiente
figura para media 0 y varianza 1.
UMSNH -
FIE
Para la distribucin N(0,1) los lmites de los 8 intervalos son
, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+,
por lo tanto para el ejemplo, los lmites son
, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+
Con esta eleccin se obtiene la siguiente tabla de frecuencias para la
muestra
-4 -3 -2 -1 0 1 2 3 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Intervalo de Clase O
i
E
i
De a 4.948
De 4.948 a 4.986
De 4.986 a 5.014
De 5.014 a 5.040
De 5.040 a 5.066
De 5.066 a 5.094
De 5.094 a 5.132
De 5.132 a +
12
14
12
13
12
11
12
14
12.5
12.5
12.5
12.5
12.5
12.5
12.5
12.5
Suma: 100 100
Intervalo de Clase O
i
E
i
De a 4.948
De 4.948 a 4.986
De 4.986 a 5.014
De 5.014 a 5.040
De 5.040 a 5.066
De 5.066 a 5.094
De 5.094 a 5.132
De 5.132 a +
12
14
12
13
12
11
12
14
12.5
12.5
12.5
12.5
12.5
12.5
12.5
12.5
Suma: 100 100
Objetivos
Despues de completar este mdulo,, es estudiante podr:
1.- Entender como las Decisiones Comerciales dependen del
conocimiento de las relaciones entre diferentes variables.
2.- Dibujar un Diagrama de Dispersin (Scatter Diagram).
3.- Entender e interpretar los conceptos de Variable
Dependiente e Independiente..
4.- Intender e interpretar los conceptos de intercepto y
pendiente (tasa de cambio).
5.- Calcular la ecuacin de la Linea de Regresin, usando el
Mtodo de los Cuadrados Mnimos. (Least-Squares Method).

Propsito: determinar la Ecuacin de la
Linea de Regresin;
Y = a + bX
Es usado para predecir el valor de la
variable Dependiente (Y) basado en los
valores de la Variable Independiente (X).

b
n XY X Y
n X X
a
Y
n
b
X
n
=

=
( ) ( )( )
( ) ( )
E E E
E E
E E
2 2
BADM4300-Prof. Pierre J. Devaris-Octubre2006
Procedimiento:
1. Seleccionar una Muestra de la
Poblacin a ser estudiada y organizarla
en pares de valores;
2. dibujar un Diagrama de Dispersin
(Scatter Diagram)para visualizar la
posible relacin entre las variables;
3. determinar la Ecuacin de la Linea de
Regresin, usando el Mtodo de los
Cuadrados Mnimos.
4. Evaluar la Ecuacin.
5. Hacer las Proyecciones a partir de la
Ecuacin.

BADM4300-Prof. Pierre J. Devaris-Octubre2006
Saddam Laden, presidente del Consejo
de estudiantes de la Universidad Fear
For All, est preocupada por los altos
precios de los libros de texto. Para
entender mejor la situacin, selecciona
al azar una muestra de 8 libros de la
librera. Decide estudiar la relacin entre
el nmero de pginas en los textos y los
costos de los mismos.

BADM4300-Prof. Pierre J. Devaris-Octubre2006
Anlisis de Correlacin : Un grupo de tcnicas
estadsticas usado para medir el grado de
relacin entre 2 variables.
Diagram de Dispersin (Scatter Diagram) : Una
grfica que muestra la relacin entre las 2
variables de inters.
Variable Dependiente (Y) : La variable que
queremos estimar o predecir.
Variable Independiente (X) : La variable que
se usa para hacer la prediccin o estimacin.
Libro Pginas Costo ($)
1 500 84
2 700 75
3 800 99
4 600 72
5 400 69
6 500 81
7 600 63
8 800 93
BADM4300-Prof. Pierre J. Devaris-Octubre2006
El Coeficiente de Correlacin (r) es una
medida del grado de la relacin entre
dos (2) variables.
Vara de -1.00 a +1.00.
Valores de -1.00 +1.00 indican una perfecta y
fuerte correlacin.
Valores cerca de 0.0 indican una debil
correlacin.
Valores negativos indican una relacin inversa y
valores positivos indican una relacin directa.

El Coeficiente de Determinacin, r
2
la
proporcin de las variaciones totales en
la variable dependiente Y que es
explicada (no causada) o atribuida a las
variaciones en la variable
independiente X.
El coeficiente de determinacin es el
cuadrado coeficiente de correlacin, y
vara de 0 a 1.00.
Desarrolle una ecuacin de regresin
usando los datos dados en el ejemplo
#1, para estimar el precio de venta
basado en el nmero de pginas.
Mtodo de Cuadrados Mnimos:,
b=.01714 and a=16.00175
Y =16.00175 + .01714X

El Error Estndar del Estimado mide la
dispersin o variabilidad de los datos
alrededor de la linea de regresin
Las frmulas usadas para calcular el
Error Estndar son:
S
Y Y
n
Y a Y b XY
n
Y X
=

E
E E E
( ' )
( ) ( )
2
2
2
2

5.1. REGRESIN LINEAL SIMPLE, CURVILNEA Y
MLTIPLE.
REGRESIN.-
Se define como un procedimiento mediante el cual se trata de determinar si existe o
no relacin de dependencia entre dos o ms variables. Es decir, conociendo los
valores de una variable independiente, se trata de estimar los valores, de una o ms
variables dependientes.
La regresin en forma grafica, trata de lograr que una dispersin de las frecuencias
sea ajustada a una lnea recta o curva.
Clases de Regresin
La regresin puede ser Lineal y Curvilnea o no lineal, ambos tipos de regresin
pueden ser a su vez:
Esta regresin se utiliza con mayor frecuencia en las ciencias econmicas, y sus
disciplinas tecnolgicas. Cualquier funcin no lineal, es linealizada para su estudio y
efectos prcticos en las ciencias econmicas, modelos no lineales y lineales
multiecuacionales.
Objetivo: Se utiliza la regresin lineal simple para:
1.- Determinar la relacin de dependencia que tiene una variable respecto a otra.
2.- Ajustar la distribucin de frecuencias de una lnea, es decir, determinar la forma
de la lnea de regresin.
3.- Predecir un dato desconocido de una variable partiendo de los datos conocidos
de otra variable.
Por ejemplo: Podra ser una regresin de tipo lineal:
En una empresa de servicio de Internet busca relacionar las ganancias que obtiene
cada computadora con el numero de usuarios que ingresan a dicha cabina
diariamente. En la tabla representa Y (Ganancias S/.) e X (Numero de usuarios)
5.1. REGRESIN LINEAL SIMPLE, CURVILNEA Y MLTIPLE.
Regresin lineal simple. Tiene como objeto estudiar cmo los cambios en una
variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una
relacin funcional entre ambas variables que puede ser establecida por una expresin
lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal
concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo
de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada
se designa por Y
x
y, segn lo establecido, se tendr


De manera equivalente, otra formulacin del modelo
de regresin lineal simple sera: si x
i
es un valor de la variable predictora e Y
i
la variable respuesta
que le corresponde, entonces



E
i
es el error o desviacin aleatoria de Y
i
.




Regresin lineal simple (RLS)
La regresin lineal es una tcnica estadstica para modelar e investigar la relacin
entre dos o ms variables. Tiene aplicacin en la industria para investigar la relacin
entre el rendimiento de la produccin y uno o ms factores del (o de los) que depende,
como la temperatura, la humedad ambiental, la presin, la cantidad de insumos, etc;
con base en este anlisis se puede pronosticar el comportamiento de una variable
que se desea estimar. Si el ingeniero industrial logra determinar cmo se relacionan
las variables conocidas de un proceso con el comportamiento futuro de otra variable
de inters, podr colaborar favorablemente y en gran medida al proceso de toma de
decisiones.
Los anlisis de regresin y correlacin nos permiten determinar tanto la naturaleza
como la fuerza de una relacin entre dos variables; de esta forma, se puede
pronosticar, con cierta precisin, el valor de una variable desconocida basndonos
en observaciones anteriores de sa y otras variables. Pero este aspecto, el de la
prediccin ser motivo de estudio en la seccin 1.4.
El modelo de regresin lineal simple es: Yi =0 + 1X + i
Donde Yi es la i-sima observacin de la variable dependiente (la que queremos
estimar), X es el correspondiente valor de la variable independiente o explicatorio,
0 y 1 son los parmetros (valores desconocidos que se suponen con valores fijos)
del modelo y i es la variable aleatoria de error.
Otros aspectos que deben considerarse: historia de cmo surge la tcnica de la
regresin, Galton y los datos de estaturas de padres e hijos, lo que al principio
se denominaba regresin hoy se conoce como correlacin. El concepto de regresin
ha quedado exclusivamente para el caso en que se consideran variables
dependientes e independientes.
Cuando la variable dependiente est en funcin de dos o ms regresores se
tiene el modelo de regresin mltiple (RLM):
Yi =0 + 1xi 1 + 2xi 2 + + qxi q + i .
Usando lgebra de matrices puede estimarse el vector de
parmetros _ = 0 1 2 . . . q t con _ = (xx)1xty
5.2 CORRELACION
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una
relacin lineal entre dos variables aleatorias. Se considera que dos variables
cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos
variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los
de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna
relacin de causalidad (Vase Cum hoc ergo propter hoc).
Fuerza, sentido y forma de la correlacin
La relacin entre dos super variables cuantitativas queda representada mediante la
lnea de mejor ajuste, trazada a partir de la nube de puntos. Los principales
componentes elementales de una lnea de ajuste y, por lo tanto, de una correlacin,
son la fuerza, el sentido y la forma:
La fuerza extrema segun el caso, mide el grado en que la lnea representa a la nube
de puntos: si la nube es estrecha y alargada, se representa por una lnea recta, lo que
indica que la relacin es fuerte; si la nube de puntos tiene una tendencia elptica o
circular, la relacin es dbil.
El sentido mide la variacin de los valores de B con respecto a A: si al crecer los valores
de A lo hacen los de B, la relacin es positiva; si al crecer los valores de A disminuyen los
de B, la relacin es negativa.
La forma establece el tipo de lnea que define el mejor ajuste: la lnea rectal, la curva
monotnica o la curva no monotnica.
Coeficientes de correlacin
Existen diversos coeficientes que miden el grado de correlacin, adaptados a la
naturaleza de los datos. El ms conocido es el coeficiente de correlacin de Pearson
(introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza
de dos variables por el producto de sus desviaciones estndar. Otros coeficientes son:
Coeficiente de correlacin de Spearman
Correlacin cannica
[Coeficiente de Correlacin Intraclase]



5.3. REGRESIN Y CORRELACIN PARA DATOS AGRUPADOS.
Y' = a + b1X1 + b2X2
Ecuacin de regresin Mltiple.- La forma general de la ecuacin de regresin
mltiple con dos variables independientes es:

X1,X2 : Variables Independientes
a : es la ordenada del punto de interseccin con el eje Y.
b1 : Coeficiente de Regresin (es la variacin neta en Y por cada unidad de
variacin en X1.).
b2 : Coeficiente de Regresin (es el cambio neto en Y para cada cambio
unitario en X2).

Prueba Global.- esta prueba investiga bsicamente si es posible que todas las
variables independientes tengan coeficientes de regresin neta iguales a 0.

Marco Terico
A fin de facilitar la comprensin del presente trabajo definiremos algunos conceptos
basicos.
Anlisis de Correlacin .- Es el conjunto de tcnicas estadsticas empleado para medir
la intensidad de la asociacin entre dos variables.
El principal objetivo del anlisis de correlacin consiste en determinar que tan intensa
es la relacin entre dos variables. Normalmente, el primer paso es mostrar los datos en
un diagrama de dispersin.

Diagrama de Dispersin.- es aquel grafico que representa la relacin entre dos
variables.
Variable Dependiente.- es la variable que se predice o calcula. Cuya
representacin es "Y"
Variable Independiente.- es la variable que proporciona las bases para el calculo.
Cuya representacin es: X1,X2,X3.......
Coeficiente de Correlacin.- Describe la intensidad de la relacin entre dos
conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la
relacin lineal entre dos variables.
El valor del coeficiente de correlacin puede tomar valores desde menos uno hasta
uno, indicando que mientras ms cercano a uno sea el valor del coeficiente de
correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal entre las dos
variables. Mientras ms cercano a cero sea el coeficiente de correlacin indicar
que ms dbil es la asociacin entre ambas variables. Si es igual a cero se concluir
que no existe relacin lineal alguna entre ambas variables.
Anlisis de regresin.- Es la tcnica empleada para desarrollar la ecuacin y dar las
estimaciones.
Ecuacin de Regresin.- es una ecuacin que define la relacin lineal entre dos
variables.
Ecuacin de regresin Lineal: Y = a + Bx
Ecuacin de regresin Lineal Mltiple: Y = a + b1X1 + b2X2 + b3X3...
Principio de Mnimos Cuadrados.- Es la tcnica empleada para obtener la ecuacin
de regresin, minimizando la suma de los cuadrados de las distancias verticales
entre los valores verdaderos de "Y" y los valores pronosticados "Y".
Anlisis de regresin y Correlacin Mltiple.- consiste en estimar una variable
dependiente, utilizando dos o ms variables independientes.
5.4. CORRELACIN POR RANGOS
Este coeficiente es una medida de asociacin lineal que utiliza los
rangos, nmeros de orden, de cada grupo de sujetos y compara
dichos rangos. Existen dos mtodos para calcular el coeficiente de
correlacin de los rangos uno sealado por Spearman y otro por
Kendall 8. El r de Spearman llamado tambin rho de Spearman es ms
fcil de calcular que el de Kendall. El coeficiente de correlacin de
Spearman es exactamente el mismo que el coeficiente de correlacin
de Pearson calculado sobre el rango de observaciones. En definitiva
la correlacin estimada entre X e Y se halla calculado el coeficiente
de correlacin de Pearson para el conjunto de rangos apareados. El
coeficiente de correlacin de Spearman es recomendable utilizarlo
cuando los datos presentan valores externos ya que dichos valores
afectan mucho el coeficiente de correlacin de Pearson, o ante
distribuciones no normales.
El clculo del coeficiente viene dado por:
En donde di = rxi ryi es la diferencia entre los rangos de X e Y. Los
valores de los rangos se colocan segn el orden numrico de los datos
de la variable.
Coeficiente de Correlacin. El coeficiente de correlacin ms utilizado es el de Pearson,
este es un ndice estadstico que mide la relacin lineal entre dos variables cuantitativas, es
una forma de medir la intensidad de la relacin lineal entre dos variables. El valor del
coeficiente de correlacin puede tomar valores desde menos uno hasta uno, 1 < r < 1,
indicando que mientras ms cercano a uno sea el valor del coeficiente de correlacin, en
cualquier direccin, ms fuerte ser la asociacin lineal entre las dos variables. El
coeficiente de correlacin de clculo r es un estimador muestral del coeficiente
poblacional Rho, .
Mientras ms cercano a cero sea el coeficiente de correlacin, este indicar que ms
dbil es la asociacin entre ambas variables. Si es igual a cero se concluir que no existe
relacin lineal alguna entre ambas variables. Hay varias maneras de equivalentes de
calcular r, a continuacin se muestran tres formas. Coeficiente Correlacin Frmula por
Covarianzas y Desviaciones Tpicas
Siendo: SXY la covarianza de (X,Y) y SX, SY las desviaciones tpicas de las distribuciones
de las variables independiente y dependiente respectivamente. Coeficiente Correlacin
Frmula Clsica. Poco usada para clculo.
Coeficiente Correlacin, Frmula por suma de cuadrados. Se usa cuando se dispone de
calculadoras de mano que hacen sumatorias y no correlacin.
5.5. COEFICIENTE DE CORRELACIN PARA DATOS NOMINALES.

You might also like