You are on page 1of 90

MDULO 2 Ral A.

Marigliano UNT
1
1. Probabilidad. Definiciones y reglas bsicas
1.1. Introduccin
En el lenguaje corriente, se utiliza con frecuencia el concepto y el trmino probabilidad,
para designar el grado de confianza que una persona tiene sobre la ocurrencia de un
determinado suceso. As cuando decimos que es probable que el dlar se mantenga
estable, o cuando escuchamos que existe un 50% de probabilidad de lluvia,
incorporamos el trmino probabilidad a nuestra vida cotidiana, como una idea de
posibilidad de ocurrencia de un determinado evento.
La probabilidad de un suceso vara entre 0 y 1, o entre 0 y 100 si se expresa en
porcentaje. Una probabilidad igual a 1 indica con certeza de que el suceso ocurrir,
mientras que una probabilidad igual a 0 muestra absoluta seguridad de que el suceso
no ocurrir. Valores intermedios sealan estados de mayor o menor confianza en la
ocurrencia del suceso.

Consideremos los siguientes experimentos:

- - Si lanzamos una moneda, cuntas veces debemos arrojarla hasta que salga
cara?

- - Si arrojamos un dado, que nmero aparecer en la cara superior?

En este tipo de experiencias, no podemos predecir de antemano el resultado cada vez
que se repite. Sin embargo, veremos que es posible prever una ley de comportamiento
de todos los resultados posibles y, en base a ella, calcular la probabilidad de obtener
un resultado aislado.
El problema de medir o cuantificar estas probabilidades, histricamente originado en
las preocupaciones de los nobles franceses para tener xito en los juegos de azar, dio
lugar al desarrollo de la teora de probabilidades.
En el Mdulo 1, hemos formulado que en la mayora de los anlisis estadsticos se
trabaja con muestras. Tambin definimos el trmino variable aleatoria,
conceptualizando que una muestra es representativa de la poblacin slo si podemos
asegurar que todos los elementos de la poblacin tuvieron una probabilidad conocida
de ser elegidos.
Este concepto adquiere una importancia primordial en el anlisis estadstico, si
consideramos que resulta imposible asegurar con absoluta certeza las inferencias
a travs de resultados muestrales. Como estos resultados son valores aleatorios,
generalizar las conclusiones de la muestra a la poblacin, produce una situacin de
incertidumbre. Si establecemos una ley de comportamiento de los resultados
MDULO 2 Ral A. Marigliano UNT
2
muestrales, la confianza de la generalizacin puede medirse en trminos de
probabilidad.
Los conceptos de probabilidad son de utilidad para la comprensin e interpretacin de
datos presentados en cuadros y grficas de publicaciones; permiten adems generar
enunciados acerca de cunta confianza tenemos en estimaciones como medias o
proporciones. Por otra parte entender que es probabilidad resulta indispensable para
explicar el significado de los valores p que se aportan en las publicaciones.

- - La probabilidad es el instrumento adecuado para medir el error que se comete al
inferir resultados de una muestra a la poblacin, cuando los elementos han sido
seleccionados aleatoriamente

1.2. Teoras probabilsticas
Existen varias teoras que definen de distintas formas la nocin de probabilidad. En
este curso estudiaremos la definicin clsica y la que establece la teora frecuencial.

1.2.1. Teora clsica
Su existencia se fundamenta principalmente en la teora de los juegos de azar,
bsicamente sustentada en que todos los resultados de un juego deben ser
igualmente probables y mutuamente excluyentes
1
.
1
Resultados mutuamente excl uyent es son aquell os que no pueden presentarse conj unt ament e

- - La probabilidad de ocurrencia de un evento se calcula como el cociente de la
cantidad de casos favorables, sobre el total de resultados igualmente posibles.

Si A es el evento aleatorio
2
al que se quiere calcular la probabilidad de ocurrencia, en
smbolos:
posibles casos de total
A valor al favorables casos
) A ( P =

2
Un evento al eat orio es un resul tado de un experi mento al eatorio

Introduciremos algunos conceptos recurriendo a los juegos de saln, en los que el
azar desempea un papel fundamental.
En muchos juegos de naipes se utiliza una baraja de 52 cartas; dividida en dos
colores: rojo y negro, cuatro palos: corazn, diamante, trbol y pique. Dentro de cada
palo hay 13 cartas: 1, 2, 3,..10, J , Q, K.
Antes de comenzar el juego se mezcla el mazo de naipes a los fines de colocar las
cartas en orden aleatorio, lo que significa que todos los posibles ordenamientos de las
MDULO 2 Ral A. Marigliano UNT
3
cartas son igualmente probables, y cada una de las cartas del mazo tiene la misma
probabilidad de ser, por ejemplo, la primera carta extrada.

Ejemplo 1.1
Determinar cul es la probabilidad de obtener un as de un mazo de 52 cartas. Esta
experiencia tiene 52 resultados posibles.
El evento de obtener un as tendr 4 resultados favorables, puesto que en el mazo hay
4 ases. Entonces:
52
4
) as un extraer ( P =


Ejemplo 1.2
Calcular la probabilidad de obtener un trbol. Dado que hay 13 trboles, la
probabilidad de obtener un trbol corresponde a un conjunto de 13 resultados
favorables, sobre 52 posibles. Entonces:

52
13
) trbol un obtener ( P =
Teora frecuencial
Para el propsito de este curso, de manera que pueda utilizarse el concepto de
probabilidad para interpretar resultados estadsticos de nuestro inters, este enfoque
del clculo de probabilidad es el que resulta de aplicacin ms prctica.
Existen situaciones en las que no puede aplicarse la nocin de un nmero definido de
casos igualmente probables, y no es posible entonces obtener un resultado de la
probabilidad a priori. En este tipo de eventos, se aplica la teora de probabilidad
conocida como teora frecuencial de la probabilidad.
Esta teora expresa que: si un experimento aleatorio
1
puede repetirse un nmero muy
grande de veces, la probabilidad de un evento en particular puede asimilarse a la
frecuencia relativa con la que ocurrir dicho evento cuando el nmero de repeticiones
es muy grande.
1
Un experi mento al eatorio es un procedimi ent o real izado un ci erto nmero de veces, bajo las mismas
condiciones de experi mentacin.

- - De esta forma, la ley de comportamiento de los fenmenos aleatorios surge de la
distribucin de frecuencias con que se presentan.

Retomando los experimentos dados al comienzo de este tema:

Ejemplo 1.3
Si lanzamos una moneda, cuantas veces debemos arrojarla hasta que salga cara?

MDULO 2 Ral A. Marigliano UNT
4
Es razonable suponer que la probabilidad de lanzar una moneda al aire y que salga
cara es:
P (salga cara) =1/2 =0,50 ( 50%)

Por supuesto, si lanzamos una moneda al aire 10 veces, no podemos garantizar que
se observarn exactamente cinco caras; la proporcin puede variar de 0 a 1, aunque
se espere que la mayora de las veces se aproxime ms a 0,5 que a 0 a 1. Si la
moneda se lanza 100 veces, la probabilidad de que el nmero de caras sea el 50% es
an mejor, y con 1.000 lanzamientos, las probabilidades aumentan ms. A medida que
se incrementa el nmero de lanzamientos, a pesar del comportamiento irregular de los
resultados individuales, los resultados promedios mostrarn una asombrosa
regularidad.
Al finalizar la experiencia, se puede cuantificar la probabilidad del evento, que consiste
en la moneda mostrando la faz cara. Este valor estar dado por el cociente entre la
cantidad de veces que la moneda cay cara y la cantidad n de veces que se la
arroj.
Como vimos en el Mdulo 1, el nmero de veces que se presenta un evento es la
frecuencia absoluta fa , y la frecuencia relativa fr representa la proporcin de veces
que se presenta un evento en las n repeticiones del experimento:
n
fa
fr =

Ejemplo 1.4
Si arrojamos un dado, que nmero aparecer en la cara superior?

Cuando arrojamos un dado muchas veces, cada prueba puede originar uno de seis
resultados posibles: 1, 2, 3, 4, 5 6. Resulta lgico suponer que al arrojar el dado,
el nmero uno por ejemplo, saldr aproximadamente la sexta parte de las veces.

P (1) = 1/6

Si repetimos la experiencia un nmero grande de veces, podremos cuantificar la
probabilidad de que al tirar un dado obtengamos el nmero uno, calculando la
frecuencia relativa.
La experiencia demuestra que la frecuencia relativa tiende a afianzarse para grandes
valores de n, es decir se puede establecer una ley de comportamiento de los
fenmenos aleatorios a travs de muchas repeticiones del experimento. La
probabilidad de un resultado particular, (resultado A), se simboliza P(A)

La teora frecuencial de la probabilidad se enuncia:

MDULO 2 Ral A. Marigliano UNT
5
- - Podemos asociar un nmero P(A) a cada evento A surgido por medio de la
realizacin de un experimento aleatorio, de manera tal que la frecuencia relativa de
A, ser aproximadamente igual a P(A) si se considera una larga serie de
repeticiones del experimento (en teora infinita).

Hay que tener en cuenta que la vinculacin entre la frecuencia relativa y la
probabilidad, establece una relacin entre una situacin experimental real (frecuencia
realmente observada) y un modelo conceptual o ideal (frecuencia terica o esperada),
por lo que sta teora slo es posible ante experimentos que puedan repetirse
indefinidamente.


1.3. Axiomas y reglas probabilsticas
Ejemplo 1.5
Un banco de sangre proporciona la siguiente informacin acerca de la distribucin de
grupos de sangre en hombres y mujeres, sobre una muestra de 500 pacientes:

Tabla 1.3.1. Distribucin del grupo sanguneo por sexo. Frecuencias absolutas
Cantidad de pacientes
Grupo sanguneo
Varones Mujeres Total
O 120 140 260
A 70 100 170
B 15 35 50
AB 10 10 20
Total 215 285 500

Con estos datos se puede construir una tabla de probabilidades, donde la probabilidad
de cada evento, por ejemplo la probabilidad de tener grupo sanguneo O, puede
asimilarse a la frecuencia relativa con la que ocurrir dicho evento:

Tabla 1.3.2. Distribucin de probabilidades del grupo sanguneo segn sexo
Probabilidades
Grupo sanguneo
Varones Mujeres Total
O 0,24 0,28 0,52
A 0,14 0,20 0,34
B 0,03 0,07 0,10
AB 0,02 0,02 0,04
Total 0,43 0,57 1

Estos datos ilustran tres postulados o axiomas importantes de la probabilidad. Si E
indica cualquier evento o resultado para el que se desee calcular la probabilidad, y W
incluye a todos los posibles resultados o eventos, se cumplen los siguientes axiomas:

1. P (E) > 0. La probabilidad de cada resultado es mayor o igual a cero. Si la
probabilidad es cero significa que el evento no ocurrir
MDULO 2 Ral A. Marigliano UNT
6

2. P (W) = 1. W incluye a todos los posibles resultados o eventos, por consiguiente
la suma de las probabilidades de los diversos resultados es igual a uno

3. P (E) s 1. La probabilidad de un resultado nunca puede ser mayor de 1

Estos postulados se consideran como las reglas fundamentales de la probabilidad.


1.3.1. Evento complemento
Los eventos pueden definirse como resultados sencillos o como conjunto de
resultados.
De la tabla 1.3.1, la probabilidad de que un individuo (de cualquier sexo) tenga grupo B
es:
P (Grupo B) =
500
50
= 0,10

Se puede querer tambin, conocer la probabilidad de que un evento no ocurra; un
evento de esta naturaleza se designa como evento complemento. Por ejemplo, el
evento complemento de tener grupo O, es no tener grupo O, y se simboliza con O.
De acuerdo al segundo axioma:

- - La suma de las probabilidades del evento O y O debe ser igual a 1:

1 ) O ( P ) O ( P = +

De acuerdo a esto, la probabilidad de no tener grupo O, o ) O ( P se calcula:

P (no tener grupo O) = ) O ( P = ) O ( P 1
=
500
260
1 = 1 0,52 = 0,48


1.3.2. Eventos mutuamente excluyentes. Regla especial de adicin

- - Dos eventos o ms son mutuamente excluyentes si la ocurrencia de uno de ellos
impide la ocurrencia de los dems

Es decir una mujer por ejemplo, no puede tener a la vez Grupo O y Grupo B.

Utilizando el diagrama de Venn, la representacin grfica de dos eventos A y B
mutuamente excluyentes, es:

MDULO 2 Ral A. Marigliano UNT
7

Figura 1.1. Diagrama de Venn. Eventos mutuamente excluyentes

La probabilidad de que ocurran eventos mutuamente excluyentes es la probabilidad de
que se presente uno u otro evento. Esta probabilidad se calcula sumando las
probabilidades de los dos eventos.

- - Si dos eventos, A y B, son mutuamente excluyentes, entonces:

) B ( P ) A ( P ) B A ( P + =

Donde el smbolo implica la unin o suma de eventos.

Por ejemplo la probabilidad de tener grupo sanguneo A o grupo sanguneo AB es:

) AB Grupo ( P ) A Grupo ( P ) AB Grupo A Grupo ( P + =
=0,34 + 0,04 = 0,38

Como los eventos Grupo A y Grupo AB son mutuamente excluyentes, no pueden
aparecer juntos, por lo cual la unin implica la aparicin de grupo A o de Grupo
AB, pero no de ambos a la vez.

Si definimos como P (W), al conjunto total de resultados posibles (Grupos: O, A, B
AB), como todos estos eventos son mutuamente excluyentes se puede escribir:

P (W) = P (O A B AB) = ) AB B A O ( P
= P (O) + P (A) + P (B) + P (AB)
= 0,52 + 0,34 + 0,10 + 0,04
= 1

Generalizando:
- - Si hay n eventos E
1
, E
2
,..E
n
los cuales son mutuamente excluyentes, entonces la
probabilidad de la unin de esto eventos es la suma de sus probabilidades
individuales:
P (E
1
E
2
E
n
) = P (E
1
) + P (E
2
) + + P (E
n
)
MDULO 2 Ral A. Marigliano UNT
8
1.3.3. Eventos no mutuamente excluyentes. Regla de adicin modificada
Recordemos que dos o ms eventos mutuamente excluyentes no pueden ocurrir al
mismo tiempo, y la regla de adicin vista se aplica para calcular la probabilidad de que
ocurra uno u otro de los eventos. Ahora se analizar la probabilidad de que ocurra uno
u otro evento cuando no son mutuamente excluyentes.

- - Eventos no mutuamente excluyentes son aquellos que tienen resultados en comn

Utilizando el diagrama de Venn podemos representar dos eventos A y B que no son
mutuamente excluyentes:


Figura 1.2. Diagrama de Venn. Eventos no mutuamente excluyentes

Se observa en el diagrama el conjunto de resultados de un experimento en que se
presentan conjuntamente los eventos A y B: ( B A ).
El smbolo corresponde en la teora de conjuntos a la interseccin de A y B, y
significa que tanto A como B ocurren. La probabilidad de un evento conjunto se
denomina probabilidad conjunta: P (A B).
Por ejemplo, sexo y grupo sanguneo O no son eventos mutuamente excluyentes,
debido a que la ocurrencia de uno no impide la del otro. La regla de adicin debe
modificarse en esta situacin; de otro modo, la probabilidad de que los dos eventos
ocurran se agregar dos veces en el clculo:

P (A B) = P (A) + P (B) P (A B)

Esta regla se conoce como regla general de adicin, debido a que puede aplicarse a
cualquier tipo de eventos ya sean mutuamente excluyentes o no. Si son mutuamente
excluyentes P (A B) = 0 (evento imposible). De acuerdo a esto, la ecuacin para la
regla general de adicin es idntica a la regla especial de adicin.

Continuando con el ejemplo 1.5, vemos en la tabla 1.3.2 que la probabilidad de ser
varn es 0,43 y la probabilidad de grupo sanguneo O es 0,52. Pero cada una de estas
MDULO 2 Ral A. Marigliano UNT
9
probabilidades incluye los resultados de aparicin conjunta de ambos eventos (varn y
Grupo O). Por lo tanto debe sustraerse la probabilidad conjunta o de interseccin de la
suma de las probabilidades de ser varn y tener grupo sanguneo O (0,24).

Entonces, el clculo resulta:

P (varn Grupo O) = P (varn) + P (Grupo O) P (varn Grupo O)

= 0,43 + 0,52 0,24
= 0,71

Obsrvese en de la tabla 1.3.2:
- - El valor en cada celda es la probabilidad conjunta para los dos eventos
representados por los encabezados de la columna y rengln correspondientes.
- - Por otro lado, por ejemplo la probabilidad de ser varn (0.43), y la probabilidad de
tener grupo sanguneo O (0.52), se denominan probabilidades marginales
debido a que se presentan en los mrgenes de una tabla de probabilidad.
- - Cada probabilidad marginal es igual a la suma de todas las probabilidades
conjuntas en un rengln o columna particular.

1.3.4. Eventos dependientes y probabilidad condicional
Los conceptos relacionados con la dependencia e independencia de eventos son
partes integrales de la teora de probabilidades. Supngase que tenemos dos eventos
A y B. Si la ocurrencia de A (o B) no afecta a la probabilidad de que B (o A) ocurra,
entonces se dice que A y B son independientes.
Por el contrario:

- - Dos eventos A y B son dependientes si la ocurrencia de A (o B) afecta la
probabilidad de que B (o A) ocurra o deje de ocurrir, es decir el que un evento
suceda depende de si el otro ha ocurrido.

Si A y B son dos eventos dependientes, la probabilidad de que ocurra tanto A como B
es igual al producto de la probabilidad de A multiplicada por la probabilidad de B con
la condicin de que A haya ocurrido.
Esto es:
P (A y B) = P (A B) = P (A) P (BA)

Esta probabilidad puede tambin calcularse como el producto de la probabilidad de B
multiplicada por la probabilidad de A con la condicin de que B haya ocurrido

P (A y B) = P (A B) = P (B) P (AB)
MDULO 2 Ral A. Marigliano UNT
10

La barra vertical entre B y A significa con la condicin de dado y P (BA) se
designa como probabilidad condicional de B dada A. Igualmente P (AB) se
designa como probabilidad condicional de A dada B.

- - La probabilidad condicional de cualquier evento es la probabilidad de que ese
evento ocurra con la condicin de que otro evento haya ocurrido.

Esta regla se considera como general, debido a que se aplica tanto a eventos
dependientes como independientes. Cuando A y B son independientes, la ocurrencia
de A no tiene efecto sobre la probabilidad de que B ocurra y viceversa.
Por lo tanto, si A y B son dos eventos independientes, P (BA) = P (B) y P (AB) =
P (A), como veremos en el apartado siguiente.

Cuando se conoce la probabilidad conjunta del evento A y de otro evento B, la
probabilidad condicional de B, dada A se obtiene:

P (BA) =
) A ( P
) B A ( P


Igualmente, la probabilidad condicional de A, dada B se calcula:

P (AB) =
) B ( P
) B A ( P


Donde ) B A ( P es la probabilidad conjunta de A y B.

Consideremos nuevamente la Tabla 1.3.1. Supongamos que slo nos interesa
considerar la submuestra de grupo sanguneo B para determinar la probabilidad de
que, adems, sean mujeres. Los resultados favorables a este evento en particular,
sern los que consideren, simultneamente, los dos eventos: grupo sanguneo B y
mujeres.



La probabilidad de tener grupo B, con la condicin de ser mujer es:

MDULO 2 Ral A. Marigliano UNT
11
P (Grupo B Mujer) =
) Mujer ( P
) Mujer B Grupo ( P

=
57 , 0
07 , 0
500 / 285
500 / 35
= =0,12

Es independiente el grupo sanguneo del sexo?

Si los eventos grupo sanguneo y sexo fueran independientes, el producto de las
probabilidades marginales sera igual a la probabilidad conjunta en todos los casos.
Para definir que dos eventos no son independientes, se necesita exhibir un slo
caso en que el producto de las probabilidades marginales no sea igual a la
probabilidad de unin o probabilidad conjunta.

En el ejemplo visto, la probabilidad conjunta es:

P (Grupo B Mujer) = 0,07

Sin embargo, el producto de las probabilidades marginales no origina el mismo
resultado, es decir:

P (Grupo B) x P (Mujer) = 0,10 x 0,57 = 0,057


Con lo que se demuestra que los eventos sexo y grupo sanguneo no son
independientes.

Ejemplo 1.7
Una empresa dedicada al montaje de microscopios pticos, recibe oculares y objetivos
procedentes de tres proveedores distintos: P
1
, P
2
y P
3
. Las lentes pueden ser buenas o
defectuosas, y por experiencia de varios aos esta empresa trabaja con la siguiente
distribucin de probabilidades:

Tabla 1.3.3. Distribucin de probabilidades de calidad de lentes segn fabricante

Calidad de las lentes P
1
P
2
P
3
Total
Buena (B) 0,20 0,32 0,40 0,92
Defectuosa (D) 0,03 0,04 0,01 0,08
Total 0,23 0,36 0,41 1,00

a) Si se selecciona una lente al azar de entre todas las recibidas, cul es la
probabilidad de que sea buena?
MDULO 2 Ral A. Marigliano UNT
12
b) Si se elige una lente al azar de entre todas las recibidas, cul es la probabilidad de
que proceda del proveedor 2?
c) Cul es la probabilidad de que una lente procedente del proveedor 1 sea buena?
d) Cul es la probabilidad de que una lente defectuosa elegida al azar proceda del
proveedor 3?

Solucin
a) La probabilidad de que una lente proveniente de cualquier proveedor sea buena es:

P (B) = 0,20 + 0,32 + 0,40 = 0,92

a) La probabilidad de que una lente proceda del proveedor 2 es:

P (P
2
) = 0,32 + 0,04 = 0,36

c) La probabilidad de que una lente sea buena, dado que procede del proveedor 1 es:

P (B P
1
) =
23 , 0
20 , 0
) P ( P
) P B ( P
1
1
=

=0,87

d) La probabilidad de que una lente proceda del proveedor 3, dado que es defectuosa
es:
P (P
3
D) =
08 , 0
01 , 0
) D ( P
) P D ( P
3
=

=0,125

Se propone como ejercicio para el alumno comprobar que los eventos calidad de las
lentes y proveedor no son independientes.


1.3.5. Eventos independientes. Regla especial de multiplicacin
Del apartado anterior, recordemos que si dos eventos son independientes, la
ocurrencia de uno no afecta a la probabilidad de que el otro ocurra o deje de ocurrir.

- - Dos eventos distintos A y B son eventos independientes si la ocurrencia de uno no
tiene efecto en el resultado del otro.


Ejemplo 1.6
El personal de un establecimiento industrial ha sido clasificado segn coeficiente
intelectual y nivel de estudios alcanzado, de la siguiente manera:



MDULO 2 Ral A. Marigliano UNT
13
Tabla 1.3.3. Personal clasificado segn coeficiente intelectual y nivel de estudios

Coeficiente
Intelectual
Con educacin
Universitaria (A
1
)
Sin educacin
Universitaria (A
2
)
Total
Mayor a 105 (B
1
) 120 80 200
Inferior a 105 (B
2
) 90 60 150
Total 210 140 350


En base a esta tabla de frecuencias, la probabilidad condicional de seleccionar una
persona con coeficiente intelectual mayor a 105 dado que tiene educacin universitaria
ser:

P (B
1
A
1
) = 57 , 0
350 / 210
350 / 120
) A ( P
) B A ( P
1
1 1
= =



Y la probabilidad de seleccionar una persona con coeficiente intelectual mayor a 105
sin educacin universitaria es:

P (B
1
A
2
) = 57 , 0
350 / 140
350 / 80
) A ( P
) B A ( P
2
1 2
= =



De los clculos realizados podemos deducir que la probabilidad de que un individuo
tenga un coeficiente intelectual mayor a 105 no depende del nivel de educacin
alcanzado. Esta probabilidad es la misma, ya sea que la persona tenga o no
educacin universitaria.

Dado que la ocurrencia A
1
(o B
1
) no afecta a la probabilidad de que B
1
(o A
1
) ocurra,
entonces se dice que A
1
y B
1
son independientes. Igual deduccin podemos hacer
para los eventos B
1
y A
2


- - Dos eventos A y B son independientes si:

) B ( P ) A / B ( P ) A / B ( P = =

- - Si B es independiente de A, tambin A ser independiente de B, y se cumplir:

) A ( P ) B / A ( P ) B / A ( P = =

Cuando hablamos de probabilidad condicional dijimos que:

P (BA) =
) A ( P
) B A ( P


Si A y B son independientes, es decir P (BA) = P (B), se tiene:


MDULO 2 Ral A. Marigliano UNT
14
P (B) =
) A ( P
) B A ( P

De la ecuacin anterior:

) B ( P ) A ( P ) B A ( P =

- - Si dos eventos A y B son independientes, la probabilidad de que ocurran tanto A
como B se encuentra multiplicando las probabilidades de los dos eventos, lo que se
conoce como regla especial de multiplicacin para probabilidades

Para el ejemplo desarrollado, la probabilidad conjunta de que un individuo tenga un
coeficiente intelectual mayor a 105 y no tenga educacin universitaria es:

) B ( P ) A ( P ) B A ( P
1 2 1 2
=

350
200
350
140
350
80
= = 0,2286

Esta regla de multiplicacin se aplica igualmente a tres o ms eventos independientes.

Ejemplo 1.7.
Si un dado se arroja tres veces: cul es la probabilidad de que aparezcan seis puntos
en todas las tiradas?
Sean A, B y C los eventos de que aparezcan seis puntos en la primera, segunda y
tercera tirada. Ya que el resultado de una tirada es independiente del resultado de
cualquier otra, la probabilidad conjunta de estos tres eventos es igual al producto de
sus probabilidades respectivas. La probabilidad de que cada lado quede hacia arriba
en una sola tirada es 1/6. Entonces se tiene:

P (A B C) = P (A) P (B) P (C)
P (A B C) = 1/6 1/6 1/6
= 1/216 = 0,0046

1.3.6. Resumen de reglas probabilsticas

Reglas de adicin
- - Si A, B y C son eventos mutuamente excluyentes:

P (A B C) = P (A) + P (B) + P (C)

- - Si dos eventos A y B no son mutuamente excluyentes:

MDULO 2 Ral A. Marigliano UNT
15
P (A B) = P (A) + P (B) P (A B) *



Reglas de multiplicacin
- - Si A, B y C son eventos independientes, la probabilidad de ocurrencia simultnea
de A, B y C es:
P (A B C) = P (A) P (B) P (C)

- - Si dos eventos, como A y B no son independientes:

P (A B) = P (A) P (BA) = P (B) P (AB) *


(*)

El cl cul o de probabi li dades para tres o ms eventos que no son mutuamente excl uyentes, o no
son i ndependi entes, requiere de operaci ones compl ej as que exceden el obj eti vo de este curso.

2. Distribuciones de probabilidad
2.1. Distribuciones de probabil idad de variables aleatori as discretas

Ejemplo 2.1
Si consideramos el experimento de lanzar dos monedas simultneamente, el conjunto
total de resultados posibles, es:

cara cara cc
cara cruz cx
cruz cara xc
cruz cruz xx


Los resultados de este experimento no son nmeros, de manera que si queremos
conocer por ejemplo, la cantidad de caras al tirar dos monedas simultneamente,
debemos definir una variable aleatoria que exprese cada resultado de este
experimento aleatorio.

- - Una variable aleatoria es un valor numrico asignado a los resultados de un
experimento aleatorio

Simbolizando con X a la cantidad de caras al tirar dos monedas, podemos construir
la siguiente tabla con el conjunto de resultados posibles de este experimento:




MDULO 2 Ral A. Marigliano UNT
16
Tabla 2.1 Variable aleatoria X definida como el nmero de caras
al arrojar dos monedas simultneamente

Resultados posibles
Valor de la variable
aleatoria X
cc 2
cx 1
xc 1
xx 0

Al estudiar la teora de la probabilidad vimos que slo se pueden asignar
probabilidades a los resultados de un experimento aleatorio, llamados eventos.
Podemos, entonces, asignar una probabilidad a cada evento o resultado posible y, por
consiguiente, a cada valor de la variable aleatoria X.
Esto significa que la probabilidad de que una variable aleatoria tome cualquier valor
es una relacin funcional con los posibles valores de la variable. Cada uno de los
distintos valores de X est asociado con uno y solamente un nmero real,
denominado probabilidad.

- - Una funcin o distribucin de probabilidad surge al asignar probabilidades a
cada uno de los valores de una variable aleatoria

Los resultados de la Tabla 2.1 son igualmente probables, y por lo tanto a cada uno de
ellos le asignaremos igual probabilidad =1/4:

Tabla 2.2 Funcin de probabilidad para X
Nmero de caras obtenidas al arrojar dos monedas simultneamente

Valores de X Probabilidad ) x ( p
0 1/4 =0,25
1 2/4 =0,50
2 1/4 =0,25
Total 4/4 =1

Puesto que los valores surgen de la cuantificacin de todos los resultados posibles de
un experimento aleatorio, la suma de las probabilidades de todos los valores que toma
la variable aleatoria es igual a 1.

La funcin de probabilidad de una variable aleatoria discreta se puede representar
grficamente por medio de un grfico de bastones. En nuestro ejemplo tenemos:

MDULO 2 Ral A. Marigliano UNT
17

Figura 2.1. Variable discreta. Grfico de bastones

Si recordamos el concepto de frecuencias relativas, podemos observar que la Tabla
2.2 es muy parecida a la tabla de frecuencias analizada en el Mdulo 1. En la primera
columna aparecen los distintos valores que toma la variable X, y en la segunda, la
correspondiente probabilidad p(x) que se puede asimilar a la nocin de frecuencia
relativa.
Sin embargo, debemos advertir que una distribucin probabilstica es una distribucin
de frecuencias a largo plazo . Es una distribucin terica, en contraste con la
distribucin de frecuencias relativas que es emprica.

La variable aleatoria X es una variable discreta, pues toma slo los valores 0, 1 y 2.
Simbolizando con
i
x cada uno de los valores que toma la variable aleatoria X,
tenemos:
2 x , 1 x , 0 x
3 2 1
= = =

Si consideramos que ) x ( p
i
es la funcin que asigna probabilidades a cada valor de
la variable aleatoria X, podemos llamarla adems funcin de probabilidad de X, y
construir la siguiente tabla, aadiendo una tercera columna de probabilidad
acumulada:

Tabla 2.3. Funcin de probabilidad acumulada

i
x ) x ( p
i
) x ( F
i

0 1/4 =0,25 1/4 =0,25
1 2/4 =0,50 3/4 =0,75
2 1/4 =0,25 4/4 =1,00

La tercera columna de la tabla representa una nueva funcin que se denomina
funcin de distribucin de probabilidad. Esta funcin acumula probabilidades de
manera semejante a la columna de las frecuencias acumuladas vistas en el Mdulo 1.
MDULO 2 Ral A. Marigliano UNT
18

- - Dada una variable aleatoria X, se llama funcin de distribucin de probabilidad a
aquella que proporciona la probabilidad de que la variable aleatoria tome un valor
menor o igual que
i
x :
) x X ( P ) x ( F
i i
s =

Cuando se considera una variable aleatoria y su correspondiente funcin de
probabilidad, la media aritmtica de esta variable aleatoria se denomina Esperanza
matemtica.

- - Cuando la variable aleatoria es discreta, el valor de la esperanza matemtica viene
dado por la suma de cada valor que toma la variable multiplicado por su respectiva
probabilidad:
) x ( p . x ) X ( E
i i
=

La Esperanza matemtica calcula el valor esperado promedio de una variable
aleatoria, en funcin de la probabilidad asignada a cada valor que toma dicha variable.
A partir de la tabla 2.3, la esperanza matemtica resulta:

E(X) = (0 0,25) + (1 0,5) + (2 0,25) = 1

El valor esperado es el promedio a largo plazo del nmero de caras obtenidas en la
tirada simultnea de dos monedas. Si realizamos el experimento unas pocas veces, o
an cientos de veces, no existe garanta de que el promedio para todas las tiradas sea
exactamente 1. Sin embargo, si el nmero de tiradas se acerca a infinito, el promedio
del nmero de caras estar muy prximo a 1.

- - La varianza de una variable aleatoria discreta, se define como la suma de los
desvos de cada valor de la variable con respecto a la esperanza matemtica,
elevados al cuadrado y multiplicados por su respectiva probabilidad:

) x ( p ] ) X ( E x [ ) X ( V
i
2
i
=


Puede tambin calcularse la desviacin estndar, como la raz cuadrada de la
varianza.
) X ( V ) X ( DE =

La siguiente tabla muestra los clculos para la esperanza matemtica y la varianza en
el ejemplo analizado:


MDULO 2 Ral A. Marigliano UNT
19
Tabla 2.4. Clculos para esperanza matemtica y varianza

i
x
) i
x ( p ) x ( p x
i i
) x ( p ] ) X ( E x [
i
2
i

0 1/4 0 1/4
1 2/4 2/4 0
2 1/4 2/4 1/4
Total 1 E(X) = 1 V(X) = 2/4 = 1/2

La desviacin estndar ser:
DE = 2 / 1 = 0,707

Las distribuciones de variables aleatorias discretas ms importantes en estudios
biolgicos, son la Distribucin binomial y la de Poisson.
Los principios bsicos de la distribucin binomial fueron desarrollados por el
matemtico suizo Jacob Bernouilli en el siglo XVII. Fue el autor del que se reconoce en
general como el primer libro sobre probabilidad, publicado en 1713. Es as que cada
prueba que utiliza la probabilidad binomial se designa ocasionalmente como prueba de
Bernouilli. La distribucin binomial proporciona la probabilidad de que un evento ocurra
dentro de un nmero determinado de pruebas independientes.
La distribucin de Poisson se debe al matemtico francs Simeon D. Poisson. Igual
que la binomial, la de Poisson es una distribucin discreta aplicable cuando el
resultado es el nmero de veces que ocurre un evento. Se utiliza para determinar la
probabilidad de eventos poco frecuentes, es decir proporciona la probabilidad de que
un resultado suceda un nmero especfico de veces cuando la cantidad de pruebas es
grande y la probabilidad de cualquier ocurrencia es pequea.
Este curso est dirigido fundamentalmente al tratamiento estadstico de datos
cuantitativos continuos, de manera que el alumno interesado en distribuciones
particulares para variables discretas, puede recurrir a bibliografa especializada, donde
puede obtener informacin detallada del tema.
Sin embargo es importante tener en cuenta los conceptos bsicos estudiados de:
funcin de probabilidad, funcin de probabilidad acumulada, y los clculos y conceptos
de esperanza matemtica y varianza en distribuciones discretas.

2.2. Distribuciones de probabil idad de variables aleatori as continuas
En el apartado anterior el anlisis se limit a variables aleatorias que toman un nmero
finito de posibles valores discretos, tales como 0, 1, 2, 3, etc. Consideraremos ahora
otro tipo de variables aleatorias, conocidas como variables aleatorias continuas. Este
tipo de variables pueden tomar un nmero infinito de posibles valores, que pueden
diferir unos de otros por cantidades infinitesimales. Sus distribuciones son
distribuciones continuas.
MDULO 2 Ral A. Marigliano UNT
20
El cuadrante mostrado en la figura 2.2. constituye un buen ejemplo para la
comprensin de una escala continua.
La circunferencia del cuadrante est dividida en 8 intervalos. Cuando se hace girar la
aguja que est en el centro, se mueve en crculos, y eventualmente se detiene en
alguna posicin. Supngase que se detiene en la posicin indicada en la figura,
correspondiente al intervalo delimitado por 1 y 2. Cuntas posiciones de parada son
posibles?


Figura 2.2.

Considrese que cada sector podra a su vez ser dividido en 10 sectores, originando
de esta manera 80 intervalos posibles para la detencin de la aguja. A su vez, cada
sector podra dividirse en 10 sectores para dar 800 intervalos.
Este proceso puede continuarse indefinidamente, de manera que los intervalos sobre
la circunferencia resulten mucho ms numerosos y pequeos, resultando evidente que
no hay un nmero finito de puntos de descanso, y si se quisiera calcular la
probabilidad de que la aguja se detenga en cualquier posicin, no existira un nmero
para el denominador, pues ste considera infinitos casos posibles.
Esto significa que la probabilidad de que una variable aleatoria continua tome
cualquier valor particular es = 0, pues el cociente entre cualquier nmero e infinito es
cero.

En smbolos:
0 ) x X ( P ) x ( f = = =

Para variables aleatorias continuas resulta inaplicable referirse a algn punto en
particular como probabilidad de X. Para determinar probabilidades, es necesario
hacer referencia a intervalos. En el ejemplo del cuadrante dividido en sectores,
pueden tomarse probabilidades asociadas con sectores o intervalos, pero no
con puntos aislados.
MDULO 2 Ral A. Marigliano UNT
21
Para calcular probabilidades asociadas con intervalos, la distribucin terica es una
funcin representada por f (X) que se conoce como funcin de densidad de
probabilidad, que puede representarse por una curva continua.
Esta probabilidad puede ser interpretada como un rea o superficie bajo la curva f (x),
llamada curva de densidad, representada en la figura 2.3.
La probabilidad de que la variable aleatoria tome un valor mayor que a y menor o igual
que b, queda determinada por el rea bajo la curva f (x), el eje de las abscisas OX, y
las rectas perpendiculares levantadas sobre ambos puntos, definidas por el intervalo
(a b) :

Figura 2.3. Funcin de densidad de probabilidad


- - Una funcin de densidad de probabilidad es aquella que asigna probabilidades a
intervalos de variables aleatorias continuas dentro del campo de definicin de
las mismas

La probabilidad, definida para un intervalo, se basa en el clculo integral del rea bajo
la curva entre dos puntos cualesquiera del eje de abscisas, generndose la funcin de
densidad de probabilidad. La podemos simbolizar como:

x d ) x ( f ) b X a ( P
b
a
}
= s s

La integracin es un concepto del anlisis matemtico, utilizado principalmente para el
clculo de reas, y su aplicacin requiere conocimientos ms elevados que los
necesarios para seguir este curso.

Veremos a continuacin un ejemplo sencillo que nos permitir percibir lo que significa
el clculo de probabilidades en una distribucin continua.

MDULO 2 Ral A. Marigliano UNT
22
Ejemplo 2.2
Consideremos una variable continua X que slo puede tomar valores entre 0 y 2:

2 X 0 s s
Adems, supongamos que la variable aleatoria X tiene asociada una funcin de
densidad de probabilidad:
x 2 / 1 ) x ( f =

Recordando el concepto de funcin, daremos diferentes valores a X para obtener los
correspondientes valores de f (x):

Tabla 2.5. Funcin de Densidad de probabilidad

x f (x)
0 1/2 . 0 = 0
1/2 1/2 . 1/2 =1/4
1 1/2. 1 =1/2
2 1/2 . 2 = 1

Con los valores de x y f (x) podemos representar grficamente esta funcin:


Figura 2.4

Si queremos calcular la superficie definida por f (x), a travs del campo de variacin de
x (0 a 2), tendramos que calcular la superficie del tringulo sombreado:

1
2
1 2
2
altura base
tringulo Superficie =

=
Es decir:
1 ) 2 x 0 ( P = s s

- - El rea total bajo la curva definida por f (x) es siempre igual a 1
MDULO 2 Ral A. Marigliano UNT
23
Este concepto puede relacionarse al caso de variables aleatorias discretas, donde la
suma de todas las probabilidades correspondientes a todos los valores posibles de la
variable aleatoria es siempre igual a 1.

Supongamos ahora, que queremos calcular la probabilidad de que la variable aleatoria
definida tome valores entre 0 y 1. Es lo mismo que calcular la superficie sombreada
del tringulo que se muestra en la figura 2.5:


Figura 2.5
25 , 0 4 / 1
2
2 / 1 1
tringulo Superficie = =

=

En smbolos:

25 , 0 ) 1 x 0 ( P = s s

Igualmente, si hacemos los clculos para el intervalo (0 ):


Figura 2.6
La probabilidad ser:

MDULO 2 Ral A. Marigliano UNT
24
0625 , 0 16 / 1
2
4 / 1 2 / 1
tringulo Superficie = =

=

0625 , 0 ) 2 / 1 x 0 ( P = s s

Si calculamos ahora la probabilidad de que la variable aleatoria x tome valores entre 1
y 1, es lo mismo que encontrar la probabilidad de la variable continua en un punto:


Figura 2.7

0
2
2 / 1 0
tringulo Superficie =

=
Luego:
0 ) 1 x 1 ( P = s s

Con lo que se comprueba que para variables continuas, la probabilidad no est
definida en un punto.

En variables aleatorias continuas puede calcularse tambin una funcin que acumula
probabilidades o funcin de distribucin, que se simboliza con F(x):

F(x) = P (X s x)

Para calcular las probabilidades acumuladas se calculan las superficies desde el
menor valor que asume la variable aleatoria, hasta el valor de X sobre el que
queremos calcular la probabilidad:

Tabla 2.6. Funcin de probabilidad acumulada

x P (X s x) F(x)
0 P (X s 0) = 0 0
P (X s ) =( . ) 2 1/16
1 P (X s 1) =(1 . ) 2 1/4
2 P (X s 2) =(2 . 1) 2 1
MDULO 2 Ral A. Marigliano UNT
25
La funcin de distribucin acumulada es siempre no decreciente; crece o a lo sumo
se mantiene constante.
- - La probabilidad de que una variable aleatoria continua X, asuma un valor menor o
igual a x se llama funcin de distribucin acumulada y se representa por:

) x X ( P ) x ( F s =

Para una variable aleatoria continua, la esperanza matemtica y la varianza se
obtienen integrando, y quedan definidas:


}
= dx ) x ( f x ) X ( E Si < x <

dx ) x ( f ] ) X ( E x [ ) X ( V
2
}
=

3. Distribucin Normal
3.1 Introduccin
Vimos que al iniciar el anlisis estadstico de una serie de datos, en particular de datos
numricos, un primer paso consiste en describir la distribucin de las variables
estudiadas. Aprendimos que adems de las medidas descriptivas correspondientes, el
comportamiento de estas variables puede explorarse grficamente.

Ejemplo 3.1
Supongamos que el objetivo de un estudio es determinar la concentracin de glucosa
srica en una poblacin definida como nios con edades comprendidas entre 5 y 12
aos, en la ciudad de San Miguel de Tucumn. Para ello, si tomamos una muestra
aleatoria de 100 nios, hacemos mediciones de la magnitud en estudio, registramos
los valores obtenidos, construimos intervalos de clase, calculamos las frecuencias de
dichos intervalos y luego graficamos los datos construyendo un histograma, es muy
probable que se obtenga la siguiente distribucin:


Figura 3.1. Histograma
MDULO 2 Ral A. Marigliano UNT
26
Uniendo los puntos medios del extremo superior de las barras, se obtiene el llamado
polgono de frecuencias:


Figura 3.2. Polgono de frecuencias

Si nos tomramos el trabajo de realizar mediciones de la variable de inters sobre una
muestra de mayor tamao, se podra construir un histograma en el que las bases de
los rectngulos definidos por los intervalos de clases fuesen cada vez ms pequeas,
de modo que uniendo los puntos medios de las barras, el polgono de frecuencias
originado tendra una apariencia cada vez ms suavizada, y podramos dibujar una
lnea curva bastante parecida a una campana simtrica, como se muestra en la figura
3.3:


Figura 3.3

Esta curva suave, asinttica, obtenida experimentalmente, representa la distribucin
de la variable observada, y es muy semejante a una curva terica unimodal y
perfectamente simtrica, que caracteriza una distribucin de probabilidad conocida
como distribucin normal, Gaussiana o de Laplace, tambin llamada curva normal
o campana de Gauss.
La distribucin normal fue reconocida por primera vez por el matemtico francs
Abraham de Moivre, quien public sus trabajos en 1733. Posteriormente, dos
astrnomos matemticos, Pierre-Simon Laplace en Francia, y Carl Friedrich Gauss de
MDULO 2 Ral A. Marigliano UNT
27
Alemania, establecieron los principios cientficos de la distribucin normal, formulando
la ecuacin de la curva; de ah el nombre de " Campana de Gauss" .
Recordemos que en el Mdulo 1 estudiamos el concepto de una medida de posicin
conocida como Moda, y vimos que las distribuciones unimodales se caracterizan por
presentar un valor definido de la variable al que le corresponde la mayor frecuencia.

La importancia de esta distribucin se debe a que distintas variables asociadas a
fenmenos naturales y cotidianos siguen, aproximadamente, una distribucin normal:

caracteres morfolgicos de individuos, como la estatura o el peso
caracteres fisiolgicos, como el efecto de un frmaco
caracteres sociolgicos, como el consumo de cierto producto por un mismo grupo
de individuos
caracteres psicolgicos, como el cociente intelectual
errores aleatorios en la medicin de ciertas magnitudes
estadsticos muestrales, como la media aritmtica.


3.2 Caractersticas y Propiedades de la distribucin normal
La distribucin de una variable normal est completamente determinada por dos
parmetros, su media o esperanza matemtica y su desviacin estndar, denotadas
generalmente por y o.
La distribucin normal presenta un valor de mayor frecuencia ( ) y, a partir de l,
decrece hacia ambos lados con una simetra perfecta.

Figura 3.4 Distribucin normal

La funcin de densidad de probabilidad que corresponde a esta curva est dada por:

2
2
i
) x (
2
1
e
2
1
) x ( f
o

t o

= < x <
Donde:
MDULO 2 Ral A. Marigliano UNT
28
o = desviacin estndar
t = tiene el significado habitual =3,1416
e = base de logaritmos neperianos =2,7183
i
x = valores para las medidas individuales
= media aritmtica para una serie infinita de medidas

i
x = desviacin de cualquier medida respecto a
o
2
= varianza

Se dice que una variable X sigue una distribucin normal de media y desviacin
estndaro, y se denota como:
X ~ N ( , o )

- - Por ser la distribucin perfectamente simtrica, la media coincide con la mediana
y la moda. La media se encuentra en el punto del eje de las abscisas que divide a la
distribucin en dos partes iguales y, a su vez, es el valor de la variable que registra
la mayor frecuencia.
- - La desviacin estndar (o), medida de la variabilidad de la distribucin, determina
la mayor o menor dispersin de los datos alrededor de la media, es decir establece
el ancho de la curva. Cuando o crece, la curva se achata, reflejando esta situacin.
- - Puesto que la curva alcanza su mayor altura en torno a la media, cuando una
variable siga una distribucin normal, ser mucho ms probable observar un dato
cercano al valor medio que uno que se encuentre muy alejado de ste. Es decir, las
pequeas desviaciones con respecto al valor central son mucho mas frecuentes
que las grandes.
- - Ocurren desviaciones positivas y negativas de igual magnitud y con la misma
frecuencia. Al ser la curva simtrica con respecto a la media, el 50% de las
observaciones se encuentran por debajo, y el 50% por encima de ella.
- - La curva es asinttica, es decir, se extiende infinitamente en los dos sentidos de su
direccin sobre el eje x. Esto significa que la variable X puede tomar cualquier
valor entre y +. El rea total bajo la curva es, por lo tanto, igual a 1.


PROPIEDADES
La distribucin normal es una distribucin terica, ideal, que cumple con ciertas
propiedades, que surgen de la aplicacin de la frmula matemtica que expresa su
funcin de probabilidad.

MDULO 2 Ral A. Marigliano UNT
29
Para cualquier valor de y o se cumple:

- - En el intervalo ( o; +o) se encuentra el 68,3% de las observaciones:

P ( o <X < + o) =0,683

- - En el intervalo ( 2o; +2o) se encuentra el 95,4% de las observaciones:

P ( 2o <X < +2o) =0,954

- - En el intervalo ( - 3 o; +3 o) se encuentra el 99,7% de las observaciones:

P ( 3o <X < +3o) =0,997



Figura 3.5. Propiedades de la distribucin normal

Si consideramos la variable continua del ejemplo 3.1: concentracin de glucosa srica
en nios con edades comprendidas entre 5 y 12 aos en la ciudad de San Miguel de
Tucumn, podramos haber obtenido en la experiencia los siguientes valores
descriptivos:
=65 mg/dL y o = 2,5 mg/dL

Si la distribucin de la variable concentracin de glucosa srica en nios es
aproximadamente normal, podemos escribir:

X ~ N (65; 2,5)

Se lee: X se distribuye normalmente con media =65 mg/dL, y desviacin estndar o
= 2,5 mg/dL

Se podran aplicar entonces las propiedades formuladas, con las siguientes
conclusiones:
MDULO 2 Ral A. Marigliano UNT
30

- - El 68,3% de los nios tendr una concentracin de glucosa entre: (65 2,5) mg/dL
y (65 + 2,5) mg/dL. Esto significa que el 68,3% de los nios tendr una
concentracin de glucosa comprendida en el intervalo: (62,5; 67,5) mg/dL.

- - El 95,4% de los nios tendr una concentracin de glucosa comprendida en el
intervalo: (60; 70) mg/dL

- - El 99,7% de los nios tendr una concentracin de glucosa comprendida en el
intervalo: (57,5; 72,5) mg/dL

Grficamente:


Figura 3.6. Distribucin de glucosa en nios con edades entre 5 y 12 aos


3.3 Distribucin normal estndar
No existe una sola distribucin normal, sino infinitas curvas normales, cada una
correspondiente a una cierta combinacin de y o, que pueden tomar los siguientes
valores:

< < y 0 < o <

- - La media indica la posicin de la campana, de modo que para diferentes valores de
la grfica es desplazada a lo largo del eje horizontal.

Por otra parte:

- - La desviacin estndar determina el grado de apuntamiento de la curva. Cuanto
mayor sea el valor de , ms se dispersarn los datos en torno a la media y la
MDULO 2 Ral A. Marigliano UNT
31
curva ser ms plana. Un valor pequeo de este parmetro indica, por
consiguiente, una gran probabilidad de obtener datos cercanos al valor medio de la
distribucin.


Figura 3.7. Distribuciones normales: (a) igual o y diferentes medias
(b) igual media y diferentes desviaciones estndar

Obtener probabilidades de la distribucin normal para un cierto intervalo de valores, es
poco prctico, pues hay infinitas variables normales y habra que desarrollar una
distribucin probabilstica distinta para cada una.
Afortunadamente existe una distribucin normal que puede aplicarse a cada uno de las
posibles variables aleatorias normales. Se conoce como distribucin normal
estndar o distribucin z, y corresponde a la combinacin de los parmetros =0
y o =1. Esta distribucin tiene la ventaja, que las probabilidades asociadas a ella ya
estn tabuladas.
A partir de cualquier variable X que siga una distribucin normal, se puede obtener una
variable normal estandarizada realizando una transformacin de la variable original.
Esta transformacin da como resultado una nueva variable que llamaremos z y que
surge al restar a la variable X original su media, y dividirla por su desviacin estndar:

o

=
i
x
z

Y su correspondiente funcin de densidad de probabilidad es:

2
z
2
e
2
1
) z ( f

=
t
<z <

Una variable normal estandarizada se denota:

Z ~ N (0, 1)

- - Obsrvese que la variable Z es la diferencia entre el valor observado de X (
i
x ) y su
media, expresada en trminos de su desviacin estndar.
MDULO 2 Ral A. Marigliano UNT
32
La distribucin de probabilidad de una variable estandarizada Z es simtrica con
respecto a 0. En una distribucin normal estndar tambin se cumple que:

P ( 1 < z < 1) = 0,683
P ( 2 < z < 2) = 0,954
P ( 3 < z < 3) = 0,997

La representacin grfica de de la distribucin de probabilidades de una variable
normal estandarizada es la siguiente:


Figura 3.8. Distribucin normal estndar


3.3.1 Uso de la distribucin normal estndar
Para la distribucin normal estndar existen tablas de probabilidades, a partir de las
cuales se puede obtener, de manera simple, probabilidades asociadas con cualquier
variable, de la que se sabe o se asume que sigue una distribucin aproximadamente
normal, siempre que la media y la desviacin estndar sean conocidas.
La tabla 1 (ver Anexo al final del mdulo) est construida considerando: a) una
distribucin normal con media =0 y desviacin estndar o =1; b) probabilidades
acumuladas, es decir, siempre debemos buscar probabilidades del tipo: P (Z s z
0
),
que se lee: probabilidad acumulada hasta z
0
, (valor particular de la variable Z).

Tomando los valores de la media y desviacin estndar de la variable Glucosa en
nios, veremos ejemplos de clculo de probabilidades correspondientes a
distribuciones normales.

Caso 1: Encontrar la probabilidad de que un valor aleatorio de Z sea igual o menor a
un nmero positivo a, es decir: P (Z s a):

MDULO 2 Ral A. Marigliano UNT
33

Figura 3.9. P (Z s a)
Ejercicio 3.3.1
Cul es la probabilidad de que un nio, elegido al azar, tenga una concentracin de
glucosa menor a 68 mg/dL?
En primer lugar, para entrar a la tabla, debemos transformar la variable original X y
obtener la respectiva variable estandarizada z:

2 , 1
5 , 2
65 68
z =

=

As, la probabilidad que se desea calcular ser:

) 2 , 1 Z ( P
5 , 2
65 68
Z P ) 68 X ( P s = |
.
|

\
|
s = <

Esta ltima probabilidad puede ser fcilmente obtenida a partir de la Tabla 1. En la
primera columna aparece el nmero entero y la primera decimal del valor de la
variable Z; en la primera fila aparece el segundo decimal del nmero buscado.
De acuerdo al ejemplo planteado, debemos buscar el valor 1,2 en la primera columna
de la tabla y 0,00 en la primera fila. La probabilidad se encuentra en la interseccin de
la fila y columna correspondiente:




MDULO 2 Ral A. Marigliano UNT
34
Resultando:
P (Z s 1,2) = 0,8849

Por lo tanto, la probabilidad buscada de que un nio elegido al azar de esa poblacin
tenga una concentracin de glucosa menor a 68 mg/dL, es aproximadamente un
88,5%.

Caso 2
Encontrar la probabilidad de que un valor aleatorio de Z sea mayor a un valor positivo
a, esto es, P (Z >a):

Figura 3.10. P (Z > a)

Ejercicio 3.3.2
Cul es la probabilidad de que un nio, elegido al azar, tenga una concentracin de
glucosa mayor a 66 mg/dL?
40 , 0
5 , 2
65 66
z =

=
La probabilidad buscada ser:

) 40 , 0 Z ( P
5 , 2
65 66
Z P ) 66 X ( P > = |
.
|

\
|
> = >

Como el rea total bajo la curva es igual a 1, se puede deducir que:
) 40 , 0 Z ( P 1 ) 40 , 0 Z ( P s = >


Resultando de la tabla:


MDULO 2 Ral A. Marigliano UNT
35
P (Z s 0,40) = 0,6554.

Por lo tanto, la probabilidad buscada de que un nio elegido al azar de esa poblacin
tenga una concentracin de glucosa mayor a 66 mg/dL, es:

1 0,6554 = 0,3446

Es decir aproximadamente un 34,5 %

Caso 3: Encontrar la probabilidad de que un valor aleatorio de Z sea igual o menor
que un nmero negativo a, esto es, P (Z s -a):


Figura 3.11. P (Z s - a)

Ejercicio 3.3.3
Cul es la probabilidad de que un nio, elegido al azar, tenga una concentracin de
glucosa menor a 60 mg/dL?
El valor z ser:
2
5 , 2
65 60
z =

=
La probabilidad que buscamos es:

) 2 Z ( P
5 , 2
65 60
Z P ) 60 X ( P < = |
.
|

\
|
< = <

Para esta probabilidad, nos encontramos con el problema de que las tablas estndar
no proporcionan el valor de P (Z s z) para valores negativos de la variable. Sin
embargo, haciendo uso de la simetra de la distribucin normal, se tiene que:

P (Z < 2) = P (Z > 2)

Entonces resulta:
MDULO 2 Ral A. Marigliano UNT
36
P (Z < 2) = 1 P (Z s 2)
P (Z < 2) = 1 0,9772
= 0,0228 ~ 2,3%

Vemos que encontrar un nio con concentracin srica de glucosa menor a 60 mg/dL
es un suceso con baja probabilidad de ocurrir.

Caso 4: Encontrar la probabilidad de que un valor aleatorio de Z caiga en un intervalo
(a, b), es decir, P (a s Z s b):


Figura 3.12. P (a s Z s b)

Ejercicio 3.3.4
Cul es la probabilidad de que la concentracin de glucosa de un nio elegido al
azar, est entre 68 y 70 mg/dL?

) 0 , 2 Z 2 , 1 ( P
5 , 2
65 70
Z
5 , 2
65 68
P ) 70 X 68 ( P s s = |
.
|

\
|
s s

= s s

Para calcular esta probabilidad, se debe encontrar la P (Z < 2,0) y restarle la
probabilidad de que Z <1,2:

P (1,2 s Z s 2,0) = P (Z s 2,0) P (Z s 1,2)
= 0,9972 0,8849
= 0,1123 ~ 11,2%




Caso 5: Encontrar la probabilidad de que un valor aleatorio de Z caiga en un intervalo
( b; a): P (- b <Z s - a)
MDULO 2 Ral A. Marigliano UNT
37


Figura 3.13. P (- b < Z s - a)

Ejercicio 3.3.5
Cul es la probabilidad de que la concentracin de glucosa de un nio elegido al azar,
est entre 60 y 62 mg/dL?

) 2 , 1 Z 2 ( P
5 , 2
65 62
Z
5 , 2
65 60
P ) 62 X 60 ( P s < = |
.
|

\
|
s s

= s <

Como la distribucin es simtrica con respecto a 0, se tiene:

P ( 2 < Z s 1,2) = P (1,2 s Z s 2)

Para calcular esta probabilidad, buscamos P (Z s 2,0) y restamos P (Z s 1,2):

P (1,2 s Z s 2) = P (Z s 2) P (Z s 1,2)
= 0,9772 0,8849
= 0,0923 = 9,23 %

Caso 6: Encontrar la probabilidad de que un valor aleatorio de Z caiga en un intervalo
que incluye al 0, esto es ( a; b): P (- a <Z s b)


Figura 3.14. P (- a < Z s b)
MDULO 2 Ral A. Marigliano UNT
38
Ejercicio 3.3.6
Cul es la probabilidad de que la concentracin de glucosa de un nio elegido al
azar, est entre 60 y 66 mg/dL?

) 4 , 0 Z 2 ( P
5 , 2
65 66
Z
5 , 2
65 60
P ) 66 X 60 ( P s s = |
.
|

\
|
s <

= s <

Vemos que para calcular esta probabilidad, se debe encontrar la P (Z s 0,4) y restarle
la P (Z s 2):
P ( 2 < Z s 0,4) = P (Z s 0,4) P (Z s 2)

La probabilidad P (Z s 0,4) se encuentra directamente en la tabla de probabilidades:

P (Z s 0,4) = 0,6554

Para encontrar P (Z s 2), como la distribucin es simtrica con respecto a 0, se tiene:

P (Z s 2) = 1 P (Z s 2)
= 1 0,9772 = 0,0228
Luego: P ( 2 s Z s 0,4) = 0,6554 0,0228
= 0,6326 = 63,26 %

Puede utilizarse Microsoft Excel para obtener las probabilidades de los ejercicios
planteados, a travs de la Funcin Distribucin Normal. Podemos acceder a ella:

- - A travs de la Sintaxis: =DISTR.NORM.ESTAND

O seleccionando el men:

- - Insertar Funcin (Excel 2003):



- - Frmulas clic en el cono (Excel 2007):
MDULO 2 Ral A. Marigliano UNT
39



Seleccionamos: DISTR.NORM.ESTAND:



Hacemos clic en Aceptar y se abre una ventana donde incorporamos el valor de z para
el que queremos calcular la probabilidad.
Por ejemplo, para obtener las probabilidades propuestas en el ejercicio 3.3.6:

P (Z s 0,4) y P (Z < 2).

Para z =0,4 obtenemos 0,65542



Para z = 2, Excel devuelve una probabilidad =0,022750.


MDULO 2 Ral A. Marigliano UNT
40
Luego:
P ( 2 s Z s 0,4) = 0,6554 0,0228 = 0,6326

Ejercicio 3.3.7
Qu concentracin de glucosa srica corresponde al percentil 75? En trminos de
probabilidades esto significa: P (Z s z) =0,75
Ese tipo de problema se resuelve en forma retrospectiva. En la tabla de probabilidades
normales realizamos el procedimiento inverso, es decir, buscamos en el cuerpo de la
tabla el valor 0,75 (o el ms cercano) y luego encontramos el valor de z que
corresponde a dicha probabilidad, utilizando la primera columna y la primera fila.
El valor que acumula el 0,75 de probabilidad es z =0,67



Hasta aqu hemos encontrado el valor estandarizado de la variable que ocupa el
percentil 75. Para saber cual es la concentracin de glucosa expresada en las
unidades originales (mg/dL), hacemos el procedimiento inverso:

o

=
X
Z o + = . Z X

X = (0,67 2,5) + 65 = 66,7 mg/dL

Los valores de X, dada una cierta probabilidad, pueden ser obtenidos desde Microsoft
Excel, a travs de la Funcin Distribucin Normal Inversa.

Podemos usar la Sintaxis:

=DISTR.NORM.INV(probabilidad;media;Desv_estndar)

O Seleccionar el men:
Insertar Funcin (Excel 2003). Frmulas clic en el cono (Excel 2007):

En la ventana que se abre seleccionamos DISTR.NORM.INV:

MDULO 2 Ral A. Marigliano UNT
41


Pulsamos en Aceptar y se abre la siguiente ventana, donde debemos incorporar los
argumentos de la funcin, esto es: la probabilidad deseada, la media y la desviacin
estndar:



El resultado es 66,6862..que puede aproximarse a 66,7 mg/dL. Si queremos el
resultado en la hoja de clculos, pulsando en Aceptar el valor se posiciona en la celda
donde est el cursor, por ejemplo en la celda A1:




MDULO 2 Ral A. Marigliano UNT
42
A travs del mismo procedimiento, utilizando la funcin DISTR.NORM.ESTAND.INV,
podemos encontrar el valor de Z:



Al hacer clic en Aceptar se abre una ventana donde en este caso slo debemos
incorporar la probabilidad. Excel devuelve el valor de la variable estandarizada z =
0,674489.para 0,75 de probabilidad.



Luego, como vimos, debemos transformar la variable normalizada para saber cual es
la concentracin de glucosa expresada en las unidades originales (mg/dL).

Ejercicio 3.3.8
Un laboratorio tiene determinado para un material de control de un cierto analito, una
media =51,5 mg/L y una desviacin estndar =3,1 mg/L. Las especificaciones dadas
por el fabricante establecen que el valor asignado al material de control es 50 mg/L,
con un rango mximo tolerable de 7 mg/L.
MDULO 2 Ral A. Marigliano UNT
43
Qu porcentaje de resultados obtenidos por el laboratorio para el material de control
sern inaceptables de acuerdo a lo establecido por el fabricante?

Se asume que la variable en estudio X =concentracin de analito tiene distribucin
aproximadamente normal, esto es:
X ~ N (51.5; 3.1)

Para que el valor de un resultado para el control sea aceptable debe estar entre:

(50 7) mg/L y (50 +7) mg/L

La fraccin de resultados aceptables puede medirse en trminos de probabilidad
como:
P (43 < X < 57)

Para calcular esta probabilidad, usamos la distribucin normal estndar:

) 77 , 1 Z 74 , 2 ( P
1 , 3
5 , 51 57
Z
1 , 3
5 , 51 43
P ) 57 X 43 ( P s s = |
.
|

\
|
s s

= < <

P ( 2,74 s Z s 1,77) = P (1,77) P ( 2,74)

Utilizando Microsoft Excel para el clculo de estas probabilidades:






Luego:
P ( 2,74 s Z s 1,77) = 0,96164 0,00307
= 0,9586

Es decir, la probabilidad de obtener un resultado dentro de las especificaciones dadas
por el fabricante es 95,9 %.
Haciendo el razonamiento inverso, la fraccin de resultados inaceptables ser del
4,1%.


MDULO 2 Ral A. Marigliano UNT
44
Ejercicio 3.3.9
Qu probabilidad existe de que un valor del control caiga fuera del intervalo 51,5 3
desviaciones estndar?
Esto significa encontrar la probabilidad de que Z expresada como valor absoluto, caiga
fuera del intervalo (- 3; +3). Esto puede escribirse como:

P (Z > 3)

El clculo de la probabilidad ser:

P (Z > 3) = P (Z s 3 ) + P (Z > 3)

Los clculos de estas probabilidades pueden hacerse como aprendimos:

P (Z s 3) = P (Z > 3) = 1 P (Z < 3)
= 1 0,9987 = 0,0013
Luego:
P (Z > 3) = 0,0013 + 0,0013
= 0,0026

Utilizando Microsoft Excel, debemos calcular slo la probabilidad acumulada hasta z =
3:



Utilizando la simetra de la curva:
P (Z < 3) = P (Z > 3)
Luego:
P (Z > 3) = 0,00135 + 0,00135
= 0,0027

Existe una muy baja probabilidad ( ~ 0,3%) de que un resultado del control exceda el
intervalo 51,5 (3 3,1) mg/L.
Es importante deducir que podramos haber calculado esta probabilidad utilizando la
3ra. propiedad de la distribucin normal:

% 73 , 99 3 = o
De donde:
MDULO 2 Ral A. Marigliano UNT
45

P (Z > 3) = 1 0,09973 = 0,0027

4. Distribucin t de Student

4.1. Caractersti cas y propiedades
La distribucin t es una distribucin de probabilidades semejante a la normal estndar,
muy utilizada en una metodologa estadstica inferencial para comparacin de medias
calculadas en muestras de tamao pequeo. Se designa como t de Student en
honor a William Gosset, que utilizando el sinnimo de student public en 1908 una
distribucin muestral terica, para un nmero de observaciones menores o iguales a
30.
La distribucin t se basa en la consideracin de que la poblacin a partir de la cual se
obtiene la muestra tiene una distribucin normal, o al menos aproximadamente normal.
No precisaremos la funcin de densidad de una variable t de Student, pero si veremos
algunas propiedades que es necesario conocer:

- - La variable t vara de a + , exactamente igual que una variable con
distribucin normal.
- - Al igual que la distribucin normal estndar z, es tambin una distribucin continua,
en forma de campana y perfectamente simtrica, con media igual a 0.
- - Una distribucin t de Student tiene mayor dispersin que la distribucin normal, por
lo cual la representacin grfica tiene la forma de una campana ms plana que la
normal estndar, y sus colas son ms altas y anchas, lo que indica que su
desviacin estndar es mayor, especialmente para muestras pequeas.
- - A diferencia de la distribucin z, existe una familia de distribuciones t, cada una de
las cuales tiene media 0 pero una desviacin estndar mayor a 1, dependiendo del
valor de n y por lo tanto del nmero de grados de libertad (n 1).
- - El nmero de grados de libertad es el nico parmetro de la distribucin t, vale
decir, la curva t est totalmente definida cuando el tamao de la muestra, y en
consecuencia el nmero de grados de libertad se conocen.
- - A medida que el tamao de la muestra aumenta, tambin se incrementan los
grados de libertad, la desviacin estndar se aproxima a 1, lo que significa que el
estimador s se acerca a o , y la distribucin t se aproxima a la normal.
- - Cuando n es igual a 30 o ms, las dos curvas estn muy prximas; cuando n ,
la curva t se vuelve idntica a la curva normal.

MDULO 2 Ral A. Marigliano UNT
46
La figura 4.1 ilustra comparativamente la distribucin normal estndar y las
distribuciones t con 5 y 25 grados de libertad:

Figura 4.1 Distribucin t con 5 y 25 grados de libertad y distribucin normal estndar

Igual que en la distribucin z, puede integrarse una funcin matemtica para encontrar
el rea bajo la curva en la distribucin t. No obstante, tambin existen tablas para
obtener valores crticos para la distribucin t, que corresponden a reas bajo la curva
de uso frecuente. La tabla 2 del Anexo proporciona valores crticos para reas
relacionadas con probabilidades (o =nivel de significacin) de 0.10, 0.05, 0.02, 0.01 y
0.001 para pruebas de dos colas y para valores de o de la mitad de ese tamao para
pruebas de una cola.
Aunque en la tabla slo estn anotados valores positivos de t, los valores negativos
estn implcitos debido al hecho de que la distribucin t es perfectamente simtrica
con respecto a t =0.
Obsrvese asimismo, en la ltima fila de la tabla, que para n = los valores de t son
iguales a z.
Aunque pueden calcularse probabilidades, tal como lo hicimos para una distribucin
normal estndar, en este curso usaremos la tabla de Distribucin t para determinar
valores crticos relacionados con intervalos de confianza y en pruebas de hiptesis,
donde se desarrollarn los conceptos de nivel de significacin (o) y pruebas de una y
dos colas, temas que sern abordados en el Mdulo 3.
Como veremos, Microsoft Excel proporciona los valores de t, de la misma forma que
los valores z para la distribucin normal estndar.

5. El error de medida
No existe un mtodo analtico que proporcione siempre el mismo resultado cada vez
que una muestra estable es sometida a un procedimiento de medida. Sabemos por
experiencia, que si la medicin se repite varias veces utilizando el mismo mtodo, los
MDULO 2 Ral A. Marigliano UNT
47
mismos reactivos, el mismo instrumento de medida, etc., cada resultado obtenido ser
distinto a los dems.

- - Cuando realizamos una medicin aislada de una magnitud (prctica comn en un
laboratorio clnico) el resultado est afectado por un error de medida.

La existencia de errores est relacionada con el mtodo analtico, los instrumentos de
medida, los reactivos y patrones, las condiciones ambientales del laboratorio y el
operador que realiza el anlisis.
Reconocido ste hecho, nos podemos preguntar:

- - Cul es la influencia de los errores analticos en el significado clnico del
resultado?
- - Cul es el margen de error que tenemos en nuestro laboratorio en los niveles de
decisin clnica?
- - Es posible conocer y describir los errores inherentes a todo procedimiento
analtico?

La descripcin de los errores en trminos numricos es posible a travs de mtodos
estadsticos. La Estadstica no mejora los resultados experimentales; es un mtodo
cientfico que permite revelar la informacin que ya estaba presente en un conjunto de
observaciones, es decir no se crea informacin nueva. Sin embargo, el tratamiento
estadstico de una serie de datos nos permite hacer juicios objetivos referentes a la
validez de los resultados.

El anlisis estadstico posibilita:
- - Detectar y evaluar la magnitud del error de una medicin
- - Definir lmites entre los cuales est el verdadero valor de la magnitud medida
- - Tomar decisiones en condiciones de incertidumbre
- - Mejorar la calidad de los resultados analticos

El concepto de error se basa en la aceptacin de que existe un valor verdadero de
la magnitud que se mide. El valor verdadero es un concepto til desde el punto de
vista terico, pero no hay modo alguno de medirlo experimentalmente. Resulta
necesario entonces, introducir el concepto de valor verdadero convencional, que es
una estimacin del valor verdadero o valor real. Usaremos en adelante los dos
trminos indistintamente.

MDULO 2 Ral A. Marigliano UNT
48
- - El error de una medicin es la diferencia entre el valor observado y el valor
convencionalmente verdadero

" verdadero valor " observado valor medida de Error =

El error de medida tiene dos componentes fundamentales
1
:

a) El Error aleatorio o indeterminado, asociado a la precisin del procedimiento de
medida.
b) El Error sistemtico o determinado, relacionado con la veracidad del
procedimiento analtico

1
Algunos aut ores defi nen un tercer ti po de error: el error grosero o accident al, causado por la avera de un
instrument o, verti do accident al de una muestra, un reactivo cont aminado, et c. Tales errores se reconocen
habitualment e con mucha f acili dad, y no son consi derados en l os apartados si gui ent es.




Figura 5.1. Componentes del error de medida. Precisin y Veracidad

- - Es importante considerar que la aparicin de un tipo de error no excluye la
existencia simultnea de ambos.

5.1 Errores aleatorios o indeterminados
Cuando se realizan mediciones repetidas del mismo mesurando, la presencia de
errores indeterminados se manifiesta por la obtencin de resultados dispersos, que
varan de forma impredecible de medicin a medicin. El efecto de tal variacin da
lugar a desvos que no son constantes, y fluctan al azar alrededor de un valor medio.
Los errores aleatorios no pueden identificarse completamente porque estn
constituidos por la acumulacin de mltiples incertidumbres individuales, generalmente
pequeas, independientes y no controladas, que influyen en el procedimiento de
medida: ruido de los componentes electrnicos del instrumento de medida, variabilidad
en el pipeteo, variabilidad en el tiempo y/o temperatura de incubacin, variacin en las
condiciones ambientales, etc.
MDULO 2 Ral A. Marigliano UNT
49
Pueden cometerse con igual probabilidad por defecto como por exceso. A medida que
aumenta la magnitud del error, disminuye la probabilidad de que aparezca una cierta
desviacin, y dicha probabilidad es idntica para el error con signo positivo que para el
mismo error con signo negativo (simetra con respecto a cero).

- - Los errores aleatorios siguen con bastante aproximacin la distribucin normal, y
por lo tanto pueden tratarse estadsticamente mediante principios estadsticos
basados en la distribucin de Gauss.

La siguiente figura muestra una curva de distribucin de errores aleatorios en medidas
repetidas de una muestra:

Figura 5.2. Distribucin de errores aleatorios

Cada medida individual tiene un determinado e impredecible error aleatorio (EA), que
puede definirse como el resultado de una medicin menos el promedio de mediciones
repetidas.
La medida a tiene un EA negativo de valor absoluto mayor al de la medida b que
tiene un EA positivo.
Por otro lado, el resultado de la medida a es menos probable, es decir aparecer
con menor frecuencia, que el resultado de la medida b.
De la definicin de EA, surge que la media aritmtica x de medidas repetidas tiene
error aleatorio igual a cero.

En el laboratorio bioqumico es habitual realizar una medicin del analito en cada
muestra, y resulta por lo tanto imposible conocer el error aleatorio de un resultado
particular. Sin embargo veremos como puede cuantificarse la incertidumbre
introducida por variaciones aleatorias en un procedimiento de medida, y estimar como
afecta a los resultados individuales.

MDULO 2 Ral A. Marigliano UNT
50
5.2 Precisin
La precisin describe la reproducibilidad de los resultados cuando se analiza
repetidamente una misma muestra estable. Es una medida de la dispersin o
distribucin de los valores alrededor de la media.
Puede definirse como:

- - El grado de concordancia entre los resultados de medidas independientes
obtenidas bajo condiciones establecidas.

De acuerdo a este concepto, un procedimiento de medida es ms preciso cuando la
dispersin entre resultados es menor, o a la inversa, es menos preciso cuando la
dispersin entre resultados es mayor, es decir existe una relacin inversa entre ambos
conceptos. Es conveniente entonces hablar de imprecisin para expresar el grado
de dispersin entre medidas independientes., trmino que se relaciona en forma
directa con el error aleatorio:

- - La imprecisin es el grado de dispersin entre los resultados de medidas
independientes obtenidas bajo condiciones establecidas.

Aunque rigurosamente los trminos precisin y/o imprecisin hacen referencia a un
grupo de medidas, esta propiedad puede generalizarse a un procedimiento o a un
instrumento de medida. Son corrientes las frases: el procedimiento A es menos
preciso que el B, o el instrumento A tiene mejor precisin que el B. El siguiente
esquema resume estos conceptos:


Figura 5.3. Error aleatorio, precisin e imprecisin



MDULO 2 Ral A. Marigliano UNT
51
5.2.1 Niveles de precisin
Se distinguen dos niveles de precisin extremos, en funcin de las condiciones en que
se obtienen los resultados de medidas independientes:

a) Repetibilidad o Repetitividad: cuando se mantienen constantes las condiciones
de medicin (reactivos, calibrador, instrumento, operario, etc.), tambin denominada
precisin intra-corrida, intra-ensayo, o intra-serie.

Se define como:

- - Proximidad entre los resultados de medidas sucesivas del mesurando, realizadas
bajo las mismas condiciones de medicin, aplicando el mismo mtodo a una
muestra homognea, en el mismo laboratorio, el mismo operador, usando el mismo
equipamiento en un intervalo corto de tiempo.

b) Reproducibilidad: cuando se varan las condiciones analticas, es decir se realizan
las mediciones en diferentes laboratorios, distintos operadores, diferentes
procedimientos de medida, etc.

Puede definirse en general, como:

- - Concordancia entre resultados de ensayos independientes correspondientes a
alcuotas de la misma muestra, en diferentes condiciones: distintos operadores,
diferente equipamiento, distintos procedimientos de medida o diferentes
laboratorios.


Figura 5.4. Repetibilidad y Reproducibilidad


De estas definiciones deducimos que existen pocas condiciones de repetibilidad
(ensayos realizados en una corrida o en un intervalo corto de tiempo), y que pueden
darse una gran variedad de condiciones intermedias, en las que participe al menos
uno de los factores que definen las condiciones de reproducibilidad, como por ejemplo
MDULO 2 Ral A. Marigliano UNT
52
que los ensayos se realicen en el mismo laboratorio cambiando el equipamiento, el
instrumento de medicin o el operador.
Cada una de estas circunstancias constituye una fuente de variacin, de tal modo que
si los resultados se obtienen en condiciones muy diversas, es de esperar que sean
ms dispersos que si las circunstancias son similares.

Se habla de reproducibilidad interlaboratorio cuando las medidas se realizan en
laboratorios distintos (ensayos de intercomparacin).

Un nivel de reproducibilidad importante para el laboratorio clnico es la denominada
precisin intermedia, o precisin entre ensayos, entre corridas, o entre series,
que relaciona la variacin en los resultados obtenidos en el mismo laboratorio en
distintas corridas o series, con los cambios de las condiciones de medicin que son
usuales en la rutina diaria (da, operador, calibracin, equipamiento, etc.).

Se define como:

- - Grado de concordancia en los resultados obtenidos en el mismo laboratorio, cuando
varan uno o ms factores, tales como el tiempo (das distintos), calibracin,
operador o equipamiento.

5.2.2. Estimacin cuantitativa

La precisin / imprecisin son propiedades cualitativas que no tienen valor numrico,
por lo que la variabilidad metrolgica debido a fluctuaciones aleatorias se expresa
numricamente mediante la desviacin estndar, la varianza o el coeficiente de
variacin.

DESVIACIN ESTNDAR

El camino ms fcil para el clculo de la imprecisin es a travs de la desviacin
estndar de mediciones repetidas, con la expresin que vimos en el mdulo I:

1 n
) x x (
s
2
i

=

(1)


La ecuacin (1) se emplea para calcular:

b) La imprecisin total a partir de un mnimo de 20 mediciones individuales de la
misma muestra en das distintos. Este procedimiento nos dar una estimacin
simple de la desviacin estndar total.

MDULO 2 Ral A. Marigliano UNT
53
Debemos tener en cuenta que las estimaciones simples de la imprecisin pueden
frecuentemente subestimar la desviacin estndar total, que debe calcularse
estimando los componentes de varianza debidos a: 1) la variabilidad dentro de la
corrida; 2) entre corridas (si se hace ms de una corrida por da) y 3) entre das. Estos
componentes de varianza son luego sumados, y posteriormente se calcula la raz
cuadrada para obtener la desviacin estndar total corregida.
La separacin y estimacin de las distintas fuentes de varianza puede realizarse a
travs de un procedimiento estadstico inferencial conocido como ANOVA (Anlisis de
la varianza), que est fuera del alcance de este curso.

b) La imprecisin intra-ensayo, si los replicados de la muestra se realizan en el mismo
da en una corrida, o en un intervalo corto de tiempo.

Cuando el protocolo establecido para la estimacin de imprecisin, determina
mediciones diarias por duplicado de la muestra, una forma conveniente para el clculo
de la imprecisin intra-ensayo es a partir las diferencias de las medidas duplicadas,
obtenindose d
1
, d
2
, d
3
,,d
k
diferencias.

En este caso, la desviacin estndar puede calcularse con la expresin:

k 2
d
s
2
i
= (2)
Donde:
- -

2
i
d

=suma de los cuadrados de las diferencias
- - k =nmero de diferencias de medidas duplicadas

Ejemplo 5.2.1
En la siguiente tabla se presentan los resultados de mediciones de un material de
control nivel normal para Qumica clnica, analito creatinina quinasa (U/L), efectuadas
por duplicado en 10 das consecutivos.
En la ltima fila de la tabla se han calculado los cuadrados de las diferencias entre
duplicados (
2
i
d ):

CK Da 1 Da 2 Da 3 Da 4 Da 5 Da 6 Da 7 Da 8 Da 9 Da 10
Res 1 97 104 101 95 100 109 98 105 100 109
Res 2 95 105 99 98 101 105 101 107 98 111
2
i
d 4 1 4 9 1 16 9 4 4 4

MDULO 2 Ral A. Marigliano UNT
54
56 d
2
i
=

= =
20
56
s 1,7 U/L

Este valor representa la imprecisin intraensayo esperada para el procedimiento de
medicin de CK en el laboratorio.

Es importante recordar que la desviacin estndar es un estadstico que, junto con la
media aritmtica, definen la distribucin de los resultados:


Figura 5.5. Distribucin normal

La desviacin estndar puede tener un mismo valor absoluto independiente de la
concentracin del analito, fenmeno que se denomina homocedasticidad:


Figura 5.6. Distribucin homocedstica

Ms frecuentemente, el valor de la desviacin estndar depende de la concentracin
de analito, y hablamos de heterocedasticidad:


Figura 5.7. Distribucin heterocedstica
MDULO 2 Ral A. Marigliano UNT
55
VARIANZA
Otra medida de dispersin es la varianza, que es el cuadrado de la desviacin
estndar:
1 n
) x x (
s
2
i
2

=

(3)

No es una medida utilizada habitualmente para la expresin cuantitativa de la
imprecisin. Sin embargo tiene mucha importancia en pruebas o tests de estadstica
inferencial de verificacin de homo y heterocedasticidad, y en la propagacin del error
aleatorio, siendo su propiedad ms importante la aditividad.

Esta propiedad puede aplicarse en la resolucin del ejercicio planteado en el ejemplo
5.2.1, donde la precisin intraensayo puede resolverse tambin a partir del cuadrado
de la desviacin estndar (1), calculando la varianza diaria de cada duplicado con la
expresin (3).
Luego se suman y promedian las 10 varianzas:

10
s s s s
s
2
10
2
3
2
2
2
1 2
i
+ + + +
=



Posteriormente se calcula la raz cuadrada para obtener la imprecisin intra-ensayo
expresada como desviacin estndar, obteniendo igual resultado:


2
i
s s = = 1,67

Este procedimiento debe realizarse promediando las varianzas, y luego extrayendo
la raz cuadrada para encontrar la desviacin estndar. (Ver Ejercicios_M2)

COEFICIENTE DE VARIACIN
Otra forma de cuantificar la imprecisin, es la desviacin estndar relativa a la media
expresada como porcentaje, o coeficiente de variacin:

100
x
s
CV =

Los errores relativos se utilizan frecuentemente para comparar precisiones de
resultados que tienen diferentes unidades o magnitudes, pues brindan una imagen
cierta de la dispersin, sin referirse a la naturaleza de la medicin ni al mtodo
empleado. Veremos en el prximo apartado su importancia en la propagacin de
errores aleatorios.


MDULO 2 Ral A. Marigliano UNT
56
Ejemplo 5.2.2
Un material de control tiene un valor asignado para albmina de 41,9 g/L. Cinco
laboratorios realizan cada uno seis determinaciones (en el mismo da) de la
concentracin de albmina, con los siguientes resultados:

Laboratorio Albmina (g/L)
A 42,5 41,6 42,1 41,9 41,1 42,2
B 39,8 43,6 42,1 40,1 43,9 41,9
C 43,5 42,8 43,8 43,1 42,7 43,3
D 35,0 43,0 37,1 40,5 36,8 42,2
E 42,2 41,6 42,0 41,8 42,6 39,0


Calcular la media aritmtica y la imprecisin intra-ensayo de cada laboratorio.
Comentar los resultados obtenidos.
Respuesta

En el siguiente cuadro se muestran los resultados del ejercicio. Debe tenerse en
cuenta que la desviacin estndar debe calcularse en este ejemplo con la expresin:

1 n
) x x (
s
2
i

=



LABORATORIOS
A B C D E
Media (g/L) 41,9 41,9 43,2 39,1 41,5
Desviacin estndar (g/L) 0,494 1,71 0,420 3,25 1,29
C.V. (%) 1,2 4,1 0,97 8,3 3,1

- - Laboratorios A y C: los ms precisos

- - Laboratorio D: el menos preciso.
- - Los laboratorios B y E tienen una precisin pobre, pero hay que considerar que el
ltimo resultado del laboratorio E (39,0 g/L) podra ser un valor anmalo (Ver
apartado 7: rechazo de valores discrepantes).

Para verificar los resultados expuestos, sugerimos realizar los clculos a travs de
Microsoft Excel, para lo cual podemos exportar los datos de la tabla a una hoja de MS
Excel, y luego utilizar las sintaxis: =promedio(..) ; =desvest(.).

Recordemos que otra forma es ir a Herramientas Anlisis de datos Estadstica
descriptiva (Excel 2003), o Datos Anlisis de datos Estadstica descriptiva (Excel
2007/2010).
MDULO 2 Ral A. Marigliano UNT
57
Este ltimo procedimiento nos permite analizar en un solo paso los datos de las cinco
columnas, es decir de los cinco laboratorios. Excel nos entregar en una hoja, los
cinco cuadros con sus respectivas medidas descriptivas.

Para el CV, debemos aplicar la frmula y hacer el clculo manualmente, o a travs de
Excel, a partir de las celdas con los resultados de la media y la desviacin estndar.

(Ver Ejercicios_M2)


5.3. Propagacin de errores aleatorios
El resultado final de una medicin suele obtenerse a partir de un clculo en el que se
combinan varias magnitudes, cada una de ellas sujeta a un determinado error
aleatorio. A menudo es necesario estimar la desviacin estndar de un resultado que
ha sido calculado a partir de dos o ms datos experimentales. Si se conoce la
precisin de cada observacin, la precisin del resultado final se puede establecer
utilizando reglas matemticas simples que dependen del tipo de relacin aritmtica
que exista entre los trminos que contienen los errores y la cantidad que se ha de
calcular.


SUMAS Y DIFERENCIAS

Ejemplo 5.3.1.
Se mide la masa de un clculo urinario (y) por la diferencia de pesada entre un
recipiente vaco (a) y del mismo recipiente conteniendo el clculo (b). Cada pesada
tiene una imprecisin asociada =10 mg.
La imprecisin de y no es la suma de las imprecisiones de (a) y (b), pues podra
suceder que los errores aleatorios sean todos positivos o negativos, en cuyo caso la
desviacin estndar podra ser a lo sumo 10 +10 =20 mg -10 -10 =- 20 mg. Es
mucho ms probable que el error aleatorio sea en algunos casos, positivo en (a) y
negativo en (b), compensndose el uno al otro.
Sin embargo, el cuadrado de la desviacin estndar o varianza tiene la importante
propiedad de que la varianza de la suma o diferencia de varios valores es igual a la
suma de las varianzas de cada uno de ellos
As, para el clculo:
c b a y + + =
2
c
2
b
2
a
2
y
s s s s + + =

- - La desviacin estndar de sumas y/o diferencias viene dada por la raz cuadrada de
la suma de las varianzas individuales:
MDULO 2 Ral A. Marigliano UNT
58
2
c
2
b
2
a y
s s s s + + =

Entonces la imprecisin final del ejemplo se calcula:

200 10 10 s
2 2 2
y
= + = mg 14 200 s
y
= =

Obsrvese que la desviacin estndar del resultado final es menor que la suma de las
desviaciones estndar de cada valor que interviene en el clculo.

Ejemplo 5.3.2.
Consideremos la siguiente operacin, donde las incertidumbres experimentales se
muestran entre parntesis como desviaciones estndar en valor absoluto:

0,50 ( 0,02) +4,10 ( 0,03) 1,97 ( 0,05)

La desviacin estndar del resultado ser:

06 , 0 05 , 0 03 , 0 02 , 0 s
2 2 2
y
= + + =


PRODUCTOS Y COCIENTES

Ejemplo 5.3.3
Consideremos el siguiente clculo:

) 01 , 0 ( 59 , 0
) 02 , 0 ( 89 , 1 ) 03 , 0 ( 76 , 1




- - Para determinar la desviacin estndar de un producto o cociente se evala la
desviacin estndar relativa del resultado, a partir de las correspondientes
desviaciones relativas de las magnitudes implicadas en el clculo

Entonces, para el clculo:
c
b a
y

=


Se obtiene la desviacin estndar relativa del resultado a partir de la raz cuadrada de
la suma de los cuadrados de las desviaciones estndar relativas de a, b y c:

2
c
2
b
2
a
y
c
s
b
s
a
s
y
s
|
|
.
|

\
|
+
|
|
.
|

\
|
+
|
|
.
|

\
|
=

Aplicando esta ecuacin al ejemplo 5.3.2., se tiene:

MDULO 2 Ral A. Marigliano UNT
59
= |
.
|

\
|
+ |
.
|

\
|
+ |
.
|

\
|
=
2 2 2
y
59 , 0
01 , 0
89 , 1
02 , 0
76 , 1
03 , 0
y
s
0,0263

Para completar el clculo, se debe encontrar el valor absoluto de la desviacin
estndar del resultado:
149 , 0 0263 , 0 638 , 5 0263 , 0 y s
y
= = =

Ejemplo 5.3.4.
La concentracin cataltica de enzimas se calcula generalmente utilizando la siguiente
expresin:

Vm
Vt 10
min / A ) L / U (
6

=
c
A

Se conoce que la imprecisin de cada valor que interviene en la ecuacin, expresada
como coeficiente de variacin o desviacin estndar relativa porcentual es:

Velocidad de transformacin AA/min CV =7,5 %
Volumen total de la mezcla Vt CV =1,1 %
Volumen de la muestra Vm CV =1,5 %
Absortividad molar c CV =0,8 %

La imprecisin del resultado es:

% 8 , 7 8 , 0 5 , 1 1 , 1 5 , 7 CV
2 2 2 2
y
= + + + =

Si queremos expresar la imprecisin del resultado como desviacin estndar:

CV 100 ) y / s (
y
=
100
y
CV s
y
=

La imprecisin de las mediciones de concentracin cataltica de enzimas puede
estimarse tambin, realizando mediciones repetidas de la muestra y calculando la
desviacin estndar, y a partir de ella se obtendra un valor de CV similar al calculado
ms arriba. Este concepto es importante, pues nos dice que la imprecisin que
proviene de distintas fuentes puede ser calculada en forma conjunta, lo que tiene la
ventaja de reducir el trabajo. Sin embargo, no nos permite identificar cuales son las
principales componentes de varianza que contribuyen a la variabilidad total.
Cualquier esfuerzo que se haga para mejorar la precisin de un experimento debe
orientarse en corregir la imprecisin de los valores con mayor variabilidad, en nuestro
ejemplo la velocidad de transformacin AA/min (7,5%), que constituye el 96% de la
variabilidad total (7,8%).

MDULO 2 Ral A. Marigliano UNT
60
TABLA 5.1. Reglas matemticas para la estimacin de la precisin de resultados

Existen reglas matemticas para el clculo de la imprecisin de resultados, cuando
estn implicadas otras operaciones como potencias y logaritmos, que no se
consideran en este curso.

5.4 Errores sistemticos o determinados
El error sistemtico (ES) es un componente del error de medida que en el transcurso
de un cierto nmero de anlisis del mesurando, se mantiene constante o vara de
modo predecible. Es independiente del nmero de observaciones, y no puede
reducirse incrementando el nmero de mediciones bajo las mismas condiciones
analticas.
Afecta a las mediciones de un modo definido. Pueden investigarse las causas que lo
producen y establecerse su magnitud, por lo que puede evitarse o disminuirse.

El error sistemtico se define como:

- - La diferencia entre el valor medio de mltiples repeticiones y el valor verdadero


Figura 5.8. Error sistemtico

Ya mencionamos que el valor verdadero es un concepto ideal que se obtendra
mediante una medicin perfecta, esto es, sin errores. Tambin dijimos que no es
MDULO 2 Ral A. Marigliano UNT
61
posible conocer el valor verdadero, pero pueden obtenerse distintos tipos de
estimacin que se aceptan como convencin y se denominan valor verdadero
convencional

Este tipo de error puede ser causado por:

- - Una calibracin incorrecta, que puede deberse a un valor errneo asignado al
calibrador, errores en la medicin de volmenes, la temperatura o tiempo de
incubacin, alteraciones en el sistema analtico que afectan la seal del instrumento
de medida, etc. Una vez detectado, este error debe corregirse a travs del uso de
patrones adecuados de calibracin.

- - Inespecificidad metrolgica (o insuficiente selectividad) del procedimiento de
medida. El trmino inespecificidad se utiliza cuando otras magnitudes que no son
el mesurando (magnitudes influyentes o interferentes), tienen efecto sobre el
resultado de la medicin de la muestra. Una gran parte de los procedimientos de
medida del laboratorio clnico, son sometidos a interferencias que pueden ser
positivas o negativas, y ocasionan errores sistemticos positivos y negativos
respectivamente. Los ES originados por interferentes son difcilmente detectables.

Un importante concepto que surge de lo expuesto es, que el error de calibracin para
un determinado analito, afecta a todas las muestras que se miden; mientras los errores
debidos a la insuficiente selectividad del procedimiento de medida, estn vinculados
slo con las muestras que contienen magnitudes interferentes.

Los ES se clasifican como:

a) Error sistemtico constante: la diferencia entre el valor observado y el real es la
misma, cualquiera sea el valor de la magnitud que se mide.

b) Error sistemtico proporcional: vara de forma proporcional con la concentracin del
analito.

En la siguiente grfica se observan tres rectas de valores observados vs valores de
referencia: la lnea llena indica resultados idnticos del procedimiento evaluado y la
referencia, con ordenada al origen = 0 (x = y). La lnea punteada superior error
sistemtico constante positivo, y la recta punteada inferior error sistemtico
proporcional:

MDULO 2 Ral A. Marigliano UNT
62


Figura 5.9. Errores sistemticos constantes y proporcionales

5.5. Veracidad
La veracidad de medida es un concepto cualitativo inversamente relacionado con el
error sistemtico. Se define como:

- - Grado de concordancia entre el valor promedio obtenido de una gran serie de
resultados y el valor verdadero convencional.
Los conceptos de error sistemtico y veracidad se aplican a una medida individual, a
una serie de medidas repetidas, a un procedimiento de medida, o a un instrumento de
medida:

Figura 5.10. Error sistemtico, sesgo y veracidad

5.5.1. Estimacin cuantitativa
La veracidad se estima a travs del error sistemtico que puede expresarse:

MDULO 2 Ral A. Marigliano UNT
63
- - Como error absoluto: es la diferencia entre el valor observado y el valor
verdadero. Tiene las mismas dimensiones que la magnitud medida, expresndose
en las mismas unidades:

verdadero valor observado valor ) bias ( ES =

El trmino absoluto tiene aqu un significado diferente del que tiene en matemticas,
donde el valor absoluto significa la magnitud de un nmero ignorando su signo. Tal
como lo usaremos, el error sistemtico expresado como error absoluto es la
diferencia entre un resultado experimental y su valor aceptado como verdadero,
incluyendo su signo. Es convencional restar del valor observado el valor verdadero,
de manera que el error sistemtico calculado puede tener signo negativo si el valor
observado es menor que el verdadero, o positivo en el caso inverso.
El trmino bias o sesgo, se utiliza conceptualmente como el inverso de veracidad, (o
inveracidad), y se aplica adems como expresin cuantitativa del error sistemtico.

- - Como error relativo: es el cociente entre el error absoluto y el valor verdadero.
Generalmente se expresa en forma porcentual:

100
verdadero valor
verdadero valor observado valor
% ES

=

Ejemplo 5.5.1
Un material de referencia tiene un valor asignado para calcio de 9,0 mg/dL. Se realizan
20 determinaciones de la concentracin de calcio en el control, con los siguientes
resultados:
Ca (mg/dL)
10,0 9,7
8,9 9,6
8,7 9,0
9,9 9,9
9,0 9,2
8,8 9,4
9,6 8,7
8,8 9,1
9,2 9,6
9,4 10,3


Para estimar el error sistemtico, debemos calcular la media aritmtica que ser el
resultado experimental, o valor observado: = x 9,3 mg/dL
El error sistemtico es:

MDULO 2 Ral A. Marigliano UNT
64
dL / mg 3 , 0 0 , 9 3 , 9 ES = = % 3 , 3 100
0 , 9
3 , 0
% ES = =

5.6 Error de medi da y exactitud
Recordemos que el error de medida es la diferencia entre el resultado de una medicin
y el valor verdadero, y que engloba los dos componentes descriptos en los apartados
anteriores:

El error aleatorio, relacionado con la imprecisin del procedimiento de medida

El error sistemtico, relacionado con la veracidad del procedimiento de medida

La exactitud de una medida es un concepto inversamente relacionado con el error de
medida, y se define como:

- - Proximidad entre el resultado de una medicin y el valor verdadero del mesurando

Examinemos un poco ms esos conceptos, a travs de un ejemplo.

Ejemplo 5.6.1
Cuatro laboratorios realizan cada uno siete medidas de un material de control. El valor
asignado al control se considera valor verdadero convencional. Los resultados
obtenidos se muestran en el siguiente esquema:


Figura 5.11. Error sistemtico, Precisin y Exactitud

Los resultados obtenidos por el Laboratorio A presentan dos caractersticas:

- - Todos ellos estn muy prximos uno de otro: los errores aleatorios son pequeos,
de manera que los resultados son precisos

MDULO 2 Ral A. Marigliano UNT
65
- - Todos son demasiado grandes: debido a errores sistemticos todos los resultados
son errneos en el mismo sentido, en este caso todos mayores que el valor
verdadero, por lo tanto la media experimental es mayor que el valor verdadero

El Laboratorio B ha obtenido resultados que contrastan con los del Laboratorio A:

- - La media est muy prxima al valor verdadero, de manera que puede considerarse
un ES 0

- - La variabilidad de los resultados es muy grande, lo que indica una precisin
insatisfactoria, es decir errores aleatorios sustanciales

- La comparacin de los resultados obtenidos por los Laboratorios A y B muestran
que los errores aleatorios y sistemticos pueden ocurrir independientemente unos
de otros

Esta conclusin se refuerza por los datos de los Laboratorios C y D:

- - Los resultados del Laboratorio C muestran una precisin pobre y un error
sistemtico negativo, pues el promedio es menor que el valor verdadero.

- - El Laboratorio D ha logrado resultados precisos e insesgados o veraces

Este experimento evidencia que:

- - La exactitud de un resultado individual puede estar afectada por los dos errores:
aleatorios y sistemticos

- - La exactitud de un resultado promedio tambin tiene contribuciones de ambas
fuentes de error: incluso si los errores sistemticos estn ausentes, el resultado
promedio no ser exactamente igual al valor verdadero, debido a la existencia de
errores aleatorios.

Los resultados obtenidos por el Laboratorio B muestran estos principios: seis de las
siete medidas muestran inexactitudes considerables, es decir suficientemente alejadas
del valor verdadero. Sin embargo el promedio est muy cerca del valor verdadero, de
manera que podemos pensar que la inexactitud de los resultados individuales se
debe en gran medida a errores aleatorios y no sistemticos
En contraposicin, todos los resultados individuales del Laboratorio A, y el promedio
resultante son inexactos. Dada la excelente precisin de este operador podemos
pensar que estas inexactitudes se deban principalmente a errores sistemticos.
En resumen: la precisin describe errores aleatorios, el sesgo describe errores
sistemticos, y la exactitud, es decir la proximidad al verdadero valor de un valor
individual o un valor promedio, incorpora ambos tipos de error:
MDULO 2 Ral A. Marigliano UNT
66

Figura 5.12. Exactitud, precisin y veracidad. Errores de medida

Qu ms se puede concluir de este experimento?

Es fcil apreciar que los datos obtenidos por el laboratorio C son inaceptables, y que
los del laboratorio D son los ms aceptables.
Puede suceder que se tenga que elegir entre los laboratorios A y B respectivamente:
Qu tipo de resultado es preferible?
Si la eleccin fuera entre dos operarios, o dos mtodos, cmo hacemos la eleccin
del mejor operario o el mejor mtodo?

Es importante darse cuenta que un mtodo que se encuentra libre de errores
sistemticos puede (si es muy impreciso), dar un valor medio que est, por azar,
muy cerca, o considerablemente alejado del valor correcto.

Por otra parte un mtodo que es preciso pero sesgado (Situacin A) puede
convertirse en otro que sea preciso y veraz (situacin D) si se descubren y eliminan
los errores sistemticos.


Figura 5.13. Error sistemtico, Precisin y Exactitud. Curvas de distribucin

5.7. Error total
Consideremos los siguientes interrogantes:

1. Hasta que punto se aproxima un resultado al valor verdadero del mesurando?
MDULO 2 Ral A. Marigliano UNT
67
2. Cul es el margen de inexactitud que puede esperarse en una medicin simple?

Como ya vimos, la inexactitud de una medicin simple no puede ser determinada, a
menos que se conozca previamente el valor verdadero. Aunque la parte sistemtica
del error puede llegar a ser conocida y corregida, la parte aleatoria (por definicin)
vara de una medicin a otra, y no podemos saber cual es de todas las posibles de
una distribucin normal.
Si la distribucin no tiene error sistemtico, la inexactitud de una medida aislada queda
determinada en forma aleatoria: en casi el 100% de los casos (99,7%), el valor
obtenido puede ser cualquiera entre la media 3 desviaciones estndar:


Figura 5.14. Inexactitud de medidas individuales sin error sistemtico

Cuando existe error sistemtico, ste se suma al aleatorio, establecindose el
concepto de Error Total que es la suma del error sistemtico y del mximo
segmento variable posible, o sea el error aleatorio:


Figura 5.14. Error sistemtico, aleatorio y total

MDULO 2 Ral A. Marigliano UNT
68
- - El error total o error de medida mximo es una combinacin de errores aleatorios y
sistemticos que estima la magnitud de error que puede ser esperado en una
medicin


Se calcula sumando el error sistemtico con una estimacin del error aleatorio para
una probabilidad definida.
Para la estimacin del error aleatorio se multiplica el coeficiente de variacin por 1,65
para cubrir el 95% de probabilidades, o por 2,33 para el 99%:

CV 65 , 1 % ES (%) total Error + = (1)
CV 33 , 2 % ES (%) total Error + = (2)
Es habitual el uso de la primera expresin.
Los coeficientes 1,65 y 2,33 corresponden a valores de la variable normal
estandarizada z para probabilidades de 0,95 y 0,99 respectivamente.
Por ejemplo, para una probabilidad = 0,95 buscamos en el cuerpo de la tabla y
encontramos el valor de z combinando la primera columna y la primera fila, que resulta
1,65:
Tabla 1. DISTRIBUCION NORMAL ESTANDAR


Si queremos utilizar Microsoft Excel, recordemos que en el men:
Insertar Funcin (Excel 2003) Frmulas clic en el cono (Excel 2007 /
2010)
MDULO 2 Ral A. Marigliano UNT
69
En la ventana que se abre seleccionamos DISTR.NORM.ESTAND.INV:



Haciendo clic en aceptar, se abre una ventana que nos permite ingresar la
probabilidad, en este ejemplo 0,95. Excel devuelve el valor de z =1,64485.que se
aproxima habitualmente a 1,65:



Es necesario tener en cuenta que los errores aleatorios y sistemticos pueden variar
con la concentracin del analito, por lo que el clculo de error total es vlido para una
dada concentracin de la magnitud medida.

Ejemplo 5.7.1
Utilizando el mtodo Glucosa oxidasa/Peroxidasa, se analiza durante 20 das seguidos
un material de referencia con un valor asignado = 110 mg/dL, obtenindose los
siguientes resultados:


MDULO 2 Ral A. Marigliano UNT
70














Calcule Error sistemtico, CV analtico y Error Total

Resultados
Media 104 mg/dL
Desviacin estndar 5,6 mg/dL
Coeficiente de variacin 5,4%
ES -6,0 mg/dL
ES% -5,4%
Error Total % (*) 14,3

(*) Para el clculo de ET se utiliz la expresin: CV 65 , 1 % ES (%) total Error + =

6. Presentacin de resultados
Los resultados experimentales cuantitativos carecen de inters si no van
acompaados de una estimacin de los errores involucrados en su medida. Una
prctica usual es citar la media como estimacin de la magnitud medida y la
desviacin estndar como estimacin de la precisin. Es menos frecuente el uso del
error estndar
1
o los lmites de confianza al 95%
2
en lugar de la desviacin estndar,
utilizndose tambin a veces, estimaciones de la incertidumbre. Ya que no existe un
convenio universal es importante establecer el mtodo empleado, pues siempre que
se conozca el nmero de mediciones, las diferentes formas de expresin pueden
convertirse unas en otras.

Un indicador menos satisfactorio, pero ms comn, de la calidad de los datos es el
nmero de cifras significativas (ver apartado 6.2).

1,2
Estos conceptos sern desarroll ados en el Mdul o 3



Da Glucosa mg/dL Da
Glucosa
mg/dL
1 100 11 112
2 105 12 109
3 95 13 104
4 97 14 109
5 95 15 101
6 96 16 106
7 111 17 100
8 105 18 111
9 107 19 108
10 99 20 107
MDULO 2 Ral A. Marigliano UNT
71
6.1. Redondeo de datos
Un aspecto relacionado con la presentacin de resultados es el redondeo de la
respuesta.
Emplearemos las siguientes reglas para el redondeo de nmeros:

1. Si la cifra que se omite es menor que 5, simplemente se elimina
2. Si el dgito a quitar es mayor que 5, se aumenta en una unidad la ltima cifra
retenida

Ejemplo 6.1
El resultado de redondear el nmero 72,8 en unidades es 73, pues 72,8 est ms
prximo de 73 que de 72.
Anlogamente, si queremos redondear en centsimas el nmero 72,8139, el resultado
es 72,81.

3. Si la cifra descartada es 5, se toma como ltima cifra el nmero par ms prximo,
es decir si el dgito retenido es par se deja como est, y si es impar se redondea
hacia al nmero par superior

Ejemplo 6.2
Los resultados de redondear a centsimas los nmeros 12,465 y 183,575 son
respectivamente: 12,46 y 183,58.

Las dos primeras reglas son de sentido comn. La tercera surge de un convenio
razonable para minimizar los errores de redondeo acumulados cuando se efecta un
gran nmero de operaciones, pues la mitad de los redondeos sern hacia arriba y la
otra mitad hacia abajo, evitando el sesgo que se podra introducir en los resultados.

Ejemplo 6.3

a) 9,56 redondeado en dcimas es 9,6
b) 7,6 redondeado a unidades es 8
c) 6,19 redondeado en dcimas es 6,2
d) 4,75 se redondea en dcimas a 4,8
e) 4,25 se redondea en dcimas a 4,2
f) 5,365 se redondea en centsimas a 5,36
g) 1,435 x 10
-9
se redondea en centsimas a 1,44 x 10
-9
h) 1,48735 x 10
-9
se redondea en dcimas a 1,5 x 10
-9


MDULO 2 Ral A. Marigliano UNT
72
6.2. Cifras signifi cati vas
El concepto de cifras significativas slo tiene sentido cuando hablamos de magnitudes
continuas, es decir de mediciones expresadas mediante nmeros reales.
Las cifras significativas de una medicin experimental son aquellas que tienen un
significado real o aportan alguna informacin. Las cifras no significativas pueden
aparecer como resultado de clculos, pero no tienen ningn valor.
Las cifras significativas estn definidas por el error de medicin, determinado a su vez
por el instrumento y/o el procedimiento de medida, que nos aportan reglas explcitas
para redondear adecuadamente de un resultado.

- - Las cifras significativas son los dgitos necesarios para expresar el resultado de una
medicin con la precisin con que fue realizada.


Ejemplo 6.4
La media de los valores: 10,09 10,11 10,09 10,10 y 10,12 es =10,102 y su
desviacin estndar es =0,013038404.
Para expresar el resultado con el nmero correcto de dgitos significativos es
necesario tomar en cuenta la desviacin estndar. Advertimos claramente que existe
incertidumbre en la segunda cifra decimal (0,01303.).
- - Los resultados experimentales se expresan con slo una cifra dudosa, e indicando
con la incertidumbre de la medida
- - Por convencin las cifras significativas de un nmero son todos los dgitos
seguros y el primer dgito incierto.

Utilizando la media como estimacin de la magnitud medida y la desviacin estndar
como estimacin de la precisin, este resultado debera expresarse como:

s x = 10,10 0,01 (n = 5)

Este resultado tiene cuatro cifras significativas. Los tres primeros dgitos son seguros,
y el ltimo dgito es incierto.
- - La ltima cifra significativa (en el extremo derecho) de cualquier magnitud medida
siempre tiene alguna incertidumbre
- - La incertidumbre mnima es 1 en el ltimo dgito.

Ejemplo 6.5
Consideremos que el promedio de 10 pesadas realizadas en una balanza granataria
(precisin = 0,01 g) =10,593333 g. Todas las cifras que ocupan una posicin menor
MDULO 2 Ral A. Marigliano UNT
73
a las centsimas no aportan ninguna informacin. No tiene ningn sentido dar el
resultado de la pesada por ejemplo con una precisin de diezmilsimas, si afirmamos
que el error es del orden de centsimas de gramo. Por lo tanto el resultado debe
redondearse a 10,59 g.
Hay incertidumbre en todas las cantidades medidas, incluso si el instrumento de
medida tiene lectura digital. Cuando un pHmetro indica un pH de 3.52, hay
incertidumbre en el dgito 2.
Si en una experiencia donde se comprueba la escala de absorbancia de un
espectrofotmetro se obtiene un promedio igual a 0.463 UA, este resultado indica que
las dos primeras cifras decimales son seguras, pero existen dudas acerca de la
tercera. A veces se recalca la incertidumbre en la ltima cifra utilizando los formatos
0,46(3) 0,46
3
.

Los dgitos empleados, aparte de los ceros necesarios para localizar el punto decimal,
se llaman dgitos significativos o cifras significativas (c.s.) del nmero.

Para conocer y emplear el nmero correcto de c.s. se siguen las siguientes reglas:

1. Cualquier dgito diferente de cero es significativo

Ejemplo 6.6
- 246 tiene tres c.s.
- 2389 tiene cuatro c.s.
- Los nmeros: 3,458 34,58 345,8 y 3458 tienen cuatro cifras significativas. La
posicin del punto decimal es independiente de ellas

2. Un cero puede ser significativo o no, dependiendo de su posicin en un nmero:
- - Los ceros son significativos cuando se encuentran rodeados de otros dgitos
diferentes de cero
- - Para los nmeros mayores que uno, los ceros escritos a la derecha de la coma
decimal son significativos
- - Los ceros a la izquierda del primer dgito distinto a cero, que slo sitan la cifra
decimal, no son significativos

Ejemplo 6.7 (los ceros significativos estn marcados en negrita)

- 1,06 tres c.s.
- 12,05 cuatro c.s.
MDULO 2 Ral A. Marigliano UNT
74
- 1,205 cuatro c.s.
- 0,0106 tres c.s.
- 0,106 tres c.s.
- 0,1060 cuatro c.s.
- 30,26 cuatro c.s.
- 0,03026 cuatro c.s.

3. Para nmeros enteros, los ceros ubicados despus del ltimo dgito distinto de cero
pueden ser o no cifras significativas.

Ejemplo 6.8
El nmero 9100 puede tener 2, 3 4 c.s. Para conocer cual es el nmero correcto de
cifras significativas se debe tener informacin del procedimiento de medida utilizado (el
instrumento de medicin, la imprecisin de la medida, etc). Por ejemplo si escribimos:
9100 1: estamos indicando cuatro c.s.
Se puede tambin utilizar la notacin cientfica, expresando el nmero como:

9,1 x 10
3
dos c.s.
9,10 x 10
3
tres c.s.
9,100 x 10
3
cuatro c.s.

Reglas prcticas para cifras significativas

1. Despreciar todos los ceros a la izquierda
2. Todos los dems ceros son significativos, incluso los que se encuentran entre dos
dgitos distintos de cero.
3. Cuando exista confusin de si los ceros a la derecha son o no significativos,
expresar los datos en notacin cientfica

Ejemplo 6.9

142,7 = 1,427 x 10
2
cuatro c.s.
6,30 x 10
-5
= 0,0000630 tres c.s.
6,0021 cinco c.s.
1,08 tres c.s.
0,0015 =1,5 x 10
-3
dos c.s.
10,9 tres c.s.
25,0 tres c.s.
8,00 x 10
2
tres c.s.
35,07 x 10
-5
cuatro c.s.
MDULO 2 Ral A. Marigliano UNT
75
6.2.1. Cifras significativas en clculos numricos
Cuando hay que utilizar varias cantidades para calcular un resultado, slo se debe
redondear en el resultado final. Una buena regla para no originar una prdida de
precisin, es dejar un dgito ms detrs de la ltima cifra significativa en los clculos
intermedios, y dejar el posterior redondeo cuando se llegue al resultado final.

Sumas y diferencias

- - Al hacer sumas y restas, el resultado final no puede tener ms cifras decimales
que el dato con menor cantidad de ellas.

Ejemplo 6.10
Si los nmeros que se suman o se restan tienen igual nmero de dgitos, el resultado
tendr el mismo nmero de decimales, que los nmeros individuales:

1,254 +2,467 =3,721

Ejemplo 6.11
El nmero de cifras significativas en la respuesta puede ser menor o mayor que la
de los datos originales:

11,85 10,10 =1,75 tres c.s.

5,352 +7,123 =12,475 cinco c.s.

Ejemplo 6.12
Si los nmeros que se suman o restan no tienen igual nmero de cifras decimales, el
valor con menos cifras decimales es el que limita la suma:

3,20 +6,381 - 0,0908 =9,4902 = 9,49

18,05 +3,224 +8,1 +24,589 =53,963 = 54,0
Ejemplo 6.13
Cuando se redondea hay que considerar todos los dgitos que siguen a la ltima cifra
significativa. Si consideramos el clculo: 32,99864 +78,80 =111,79864

Se debe redondear el resultado a cinco cifras significativas. Los dgitos 864 estn
detrs de la ltima cifra significativa (9). Dado que el nmero 864 est ms cerca de la
prxima cifra decimal, redondeamos el 9 a 10, es decir redondeamos a 111,80.

MDULO 2 Ral A. Marigliano UNT
76
Si las cifras no significativas estuvieran ms prximas a la cifra anterior,
redondearamos hacia abajo. Por ejemplo el nmero 122,79456 redondeado a cinco
c.s. es =122,79.

Ejemplo 6.14
Cuando se suman o restan nmeros expresados en notacin cientfica, se debe tener
la precaucin de expresar todos los nmeros con el mismo exponente para realizar el
clculo:

1,632 10
5
+4,205 10
3
+0,894 10
6
1,632 10
5
+0,04205 10
5
+8,94 10
5


=10,61405 10
5
= 10,61 10
5


El resultado 10,61405 x 10
5
se redondea a 10,61 x 10
5
porque el nmero 8,94 x 10
5

limita el resultado de la suma a dos cifras decimales cuando todos los nmeros estn
expresados como mltiplos de 10
5
.

Productos, cocientes y races

Para productos, cocientes y races, el resultado debe redondearse de manera que
contenga el mismo nmero de dgitos significativos que el factor original con
menos cifras significativas.

Ejemplo 6.15

24 4,020 100 =0,9648 = 0,96

Ejemplo 6.16

1,648 0,0233 =70,729613 = 70,7

Ejemplo 6.17

5,1209 x 10
12
2,4 x 10
-15
=1,2 x 10
-2


Ejemplo 6.18

7 , 38 = 6,22093. = 6,22

7. Rechazo de valores discrepantes
Es muy frecuente encontrarse con la situacin en que uno (o ms) de los resultados
que se obtienen en un conjunto de medidas repetidas difiera excesivamente del resto
de datos, o de la media. Estas medidas se denominan resultados extremos,
MDULO 2 Ral A. Marigliano UNT
77
discrepantes, anmalos, outliers, etc. Cuando una serie de datos tiene un resultado
discrepante, debe tomarse la decisin de aceptarlo o rechazarlo.
La eleccin de un criterio para el rechazo de un resultado sospechoso debe ser hecha
cuidadosamente. Si elegimos un criterio que admita datos muy divergentes, se corre el
riesgo de retener resultados que son falsos, y que tienen un efecto incierto sobre el
promedio de datos. Por otra parte, si caemos en el extremo opuesto facilitando el
rechazo de un resultado, podemos descartar medidas que son correctas dentro de la
serie, ocasionando una falsa disminucin de la variabilidad de la serie.
Idealmente, habra que tomar nuevas medidas cuando aparezca un valor sospechoso,
especialmente si inicialmente slo se han tomado pocos valores, lo que puede ayudar
a determinar si debera rechazarse o no el valor sospechoso.
Se han desarrollado varios procedimientos estadsticos para suministrar criterios de
rechazo o retencin de discrepantes, como el contraste Q de Dixon y el contraste de
Grubbs. En el mdulo anterior vimos un procedimiento grfico de anlisis de datos
(boxplot), que permite detectar valores extremos.

7.1. Contraste Q de Dixon
El test Q es un test sencillo y de uso generalizado para pequeas muestras. El
procedimiento evala una medida sospechosa comparando la diferencia entre ella y la
medida ms prxima en tamao, con el rango de las medidas.
Se utiliza de la siguiente manera:

- - Se ordenan los datos de menor a mayor
- - Se calcula el rango (dispersin de toda la serie =R)
- - Se calcula el valor absoluto de la diferencia entre el valor dudoso (x
Q
) y su vecino
ms prximo (x
N
)
- - El estadstico Q experimental se calcula:

R
x x
Q
N Q
exp

=


Se compara el valor de Q
exp
obtenido con el valor crtico de tablas que simbolizaremos
Q* (Tabla 3 del Anexo)

- Si el valor de Q
exp
es que Q*

el resultado sospechoso se rechaza con el grado de
confianza elegido.
- Si en cambio Q
exp
< que Q*, el resultado se acepta

MDULO 2 Ral A. Marigliano UNT
78
Los valores crticos de Q de la Tabla 3 son adecuados para un contraste de dos colas,
el cual es apropiado cuando no se conoce de antemano en que extremo de la
distribucin puede darse el valor anmalo. La decisin de rechazo o aceptacin puede
tomarse con 90, 95 o 99 % de confianza.
Este test no es til cuando el nmero de datos es menor a 5. Si se toma solamente
este contraste corremos el riesgo de acumular datos alejados, que no pertenecen a la
distribucin. Por esto, el buen criterio y la decisin para repetir un experimento suelen
ser recomendables en estos casos.

7.2. Contraste de Grubbs
Este test compara la desviacin entre el valor sospechoso y la media muestral, con la
desviacin estndar de la muestra.
Para usar este contraste, se calcula el estadstico G experimental:


s
x x
G
d
exp

=


Donde
d
x es el resultado dudoso y x y s son la media y la desviacin estndar de
toda la serie incluyendo el resultado cuestionable.
- Se rechaza el resultado dudoso cuando el valor de G
exp
es mayor al valor crtico G*
(Tabla 4).

Ejemplo 7.1
El anlisis de un material de control realizado por quintuplicado arroj los siguientes
valores para Mg: 4,25 4,09 4,31 3,92 4,18 mg/dL. El cuarto valor parece
anmalo. Se debe rechazar o retener?
Aplicar los criterios de Dixon y Grubbs para un 95% de confianza

Criterio de Dixon:

Los valores ordenados de menor a mayor son:

3,92 4,09 4,18 4,25 4,31

El estadstico Q es:

436 , 0
92 , 3 31 , 4
09 , 4 92 , 3
Q
exp
=

=

De la Tabla 3, para n =5, el valor crtico Q* es =0,710 (p =0,05).

MDULO 2 Ral A. Marigliano UNT
79
El valor 0,436 es menor que 0,710 por lo tanto el valor 3,92 se mantiene en la serie de
datos.

Criterio de Grubbs:

La media aritmtica es 4,15 mg/dL y la desviacin estndar es 0,15 mg/dL.

El estadstico G es:
53 , 1
15 , 0
15 , 4 92 , 3
G
exp
=

=

De la tabla 4, para n =5, el valor crtico G* es =1,71. El valor de G experimental es
menor que G*, el dato no se rechaza.

Ejemplo 7.2
Se realizaron cinco anlisis sobre un pool de sueros para la determinacin de
colesterol, obtenindose los siguientes resultados: 192 194 188 191 207 mg/dL

a) Aplique los criterios de Dixon y Grubss para una probabilidad del 95%, y verifique si
el dato 207 mg/dL es un valor marginal. Debe ser rechazado o aceptado?
b) Estimar la variacin de la media y la desviacin estndar si el valor discrepante es
rechazado

Criterio de Dixon:

Los valores ordenados de menor a mayor son:

188 191 192 194 207

El estadstico Q es:

684 , 0
188 207
194 207
Q
exp
=

=


El valor crtico de Q para n =5 es 0,710 (p =0,05).

Como Q <Q* el dato no se rechaza.

Criterio de Grubbs:

La media aritmtica es 194 mg/dL y la desviacin estndar es 7,37 mg/dL.

El estadstico G es:
76 , 1
37 , 7
194 207
G
exp
=

=
MDULO 2 Ral A. Marigliano UNT
80

El valor calculado es mayor que el valor crtico G* para n =5: 1,71.

El dato debe ser rechazado de acuerdo a este criterio. Obsrvese que si el dato se
rechaza el nuevo promedio resulta = 191 mg/dL, y la desviacin estndar = 2,5 mg/dL.

Estos resultados contradictorios son frecuentes en contrastes de datos discrepantes.
Este ejemplo muestra la importancia de ser cautos al rechazar valores sospechosos.
Cuando las medidas se repiten pocas veces, el rechazo de un valor discrepante
origina una gran variacin sobre la media y la desviacin estndar. Para los 5 valores
de la concentracin de colesterol la desviacin estndar es 7,37 mg/dL, pero cuando
se rechaza el valor sospechoso se convierte en 2,5 mg/dL, es decir la imprecisin ha
disminuido a la tercera parte.


Ejemplo 7.3
Se aaden tres medidas ms a las del ejemplo anterior, quedando:
192 194 188 191 207 186 190 189 mg/dL.
Aplique los mismos criterios para decidir si el valor experimental 207 mg/dL se debe
rechazar o mantener.

Criterio de Dixon:

Los valores ordenados de menor a mayor son:

186 188 189 190 191 192 194 207

El estadstico Q es:

619 , 0
186 207
194 207
Q
exp
=

=

De la tabla 3, el valor crtico Q* para n =8 es 0,468 (p =0,05).

El estadstico calculado es mayor que el valor crtico, por lo que el valor discrepante se
rechaza.

Criterio de Grubbs:

La media aritmtica es 192 mg/dL y la desviacin estndar es 6,49 mg/dL.

El estadstico G es:
31 , 2
49 , 6
192 207
G
exp
=

=

MDULO 2 Ral A. Marigliano UNT
81
El valor crtico G* es 2,13. El valor experimental es mayor que el crtico. El dato se
rechaza.

Si un conjunto de datos tiene dos o ms resultados sospechosos, surgen otras
complicaciones. Las figuras 7.1 y 7.2 ilustran en forma de diagrama de puntos dos
ejemplos de tales dificultades.
En la figura 7.1 hay dos resultados (2,9 y 3,1), altamente sospechosos si lo
comparamos con la media de los datos:


Figura 7.1. Dos datos sospechosos en el extremo superior de los datos

El clculo de Q experimental sera el siguiente:

182 , 0
0 , 2 1 , 3
9 , 2 1 , 3
Q
exp
=

=

valor que no es significativo (p =0,05) frente a Q*: 0,568.

Lo que ha ocurrido es que el posible valor discrepante (3,1) ha sido enmascarado por
otro posible valor anmalo (2,9), originando un valor de Q experimental pequeo.

La figura 7.2 muestra una situacin diferente, donde los valores anmalos estn en los
extremos del conjunto de datos:

Figura 7.2. Dos datos sospechosos en los extremos del conjunto de datos

Esta situacin origina un valor grande para el denominador en el clculo del
estadstico. Consecuentemente, Q experimental es pequeo y no significativo.

Algunos autores sugieren una regla prctica para la aplicacin del criterio de Dixon,
que resulta particularmente til cuando se desea verificar la presencia de valores
anmalos en los dos extremos de la distribucin de datos. El procedimiento es el
siguiente:

- - Se ordenan los datos de menor a mayor
MDULO 2 Ral A. Marigliano UNT
82
- - El valor menor es anmalo si: 3 / ) (
1 1 2
x x x x
n
>
- - El valor mayor es anmalo si: 3 / ) (
1 1
x x x x
n n n
>



Ejemplo 7.4
Consideremos los siguientes valores ordenados de menor a mayor: 94, 97, 98, 98, 98,
99, 99, 100, 100, 100, 100, 100, 101, 101, 102, 103, 103, 104, 105, 118.

El procedimiento es:

(97 94) > (118 94) /3 3 <8 94 no es anmalo
(118 105) >(118 94) /3 13 > 8 118 es anmalo

Se elimina el valor 118 y se reinicia el proceso:

(97 94) > (105 97) /3 3 > 2,7 94 es anmalo

Se elimina el valor 94 y se reinicia el proceso:

(98 97) > (105 97) / 3 1 < 2,7 97 no es anmalo
(105 104) > (105 97) /3 1 < 2,7 105 no es anmalo

Se eliminan entonces los valores 94 y 118, con lo que se finaliza el procedimiento

Los contrastes descriptos suponen que la distribucin de los datos es normal, lo que
es difcil de probar cuando tenemos una pequea serie de mediciones. En
consecuencia, las reglas estadsticas que son perfectamente fiables en distribuciones
normales, se deben usar con extrema precaucin cuando se aplican a muestras
conteniendo pocos datos.
Estos contrastes no deben usarse si se sospecha que la poblacin pueda no tener una
distribucin normal. Si se trata de muestras pequeas deben emplearse slo como
ayuda al sentido comn.
Por lo tanto, lo recomendable es seguir las siguientes recomendaciones para el
tratamiento de una serie de resultados con un valor sospechoso:

1. Reexaminar cuidadosamente todos los datos en relacin con el discrepante.
2. Estimar la precisin de la serie de datos y compararla con la razonablemente
esperada para el procedimiento analtico, para inferir si el resultado anmalo es
o no cuestionable.
3. Repetir los anlisis, y en lo posible, si la muestra alcanza, realizar una nueva
serie de mediciones con el mismo nmero de datos. Si los nuevos datos
MDULO 2 Ral A. Marigliano UNT
83
coinciden con los de la serie original que parecan vlidos, aumentar la
sospecha de que el discrepante debe ser rechazado.
4. Aplicar una prueba estadstica, como el test Q de Dixon, o el de Grubbs, (u otros)
para ver si el dato dudoso debe retenerse o debe ser rechazado.
5. Si el contraste estadstico indica que el dato discrepante debe retenerse, analizar
la conveniencia o no, de informar el resultado experimental a travs de la
mediana en lugar de la media.

En resumen, la aplicacin ciega de los test estadsticos para retener o rechazar una
medida sospechosa en una serie reducida de datos, no es mucho mejor que una
decisin personal del analista. La aplicacin de un criterio, adquirido gracias a una
gran experiencia con un mtodo analtico es normalmente un procedimiento ms
consistente.





































MDULO 2 Ral A. Marigliano UNT
84
REFERENCIAS BIBLIOGRFICAS
CHAO, L. (1994). Introduccin a la Estadstica. CECSA

CIENCIA Y TCNICA ADMINISTRATIVA, consultado en marzo de 2012.
URL: http://cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_5.htm

CIENCIA Y TCNICA ADMINISTRATIVA, consultado en marzo de 2012.
URL: http://cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_6.htm

CIENCIA Y TCNICA ADMINISTRATIVA, consultado en abril de 2012.
URL: http://cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_7.htm

CRISTFOLI, M.E. (2010). Manual de Estadstica con Excel. Ed. Omicron

DAWSON-SAUNDERS, B. y TRAPP, R.C. (1997). Bioestadstica Mdica. Ed. El Manual Moderno,
S.A.

FERNNDEZ GORDILLO, J.C. Estadstica y Probabilidad, consultado el 25 de junio de 2011.
URL: http://www.vitutor.com/estadistica.html

GELLA, F.J. (2000). Metrologa en el laboratorio clnico. Barcelona: Byosistems S.A.

GELLA, F.J. (2005). Control de la calidad en el Laboratorio Clnico (2
a
edicin). Barcelona:
Byosistems S.A.

HARRIS, D.C. (2007). Anlisis Qumico Cuantitativo 3 Edicin. Ed. Revert S.A.

KAPLAN, L.A. y PESCE, A. (1996). Clinical Chemistry. Ed. Mosby

LARIOS OSORIO, V. Departamento de Matemticas de la Facultad de Ingeniera de la U.A.Q.
(Mxico), consultado el 20 de mayo de 2012.
URL: http://www.uaq.mx/matematicas/estadisticas/xu4.html

LARIOS OSORIO, V. Departamento de Matemticas de la Facultad de Ingeniera de la U.A.Q.
(Mxico), consultado el 20 de mayo de 2012.
URL: http://www.uaq.mx/matematicas/estadisticas/xu5.html

MILLER, J.N. y MILLER J.C. (2002). Estadstica y Quimiometra para Qumica Analtica. Ed.
Prentice Hall, Pearson Educacin S.A.

NCCLS EP10-A. (2002). Preliminary Evaluation of Quantitative Clinical Laboratory Methods;
Approved Guideline.
Norma Argentina IRAM: ISO 15189 (2005). Primera Edicin

MDULO 2 Ral A. Marigliano UNT
85
RIUS DAZ, F., BARN LPEZ, F.J., SANCHEZ FONT, E. y PARRAS GUIJOSA, L. Bioestadstica:
mtodos y aplicaciones. Universidad de Mlaga, consultado el 15 de febrero de 2012.
URL: http://www.bioestadistica.uma.es/libro/

SKOOG, D.A., WEST, D.M. y HOLLER, F.J. (1997). Fundamentos de Qumica Analtica. Ed.
Revert S.A.

SOCIEDAD ESPAOLA DE BIOQUMICA CLNICA Y PATOLOGA MOLECULAR. Curso de
Estadstica para el laboratorio clnico, consultado el 10 de febrero de 2012.
URL: http://www.seqc.es/es/Varios/7/7/Curso_de_Estadistica_para_el_laboratorio_Clinico/

SPIEGEL, M.R. (1991). Estadstica (Segunda Edicin). Ed. McGraw-Hill
VALCRCEL, M. (1999). Principios de Qumica Analtica. Springer-Verlarg Ibrica, Barcelona.







MDULO 2 Ral A. Marigliano UNT
86


















ANEXO MODULO 2


TABLAS ESTADSTICAS


















MDULO 2 Ral A. Marigliano UNT
87

Tabla 1. DISTRIBUCION NORMAL ESTNDAR


reas bajo la curva normal estndar. Los valores de la tabla que no se muestran en
negrita representan la probabilidad de observar un valor menor o igual a z. La cifra
entera y el primer decimal de z se buscan en la primera columna, y el segundo
decimal en la cabecera de la tabla.


Segunda cifra decimal del valor de z
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .4878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998







MDULO 2 Ral A. Marigliano UNT
88


Tabla 2. DISTRIBUCIN t DE STUDENT

Nivel de significacin para test de una cola
0,1 0,05 0,025 0,01 0,005 0,0005
Nivel de significacin para test de dos colas
Grados de
libertad
0,2 0,1 0,05 0,02 0,01 0,001
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.598
3 1.638 2.353 3.182 4.541 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.405
8 1.397 1.860 2.306 2.896 3.355 5.041
9 1.383 1.833 2.262 2.821 3.250 4.781
10 1.372 1.812 2.228 2.764 3.169 4.587
11 1.363 1.796 2.201 2.718 3.106 4.437
12 1.356 1.782 2.179 2.681 3.055 4.318
13 1.350 1.771 2.160 2.650 3.012 4.221
14 1.345 1.761 2.145 2.624 2.977 4.140
15 1.341 1.753 2.131 2.602 2.947 4.073
16 1.337 1.746 2.120 2.583 2.921 4.015
17 1.333 1.740 2.110 2.567 2.898 3.965
18 1.330 1.734 2.101 2.552 2.878 3.922
19 1.328 1.729 2.093 2.539 2.861 3.883
20 1.325 1.725 2.086 2.528 2.845 3.850
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1.321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1.701 2.048 2.467 2.763 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659
30 1.310 1.697 2.042 2.457 2.750 3.646
40 1.303 1.684 2.021 2.423 2.704 3.551
60 1.296 1.671 2.000 2.390 2.660 3.460
120 1.289 1.658 1.980 2.358 2.617 3.373
1.282 1.645 1.960 2.326 2.576 3.291



MDULO 2 Ral A. Marigliano UNT
89


Tabla 3. CONTRASTE DE DIXON
VALORES CRITICOS Q DE RECHAZO

Nmero de
observaciones
90%
confianza
95%
confianza
98%
confianza
99%
confianza
3 0,941 0,970 0,988 0,994
4 0,765 0,829 0,889 0,926
5 0,642 0,710 0,780 0,821
6 0,560 0,625 0,698 0,740
7 0,507 0,568 0,637 0,680
8 0,468 0,526 0,590 0,634
9 0,437 0,493 0,555 0,598
10 0,412 0,466 0,527 0,568
11 0,392 0,444 0,502 0,542
12 0,376 0,426 0,482 0,522
13 0,361 0,410 0,465 0,503
14 0,349 0,396 0,450 0,488
15 0,338 0,384 0,438 0,475
16 0,329 0,374 0,426 0,463
17 0,320 0,365 0,416 0,452
18 0,313 0,356 0,407 0,442
19 0,306 0,349 0,398 0,433
20 0,300 0,342 0,391 0,425
21 0,295 0,337 0,384 0,418
22 0,290 0,331 0,378 0,411
23 0,285 0,326 0,372 0,404
24 0,281 0,321 0,367 0,399
25 0,277 0,317 0,362 0,393
26 0,273 0,312 0,357 0,388
27 0,269 0,308 0,353 0,384
28 0,266 0,305 0,349 0,380
29 0,263 0,301 0,345 0,376
30 0,260 0,298 0,341 0,372

















MDULO 2 Ral A. Marigliano UNT
90


TABLA 4. CONTRASTE DE GRUBBS
VALORES CRTICOS DE RECHAZO (p = 0,05)

Nmero de
observaciones
Valor
crtico
Nmero de
observaciones
Valor
crtico
3 1,15 27 2,86
4 1,48 28 2,88
5 1,71 29 2,89
6 1,89 30 2,91
7 2,02 31 2,92
8 2,13 32 2,94
9 2,21 33 2,95
10 2,29 34 2,97
11 2,34 35 2,98
12 2,41 36 2,99
13 2,46 37 3,00
14 2,51 38 3,01
15 2,55 39 3,03
16 2,59 40 3,04
17 2,62 50 3,13
18 2,65 60 3,20
19 2,68 70 3,26
20 2,71 80 3,31
21 2,73 90 3,35
22 2,76 100 3,38
23 2,78 110 3,42
24 2,80 120 3,44
25 2,82 130 3,47
26 2,84 140 3,49

You might also like