You are on page 1of 30

UNIVERSIDAD DE PAMPLONA

NOTAS DE CLASE
BIOESTADISTICA
NORA YAKELYN GRANADOS
DEPARTAMENTO DE MATEMATICA

Este documento contiene algunos ejercicios propuestos acompañados de ejemplos que le


servirán de guía para el programa de bioestadística.
INDICE

PAG
1. INTRODUCCION A LA ESTADISTICA
1
1.1 CONCEPTO DE BIOESTADISTICA
1
1.2 ELEMENTOS UTILIZADOS PARA UN
ANALISIS ESTADISTICO 1

2. ESTADISTICA DESCRIPTIVA
5
2.1 MEDIDAS DE TENDENCIA CENTRAL
5
2.2 EJERCICIOS PROPUESTOS
9
2.3 MEDIDAS DE DISPERSION
11
2.4 EJERCICIOS PROPUESTOS
17
3. PROBABILIDAD
18
3.1 CONCEPTO
19
3.2 REGLA DE LA ADICION
19
3.3 TABLA DE PROBABILIDADES
20
3.4 TEOREMA DE BAYES
24
3.5 EJERCICIOS PROPUESTOS
26
1

¿Qué ES LA BIOESTADISTICA?

Es una palabra compuesta por dos ciencias BIO (biología) y ESTADÍSTICA que
combinadas representan la estadística aplicada a la biología.

Estadística: Ciencia que se encarga de recolectar, organizar y analizar


información proveniente de muestras o poblaciones, para tratar de
explicar fenómenos que ocurren en la realidad.

Biología: Ciencia que estudia a los seres vivos; ya sean animales, plantas o seres
humanos. Principalmente se preocupa de [Escriba una cita del documento o el resumen
de un punto interesante. Puede situar el cuadro de texto en cualquier lugar del documento. Use la
ficha Herramientas de dibujo para cambiar el formato del cuadro de texto de la cita.]

los procesos vitales de cada ser, como su nacimiento, desarrollo,


procreación y muerte.

EJEMPLOS

 Registro de eventos repetidos.


 Crecimiento de una planta a partir de diferentes
Nutrientes.
 Registros de cantidad de plantas, bacterias,
microorganismos, etc.

ELEMENTOS A TENER EN CUENTA PARA EL ANALISIS DE UN


PROBLEMA

1. Identificar la población de estudio


2. Determinar la muestra
3. Identificar las variables y hacer su respectiva clasificación

TENGA EN CUENTA…

POBLACION: Conjunto de entidades (personas, animales,


objetos, instituciones, empresas) que conservan una
característica en común.

MUESTRA: Es una parte de la población o un subconjunto.


2

VARIABLE: Es una característica de los elementos de la población. Puede ser


Cualitativa o Cuantitativa.

Variable CUALITATIVA: Hace referencia a cualidades o atributos del


elemento de estudio.

Variable CUANTITATIVA: Se refiere a valores numéricos, puede ser


Discreta o Continua.

DISCRETA: Asociada a valores enteros, contables.

CONTINUA: Valores que se encuentran dentro de un intervalo, se


representan por números decimales.

ESCALA: Es una clasificación que se le hacen a las variables. De acuerdo al


origen de la variable se tiene la siguiente clasificación:

CUALITATIVA CUANTITATIVA

NOMINAL ORDINAL INTERVALO RAZON

CUALITATIVA

 NOMINAL: Se establecen categorías que no requieren de un orden


establecido.

 ORDINAL: Se establecen categorías que guardan una relación de orden


entre sí, es decir, existe una jerarquización de las categorías.

CUANTITATIVA

 INTERVALO: Establece la distancia numérica entre dos puntos; maneja un


cero arbitrario que no indica ausencia de la variable.

 RAZON: Es la escala más fuerte, maneja un cero absoluto que indica


ausencia de la variable.
3

EJEMPLO:

Los trastornos en la conducta alimentaria constituyen un problema de salud por


su creciente incidencia, gravedad de la sintomología asociado a la resistencia al
tratamiento y porque se presenta en edades tempranas. Se estudió la relación
entre las conductas de riesgo del trastorno alimentario, la imagen corporal y la
autoestima en un grupo de adolescentes de secundaria. Se contó con 248
alumnos: 153 mujeres y 145 hombres con una edad promedio de 13 años.

POBLACION: Adolescentes con edad promedio de 13 años de secundaria

MUESTRA: 248 alumnos: 153 mujeres y 145 hombres con edad promedio de 13
años de secundaria

VARIABLE: Conductas de riesgo de trastorno alimentario

TIPO DE VARIABLE: Cualitativa

ESCALA: Nominal

CONCEPTOS TOMADOS DE LA ESTADISTICA


PARA EL ANALISIS DE LA
BIOLOGIA

MEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMETICA (PROMEDIO): Es una de las medidas más utilizadas y de un


cálculo fácil, porque consiste en sumar las observaciones sobre el total de la
muestra. Resulta inútil este estadístico en aquellas poblaciones que presentan
una asimetría muy marcada.
4

MODA: Se conoce como el dato que más se repite o que se presenta con mayor
frecuencia. Es utilizado en variables cualitativas (nominal)

MEDIANA: Se caracteriza porque divide la información en dos partes iguales.


Valor de la mitad de una lista de datos ordenados. Es utilizado en variables
cualitativas (ordinal) y cuantitativas.

¿CÓMO CALCULAR LA MEDIANA EN DATOS NO AGRUPADOS?

1. Ordenar los datos en forma ascendente (De mayor a menor) o en forma


descendente (De menor a mayor)

2. Observar el valor de n
 Si n es par se suman y se dividen en dos los datos centrales y esa es
la mediana
 Si n es impar se toma el dato central.

TENGA EN CUENTA…

En datos no agrupados o libres los representan los valores de la variable mientras


que en datos agrupados (intervalos) representan las marcas de clase.

EJEMPLO 1:

Se realizó un estudio descriptivo que determinó la infección por Toxoplasma


gondii, en 120 muestras de carnes de consumo humano, obtenidas en dos tipos
de expendios del municipio de Sincelejo. De cada sector se tomaron 60 muestras
distribuidas así: 20 muestras de carne de res, 20 muestras de carne de cerdo y 20
muestras de carne de pollo. Estas muestras fueron sometidas a una extracción de
ADN mediante el método de altas concentraciones de sales y a una PCR
anidada para amplificar una región especifica del material genómico de T. gondii
correspondiente al gen B1.

Hallar:

1. Población, muestra, variable, tipo de variable y escala.


2. Organizar la información en una tabla
5
3. Calcular las medidas de tendencia central e interpretar

SOLUCION:

1. Población: Expendios de carne del Municipio de Sincelejo


Muestra: 120 muestras de carne de consumo humano
Variable: Tipo de carne
Tipo de variable: Cualitativa
Escala: Nominal

2.
TIPODE CARNE EXPENDIO 1 EXPENDIO 2
Carne de Res 20 20
Carne de Cerdo 20 20
Carne de Pollo 20 20
TOTAL 60 60

3. En promedio en cada tipo de carne se trabajaron 20 muestras en cada


expendio del Municipio de Sincelejo.

EJEMPLO 2:
En Cali se realizó un estudio de niños recién nacidos para determinar el peso, en
gramos que ganaron en sus tres primeros días de vida. Los resultados fueron los
siguientes:

165 160 460 365 440


440 390 230 440 295

Hallar:

1. Población, muestra, variable, tipo de variable y escala.


2. Calcular las medidas de tendencia central e interpretar

SOLUCION:
6
1. Población: Bebes recién nacidos en Cali
Muestra: 10 bebes recién nacidos
Variable: Peso en sus tres primeros días de vida
Tipo de variable: Cuantitativa, continua
Escala: Razón

2. MEDIA ARITMETICA


̅

En promedio los recién nacidos ganan un peso durante los tres primeros
días de 338,5 gramos.

MODA

Mo = 440

El peso más frecuente registrado en los recién nacidos durante los tres
primeros días es de 440 gramos.

MEDIANA

1. Ordeno los datos

160 165 230 295 365 390 440 440 440 460

Me

2. Observo el valor de n

La muestra es de 10 por lo tanto es par, entonces se toman los dos


datos centrales, se suman y se dividen entre dos.

El 50% de los recién nacidos a los tres días registran un peso de 377,5
gramos.
7

EJEMPLO 3:
Se realizó una encuesta a 30 familias de una cierta población sobre la duración
de las ampolletas; la información que se obtuvo fue la siguiente:

7 familias dijeron que les duraban entre 20 y 26 días

8 dijeron entre 26 y 33 días

5 dijeron entre 33 y 40 días

2 dijeron entre 47 y 54 días

3 dijeron entre 54 y 61 días,

y una familia dijo que le duro más de 61 días

Hallar:

1. Población, muestra, variable, tipo de variable y escala.


2. Organizar la información en una tabla
3. Calcular las medidas de tendencia central e interpretar
4. Elaborar una grafica

SOLUCION:

1. Población: Familias de cierta población


Muestra: 30 familias
Variable: Duración de las ampolletas
Tipo de variable: Cuantitativa, discreta
Escala: Razón
2.
AMPOLLETAS FAMILIAS

20 – 26 7 23 161 7
26 - 33 8 Mo 29.5 236 15 Me
33 – 40 5 35.5 177.5 20
40 – 47 4 41.5 166 24
47 – 54 2 47.5 95 26
54 – 61 3 53.5 160.5 29
61 – 68 1 59.5 59.5 30
TOTAL 30 1055.5
8
3. MEDIA ARITMETICA

̅

En promedio la duración de las ampolletas es de 35,18 días.

MEDIANA

Lo primero que se debe hacer es ubicar la mediana (dividir la muestra en


dos) a través de las frecuencias absolutas y ubicarla en los intervalos.

El 50% de duración de las ampolletas es de 33 días.

MODA

Lo primero que se debe hacer es ubicar la moda en la frecuencia absoluta


mayor, recibiendo el nombre de frecuencia modal.

La duración más frecuente en las ampolletas utilizadas por las familias es de


27,75 días.
9
4. Gráfica

9
8
7
6
FAMILIAS

5
4
3
2
1
0
20 – 26 26 - 33 33 – 40 40 – 47 47 – 54 54 – 61 61 – 68
AMPOLLETAS

EJERCICIOS

PROPUESTOS

1. En una farmacia se está recogiendo información sobre el grado de


satisfacción de los clientes respecto a su servicio nocturno, concretamente se
está preguntando cual es la opinión de los clientes en cuanto la relación
calidad precio de este servicio nocturno. Las respuestas dadas por los clientes
han sido codificadas:

0 Muy desfavorable
1 Desfavorable
2 Favorable
3 Muy favorable

Se ha preguntado a un total de 50 clientes y sus respuestas codificadas han


sido las siguientes:
10
0 1 2 3 0 1 2 2 2 1
1 2 3 0 0 2 2 0 3 1
0 3 3 3 2 1 2 2 0 3
0 3 0 1 2 0 0 2 3 3
2 2 2 0 2 1 3 0 3 0

Hallar:
1. Población, muestra, variable, tipo de variable y escala
2. Organiza la información en una tabla
3. Determine las medidas de tendencia central e interprete
4. Realice una grafica

2. En una encuesta a personas con hipertensión arterial, se les ha preguntado el


número de veces que han recibido control de su presión arterial en los últimos
6 meses. Las respuestas se muestran a continuación:

3 5 2 0 1 6 2 0 6 2 0 4 3 3 5 2 0 0 1 2
5 3 6 6 4 6 0 3 1 1 0 5 6 4 4 6 2 3 3 6

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Organiza la información en una tabla
3. Completa tabla de frecuencias
4. Determine las medidas de tendencia central e interprete
5. Realice una grafica

3. Se han tomado muestras a 40 niños de entre 1 y 5 años del nivel de cobre en


orina, obteniéndose los siguientes valores:

0.10 0.34 0.42 0.45 0.50 0.55 0.62 0.64 0.65 0.69

0.10 0.36 0.42 0.48 0.52 0.58 0.63 0.65 0.66 0.70

0.72 0.73 0.74 0.74 0.75 0.76 0.77 0.78 0.81 0.83

0.85 0.86 0.88 0.90 0.94 0.98 1.04 1.12 1.16 1.24

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Organiza la información en una tabla de intervalos iguales
3. Completa tabla de frecuencias
4. Determine las medidas de tendencia central e interprete
5. Realice una grafica
11
4. Se dispone del peso (en gramos) de 16 niños de un mes de edad. Los datos se
muestran a continuación:

4123 4160 4422 3281 4096 3596 4017 4240


4336 4165 3853 3990 4166 4127 3769 4194

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Determine las medidas de tendencia central e interprete
3. Realice una grafica

5. Un médico de cabecera en un área rural está interesado en conocer cuando


se producen un mayor número de demandas de asistencia a domicilio para
reforzar el horario que más lo necesita. Para ello ha recogido datos sobre las
últimas demandas que ha tenido y las ha catalogado como visitas de
mañana, tarde, noche o festivo dependiendo de la hora y el día en el que se
han producido. Los datos que ha obtenido son los siguientes:

Mañana Noche Noche Noche Mañana Tarde Tarde Mañana Tarde

Mañana Festivo Tarde Mañana Noche Festivo Mañana Mañana Mañana

Noche Tarde Tarde Mañana Tarde Festivo Mañana Noche Festivo

Mañana Tarde Festivo Tarde Noche

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Organiza la información en una tabla
3. Determine las medidas de tendencia central e interprete
4. Realice una grafica

MEDIDAS DE DISPERSION

Estas medidas indican las distancias que se encuentran separados los datos
numéricos alrededor de una medida de centralización.
12
Las medidas de dispersión más utilizadas son:

1. DESVIACION ESTANDAR O TIPICA : Muestra las distancias con


respecto a la media aritmética.

2. VARIANZA : Medida de variación más importante, se obtiene a partir


de la media aritmética de una distribución. Se define como el cuadrado
de la desviación típica.

3. COEFICIENTE DE VARIACION : Esta medida relaciona la desviación


estándar y la media y se acostumbra a expresarlo en porcentaje. Medida
muy utilizada en procesos de control de calidad y comparación de
muestras en toma de decisiones.

Si el coeficiente de variación está por debajo del 25% se consideran


muestras homogéneas y en caso contrario muestras heterogéneas.

EJEMPLO 1:
Los siguientes son los puntajes de un grupo de adolescentes en un test
de Agudeza Visual: 25, 12, 15, 23, 24, 39, 13, 31, 19, 16.

HALLAR:

1. Población, muestra, variable, tipo de variable y escala


2. Medidas de dispersión e interpretar
3. Realiza una gráfica de dispersión

SOLUCION:

1. Población: Grupo de adolescentes


Muestra: 10 adolescentes
Variable: Agudeza visual
Tipo de variable: Cuantitativa, continua
Escala: Razón

2. Primero se obtiene el promedio:



̅

En promedio la agudeza visual de los adolescentes es de 21,7


13

La desviación es:

∑ ̅
√ √

La varianza es:

El coeficiente de variación es:

Este resultado indica que existe gran dispersión en la agudeza visual de los
adolescentes, se trata de muestras heterogéneas.

3. Gráfico de dispersión (nube de puntos)

EJEMPLO 2:
Se realizó un estudio del tiempo en (años) de las personas afiliadas al
Seguro Social, encontrándose la siguiente información:

AÑOS DE NUMERO DE
AFILIACION PERSONAS
3 4
4 2
5 3
6 2
10 1
TOTAL 12
14

HALLAR

1. Población, muestra, variable, tipo de variable y escala


2. Medidas de dispersión e interpretar

SOLUCION:

1. Población: Personal afiliado al Seguro Social


Muestra: 12 personas afiliadas
Variable: Tiempo de afiliación
Tipo de variable: Cuantitativa, continua
Escala: Razón

2. Antes de calcular la desviación se debe obtener el promedio

AÑOS DE NUMERO DE AÑOS*NUMPERSONAS ̅̅̅


̅
AFILIACION PERSONAS ( ) * )
( )
3 4 12 11,56
4 2 8 0,98
5 3 15 0,27
6 2 12 3,38
10 1 10 28,09
TOTAL 12 57 44,71

El promedio se obtiene con la siguiente ecuación:


̅

En promedio el personal está afiliado al Seguro Social 4, 7 años

La desviación es:

∑ ̅
√ √

La varianza es:

El coeficiente de variación es: ̅

Existe mucha dispersión en los años de afiliación del personal al Seguro Social, se
trata de muestras heterogéneas.
15

EJEMPLO 3:
En un centro medico se está estudiando a la población infantil con sobrepeso, para lo cual se
anotó en una tabla los siguientes datos, de un total de 150 niños evaluados.

KILOS DE NIÑOS
SOBREPESO
2–6 59
6 -10 38
10 – 14 25
14 -18 16
18 – 22 10
22 - 26 2
TOTAL 150

HALLAR

1. Población, muestra, variable, tipo de variable y escala


2. Medidas de dispersión e interpretar
3. Elaborar una grafica

SOLUCION:

1. Población: Población infantil con sobrepeso


Muestra: 150 niños con sobrepeso
Variable: Peso (kg)
Tipo de variable: Cuantitativa, continua
Escala: Razón

2. Antes de calcular la desviación se obtiene el promedio

KILOS DE NIÑOS ̅̅̅


̅
SOBREPESO
2–6 59 4 236 1451,49
6 -10 38 8 304 35,02
10 – 14 25 12 300 231,04
14 -18 16 16 256 792,98
18 – 22 10 20 200 1218,81
22 - 26 2 24 48 452,40
TOTAL 150 1344 4181,74
16

̅

En promedio el sobrepeso en kilos de los niños es de 8,96

La desviación es:

∑ ̅
√ √

La varianza es:

El coeficiente de variación es: ̅

Existe mucha dispersión en el sobrepeso de la población infantil, se trata de


muestras heterogéneas.

3. Gráfica

160
140
120
100
Niños

80
60
40
20
0
0-2 2–6 6.-10 10 – 14 14 -18 18 – 22 22 - 26
SOBREPESO (Kg)
17
EJERCICIOS

PROPUESTOS

1. En un grupo de estudiantes se considera el número de ensayos que necesita


cada uno para memorizar una lista de seis pares de palabras. Los resultados
fueron:

5 8 3 9 6 7 10 6 7 4
6 9 5 6 7 9 4 6 8 7

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Organiza la información en una tabla
3. Determine las medidas de dispersión e interpretar
4. Realice una gráfica

2. Los resultados de un test de aptitud tomado a un grupo de 100 personas se


volcaron en la siguiente tabla:

PUNTAJE PERSONAS
0,5 – 5,5 7
5,5 – 10,5 12
10,5 – 15,5 21
15,5 – 20,5 32
20,5 – 25,5 28

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Determine las medidas de dispersión e interpretar
3. Realice una gráfica

3. La concentración de sólidos suspendidos en agua de un río es una


característica ambiental importante. Un artículo científico reportó sobre la
concentración (en partes por millón, o ppm) para varios rios diferentes.
Supongamos que se obtuvieron las siguientes 50 observaciones para un rio en
particular:

55.8 37.0 65.8 60.6


60.9 91.3 42.3 33.8
18

Hallar:

1. Población, muestra, variable, tipo de variable y escala


2. Determine las medidas de dispersión e interpretar
3. Realice una gráfica de dispersión

PROBABILIDAD

Se conoce como la ocurrencia o no de un evento; también se puede


tomar como una medida de riesgo en el caso de tomar una muestra del
total de una población. La probabilidad mide la frecuencia con la que
aparece un resultado determinado cuando se realiza un experimento.

La siguiente ecuación desarrollada por Laplace permite obtener la


probabilidad de un evento

ELEMENTOS DE PROBABILIDAD
EXPERIMENTO: Cualquier acción cuyo resultado se registra como un dato, o
proceso mediante el cual se obtiene una observación (o medida). Se
representa por la letra S.

EVENTO: Se conoce como el resultado de un experimento; cuando este se


realiza al azar se denomina aleatorio o al azar. Generalmente se utilizan
letras mayúsculas para representarlos: A, B, C,…

EJEMPLOS:
 Determinar el RH de una persona
 Determinar el grupo de sangre
 Determinar el sexo en dos bebés
19
REGLA DE LA ADICION

En esta regla de probabilidad se da una clasificación a los eventos de


acuerdo al conectivo “o” (), éste está relacionado con la unión () y
con el operador suma (+).

EVENTOS NO EXCLUYENTES: Se dice no excluyentes si durante una prueba


puede ocurrir uno o el otro o los dos.

Su regla de probabilidad es:

EVENTOS MUTUAMENTE EXCLUYENTES: Se dice mutuamente excluyentes


cuando la ocurrencia de un evento imposibilita la ocurrencia del otro, es
decir; cuando solo uno de ellos puede ocurrir cuando se realiza una sola
prueba.

Si dos conjuntos A y B no tienen elementos en común, su intersección será


nula o vacía. En este caso A y B se dicen eventos mutuamente
excluyentes. A ∩ B = Φ

Su regla de probabilidad es:

EJEMPLO 1:

La sangre humana puede contener o no ciertos antígenos; el antígeno A, el


antígeno B o ambos. Un tercer antígeno llamado RH, es significativo en la
reproducción humana puede o no estar presente en un individuo. La sangre es
llamado tipo A – positivo si el individuo tiene el A y el RH, pero no el antígeno B.
Una persona que tiene solamente los antígenos A y B se dice que tiene sangra
tipo AB – negativa. Una persona que tiene solo el antígeno RH tiene sangre tipo O
– positiva. En algún hospital fueron registrados los siguientes datos sobre
pacientes:
20

25 pacientes tuvieron el antígeno A


17 tuvieron los antígenos A y B
27 tuvieron el antígeno B
22 tuvieron los antigenos B y RH
30 tuvieron el antígeno RH
12 no tuvieron ninguno de los antígenos
16 tuvieron los antígenos A y RH
15 tuvieron los tres antígenos

a. ¿Cuántos pacientes están representadas aqui? 54


b. ¿Cuántos pacientes tienen exactamente un antígeno? 17
c. ¿Cuántos pacientes tienen exactamente dos antigenos? 10

¿Cuántos tienen los siguientes tipos de sangre?

d. O – positivo 7
e. AB – positivo 15
f. B – negativo 3
g. O – negativo 35

TABLA DE PROBABILIDADES

PROBABILIDAD MARGINAL:

Este tipo de probabilidad se caracteriza porque tiene en cuenta solo un evento y


porque para determinarla se ignora una o más características del espacio
muestral. En una tabla esta probabilidad es obtenida de los márgenes o totales.
21
PROBABILIDAD CONJUNTA:

Este tipo de probabilidad se caracteriza porque ocurren dos eventos al mismo


tiempo o en forma simultánea, puesto que insiste en la probabilidad de resultados
comunes a ambos eventos. Dentro de una tabla esta probabilidad es obtenida
del intercepto de filas y columnas o lo que se conoce como celdas.

PROBABILIDAD CONDICIONAL:

Sean A y B dos eventos cualquiera que se encuentran en un espacio muestral S


de manera tal que P(B) > 0. La probabilidad condicional de A al ocurrir el evento
B, es el cociente de la probabilidad conjunta de A y B con respecto a la
probabilidad marginal de B; de esta manera se tiene:

Por simetría, la probabilidad condicional de B dada la ocurrencia de A, es:


22

EJEMPLO 2:

Para armar la siguiente tabla se han tenido en cuenta las


calificaciones: aceptable (A), bueno (B) y excelente (E)

Mujer Hombre
Total
(M) (H)
A 7 9 16
B 10 8 18
E 2 4 6
Total 19 21 40

Si entre los 40 alumnos de dicho curso, se elige 1 al azar, hallar la


probabilidad de que:

a. Haya obtenido A en la evaluación


b. Sea mujer y haya obtenido B en la evaluación
c. Haya obtenido A o B en la evaluación
d. Sea hombre o haya obtenido E en la evaluación
e. Haya obtenido A sabiendo que el alumno elegido es varón.
f. Demuestre que H y B sean Mutuamente Excluyentes
g. Demuestre que H y B sean Independientes
23

SOLUCION:

a.

b.

c.

d.

e.

f. H y B sean Mutuamente
Excluyentes

Como son diferente de vacío; por lo tanto H y B no son


mutuamente excluyentes.

g. H y B son Independientes
24
Para demostrar que H y B sean independientes por concepto se
considera que la probabilidad conjunta es igual al producto de las
marginales; es decir:

Por lo tanto H y B no son independientes.

TEOREMA DE BAYES
Sean B1, B2, …., Bn particiones de S (espacio muestral) tales que:

B1B2…Bn = S

B1B2…Bn = ᵩ

Supongamos que el espacio muestral S tiene tres particiones

Sea A un subconjunto de S; A lo
definimos como:

Aplicando probabilidad tenemos:

Este se conoce como una probabilidad total

La probabilidad TOTAL de un evento es la suma exhaustiva de las


probabilidades de todos los casos mutuamente excluyentes que conducen
a dicho evento.

Sea B1 una partición cualquiera, el teorema de Bayes se define como:


25

EJEMPLO 3:

El 1% de la población de un determinado lugar padece una enfermedad. Para detectar


esta enfermedad se realiza una prueba diagnóstico. Esta prueba da positiva en el 97% de
los pacientes que padecen la enfermedad; en el 98% de los individuos que no la padecen
da negativa. Si elegimos al azar un individuo de esa población:

a. Encuentre el espacio muestral

E: Enfermo
Ec: Sano

D|E: Diagnóstico positivo dado que está


enfermo

Dc|E: Diagnóstico negativo dado que está


enfermo

D|Ec: Diagnóstico positivo dado que está sano

Dc| Ec: Diagnóstico negativo dado que está


sano

b. ¿Cuál es la probabilidad de que el individuo de positivo y padezca la enfermedad?

c. Si sabemos que ha dado positiva, ¿Cuál es la probabilidad de que padezca la


enfermedad?
26

EJERCICIOS

PROPUESTOS

1. En cierta facultad se sabe que un 25% de los estudiantes suspendió


matemáticas, un 15% suspendió química y un 10% suspendió ambas. Se
selecciona un estudiante al azar.

a. Si suspendió química, ¿Cuál es la probabilidad de que también


suspendiera matemática?
b. Si suspendió matemática ¿Cuál es la probabilidad de que también
suspendiera química?
c. ¿Cuál es la probabilidad de que suspendiera al menos una de las dos?
2. Un hospital tiene dos quirófanos en funcionamiento. En el primero se han
producido incidentes en el 20% de sus operaciones y el segundo solo en
4%. El número de operaciones es el mismo en ambos quirófanos. La
inspección hospitalaria analiza el expediente de una operación, elegido al
azar y observa que en esa operación se produjo un incidente. ¿Cuál es la
probabilidad de que la operación se realiza en el primer quirófano?

3. Se sabe que en cierta operación el número de personas que padecen la


enfermedad (E) es del 1%. Se ha investigado una prueba diagnóstica que
ha resultado positiva en el 97% de las personas que padecen la
enfermedad (E) y en el 2% de las personas sanas. Calcular la probabilidad
27
de que una persona con prueba positiva padezca realmente la
enfermedad.

4. Un equipo de investigación está preparando un nuevo test para el


diagnóstico de la enfermedad de Alzheimer. El test se ha probado en una
muestra aleatoria con 450 pacientes diagnosticados con Alzheimer y una
muestra aleatoria independiente de 500 pacientes que no presentan
síntomas de la enfermedad. La siguiente tabla resume los resultados del
ensayo.

RESULTADO DEL PADECEN ALZHEIMER TOTAL


TEST SI NO
POSITIVO 436 5 441
NEGATIVO 14 495 509
TOTAL 450 500 950

Con estos datos responder a las siguientes preguntas:

a. ¿Cuál es la probabilidad de que un sujeto sano haya dado positivo en


el test?

b. ¿Cuál es la probabilidad de que un sujeto enfermo haya dado negativo


en el test?

c. Sabiendo que un sujeto ha dado positivo en el test, ¿Cuál es la


probabilidad que este enfermo?

d. Sabiendo que un sujeto ha dado negativo en el test, ¿Cuál es la


probabilidad que este sano?

5. Una empresa produce anillas para identificación de tortugas marinas en


tres fábricas. El volumen de producción diario es de 500, 1000 y 2000
unidades respectivamente. Se sabe que la fracción de producción
defectuosa de las tres fábricas es de 0,005; 0,008 y 0,010 respectivamente.
Si se selecciona una anilla de forma aleatoria del total de producción de
una día y se descubre que es defectuosa, ¿de que fábrica es más
probable que provenga esa anilla?
REFERENCIA
BIBLIOGRAFICA

www.uam.es/personal_pdi/ciencias/cifus/biologia/probabilidad02.pdf

https://sites.google.com/site/623probabilidad/probabilidad-clasica-empirica-y-subjetiva

www.uv.es/~mamtnez/AECS.pdf

www.psi.uba.ar/academica/carrerasdegrado/psicologia/sitios.../practica_3_2c.pdf

You might also like