Professional Documents
Culture Documents
I. BIOESTADSTICA
1.1. Estadstica y bioestadstica
Daniel indica que la estadstica es la disciplina que se ocupa de 1) la recoleccin, organizacin,
resumen y anlisis de datos, y 2) la obtencin de inferencias a partir de un volumen de datos
cuando se examina solo una parte de estos.
La Bioestadstica, en el mbito de la Estadstica, hace referencia a mtodos estadsticos y
matemticos que se aplican al anlisis de datos provenientes de las ciencias biolgicas. Debido
a que las cuestiones a investigar, cuando se trabaja con personas, animales, plantas u otros
organismos vivos, son de naturaleza muy variada. Incluye no slo herramientas para el anlisis
estadstico descriptivo de datos biolgicos sino tambin el uso de numerosos procedimientos
y algoritmos de clculo y computacin para el anlisis inferencial, el reconocimiento de
patrones en los datos y la construccin de modelos que permiten describir y analizar procesos
aleatorios (Balzarini et al, 2011).
1.2. Objeto de estudio.
El objetivo de la estadstica es investigar y evaluar la naturaleza y el significado de la
informacin contenida en los datos (Daniel).
Es necesario tener en cuenta que la estadstica se ha propuesto como instrumento de
investigacin. La investigacin puede ser en gentica, mercadeo, nutricin, agronoma, etc.
Es el campo de investigacin, no el instrumento, el que debe proporcionar los porqu del
problema de investigacin. Aveces, este hecho se pasa por alto y los usuarios olvidan que
tienen que pensar, que la estadstica no puede pensar por ellos. La estadstica, sin embargo,
ayuda a los investigadores a disear experimentos y a evaluar objetivamente los datos
numricos resultantes. Es nuestra intencin proporcionar a los investigadores instrumentos
estadsticos tiles para este fin.
1.3. Estadstica descriptiva y estadstica
inferencial.
Ejemplo
Se desea hacer un estudio sobre el consumo de drogas en el distrito de Comas. Con esta
finalidad se extrae una muestra aleatoria de 240 adolescentes del distrito de Comas en el 2013
y se les aplica la encuesta respectiva.
Se aplica la Estadstica Descriptiva para recopilar, clasificar, organizar y presentar en una
tabla de frecuencias y en forma grfica los datos recogidos de una encuesta.
Frecuencia de
consumo Nmero Porcentaje
No 100 41.7
Interdiario 80 33.3
Diario 40 16.7
A veces 20 8.3
Total 240 100.0
Fuente: UNAL La Molina Dpto. de Estadstica e Informtica
45.0 41.7
40.0
33.3
35.0
30.0
25.0
%
20.0 16.7
15.0
8.3
10.0
5.0
0.0
No Interdiario Diario A veces
FRECUENCIA
Ejemplo
1. El conjunto de todos los estudiantes de una institucin educativa.
2. El conjunto de todos los meses de venta en una casa comercial entre el 2007- 2011.
3. El conjunto de personas que viven en el Distrito de Ayacucho.
Ejemplo
1. Un estudiante de la Institucin educativa.
2. Cada mes de venta en una casa comercial entre el 2007-2011.
3. Cada persona que viven en el Distrito de Ayacucho.
Ejemplo
1. 120 estudiantes de la institucin educativa.
2. 45 meses de venta en una casa comercial entre el 2007-2011.
3. 80 personas que viven en el Distrito de Ayacucho.
4) Variable. Son las caractersticas que toman diferentes valores cuando son evaluadas en las
unidades elementales de una poblacin o muestra. Se representan por las ltimas letras
maysculas del alfabeto, por ejemplo: X, Y, Z, W, P, T, X1, X2, Y1, etc.
Tipos de Variables
A. Variables Cuantitativas. Son aquellas que se expresan en forma numrica y tiene
sentido realizar operaciones matemticas con ellas. Pueden ser del tipo:
Variable Cuantitativa Continua. Son aquellas que pueden tomar cualquier valor
numrico dentro de un intervalo continuo. Se utiliza un instrumento de medicin
para generar sus valores: balanza, termmetros, test, escalas, cronmetros,
winchas, etc.
Ejemplo
1. Peso del langostino de ro (en gr)
2. Tiempo para encontrar estacionamiento en un centro comercial (minutos)
3. Gasto mensual familiar en atencin mdica (nuevos soles)
Ejemplo
1. Nmero de artculos defectuosos en un lote de 20
2. Nmero de clientes atendidos cada 20 minutos en una ventanilla
3. Nmero de predios que posee un agricultor de un valle
B. Variable Cualitativa. Son aquellas que permiten que una unidad elemental pueda ser
clasificada como poseedora o no de cierta cualidad, propiedad o atributo. No tiene
sentido realizar operaciones matemticas con ellas. Son aquellas cuyos valores
posibles son atributos o categoras.
Variable Cualitativa Nominal. Son aquellas cuyos valores (cualidades, propiedades o
atributos) no son factibles de ser clasificados a travs de un criterio de orden o
jerarqua. Sus valores posibles no tienen un orden de importancia.
Ejemplo
1. Sexo de los estudiantes (Masculino o Femenino)
2. Estado civil de una persona (Soltero, Casado, Divorciado, Viudo o Conviviente)
3. Marca de una computadora (A, B, C o D)
4. Marca de Automvil (Toyota, Chevrolet, Mercedes Benz, etc...)
Variable aleatoria?
Otros autores hacen uso de la definicin de variables aleatorias, que en realidad se tratan de
las variables cuantitativas, pudiendo ser stas discretas y continuas. Pondremos nfasis en la
aleatoriedad, por lo tanto siempre que se determina la estatura, el peso o la edad de un
individuo, el resultado frecuentemente se denomina valor de la variable respectiva. Cuando
los valores se originan como resultado de factores aleatorios (al azar), que no pueden
predecirse con exactitud y anticipacin, la variable se llama variable aleatoria. Un ejemplo
de variable aleatoria es la estatura de los adultos; cuando nacen los nios no es posible
predecir con exactitud la estatura que tendrn en su edad adulta; la estatura que alcanza un
adulto es el resultado de muchos factores genticos y ambientales. Los valores resultantes
de los procedimientos de medicin se denominan observaciones o medidas.
Variable aleatoria discreta (Variable cuantitativa discreta)
Entre los ejemplos de variables aleatorias discretas: El nmero de admisiones diarias en
un hospital general es una variable aleatoria discreta, puesto que el nmero de
admisiones por da debe representarse con nmeros enteros tales como 0, 1, 2 o 3. El
nmero de admisiones en un da determinado no puede ser 1.5, 2.997 o 3.333. El nmero
de caries, amalgamas o prdida de dientes por nio en una escuela primaria es otro
ejemplo de una variable discreta.
Variable aleatoria continua (variable cuantitativa continua)
Entre los ejemplos de variables continuas se hallan las diversas mediciones que pueden
hacerse en individuos tales como su estatura, peso y dimetro craneano. Sin importar
cun cerca estn las estaturas de dos personas, tericamente siempre es posible encontrar
otra persona cuya estatura se encuentre entre las dos estaturas de referencia.
Ahora bien, debido a las limitaciones de los instrumentos de medicin disponibles, las
observaciones sobre variables que son inherentemente continuas se registran como si fueran
discretas. La estatura, por ejemplo, normalmente se redondea metros o centmetros completa
ms cercanos, mientras que si se cuenta con el instrumento de medicin adecuado, esa medida
puede hacerse tan precisa como se desee.
Ejemplos:
1. Decir cules de estos datos son discretos y cules continuos:
(a) Nmero de acciones vendidas un da en la Bolsa de Valores.
(b) Temperaturas medidas en un observatorio cada media hora.
(c) Vida media de los tubos de televisin producidos por una fbrica.
(d) Ingresos anuales de los profesores de Enseanza Media.
(e) Longitudes de 1000 tornillos producidos en una empresa.
Solucin
(a) Discretos; (b) continuos; (c) continuos; (d) discretos; (e) continuos.
5) Observacin. Es el valor posible que toma una variable. A las observaciones se les suele
representar con las letras minsculas subindicadas, como por ejemplo x, y, zi
Ejemplo
1. X = Peso del langostino de ro (en gr). Observaciones:
x1= 2.5, x2 = 3.0,..,x10 = 3.2
2. Y = Calificacin de un servicio. Observaciones: .y1 = Bueno,y2 = Regular,y3 = Malo
Ejemplo
1. En una muestra de 30 meses de venta se encontr que el nmero promedio de cocinas
vendidas fue de 14.9 ( X = 14.9) .
2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no sabe
leer y ni escribir (p = 0.011) .
3. Suponga que en el distrito de Brea se ha seleccionado una muestra de 500 personas
encontrndose los siguientes resultados:
Instruccin Proporcin (pi)
Primaria 0.460
Secundaria 0.430
Superior 0.110
TOTAL 1.000
Anlisis de muestras. Se elige una muestra de una poblacin para hacer inferencias
respecto a esa poblacin a partir de lo observado en la muestra (sondeos de opinin,
control de calidad, etc).
Descripcin de datos. Procedimientos para resumir la informacin contenida en un
conjunto (amplio) de datos.
Contraste de hiptesis. Metodologa estadstica para disear experimentos que
garanticen que las conclusiones que se extraigan sean vlidas. Sirve para comparar las
predicciones resultantes de las hiptesis con los datos observados (medicina eficaz,
diferencias entre poblaciones, etc).
Medicin de relaciones entre variables estadsticas (contenido de gas hidrgeno neutro
en galaxias y la tasa de formacin de estrellas, etc).
Prediccin. Prever la evolucin de una variable estudiando su historia y/o relacin con
otras variables.
1.6. La bioestadstica en la investigacin cientfica.
La estadstica es un instrumento aplicable en el mtodo cientfico, para el cual fue
desarrollada. Su aplicacin particular est en los muchos aspectos del diseo de un
experimento, desde el plan inicial para la recoleccin de los datos, y en el anlisis de los
resultados a partir de los datos resumidos, hasta la evaluacin de la incertidumbre de toda la
inferencia extrada de ellos.
De una forma esquemtica, el proceso experimental suele desarrollarse siguiendo el siguiente
esquema: Definir la pregunta o problema a resolver. Cuanto ms claro y definido sea el
objetivo del experimento, mucho ms fcil ser realizar su planificacin y ejecucin.
Obtener informacin y recursos. Una vez definido el objetivo del experimento, es
necesario elaborar un plan de trabajo para poder alcanzarlo. Hay que identificar qu
equipos son necesarios, qu cantidades hay que medir, y de qu manera se va a realizar
el experimento.
Formular hiptesis, acerca de los resultados de nuestro experimento. Hacerlo antes de
su ejecucin evita el sesgo personal de identificar los resultados que ya se conocen
como objetivos iniciales (no debemos engaarnos a nosotros mismos).
Realizar el experimento y obtener las medidas. Esta tarea se subdivide en varios pasos:
Preparacin: el equipo debe ser puesto a punto para su utilizacin. Si el
experimento requiere la utilizacin de aparatos con los que no estamos
familiarizados, es necesario leer atentamente los manuales de utilizacin, e
incluso consultar a experimentadores con experiencia previa en su manejo.
Todo ello evita perder tiempo y cometer errores de bulto, a la vez que preserva
la integridad del equipo (y la nuestra!).
Experimentacin preliminar: suele ser muy aconsejable realizar una pequea
experimentacin de prueba antes de iniciar la toma definitiva de medidas.
Esto facilita el uso correcto del equipo instrumental, permitiendo identificar
los aspectos ms difciles o en los que resulta ms fcil cometer errores.
Toma de datos: el trabajo cuidadoso y detallado son fundamentales en todo
proceso experimental. Ejecutar dicha labor siguiendo un plan de trabajo bien
definido resulta bsico. No hay nada ms frustrante que descubir, tras largas
horas de medidas, que hemos olvidado anotar algn parmetro esencial o sus
2. LOS DATOS
2.1. Observacin
Las observaciones constituyen la materia prima con la cual trabajan los investigadores. Para
que se pueda aplicar la estadstica a esas observaciones stas deben estar en forma numrica.
- En el mejoramiento de cultivos, los nmeros bien pueden ser rendimientos por parcela.
- En la investigacin mdica, pueden ser tiempos de recuperacin bajo varios
tratamientos.
- En la industria, pueden ser cantidad de defectos en varios lotes de un artculo
producido en una lnea de montaje.
Tales nmeros constituyen datos y su caracterstica comn es la variabilidad o variacin.
2.2. Datos
Daniel indica que los datos son la materia prima de la estadstica. Para este propsito defini
a los datos como nmeros. Las dos clases de nmeros que se utilizan en estadstica son
nmeros que resultan de la toma en el sentido literal del trmino de medidas, y aquellos
que resultan del proceso de conteo.
Por ejemplo, cuando una enfermera pesa al paciente o le toma la temperatura, se obtiene la
medida que consiste en una cantidad, por ejemplo 70 kilogramos o 37 grados Centgrados. Un
tipo bastante diferente de nmeros se obtiene cuando el administrador de un hospital cuenta
el nmero de pacientes, quiz 20, dados de alta en un da. Cada uno de los tres nmeros es un
dato (datum) y los tres juntos son datos.
REDONDEO DE DATOS
El resultado de redondear un nmero como 72.8 en unidades es 73, pues 72.8 est ms
prximo de 73 que de 72. Anlogamente, 72.8146 se redondea en centsimas (o sea con
dos decimales) a 72.81, porque 72.8146 est ms cerca de 72.81 que de 72.82.
Al redondear 72.465 en centsimas nos hallamos ante un dilema, ya que est
equidistante de 72.46 y de 72.47. Se adopta en tales casos la costumbre de redondear al
entero par que preceda al 5. As pues, 72.465 se redondea a 72.46, 183.575 se redondea
a 183.58 y 116.500.000 se redondea en millones a 116,000,000. Esta estrategia es
particularmente til para minimizar los errores de redondeo acumulados cuando se
efecta un gran nmero de operaciones.
2.3. Recoleccin de datos
Levine y Berenson, indican que en muchas ocasiones, los datos son medidas que se obtienen
de los elementos de una muestra, y las muestras se toman de la poblacin, de tal forma que
sean lo ms representativas posible. La tcnica ms comn para asegurar una representacin
adecuada es usar una muestra aleatoria.
2.4. Sistema y fuentes de informacin
El desempeo de actividades estadsticas obedece a la necesidad de responder a diversas
preguntas. Por ejemplo, los mdicos probablemente quieran encontrar respuestas a preguntas
con respecto a la utilidad relativa de procedimientos de tratamiento alternativos. Los
administradores posiblemente quieran responder a preguntas respecto a reas de inters como
el espritu de equipo de los empleados o el uso de las instalaciones. Cuando se determina que
el enfoque adecuado para buscar una respuesta a la pregunta requiere del uso de la estadstica,
se comienza a investigar datos apropiados que sirvan como la materia prima en la
investigacin. Estos datos normalmente estn disponibles de una o ms fuentes como las
siguientes:
1. Registros rutinarios. Es difcil imaginar algn tipo de organizacin que no lleve
registros de la operacin diaria de sus actividades. Mientras que los registros clnicos de
un hospital, por ejemplo, contienen una inmensa cantidad de informacin acerca de los
pacientes, los registros contables de la institucin contienen datos en abundancia sobre las
actividades financieras del hospital. Cuando surge la necesidad de tener datos, se debe
buscar primero en los registros que se llevan rutinariamente.
2. Encuesta. Si los datos necesarios para contestar una pregunta no estn disponibles a
partir de los registros almacenados de manera rutinaria, la fuente lgica puede ser una
encuesta. Por ejemplo, suponga que el administrador de una clnica desea obtener
informacin respecto a la forma de transporte que utiliza el paciente para visitar la clnica.
Si la forma de admisin no contiene una pregunta acerca del transporte, es posible llevar a
cabo una encuesta entre los pacientes para obtener esta informacin.
3. Experimentacin. Frecuentemente, los datos necesarios para responder una pregunta
estn disponibles slo como resultado de la experimentacin. Tal vez una enfermera quiere
saber qu estrategia es mejor para maximizar el seguimiento de las indicaciones mdicas
por parte del paciente. La enfermera podra conducir un experimento en el que se prueben
diferentes estrategias para motivar el cumplimiento del tratamiento en distintos pacientes.
La evaluacin subsecuente de las respuestas a las diversas estrategias puede capacitar a la
enfermera para decidir cul es ms efectiva.
4. Fuentes externas. Los datos necesarios para responder a una pregunta pueden ya existir
como informes publicados, bancos de datos disponibles o en la literatura de investigacin.
En otras palabras, uno se puede encontrar con que alguien ms ya plante la misma
pregunta y que la respuesta que obtuvo puede aplicarse a la situacin presente.
2.5. Poblacin
Habitualmente se considera a una poblacin como una coleccin de entidades, por lo general
personas. Sin embargo, una poblacin o coleccin de entidades puede estar compuesta de
animales, mquinas, plantas o clulas. Una poblacin de entidades se define como la coleccin
ms grande de entidades de inters en un momento particular. Si se toma la medida de alguna
variable para cada una de las entidades en una poblacin, se obtiene una poblacin de valores
para esa variable. Por lo tanto, una poblacin de valores se puede definir como la mayor
coleccin de valores para una variable aleatoria, los cuales son de inters en un momento
particular. Por ejemplo, si se tiene inters en conocer el peso de todos los nios inscritos en el
sistema de educacin primaria del estado, la poblacin est formada por todos esos pesos. Si
se tiene inters slo en el peso de los estudiantes inscritos en el primer grado, se tiene una
poblacin diferente, compuesta por los pesos de los estudiantes de primer grado. Por lo tanto,
las poblaciones se determinan o definen con base en el campo de inters. Las poblaciones
pueden ser finitas o infinitas. Si una poblacin de valores consiste en un nmero fijo de esos
valores, se dice que la poblacin es finita. Si, por otra parte, una poblacin consiste en una
sucesin interminable de valores, entonces es una poblacin infinita.
2.6. Muestra
Una muestra puede definirse simplemente como una parte de una poblacin. Suponga que una
poblacin se compone de los pesos de todos los nios inscritos en el sistema de educacin
primaria del estado, y se escoge para el anlisis slo una fraccin de los nios; entonces se
tiene nicamente una parte de la poblacin, es decir, se tiene una muestra.
2.7. Elaboracin de los datos
Steel y Torrie (1988) mencionan que ha sido ampliamente demostrado que no se puede tomar
una muestra aleatoria sin emplear un proceso mecnico. En el proceso usado para obtener una
muestra aleatoria o para introducir la aleatoriedad en un experimento o encuesta, por lo general
interviene una tabla de nmeros aleatorios, como la tabla A.1. Esta tabla est formada por los
dgitos 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9 distribuidos en una tabla de 100 por 100, dando lugar a
10,000 dgitos aleatorios. Estos nmeros se obtuvieron en una mquina y no hay razn para
pensar que algn nmero apareciera con ms frecuencia que otro, ni que alguna sucesin de
nmeros fuese ms frecuente que otra, excepto por el azar. Hay 1,015 ceros, 1,026 unos, 1,013
doces, 975 treces, 976 cuatros, 932 cincos, 1,067 seis, 1,013 sietes, 1,023 ochos, 960 nueves;
5,094 son pares y 4 906 son impares. Ilustremos el uso de la tabla tomando una muestra
aleatoria de 10 observaciones de la tabla 4.1. Los datos de la tabla 4.1 se han clasificado de
acuerdo con la magnitud asignndoles nmeros de orden. La organizacin por orden no es
necesaria para extraer muestras al azar; el orden de los nmeros aleatorios pudo haberse
asignado en forma arbitraria.
Para obtener una muestra aleatoria de 10 pesos, tmense 20 dgitos consecutivos de la tabla
A.1 y regstrense como 10 pares. Estos sern los nmeros de orden de los pesos
correspondientes. Se puede comenzar en cualquier parte de la tabla, pero una forma ms
satisfactoria es sealar con el dedo en una de las pginas, leer los cuatro nmeros opuestos
ms cercanos a la punta del dedo y utilizar stos para localizar el punto de partida. As:
1. En la primera pgina de la tabla A.1, el dedo encuentra el nmero 1188 (frente a 10 y
son los primeros cuatro dgitos en la columna 20-24).
2. Se va a la fila 11, columna 88, como punto de partida.
3. Se registran en pares los 20 dgitos que se encuentran yendo hacia la derecha, y que
son 06, 17, 22, 84, 44 y 55; por comodidad, se baja una lnea y se procede al revs para obtener
los otros nmeros, o sea, 09,15,30 y 59.
4. Se toman los nmeros de los elementos y se llevan a la tabla 4.1 para obtener las
correspondientes observaciones: 20, 30,32, 51, 39, 41, 25, 29, 35 y 42 libras.
Este es un procedimiento aleatorio que equivale a extraer de una bolsa con 100 frjoles
marcados con 100 contenidos de grasa de leche, volviendo cada frjol a la bolsa y mezclando
bien los frijoles antes de cada extraccin. Por esta razn, se dice que el muestreo es con
reemplazo. Ntese que cada elemento puede sacarse cualquier nmero de veces
Tabla 4.1 Ordenamiento en libras, de la grasa de leche producida por 100 vacas Holstein
durante un mes.
Los datos originales se modificaron para que se aproximaran a una distribucin normal con
=40 lb y =12 lb.
Unidad Libras Unidad Libras Unidad Libras Unidad Libras
0 10 25 33 50 40 75 47
1 12 26 33 51 40 76 48
2 14 27 34 52 41 77 48
3 15 28 34 53 41 78 48
4 17 29 34 54 41 79 49
5 18 30 35 55 41 80 49
6 20 31 35 56 42 81 49
7 22 32 35 57 42 82 50
8 23 33 36 58 42 83 50
9 25 34 36 59 42 84 51
10 26 35 36 60 43 85 51
11 27 36 37 61 43 86 52
12 28 37 37 62 43 87 52
13 28 38 37 63 43 88 53
14 29 39 37 64 44 89 54
15 29 40 38 65 44 90 55
16 30 41 38 66 44 91 57
17 30 42 38 67 45 92 58
18 31 43 38 68 45 93 60
19 31 44 39 69 45 94 62
20 31 45 39 70 46 95 63
21 32 46 39 71 46 96 65
22 32 47 39 72 46 97 66
23 32 48 40 73 47 98 68
24 33 49 40 74 47 99 70
Fuente: Steel y Torrie (1988)
Luego de usar la Tabla A.1, se obtiene una muestra aleatoria de 10 pesos, procedentes de la
Tabla 4.1
Tabla 4.2 Muestra aleatoria de 10 pesos.
grasa de
pares de leche
dgitos (libras)
06 20
17 30
22 32
84 51
44 39
55 41
09 25
15 29
30 35
59 42
Nmero de Nmero de
Ao bushels de bushels de
trigo maz
1975 200 75
1976 185 90
1977 225 100
1978 250 85
1979 240 80
1980 195 100
1981 210 110
1982 225 105
1983 250 95
1984 230 110
1985 235 100
Solucin
(a) 1976; (b) 1981 y 1984; (c) 1980; (d) 1978, 1982, 1983 y 1985; (e) 1977 y 1982, y 1978 y
1983; (f) 1983.
Representar los datos del Problema anterior usando: (a) grficos de trazos y (b) grficos de
barras.
Solucin
(a) La Figura muestra el grfico de trazos.
300
250
150
Trigo
100 Maz
50
0
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Ao
250
Nmero de bushels
200
150
Trigo
100
Maz
50
0
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Ao
400
350
Nmero de bushels
300
250
200
Maz
150
Trigo
100
50
0
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Ao
(a) Expresar la cantidad anual de bushels de trigo y maz del Problema como porcentajes de
la produccin total anual.
(b) Representar los porcentajes obtenidos en la parte (a).
Solucin
(a) En 1975 el porcentaje de trigo = 200/(200 + 75) = 72.7%, y el maz 100% 72.7% =
27.5%; etc. Los porcentajes se indican en la Tabla 1.5.
Ao 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Porcentaje de trigo 72.70% 67.30% 69.20% 74.60% 75.00% 66.10% 65.60% 68.20% 72.50% 67.60% 70.10%
Porcentaje de maz 27.30% 32.70% 30.80% 25.40% 25.00% 33.90% 34.40% 31.80% 27.50% 32.40% 29.90%
100.0%
90.0%
80.0%
70.0%
Porcentaje
60.0%
50.0%
Maz
40.0%
Trigo
30.0%
20.0%
10.0%
0.0%
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Ao
Ejemplo: Las reas de los continentes se recogen en la siguiente Tabla. Representar los datos
grficamente.
Tabla. reas de los continentes
rea
Continente
km2 %
Asia 43810000 29.3%
Amrica 42330000 28.3%
frica 30370000 20.3%
Antrtida 13720000 9.2%
Europa 10180000 6.8%
Oceana 9008500 6.0%
Total 149418500 100.0%
Solucin
DEPARTAMENTO DE CIENCIAS BIOLGICAS 23
UNSCH Bioestadstica I Prof. Reynn Cndor A.
Oceana
Europa
Continentes
Antrtida
frica
Amrica
Asia
Tabla de frecuencias
Clase o categora (f) (fri) (p)
Atributo 1 f1 fr1 P1
Atributo 2 f2 fr2 P2
.
.
.
Atributo k fk frk Pk
n 1 100
Donde:
k= Nmero de clases
n= Nmero de observaciones o unidades elementales
Frecuencia absoluta ( fi ). Es el nmero de observaciones que existen en la clase o
categora i.
k
Se cumple: f
i 1
i n
Tipo de grficos
Se pueden usar las frecuencias absolutas (fi) o relativas (fri) para elaborar dos tipos de
grficos
Grfico de barras vertical u horizontal
Grfico circular
Ejemplo. Se hizo una encuesta a una muestra de 45 clientes del Banco Comercial y se
obtuvo los siguientes resultados:
Grfico de barras
30.00
25.00
20.00
15.00
%
10.00
5.00
0.00
Ta1 Ta2 Ta3 Ta4 Ta5 Ta6
TARJETA DE CRDITO
2%
22% 27%
16%
24%
9%
En el grfico circular, se aprecia que la tarjeta de crdito Ta6 es la de uso menos frecuente.
Frecuencia Frecuencia
Frecuencia Frecuencia
Categora absoluta relativa
absoluta relativa
de dolor acumulada acumulada
(fi) (fri)
(F) (Fr)
Ninguno 31 0.52 31 0.52
Leve 17 0.28 48 0.80
Moderado 8 0.13 56 0.93
Severo 4 0.07 60 1.00
Total 60 1
35 31 0.6 0.52
Frecuencia absoluta
30
Frecuencia relativa
0.5
25
0.4
20 17 0.28
0.3
15
8 0.2 0.13
10
4 0.1 0.07
5
0 0
Ninguno Leve Moderado Severo Ninguno Leve Moderado Severo
Mediciones de dolor percibido Mediciones de dolor percibido
70 1.2
Frecuencia absoluta acumulada
0 0
Ninguno Leve Moderado Severo Ninguno Leve Moderado Severo
Mediciones de dolor percibido Mediciones de dolor percibido
70 1.2
60 60 1 1
56 0.93
50 48 0.8 0.8
40 31 0.6 0.52
30
17 0.4 0.28
20
8 0.2 0.13
10 4 0.07
0 0
Ninguno Leve Moderado Severo Ninguno Leve Moderado Severo
Mediciones de dolor percibido Mediciones de dolor percibido
Tabla de frecuencias
N de Valor de la (fi)(fri) (p)
clase variable
1 X1 f1 fr1 P1
2 X2 f2 fr2 P2
.
.
.
k Xk fk frk Pk
Total n 1 100
Tipo de grfico. Se elabora el grfico de bastones o varas con las frecuencias absolutas,
relativas o porcentuales.
Interprete:
f2 = 15 Existen 15 clientes del Banco Comercial que hacen un viaje al mes.
p1 = 22.22 El 22.22% de los clientes no han realizado viajes.
30.00
25.00
20.00
%
15.00
10.00
5.00
0.00
0 1 2 3 4
VIAJES
Donde:
LI i = Lmite inferior de la clase i (Lmite cerrado)
LSi =Lmite superior de la clase i (Lmite abierto, salvo ltima clase que es cerrado)
Marca de clase ( X i' ). Es el punto medio del intervalo de clase. Se considerar como el valor
representativo de los valores que pertenecen al intervalo de clase.
LI i LSi
Se calcula: X i' o X i' X i'1 TIC , donde TIC es el tamao del intervalo de clase
2
t
Propiedad: Ft Fh
i h 1
fi , h t
Fi
f j i
fri
j 1
Fri
n n j 1
t
Propiedad: Frt Frh
i h 1
fri , h t
Paso 5. Realizar el conteo del conjunto de datos, como el resultado de asignar cada
observacin a alguno de los intervalos de clase. Luego completar la tabla hallando
X i' , fi , fri , Fi , Fri
Tipos de grficos
Histograma. Se usan las frecuencias absolutas o relativas en el eje vertical y los intervalos
de clase en el eje horizontal.
Polgono. Se usan las frecuencias absolutas o relativas en el eje vertical y las marcas de clase
en el eje horizontal.
En nuestro ejemplo, k = 6.4556, estamos en el segundo caso, por lo que el nmero de clases
que se debe considerar es k=6.
Interprete:
f2 = 20; 20 de los clientes tienen un ingreso mensual de por lo menos S/. 3900
pero menos de S/. 5810.
fr4 = 0.0222; 0.0222 es la proporcin de clientes que ganan por lo menos S/. 7720 pero
menos de S/. 9630
p5 = 4.44; 4.44% de los clientes ganan por lo menos S/. 9630 pero menos de S/. 11540.
3
F3 fi f1 f 2 f3 11 + 20 + 10 = 41; 41 de los clientes ganan mensualmente por
i 1
que 0.9332 es la proporcin de clientes que ganan por lo menos S/. 1990 pero menos
de S/. 9630.
Fr5 - Fr3 = 0.9776 - 0.9110 = 0.0666
5
Fr5 - Fr3 = fr = fr4 + fr5 = 0.0222 + 0.0444 = 0.0666, indica que 0.0666 es la
i4
i
proporcin de los clientes que ganan por lo menos S/.7720 pero menos de S/.11540.
3
P3 = pi = pl + p2 + P3 = 24.44 + 44.44 + 22.22 = 91.10, indica que el 91.10% de los
i 1
clientes tienen ingresos mensuales de por lo menos S/.1990 pero menos de S/.7720
P5 - P2 = 97.76 - 68.88 = 28.88
5
P5 - P2 = p
i 3
i =P3 + P4 + P5 =22.22 + 2.22 + 4.44 = 28.88, indica que el 28.88% de
los clientes de ese banco tienen ingresos mensuales por lo menos S/. 5810 pero menos
de S/. 11540.
X 3' = 6.765 es el valor representativo de los clientes que ganan por lo menos S/.5810
pero menos de S/.7720. Las diez observaciones (f3 = 10) que hay en la clase 3 son
representadas por el valor S/. 6765.
Histograma de frecuencias
50.00
40.00
30.00
%
20.00
10.00
0.00
2.945 4.855 6.765 8.675 10.585 12.495
INGRESO
En el histograma se puede apreciar que la clase ms frecuente es la segunda esto indica que
los ingresos ms frecuentes son de por lo menos S/. 3900 pero menores a S/. 5810.
Polgono de frecuencias
50.00
45.00 44.44
40.00
35.00
30.00
25.00
%
24.44
22.22
20.00
15.00
10.00
5.00 4.44
2.22 2.22
0.00
2.945 4.855 6.765 8.675 10.585 12.495
INGRESO
En el polgono de frecuencias se observa que son pocos los clientes con Ingresos mensuales
altos.
50.00
45.00
40.00
35.00
30.00
25.00
%
20.00
15.00
10.00
5.00
0.00
2.945 4.855 6.765 8.675 10.585 12.495
INGRESO
Ejemplo 4. La tabla 2.4 presenta distribuciones agrupadas para los datos de la presin
sangunea. Como puede observarse, los valores de presin sangunea se colocaron en
intervalos que tcnicamente se conocen como intervalos de clase. Las diversas distribuciones
se basan entonces en esos intervalos. Al reducir los datos en esta forma, los patrones de
respuesta se distinguen con mayor facilidad. Pero el precio que se paga por la comodidad
interpretativa es la prdida de informacin.
Por ejemplo, mientras que es fcil ver que alrededor del 21.5% de los valores cae en el
intervalo 135-139, no hay informacin acerca de los valores individuales en este intervalo.
Al construir tablas de este tipo se deben responder dos preguntas relacionadas. En cuntos
intervalos se deben agrupar los valores y qu tan grandes debern ser los intervalos? Muy
pocos intervalos provocan la prdida de mucha informacin, mientras que muchos intervalos
hacen fracasar el propsito de resumir los datos. El tamao de los intervalos depender del
nmero de intervalos utilizados y viceversa. No existen reglas rgidas y rpidas al respecto.
En esencia, usted desear presentar los datos dndoles el mayor signicado posible. Sin
embargo, hay algunas reglas generales que sirven como gua. Una sugerencia comn es que
no debe haber menos de seis ni ms de 15 intervalos. Otra regla til es que, cuando sea posible,
se debe usar una anchura en los intervalos de clase de 5 unidades, de 10 unidades o de algn
mltiplo de 10 para que el resumen de los datos sea ms comprensible.
TABLA. Las presiones sanguneas de 144 adolescentes moderadamente obesos.
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Presiones sanguneas 86 90 92 92 93 95 95 95 96 96 97 97 98 98 99
Paciente 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Presiones sanguneas 100 100 100 100 102 103 105 105 106 107 107 109 110 110 110
Paciente 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Presiones sanguneas 111 111 111 114 114 115 115 115 115 115 115 116 116 116 117
Paciente 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
Presiones sanguneas 118 118 119 119 120 120 120 121 122 122 122 123 123 124 124
Paciente 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
Presiones sanguneas 124 124 125 125 125 125 126 126 126 126 126 126 126 127 127
Paciente 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
Presiones sanguneas 127 128 128 128 129 129 129 130 130 130 130 130 131 131 131
Paciente 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105
Presiones sanguneas 132 132 132 132 133 133 133 133 133 133 133 133 134 134 134
Paciente 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
Presiones sanguneas 134 134 135 135 135 135 135 135 135 135 136 136 136 137 137
Paciente 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135
Presiones sanguneas 137 137 137 137 137 137 137 137 137 138 138 138 139 139 139
Paciente 136 137 138 139 140 141 142 143 144
Presiones sanguneas 139 139 139 140 140 140 140 143 143
30.00
25.00
20.00
15.00
%
10.00
5.00
0.00
90 98 106 114 122 130 138 146
PRESIN SANGUNEA
Referencia bibliogrfica:
Balzarini Mnica; Di Rienzo Julio; Tablada Margot; Gonzlez, Laura; Bruno Cecilia;
Crdoba Mariano; Robledo Walter; Casanoves Fernando. 2011. Estadstica y Biometra.
Editorial Brujas. Argentina.
Gua del curso de estadstica general. 2016. Departamento estadstica e informtica.
UNALM
Blair R. Clifford y Richard A. Taylor. 2008. Bioestadstica. Pearson Educacin, Mxico, 2008