You are on page 1of 12

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas

Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

Captulo I La estadstica y sus aplicaciones. Algunos conceptos importantes. La estadstica es la rama de la ciencia que se encarga del conjunto de procedimientos (mtodos) que se utilizan para la coleccin, presentacin y anlisis de observaciones. Tiene como propsito la descripcin del conjunto de datos colectados, as como la generalizacin y/o toma de decisiones acerca de las caractersticas de todas las observaciones potenciales bajo consideracin. En consecuencia nos permite organizar y resumir datos para poder realizar inferencias (conclusiones) relativas a los mismos. La estadstica forma parte de los mtodos generales de investigacin (Mndez, 1989). La rama de la estadstica que se encarga de la coleccin, organizacin, presentacin y descripcin de los datos recibe el nombre de estadstica descriptiva. De la misma manera, la inferencia estadstica o estadstica inferencial o inductiva es la que tiene que ver con la toma de decisiones y la elaboracin de generalizaciones sobre la base de informacin parcial o incompleta, obtenida a partir de tcnicas descriptivas. Pensemos, por ejemplo en un investigador de nutricin animal interesado en conocer la ganancia diaria de peso (GDP) alcanzada por los bovinos en finalizacin en una granja engordadora que utiliza la informacin de slo 8 de los 59 animales disponibles, esto es de una muestra de la poblacin de inters, y obtiene los siguientes resultados (en kg): 0.950, 0.840, 0.900, 1.040, 0.780, 0.925, 0.860, 0.945. La medida estadstica que utiliza es la GDP promedio, es decir, la media aritmtica, que corresponde a la suma de los valores observados dividida entre el nmero de ellos. Para este caso 7.24/8 = 0.905. El resultado obtenido de esta forma est en gran medida limitado a los datos colectados y slo nos permite resumir y describir parte de la informacin obtenida. Es una parte de la estadstica descriptiva, pero no involucra inferencia o generalizacin relativa a la GDP de los animales no evaluados. En muchos casos no se tiene el tiempo ni los recursos suficientes para llevar a cabo una evaluacin del total de las observaciones potenciales. Por tales motivos, el investigador decide usar slo una muestra para evaluar el comportamiento de la granja en general, esto es, a partir de informacin parcial o incompleta efecta una estimacin e infiere sobre el rendimiento promedio de la granja, para lo cual requiere del conocimiento de tcnicas estadsticas inferenciales. Supongamos ahora que otro investigador evalu del mismo modo a otro grupo de animales de una explotacin contigua obteniendo un resultado de 0.870. En tales circunstancias podramos plantearnos: a) que la diferencia de promedios es de 0.035 kg, lo que corresponde a un dato meramente descriptivo; b) que el promedio de la granja A es de 0.905 mientras que el de la B es de 0.870, lo que corresponde tambin a estadstica descriptiva; c) que el ganadero de la granja A piensa que sus bovinos tienen un mejor desempeo productivo, lo que se refiere a inferencia estadstica.

Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

Cabe sealar que se pueden plantear, segn el conocimiento del rea de estudio que se trate, mltiples hiptesis relativas a los par metros de inters. As por ejemplo, bajo el supuesto de que la diferencia entre 0.870 y 0.905 fuera estadsticamente significativa (esto es, con un porcentaje de confiabilidad elevado, basado en probabilidad, que nos indica el grado de credibilidad que debe asociarse a cada inferencia) se podran plantear diversas hiptesis en relacin a las causas de dicha diferencia, como por ejemplo diferencias en el nivel de alimentacin, en la calidad gentica de los animales, etc. Obvio es decir que los planteamientos o inferencias producto del anlisis de informacin numrica slo dan soporte a las hiptesis planteadas por quien utiliza las tcnicas estadsticas, situacin que no hace necesariamente vlidas las hiptesis o generalizaciones efectuadas. La estadstica desempea un papel importante en la contrastacin o prueba de hiptesis cientficas, cuando involucran fenmenos aleatorios. Una hiptesis puede o no rechazarse, pero el proceso se condiciona al grado de validez de los supuestos adicionales y las circunstancias de la prueba. Las pruebas de significancia estadstica slo indican la probabilidad de que los resultados ocurran por azar sin que sea cierta la hiptesis cientfica (Mndez, 1991). La inferencia estadstica tiene su fundamento en la postulacin de modelos estocsticos (probabilsticos). Un modelo es una representacin verbal, fsica o simblica de un fenmeno real (Mndez, 1982). La estadstica se encarga del estudio de los fenmenos aleatorios, que son aquellos donde no es posible hacer predicciones del estado final. Aunque estrictamente todo fenmeno es aleatorio, existen algunos cuyo grado de aleatoriedad es tan pequeo que es posible considerarlos, al menos en la prctica, como predecibles y reciben el nombre de fenmenos determinsticos. Cuando los fenmenos aleatorios se estudian de manera repetida bajo condiciones constantes presentan sus diferentes modalidades en frecuencias relativas o proporciones estables, lo que se conoce como regularidad estadstica, como por ejemplo la proporcin de vacas de primer parto en las granjas lecheras. Una variable se refiere a una caracterstica que puede tomar diferentes valores o cualidades, as por ejemplo el peso al nacer en los cerdos de la raza Landrace, la concentracin de progesterona srica en conejas de la raza Nueva Zelanda con 20 das de gestacin, el rendimiento en toneladas por hectrea de alfalfa, el sexo, edad y color de pelaje corresponden entre otras, a variables. La variable es aleatoria si el hecho de que tome un determinado valor es en s un evento aleatorio (Mendenhall y Reinmuth, 1981). Si bien esta definicin es en cierto sentido una tautologa, nos conduce a comprender que si los valores que toma dicha variable corresponden a los diferentes resultados probables de un experimento, el hecho de que tome un valor muy particular lo convierte en un evento aleatorio, esto es, se dice que su valor est sujeto a leyes probabilsticas y que sigue, por lo tanto, una distribucin de probabilidad (lo que ser comentado posteriormente). En consecuencia slo puede estimarse el valor posible. Existen dos tipos de variables claramente identificables, las cuantitativas y las cualitativas. Una variable cuantitativa es aquella que puede medirse porque toma determinado valor numrico de una escala. Son claro ejemplo: la edad al destete en los cerdos, la altura a la
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

cruz en los caballos de salto, el rea foliar de trbol rojo, el rendimiento en toneladas por hectrea de sorgo forrajero, etc. Estas a su vez se dividen en discretas y continuas. La variable cuantitativa discreta es aquella que no presenta continuidad en su medicin, tomando habitualmente valores enteros. Son ejemplos el nmero de animales enfermos en una granja, el nmero de garrapatas presentes en un animal, el nmero de partos de una vaca lechera, el nmero de lechones nacidos vivos, etc. Una variable cuantitativa continua es aquella que puede medirse y que presenta un infinito numrico de valores en la escala, que pueden ser litros, centmetros, caloras, kilogramos, joules, etc., como son la alzada en ganado, el peso al nacer, el requerimiento energtico en la dieta de una vaca lechera. Debido a que el nmero de dgitos es infinito, slo queda supeditado a la precisin del equipo con que se mide. Por su parte la variable cualitativa se refiere a aquellas caractersticas que no pueden ser medidas en el sentido en que se mide la estatura. peso, edad, etc. Slo pueden ser catalogadas o calificadas. Son ejemplo de ello los diversos diagnsticos como de afecciones como el desplazamiento de abomaso, el carcinoma, la retculo pericarditis traumtica, donde el grado de afectacin no puede cuantificarse, se dice que el padecimiento se presenta o no, y la severidad, en caso de ser apreciable, es una cualidad ms. Son ejemplos de variables cualitativas la presencia de cuernos en los bovinos, las variedades o razas de aves de postura, el color del pelaje en los caballos, etc. Las variables cualitativas reciben tambin el nombre de variables categricas o variables ordinales, ya que las diferentes categoras y la ubicacin en una escala ordinal (primero, segundo, etc., que indica cual es mayor pero no implica distancias iguales entre niveles), no pueden ser cuantificadas. As por ejemplo, una granja tecnificada es superior a una no tecnificada (diferente categora), e igualmente ubicar a las cinco mejores vacas de una explotacin del primer al quinto lugar slo implica el orden de ubicacin, pero no nos dice nada de su potencial productivo verdadero. Otra manera de visualizar lo anterior es considerando lo que se denomina como escalas de medicin. Existen cuatro escalas de medicin: la nominal, ordinal, intervalo, y razn. La observacin de variables no ordenadas constituye el nivel de medida ms bajo y se refiere a la escala de medicin nominal. Sus datos estn constituidos, por lo general, por la frecuencia de valores y reciben el nombre de datos de atributos, frecuencias, enumerativos o categricos. Son ejemplos el sexo, la raza, el hato, el color del pelo, etc. Las relaciones matemticas posibles con este tipo de variables son la igualdad o desigualdad, que implica la pertenencia o no a una clase determinada. Una escala de medicin superior corresponde a la escala ordinal, en donde podemos encontrar variables cuyas clases representan series ordenadas de acuerdo con sus relaciones, de modo que la diferencia entre clase y clase implica una especie de relacin entre s, del tipo de mayor y menor (A > B > ... > Z), como por ejemplo una afeccin respiratoria que puede ordenarse como leve, moderada y grave, o bien ms bravo, menos noble, o como el ejemplo de las cinco mejores vacas de una explotacin ordenadas de la mayor a la menor citado previamente. La posicin se asigna de acuerdo con el ordenamiento, la mayor ser la 1, la siguiente la 2, y as sucesivamente hasta la ltima, si bien es cierto que dicha escala puede asignarse en sentido contrario. Debe quedar claro que
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

la distancia existente entre clases en esta escala de medicin no es constante al variar de una a otra, esto es, la distancia entre la primera y la segunda puede no ser la misma que la existente entre la segunda y la tercera, etc. El nivel ms alto en las escalas de medicin corresponde a las escalas de intervalo y razn cuyos valores numricos se asocian de manera cuantitativa, lo que hace posible el uso de cualquier tipo de operacin aritmtica. La caracterstica fundamental de este tipo de escalas es que las diferencias iguales entre dos puntos en cualquier parte de la escala, son iguales entre s. Por ejemplo, la diferencia entre 26.5 y 29.3 kg es la misma que la diferencia entre 27.2 y 30.0 kg. La diferencia existente entre las escalas de intervalo y la de razn (llamada tambin de cociente) es que la primera utiliza un cero arbitrario, mientras que la segunda emplea un cero real, por lo que slo esta ltima permite la comparacin entre los valores de la misma y la relacin que existe entre las distancias que los separan; as por ejemplo 8 gazapos son el doble de 4 y 6 el doble de 3, y en este sentido la relacin entre 8 y 4 y la existente entre 6 y 3 es la misma. Un ejemplo clsico de la diferencia entre este tipos de escalas es la temperatura cuando se considera como la escala Celsius o centgrados y la Fahrenheit que son ambas de intervalo y la escala Kelvin, que por considerar el cero absoluto o cero real corresponde a una escala de razn (Haber y Runyon, 1973). Los datos u observaciones son aquellos nmeros o cualidades que se obtienen en un momento determinado del entorno cotidiano o de un experimento particular con la finalidad de ser descritos e interpretados. Todas aquellas caractersticas que cumplen con el requisito de ser variables conforman la poblacin. Por lo tanto, se define una poblacin de elementos como la mayor coleccin de estos por los que se tiene cierto inters en un momento dado. Si se lleva a cabo una medicin de alguna variable sobre cada uno de los elementos en una poblacin, se genera entonces una nueva poblacin de valores de dicha variable. As tenemos, por ejemplo, una poblacin de caprinos de 4 meses de edad y una poblacin de los pesos de dichos animales. Una muestra se refiere a una coleccin de medidas u observaciones tomadas de una poblacin y corresponde, por consiguiente, a un subconjunto de la poblacin. El nmero de observaciones de una muestra, para que tenga sentido como tal, es inferior al de la poblacin. Las muestras se toman debido a que la mayora de las veces no es posible, por razones econmicas, operativas, etc., analizar a toda la poblacin. Las caractersticas medibles de una poblacin son generalmente denominadas parmetros y los valores de dichos parmetros son considerados como los valores verdaderos; por ejemplo el promedio de ganancia de peso de los becerros de raza Hereford, el tiempo de coagulacin sangunea en caninos adultos de la ciudad de Mxico, el rea foliar de la alfalfa a los 45 das de la siembra son caractersticas medibles y los valores centrales de ellos y los que representan su variabilidad son sus parmetros. Sus valores son los valores verdaderos. Una estadstica es una caracterstica medible de una muestra; as, parmetro es a poblacin como estadstica es a muestra. Los estadsticos utilizan estadsticas para inferir sobre parmetros, pero para ello deben recurrir al uso de muestras aleatorias que son aquellas en las que todos los elementos de la poblacin tienen la misma probabilidad de pertenecer a la muestra y son, por lo general, representativas de la poblacin de que proceden. Resulta
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

intuitivamente evidente que al aumentar el tamao de la muestra se obtienen resultados ms cercanos o parecidos a los valores reales de la poblacin o valores parametrales. Podemos entonces ver, de manera ms clara, que el objetivo de la estadstica es finalmente obtener medidas descriptivas calculadas a partir de muestras aleatorias para poder realizar, con esos resultados, inferencias relativas a los valores parametrales. La estadstica se ayuda adems de mtodos de coleccin, presentacin y anlisis para poder cumplir con su propsito. Captulo II La Estadstica Descriptiva. Las medidas descriptivas se dividen en dos grandes grupos, las de tendencia central y las de dispersin o variacin. Las primeras corresponden a aquellas que nos dan una idea de los valores medios, valores centrales o ms frecuentes de una determinada distribucin de valores. La media, moda y mediana son ejemplos de ellas. Las medidas de dispersin son aquellas que nos informan sobre el grado de variabilidad o variacin presente en un grupo de datos u observaciones y como ejemplo tenemos al rango, varianza, desviacin estndar, desviacin media y el coeficiente de variacin. La media aritmtica o promedio de una poblacin se denota con la letra griega , y la de una muestra como X . Sean X1, X2,...,Xn las observaciones, datos, medidas o valores de una poblacin, la media aritmtica se calcula: =

X
i =1

/N

donde N representa el nmero total de observaciones de la poblacin. Anlogamente, en la media muestral, n se refiere a los datos existentes y representa al tamao de la muestra: X=

X
i =1

/n

La media aritmtica es la ms importante de las medidas de tendencia central en cuanto a propsitos inferenciales. Posee adems las propiedades de la unicidad, esto quiere decir que para un conjunto de datos slo existe una media aritmtica, simplicidad, ya que es una medida fcil de comprender y de calcular, y es sensible a valores extremos, esto es, cuando los extremos (valores mximo y mnimo) se encuentran lejos de la mayora de las observaciones, la media calculada tiende a distorsionarse. La moda corresponde al valor ms abundante o frecuente en una distribucin de valores y por lo tanto se determina su valor por inspeccin y no por procedimientos de clculo. Se
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

representa como Mo. Una muestra puede carecer de moda, en cuyo caso se dice que es amodal, o bien puede presentar dos o ms modas, dicho de otro modo, puede ser bimodal o polimodal. Esta medida es til cuando se est interesado en el caso tpico o comn de una distribucin de valores determinada, o en caractersticas que constituyen variables discretas, como el nmero de lechones en una camada. La mediana es una medida que se obtiene con facilidad pero que requiere del ordenamiento de los datos de mayor a menor o viceversa. Se le reconoce como Me. Se refiere al valor intermedio de la distribucin de los mismos. Los datos se ordenan y el valor que queda justo a la mitad es la mediana. Si el nmero de datos es par, se suman los valores centrales y se divide entre dos para calcularse. Tiene la desventaja de que en series muy grandes, resulta laborioso el ordenamiento de datos, si bien ahora con el uso de hojas electrnicas existentes para computadoras personales (PC) y los paquetes estadsticos se obtiene con rapidez. El ordenamiento de un grupo de valores se representa escribiendo entre parntesis el valor del subndice, as Xi indica los valores i diversos de X pero X(i) indica que dichos valores estn ordenados de menor a mayor, as por ejemplo si tenemos 11 valores en una muestra el valor de X(6) corresponde al valor de la mediana de dicha muestra, pero si son 12 los valores entonces la mediana corresponde a (X(6)+X(7))/2. Una propiedad interesante de la mediana es que no se afecta por la presencia de valores extremos, lo que la convierte til cuando en una distribucin de valores existen valores extremos que afectan la simetra de la misma. Desde un punto de vista terico, en poblaciones muy grandes, referidas a variables cuantitativas continuas, con distribucin normal (que comentaremos ms adelante), la media, moda y mediana son iguales. Supongamos que un investigador llev a cabo mediciones en 9 bovinos con afeccin renal para determinar la cantidad de nitrgeno no proteico (NNP) presente en orina y que encontr los resultados mostrados en el siguiente cuadro. Concentracin de NNP en sangre de Bovinos con Nefropata* Nmero de Concentracin Paciente en mg/dl 1 35 2 42 3 30 4 48 5 65 6 52 7 31 8 48 9 27
* Datos hipotticos (valores normales: 20-40 mg/dl)

Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

Con los datos anteriores obtenemos las medidas de tendencia central: Media: X = (35 + 42 + ... + 26)/9 = 42. Moda: Mo = 48 (es el nico valor que se repite). Mediana: Ordenamos los datos de menor a mayor: X(1)= 27, X(2)= 30, X(3)= 31, X(4)= 35, X(5)= 42, X(6)= 48, X(7)= 48, X(8)= 52, y X(9)= 65. Por lo tanto la mediana corresponde al valor X(5), esto es, Me = 42. Como puede notarse, las medidas de tendencia central son simples y muy fciles de obtener. De cualquier modo, en lo sucesivo, nuestro inters se centrar fundamentalmente en la media; de hecho la mayora de las medidas de dispersin se explican en funcin de la media. Analizaremos ahora las medidas de dispersin aprovechando el mismo grupo de datos para dar continuidad al ejemplo. Las medidas de dispersin, tambin llamadas de variacin o variabilidad son aquellas que nos permiten conocer que tan dispersos o variables son un grupo de valores o datos cualquiera. Indican el grado de variabilidad de los mismos. El rango corresponde a la medida de dispersin ms sencilla y se refiere a la distancia escalar existente entre la observacin con valor mximo y la observacin con valor mnimo, esto es, corresponde a la diferencia entre la mayor y la menor de las observaciones. El rango, llamado tambin recorrido, se simboliza con la letra R. R = Valor mximo - Valor mnimo esto es, R = X(n) - X(1) El rango se utiliza poco ya que no provee una medida de variacin con relacin al centro de la distribucin de valores, esto es, no da una medida de variabilidad con relacin a ningn valor de tendencia central. Para el ejemplo de los bovinos (NNP) tenemos: R = 65 - 27 = 38 La variabilidad de cualquier distribucin de valores es vista, generalmente, en trminos de la desviacin de cada valor con respecto a la media, es decir: Xi - X Si las desviaciones son pequeas, los datos son, en consecuencia, menos variables que si stas son grandes. Por ende, esta desviacin nos da informacin relativa al grado de variacin en una muestra. Se esperara entonces que la suma de estas desviaciones divididas por el nmero de datos nos proporcionara un promedio de ellas de fcil obtencin e interpretacin; sin embargo, esto no es factible ya que algunas desviaciones son positivas y otras negativas (recordemos que la media esta precisamente "centrada", y la suma de las mismas es siempre igual a cero:
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

(X
i =1

X) =0

Esto se explica, como se seal, en virtud de que la media es una constante que se ubica en el centro de la distribucin de valores. Por tal motivo, una solucin a dicha dificultad consiste en computar la desviacin media (DM), esto es, la desviacin promedio de los valores observados con respecto a la media en trminos absolutos, esto es, considerando los valores escalares (omitiendo el signo de la desviacin). La desviacin media se calcula entonces de la siguiente manera: DM = donde

i =1

(Xi X )

/n =0

(Xi X ) significa que los signos de las desviaciones son ignorados. Esta circunstancia hace al mtodo poco til en muchos procedimientos algebraicos y por lo consiguiente limita su manipulacin matemtica.
Para el ejemplo de los bovinos con nefropata podemos calcular la desviacin media, para lo cual agrupamos y tabulamos nuestros datos del modo siguiente: Xi 35 42 30 48 65 52 31 48 27 Total 378 X 42 42 42 42 42 42 42 42 42 378

(Xi X )
7 0 12 6 23 10 11 8 15 92

Por lo tanto, la desviacin media de este grupo de datos se obtiene: DM = 92 / 9 = 10.22 El resultado (DM) anterior se interpreta como el promedio de las desviaciones originales. El signo ms menos () es debido a que dichas desviaciones estn a ambos lados de la media aritmtica. Otra forma de resolver el problema relativo a que el promedio de la suma de las desviaciones de los valores con respecto a la media es igual a cero es elevando al cuadrado cada una de ellas. De este modo la suma de los cuadrados de dichas desviaciones puede
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

promediarse sobre el nmero de las mismas. Hacerlo produce la medida ms importante de dispersin, denominada varianza. La varianza poblacional se calcula de la forma siguiente: 2 = y la varianza muestral: S2 =

(X
i =1

X )2 / N

(X
i =1

X )2 / n 1

La varianza muestral tiene como denominador el nmero de observaciones menos una (n-1). Esto se debe a que al conocer el estimador de un valor parametral, en este caso la media, conocemos la suma total, y entonces resulta fcil comprobar que podemos obtener el valor de una de las observaciones si tenemos las n-1 restantes. Si sabemos, por ejemplo, que en una muestra de tamao 3 la media es 8.4, el valor X1 decimos puede tomar valores que varan, as entonces, supongamos que su valor es 8.0, X2 ahora puede tomar igualmente valores que varan, si suponemos que su valor es 8.7, entonces X3 "pierde su libertad" y su valor slo puede ser 8.5 para que cumpla con la restriccin que se ha impuesto al tener fijo el valor de la media en 8.4. La varianza muestral, es en consecuencia siempre mayor a la poblacional. Ahora bien, la denominada "frmula de trabajo" de la varianza es el producto de una simplificacin algebraica de la ecuacin original, y corresponde a: S2 = ( X i2 ( X i ) 2 ) / n 1
i =1 i =1 n n

La varianza representa normalmente para el estudiante novicio un problema para su conceptualizacin. La razn es que las desviaciones no estn representadas en una dimensin lineal, sino cuadrtica. Resulta entonces lgico linealizar dicho valor y obtener as una medida de la dispersin expresada en sus trminos originales. Esto se logra extrayendo la raz cuadrada a la varianza. El resultado as obtenido se conoce como desviacin estndar, y corresponde a:

= ( ( X i X ) 2 / N )1/ 2 = ( ( X i2 ( X i ) 2 ) / N )1/2
i =1 i =1 i =1

En forma similar, si se desea obtener la desviacin estndar muestral (S), se sustituye entonces el valor de N por el de n-1 en el denominador: S = ( ( X i2 ( X i ) 2 ) / n 1 )1/2
i =1 i =1 n n

La desviacin estndar y la varianza son medidas de dispersin que permiten la manipulacin matemtica compleja y por lo tanto son de gran utilidad.
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

Otra importante medida de dispersin es el coeficiente de variacin (CV), que expresa la variabilidad existente con respecto a la media en trminos porcentuales y es muy simple de obtener: CV = (S / X ) 100 donde S corresponde a la desviacin estndar (muestral) y X a la media muestral. Calculemos ahora la varianza, desviacin estndar y coeficiente de variacin de nuestro ejemplo: S2 = (352 + 422 + ... + 262 (35 + 42 + ... + 26)2 / 9) / 8 = 155 Igualmente: S = (S2)1/2 = (155)1/2 = 12.45 y finalmente: CV = (12.45 / 42) x 100 = 29.64 % Como puede notarse, el clculo de las medidas de dispersin es en realidad sencillo. Para familiarizarse con estas medidas, conviene calcularlas, a modo de ejercicio, empleando algunas variables que sean de nuestro inters. Captulo III Elementos de muestreo. Muestra. Como ya se mencion, se refiere a una coleccin de medidas u observaciones tomadas de una poblacin. Para que sea representativa de la poblacin es indispensable que sea obtenida al azar (en forma aleatoria). Muestra aleatoria. Es aquella en que los elementos de la poblacin que pasan a la muestra lo hacen por sorteo de tal modo que cada miembro de la poblacin tiene la misma probabilidad de estar en la muestra y por lo tanto se dice que es representativa de la poblacin. Tamao de la muestra. Queda determinado por consideraciones econmicas, prcticas y de factibilidad inherente al problema de que se trate, as como en funcin de la variabilidad del fenmeno y de la precisin requerida. La estimacin del tamao de la muestra se mencionar en el captulo de Estimacin. En algunos casos, se establecen reglas empricas tales como: a) medir del 5 al 10% de las plantas de una parcela o el 7 al 10% de su superficie, b) en poblaciones muy grandes suele bastar el 1% de los valores existentes e incluso menos. En realidad, cuando se conoce la variacin que presenta el problema en estudio, es posible elegir el tamao de la muestra en funcin de la precisin que se desee, como veremos ms adelante.

Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

10

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

Error de muestreo. De un modo muy general, podemos decir que el error de muestreo es la diferencia entre el valor de la muestra y el valor real. As las cosas, la mejor tcnica de muestreo es aquella que reduce haciendo mnimo dicho error de muestreo. Unidad de muestreo. Es aquella unidad sobre la que se lleva a cabo la medicin. Puede ser una toma sangunea, plantas, la superficie de una parcela, un animal o grupo de ellos, expedientes clnicos, etc. La unidad de muestreo debe elegirse cuidadosamente y mantenerse a lo largo de todas las mediciones y debe reunir las caractersticas siguientes: a) fcil de identificar, b) fcil de medir, c) proporcionar una precisin elevada, y d) ser de mnimo costo. Muestreo aleatorio simple. En este tipo de muestreo slo hay un tipo de unidad de muestreo. Es el ms sencillo de los mtodos de muestreo. Cada unidad de muestreo tiene igual probabilidad de incluirse en la muestra. En la prctica, el primer paso consiste en la numeracin de las unidades desde 1 hasta N, donde N corresponde a la ltima. Despus se extrae una serie de nmeros aleatorios (o cualquier procedimiento aleatorio) para elegir los valores de la muestra. Puede hacerse de dos maneras: con reemplazo y sin reemplazo. Muestreo con reemplazo. En este tipo de muestreo, la unidad seleccionada regresa a la poblacin de modo tal que puede ser elegida nuevamente. Este tipo de muestreo hace independientes a los elementos de la muestra. Muestreo sin reemplazo. En este caso, la unidad de muestreo seleccionada no retorna a la poblacin. Esto genera que los valores obtenidos aumentan la probabilidad de aparicin de los valores que an no han sido elegidos. Esto implica que no existe independencia entre los valores. Muestreo sistemtico. Es muy similar al muestreo aleatorio simple, slo que en este tipo de muestreo se elige un intervalo dependiendo del tamao de la muestra que se desee, denominado convencionalmente como k para despus elegir aleatoriamente un nmero que corresponder a la primera unidad de muestreo y de ah en adelante se toma un valor cada k veces (o espacios) hasta concluir. Por ejemplo, si k =15 y se elige al azar el 8, los elementos de la muestra (previamente enumerados) ser el 8, 23, 38, 53 etc. Muestreo aleatorio estratificado. Se muestra en N subpoblaciones denominadas estratos de manera aleatoria. Estos estratos pueden referirse a grupos de edades, sexos, condicin socioeconmica, nivel cultural, inclinacin poltica, grupo sanguneo, raza, nmero de parto, nmero de corral, etc. Dentro de cada estrato se realiza un muestreo aleatorio simple o el sistemtico, y en la estimacin de los parmetros no debe olvidarse que cada estrato se constituye con un nmero de elementos diferente y por lo tanto deben ponderarse en el muestreo dentro de cada estrato. Muestreo por conglomerados. Cuando se tienen grupos de plantas, animales, etc., y no es posible tener una lista de ellos, stos suelen agruparse en conglomerados sobre los que se
Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

11

Manual de Bioestadstica para Mdicos Veterinarios y Zootecnistas


Profesor Hctor Castillo Jurez Universidad Autnoma Metropolitana, Unidad Xochimilco

hace un muestreo de los valores de grupo. Ello pasa por ejemplo con camadas, grupos de plantas, etc. Muestreo bietpico. Corresponde en realidad a un submuestreo, es decir, una vez elegida la muestra se toma una muestra (submuestra) de la misma. Por ejemplo se elige al azar de entre un grupo de expedientes clnicos de pacientes afectadas por metritis como primer paso. El segundo consiste en asignar un tratamiento distinto a pequeos grupos de las mismas. En la agricultura es frecuente elegir una parcela en el primer muestreo y en la segunda etapa muestrear dentro de ella en funcin de la extensin de la misma. Muestreo multietpico. Se refiere al muestreo que incluye varios submuestreos. Es slo una extensin del muestreo bietpico. Se le utiliza en una gran variedad de circunstancias por razones diversas, pero sobre todo de naturaleza econmica. Resulta obvio recordar que dentro de cada etapa o submuestreo se realiza el muestreo aleatorio simple o el sistemtico. Anlogamente, puede incluirse el muestreo por conglomerados y el estratificado en alguna o algunas de las etapas del muestreo multietpico. Bibliografa. Haber, A., y Runyon, R. P. (1973). Estadstica general. Fondo Educativo Interamericano. Mxico. Mendenhall, W., y Reinmuth, J. E. (1981). Estadstica para administracin y economa. Grupo Editorial Iberoamrica, 1a edicin, Mxico. Mndez, R. I. (1982). Comentarios sobre la inferencia estadstica. Serie Azul. Monografas. No 55, IIMAS, UNAM. Mndez, R. I. (1989). La ubicacin de la estadstica en la metodologa cientfica. Ciencia., 40: 39-48. Mndez, R. I. (1991). La estadstica como ciencia y su papel en la investigacin. Monografas. Vol. 1, No 5, Sep., IIMAS, UNAM.

Correo electrnico: Crianza_animal@hectorcastillo.org Portal Web: http://www.hectorcastillo.org Telfono: 5483 7000 Extensin 3132

12

You might also like