Professional Documents
Culture Documents
Elemental
1. Generalidades
El conteo sobre la población y las riquezas existentes en el territorio del Egipto antiguo
data de tiempos tan remotos como el año 3,050 antes de nuestra era. Esa práctica, de
acuerdo al historiador griego Heródoto, constituía un ejercicio orientado a la construcción
de la Pirámides. Esa experiencia ganada por los egipcios le permitió al gobierno del
faraón Ramsés II la realización de un censo de naturaleza agraria, destinado a verificar
un reparto de tierras. En años inmediatamente posteriores, hacia el año 3,000 antes de
nuestra era, en los pueblos de Babilonia, una de las importantes civilizaciones de la
antigüedad, ya se utilizaban piezas de arcilla para grabar inscripciones relativas a datos
acerca de la producción agrícola y las cantidades vendidas o cedidas a través de
trueques 1 .
El nivel de organización social alcanzado por el Imperio Romano hizo que su nivel de
requerimientos de información fuese elevado. Por esta razón se considera a los romanos
como la civilización de la antigüedad que llegó más lejos en relación al empleo de
prácticas estadísticas. A los funcionarios al servicio del imperio se les exigía registrar
algunos eventos relacionados con el ciclo vital de las personas como: nacimientos,
defunciones y casamientos. En forma adicional, en los territorios conquistados se hacían
inventarios periódicos del ganado, los esclavos y otras riquezas existentes.
En pleno apogeo de este Imperio Romano, cada cinco años se hacían recuentos en la
población. Uno de estos eventos, del cual también se da cuenta en el Nuevo Testamento,
fue el recuento de población levantado en el año I de la Era Cristiana, a partir de un
edicto del Emperador Cesar Augusto. De acuerdo al Nuevo Testamento, durante este
recuento poblacional se produjo el nacimiento de Cristo, en momentos en que sus
progenitores se trasladaron a Belén, su lugar de residencia habitual, para empadronarse.
Este evento estuvo destinado a cuantificar la población del imperio, determinar el número
de propietarios y las propiedades que poseían como: tierras, cabezas de ganado,
esclavos y otras riquezas, por que, entre otras utilidades, sirvió para fijar impuestos. Este
levantamiento de información, de naturaleza universal, pues se aplicó en todo el imperio,
fue conocido con el nombre de censere. Esta palabra sirvió como antecedente para
denominar como censo a todo aperativo destinado a recabar información a cerca de una
población completa.
Durante el período de cerca de 10 siglos que siguió a la caída del Imperio Romano se
considera que hubo pocos eventos de naturaleza estadística de envergadura. Las
excepciones las constituyen las recopilaciones de información acerca de las tierras
propiedad de la iglesia católica desarrolladas por Pipino el Breve en el año 758 y por
Carlomagno en el año 762; además de algunos recuentos de población que de manera
parcial se levantaron en Francia en el Siglo IX.
En las postrimerías del Siglo XI, el rey Guillermo I, conocido como Guillermo el
Conquistador, encargó en el año 1086, la realización de un conteo de la población, las
propiedades, así como de la extensión y el valor de las tierras en Inglaterra. Esta
recopilación se recoge en un importante documento conocido como Domesday Book, o
1
Hernández González, Sergio. Historia de la estadística. In: Revista de divulgación científica y tecnológica
de la Universidad Veracruzana, Volumen XVIII, No. 2. Mayo-Agosto de 2005. Veracruz, 2005.
Libro del Gran Catastro, el cual se considera como el primer compendio estadístico
británico, y uno de los primeros del mundo.
Aunque Carlomagno en Francia y Guillermo el Conquistador en Inglaterra trataron de revivir
la técnica romana, los métodos estadísticos permanecieron casi olvidados durante la Edad
Media. Durante los siglos XV, XVI y XVII, hombres como Leonardo de Vinci, Nicolás
Copérnico, Galileo Galilei, William Harvey, Francis Bacon y René Descartes hicieron grandes
operaciones con base en el método científico, de tal forma que cuando se crearon los
Estados nacionales y surgió como fuerza el comercio internacional, había ya un método
capaz de aplicarse a los datos económicos.
Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a registrarse en
Inglaterra las defunciones causadas por esta enfermedad. En Francia, más o menos por la
misma época, la ley exigía a los clérigos registrar los bautismos, fallecimientos y matrimonios.
Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés comenzó a
publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en
1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenían datos sobre los
nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt compiló documentos
que abarcaban treinta años, mediante los cuales efectuó predicciones sobre el número de
personas que morirían de diversas enfermedades, así como de las proporciones de
nacimientos de hombres y mujeres que cabía esperar. El trabajo de Graunt, condensado en
su obra Natural and political observations… made upon the Bills of Mortality (Observaciones
políticas y naturales…hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo de
inferencia y teoría estadística.
Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación estadística de
los recursos nacionales, que comprendía datos acerca de la organización política,
instrucciones sociales, comercio y poderío militar. Durante el siglo XVII se aportaron
indicaciones más concretas sobre los métodos de observación y análisis cuantitativo y se
ampliaron los campos de la inferencia y la teoría estadística.
Los eruditos del siglo XVII demostraron especial interés por la estadística demográfica como
resultado de la especulación sobre si la población aumentaba, disminuía o permanecía
estática.
En los tiempos modernos, tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en
1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este
investigador se propuso destruir la antigua creencia popular de que en los años terminados
en 7 moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los
archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción, pudo
demostrar que en tales años no fallecían más personas que en los demás. Los
procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor
del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos
sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de
seguros.
Uno de los primeros trabajos sobre las probabilidades corresponde al matemático italiano del
siglo XVI Girolano Cardano, aunque fue publicado 86 años después de su fallecimiento. En el
siglo XVII encontramos correspondencia relativa a la probabilidad en los juegos de azar entre
los matemáticos franceses Blaise Pascal y Pierre de Fermat, fundamentos sobre los que
Christian Huygens, físico, matemático y astrónomo danés, publicaría un libro en 1656.
Durante ese mismo siglo y principios del XVIII, matemáticos como Bernoulli, Maseres,
Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante, durante cierto
tiempo la teoría de las probabilidades limitó su aplicación a los juegos de azar, y no fue sino
hasta el siglo siguiente que comenzó a aplicarse a los grandes problemas científicos.
Jacques Quételect es quien aplica la estadística a las ciencias sociales. Interpretó la teoría de
la probabilidad para su uso en esas ciencias y aplicó el principio de promedios y de la
variabilidad a los fenómenos sociales. Quételect fue el primero en efectuar la aplicación
práctica de todo el método estadístico entonces conocido a las diversas ramas de la ciencia.
Una vez sentadas las bases de la teoría de probabilidades, podemos situar el nacimiento de
la estadística moderna y su empleo en el análisis de experimentos en los trabajos de Francis
Galton y Kurt Pearson. Este último publicó en 1892 el libro The Grammar of Science (La
gramática de la ciencia), un clásico en la filosofía de la ciencia, y fue él quien ideó el conocido
test de Chi -cuadrado. El hijo de Pearson, Egon, y el matemát ico nacido en Polonia Jerzy
Neyman pueden considerarse los fundadores de las pruebas modernas de contraste de
hipótesis.
Pero es sin lugar a dudas Ronald Arnold Fisher la figura más influyente de la estadística,
pues la situó como una poderosa herramienta para la planeación y análisis de experimentos.
Contemporáneo de Pearson, desarrolló el análisis de varianza y fue pionero en el desarrollo
de numerosas técnicas de análisis multivariante y en la introducción del método de máxima
verosimilitud para la estimación de parámetros. Su libro Statistical Methods for Research
Workers (Métodos estadísticos para los investigadores), publicado en 1925, ha sido
probablemente el libro de estadística más utilizado a lo largo de muchos años.
Mientras tanto, en Rusia, una activa y fructífera escuela de matemáticas y estadística aportó
asimismo –como no podía ser de otro modo– su considerable influencia. Desde finales del
siglo XVIII y comienzos del XIX cabe destacar las figuras de Pafnuty Chebichev y Andrei
Harkov, y posteriormente las de Alexander Khinchin y Andrey Kolmogorov.
En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos
de las ciencias naturales y sociales, los investigadores vieron la necesidad de reducir la
información a valores numéricos para evitar la ambigüedad de las descripciones verbales.
Esquema 1
Origen y evolución de la Estadística
Surgimiento de la
Estadística
Siglo XVII
Tiempos Epoca
remotos actual
Estadística
Matemática
Sin embargo, esta nueva rama de la Estadística nació de una práctica de los nobles
ingleses de la época durante sus momentos de ocio. Los hombres pertenecientes a la
casta social de mayor estatus, entre otras formas de entretenimiento, con frecuencia eran
dados a la práctica de juegos de azar.
Mientras jugaban observaron que en los resultados de este tipo de ejercicio se producían
ciertas regularidades. Así por ejemplo, al lanzar una moneda al aire, el resultado al caer
era cara o cruz, pues eran las estampas que poseían las monedas existentes en la época
en los dos lados. Sin embargo, después de estar jugando durante un período largo
observaban que el número de veces que la moneda había caído con la cruz hacia arriba
era similar al número de veces en que el resultado había sido cara. De igual forma, a
lanzar el dado una vez su resultado era cualquiera de los números del 1 al 6, dado que
este objeto tiene 6 caras, las cuales están numeradas en forma correlativa desde 1 hasta
6. No obstante, después de un número grande de jugadas, en que el dado el dado había
sido lanzado un número grande de veces, se observaba que cada uno de los números
había salido aproximadamente un sexto (1/6) de las veces. Este tipo de comportamiento
fue observado por los nobles ingleses de mediados del Siglo XVII cuando practicaban
otros juegos de azar.
Ante las interrogantes surgidas a los nobles jugadores supusieron que estos fenómenos
podían estar relacionados con cuestiones de índole matemática, por esa razón expusieron
la situación ante algunos matemáticos de la época. Estos científicos hicieron
experimentos de laboratorio y comprobaron las observaciones de los nobles jugadores,
llegando a la conclusión de que estas regularidades seguidas por los juegos de azar
obedecen a leyes matemáticas, nominadas posteriormente como leyes de las
probabilidades. A su vez, las leyes de las probabilidades constituyen la base de la
Teoría de las Probabilidades. Finalmente, la Teoría de las Probabilidades constituyen la
piedra angular sobre la cual se basa la Estadística Matemática.
Esquema 2
Surgimiento de la Estadística Matemática
Regularidades
observadas por
los nobles
jugadores del
Siglo XVII en los
juegos de azar
Respuestas de
los matemáticos
de la época a los Teoría de las Estadística
problemas aso- Probabilidades Matemática
ciados a los
juegos de azar
2.1 Estadísticas
Las estadísticas pueden ser de naturaleza muy diversa, en función del tema o materia a la
cual hagan referencia. De esta forma se tienen:
b) Estadísticas judiciales, las cuales hacen referencia a datos relacionados con las
actividades del área judicial, como es: número de personas sometidas a la justicia
durante el año 2009 en función de la provincia; número de personas sometidas a la
justicia durante el año 2009 en función del tipo de infracción cometida; número de
tribunales existentes en la República Dominicana en función de la provincia;
número de magistrados existentes en la república Dominicana en función de la
edad; número de reos sentenciados en la República Dominicana en función de la
edad; etc.
Un inversionista está interesado en producir spaguettis con ajo, para lo cual requiere
saber si por lo menos el 10% de la población estaría dispuesto a consumirlo. Con tales
propósitos decide hacer un estudio en todo el país, para lo cual selecciona una
muestra de 5,000 hogares distribuidos en todo el territorio nacional. En esos hogares
entrevista al ama de casa, por ser la persona que comúnmente determina qué se
consume en el hogar. Si por lo menos un 10% de estas amas manifiesta su
disposición a consumir los spaguettis con ajo, entonces el inversionista decidirá
fabricar el producto.
Gregor Mendel descubrió las bases de la genética hace más de un siglo, por métodos
esencialmente estadísticos. Trabajando con guisantes, notó las características de los
padres y contó el número de hijos con determinadas características. Las regularidades
que observó lo condujeron a formular sus teorías.
Se ha escuchado la frase: Con estadística se puede probar cualquier cosa. Esto sin
embargo es falso. Lo que ocurre es que se puede hacer uso equivocado de la
Estadística como en los casos siguientes:
i) Proporción
Cuadro 1
Valor de los ingresos percibidos por los cuatros miembros de la familia
Gómez durante el mes de junio del 2005
(En dólares)
Cuadro 2
Proporción de los ingresos percibidos por los cuatros miembros de la
familia Gómez por concepto de salarios y provenientes de donaciones
regalos y bonificaciones, durante el mes de junio del 2005
(En dólares)
Entonces puede concluirse que, en general, de cada dólar que ingresó al hogar de
la familia Gómez en el mes de junio del 2005, 85 centavos provinieron del salario
percibido por cada uno de sus cuatro miembros, mientras que 15 centavos
correspondieron a las entradas provenientes de donaciones, regalos y
bonificaciones. Mientras tanto, de cada dólar que le ingresó al padre en durante el
mes, 75 centavos llegaron por concepto de salario, mientras que 25 centavos
provinieron de donaciones, regalos y bonificaciones, y de esta misma forma se
pueden interpretar las demás proporciones. Siguiendo el mismo procedimiento de
análisis se puede abordar la el origen de los ingresos de la madre, el hijo y la hija.
Cuadro 3
REPUBLICA DOMINICANA: Valor del gasto mensual de los hogares en alimentos y bebidas
no alcohólicas y en otros bienes y servicios, según región geográfica, 2007
Valor del gasto mensual de los hogares
Región geográfica Total En alimentos y En otros bienes y
bebidas servicios
Total 51,637,308,855 11,036,578,616 40,600,730,239
Región Ozama o Metropolitana 21,152,615,621 3,704,577,019 17,448,038,602
Región Norte o Cibao 18,353,750,634 4,098,582,180 14,255,168,454
Región Sur 6,707,685,474 1,921,363,875 4,786,321,599
Región Este 5,423,257,126 1,312,055,542 4,111,201,584
Fuente: Oficina Nacional de Estadística: Encuesta Nacional de Ingresos y Gastos de los Hogares, 2007. Santo Domingo, 2009.
De la misma forma que en el caso de los ingresos de los miembros del hogar de la
familia Gómez, la interpretación de los componentes del gasto de los hogares
según región se hace más fácil a través de proporciones como las expuestas en el
cuadro 4.
Cuadro 4
REPUBLICA DOMINICANA: Proporción del valor del gasto mensual de los hogares en
alimentos y bebidas no alcohólicas y en otros bienes y servicios,
según región geográfica, 2007
Proporción del gasto mensual de los hogares
Región geográfica Total En alimentos y bebidas En otros bienes y
no alcohólicas servicios
Total 1.00 0.21 0.79
Región Ozama o Metropolitana 1.00 0.18 0.82
Región Norte o Cibao 1.00 0.22 0.78
Región Sur 1.00 0.29 0.71
Región Este 1.00 0.24 0.76
De los valores de este cuadro se concluye que, en el año 2007, de cada peso gastado
mensualmente por los hogares dominicanos, 21 centavos se destinaban a la compra de
alimentos y bebidas no alcohólicas, mientras que los otros 79 centavos se gastaban en la
compra de otros bienes y servicios. A su vez, mientras que en los hogares de la Región
Sur, de cada peso gastado, 29 centavos eran usados para comprar alimentos y bebidas
no alcohólicas, en la Región Ozama o Metropolitana, de cada peso gastado, solo 18
centavos iban a la compra de estos bienes. Mientras tanto, en el Cibao Norte se
destinaban 22 centavos de cada peso se destinaban a estas compras y en el Este 24
centavos.
ii) Porcentaje
Los porcentajes constituyen una forma de expresión relativa de valores que forman parte
de un total. Esto es, la representación de las partes del total mediante unidades del 100
por ciento.
Cuadro 3
REPUBLICA DOMINICANA: Número de hogares, por tenencia de computador,
según zona, 2002
Zona Número de hogares
Total Tiene computador No tiene
Total 2,193,848 119,609 2,074,239
Urbana 1,398,614 108,613 1,290,001
Rural 795,234 10,996 784,238
Fuente: Oficina Nacional de Estadística: VIII Censo Nacional de Población y Vivienda, 2002.
Comprender el significado de esos valores puede hacerse mucho más fácil si se llevaran
a sus equivalencias en porcentajes.
Cuadro 4
REPUBLICA DOMINICANA: Composición porcentual de los
hogares, por tenencia de computador, según zona, 2002
Porcentaje de hogares
Zona Total Tiene No tiene
Total 100.0 5.5 94.5
Urbana 100.0 7.8 92.2
Rural 100.0 1.4 98.6
Fuente: Oficina Nacional de Estadística: VIII Censo Nacional de Población y Vivienda, 2002.
Porcentaje de hogares
Zona Total Tiene No tiene
Total 100.0 100.0 100.0
Urbana 63.8 90.8 62.2
Rural 36.2 9.2 37.8
Fuente: Oficina Nacional de Estadística: VIII Censo Nacional de Población y Vivienda, 2002.
De la lectura del cuadro 5 se deduce que el 63.8% de los hogares del país estaban en la
zona urbana, mientras el 36.2% restante estaba en la zona rural. A su vez, entre los
hogares que disponían de computador, el 90.8% esta en la zona urbana y el 9.2% en la
rural. Mientras tanto, de los hogares donde no había computador, el 62.2% estaba en la
zona urbana y el restante 37.8% en la zona rural.
iii) Razón
La razón es la relación por cociente entre dos valores. Por lo general, se utiliza para
establecer la magnitud de un valor frente a otro.
Ejemplo: Si se toman los datos del cuadro 3 y se dividen los de la columna tres entre los
de la columna dos entonces se obtendrá la razón del número de hogares que no tiene
computador en relación al de aquellos hogares que sí tiene. De esta forma se generaron
los resultados expuestos en el cuadro 6.
Cuadro 6
REPUBLICA DOMINICANA: Razón entre el número de hogares
que no tiene computador y el que sí tiene, según zona, 2002
Zona Razón
(No tiene/Tiene)
Total 17.34
Urbana 11.88
Rural 68.05
Fuente: Oficina Nacional de Estadística: VIII Censo Nacional de Población
y Vivienda, 2002.
De acuerdo a las razones exhibidas en el cuadro 6, a nivel nacional, por cada hogar que
tenía computador un total de 17 no disponían de este artefacto. A vez, la zona urbana, por
cada hogar que tenía, 12 no disponían del mismo; mientras que en la zona rural, por cada
hogar con computador habían 68 que no tenían.
Uno de los usos más frecuentes que se da a la proporción es su aplicación en el concepto
epidemiológico de riesgo relativo. Se trata del cociente entre dos porcentajes, dos tasas,
dos proporciones, dos índices, etc., de modo que se puede establecer el exceso del valor
de uno con relación al otro. Cuando se alude al exceso se hace referencia a cuánto mayor
que un valor es el otro, y no cuántas veces es una valor con respecto al otro. De esta
forma, si A=3 y B=3, la razón será: 3/3=1. Esto significa que si ambos valores son iguales,
entonces no hay exceso de un valor con respecto al otro, por tanto, la diferencia con
respecto a uno (1) será el exceso. Normalmente, como base para la comparación suele
tomarse al valor que representa la mejor situación.
iv) Tasa
Las tasas poseen la característica denominada intensidad, que es la fuerza con que se
produce el fenómeno en la población. En este caso será: uno por cada cien, uno por cada
mil, uno por cada diez mil, etc.
Ejemplos:
1) La tasa de desempleo de la República Dominicana en abril del 2011 era 14%. Eso
significa que en ese momento, en la República Dominicana, 14 de cada 100 personas
en condiciones para trabajar se encontraban desempleadas. Por tanto, la intensidad
del desempleo era de 14 de cada 100.
2.3.1 Redondeo
Primera regla: Si el dígito a eliminar es menor que “5”, entonces simplemente se descarta
y se le suma “1” al dígito anterior.
Ejemplos:
2) Si se quiere redondear el número 8.23 a una cifra decimal, se elimina el ‘‘3’’, quedando
entonces el número 8.2.
Ejemplos:
1) Si se quiere redondear el número 12.567 a dos cifras decimales, se elimina el dígito ‘‘7’’
y se le suma ‘‘1’’ al dígito ‘‘6’’, quedando así el número 12.57.
Ejemplos:
Ejemplos:
Debe tenerse cuidado al momento en que se decide truncar, pues si se hace con números
grandes no tiene mayores consecuencias. Por ejemplo, si se trunca el número 387.8,
entonces se convertirá en 587. La pérdida es de apenas es de 0.8, lo cual representa
apenas un 0.2%. Sin embargo si se truncase el número 2.8, se estaría despreciando un
valor de 0.8 que representa casi un 29%.
Estadística inductiva, también llamada estadística inferencial es aquella que busca dar
explicaciones al comportamiento de un conjunto de observaciones, probar la significación
o validez de los resultados; intenta descubrir las causas que lo originan, con gran
aplicación en el campo del muestreo, lográndose de esta manera conclusiones que se
extienden más allá de las muestras estadísticas mismas.
Ejemplos:
A juzgar por los las situaciones expuestas a través de los ejemplos precedentes, las
poblaciones pueden ser de naturaleza muy diversa. Pueden estar constituidas por
individuos, como las correspondientes a los ejemplos 1, 2 y 3; por objetos, como la del
ejemplo 4; o por mediciones, como la del ejemplo 5.
Toda población está definida en función las dimensiones: espacio y tiempo. De esa
forma, en el ejemplo 1, el espacio es la Universidad Autónoma de Santo Domingo y el
tiempo es el semestre 2012-1; en el ejemplo 2, el espacio es la Región Este de la
República Dominicana y el tiempo es el mes de febrero del 2012; y así sucesivamente.
Por su naturaleza, las poblaciones pueden ser de dos tipos: finitas e infinitas.
Población es finita es aquella que posee un número de elementos que puede ser contado
o estudiado. Es el caso, por ejemplo, de los estudiantes de la Universidad Autónoma de
Santo Domingo en el semestre 2012-1 o el número de viviendas de la República
Dominicana en diciembre del 2010. En ambos casos, bastaría con hacer un censo de
cada población y se podría contar a todos los elementos.
ii) Muestra. Es una parte representativa de la población, la cual se toma con el propósito
de derivar resultados de ésta sin la necesidad de estudiarla completa. La
representatividad se torna en una propiedad inherente a toda muestra y consiste en que
los elementos de ésta última posean las mismas características que el conjunto de
elementos de la población. Por tanto, la muestra será representativa en la medida que
esté compuesta por elementos pertenecientes a todos los grupos que componen la
población.
Ejemplo 1: Juan Sánchez es un investigador del área social quien está interesado en
determinar el porcentaje de jefes de hogar analfabetos en la ciudad de Aguas Claras. En
esta ciudad existe un total de 350,000 hogares, por tanto, existen 350,000 jefes de hogar.
La ciudad está compuesta por 120 barrios; 60 de ellos compuestos por hogares de clase
baja donde reside el 50% de los hogares de la ciudad; 40 barrios constituidos por hogares
de clase media, donde reside el 35% de los hogares; mientras que los 20 barrios
restantes pertenecen a clase alta, y allí reside el 15% de los hogares de Aguas Claras.
Una vez concluida la recolección de los datos se cuenta el número de jefes de hogar que
sabe leer y escribir y se determina que son 240, mientras los que saben leer y escribir son
960. Esto indicaría que el 20% de los jefes de hogar estudiados es analfabeto.
A partir del resultado anterior ¿podría decirse que el 20% de los jefes de hogar de la
ciudad de Aguas Claras es analfabeto? La respuesta es NO, porque la muestra no es
representativa, dado solo toma en cuenta hogares pertenecientes a la clase baja y resulta
que el analfabetismo es diferencial por clase social. Es decir, es más elevado, cuanto más
bajo es el grupo social al cual pertenecen las personas.
Después de visitar los 20 barrios y en cada uno haber preguntado a un grupo de jefes de
hogar si saben leer y escribir se contó el número de aquellos que saben leer y escribir y
se determinó que son solo 24, mientras los que saben leer y escribir son 1,176. Esto
indicaría que el 2% de los jefes de hogar estudiados es analfabeto.
Tomado en cuenta el resultado anterior ¿podría decirse que el 2% de los jefes de hogar
de la ciudad de Aguas Claras es analfabeto? En este caso la respuesta también es NO,
porque la muestra no es representativa, dado solo toma en cuenta hogares
pertenecientes a la clase alta.
Ejemplo 3: María García, también investigadora del área educativa, está interesada en
establecer el porcentaje de jefes de hogar de la ciudad de Aguas Claras que no sabe leer
ni escribir. Para su investigación, la señora García, de la misma forma que Sánchez y
González, tomó una muestra de 1,200 hogares, solo que ella tomó la decisión de estudiar
los cuales ha distribuido en los 20 barrios de clase alta.
Dado que en los barrios de clase baja reside el 50% de la población de la ciudad, la
señora García decidió estudiar el 50% de la muestra de los 1,200 hogares en los 60
barrios de clase baja, es decir, tomó 600 hogares y los distribuyó en esos 60 barrios. Del
mismo modo, dado que el 35% de los hogares de la ciudad reside barrios de clase media,
tomó el 35% de la muestra, es decir 420 hogares, en los 40 barrios de clase media.
Además, dado que 15% de la población de la ciudad reside en barrios de clase alta,
reservó el 15% de la muestra, es decir 180 hogares, para estudiarlos en los 20 barrios de
clase alta.
Después de visitar los 120 barrios de la ciudad y entrevistar allí los 1,200 jefes de hogar
encontró que 156 de ellos no saben leer y escribir, mientras que los 1,044 restantes sí
saben. Esto indicaría que 13% de los jefes de hogar estudiados es analfabeto.
Tomado en cuenta el resultado anterior ¿podría decirse que el 13% de los jefes de hogar
de la ciudad de Aguas Claras es analfabeto? Dado que se trata de una muestra
autoponderada, es decir, está formada por hogares de los tres grupos sociales en la
misma proporción que éstos están representados en la población, si la selección de cada
hogar se hizo respetando principios estadísticos de aleatoriedad, entonces sí podría
hacerse la afirmación de que el 13% de los jefes de hogar de la ciudad de Aguas Claras
son analfabetos, puesto que la muestra es representativa.
A través del muestreo se estudia solo a una parte de la población, con la intención de
obtener un valor que se espera sea de magnitudes similares al de ese mismo valor de la
población. A este proceso se le denomina inferencia o inducción, es decir,
procedimiento a través del cual se le atribuye a la población la propiedad observada en la
muestra.
Población
Muestra
Extracción de la muestra
Inferencia o inducción
Análisis
En el muestreo se trabaja con los resultados derivados del estudio de muestras y con
frecuencia también se alude a medidas estadísticas obtenidas a partir de los datos de una
población completa. De esa forma, hace referencia los conceptos de estimador y
parámetro.
i) Estimador. Es toda medida obtenida a partir del estudio de una muestra. De esta
forma, si con los datos de una muestra se calcula un porcentaje, ese valor será el
estimador del porcentaje; si en cambio se obtiene una proporción, entonces ese valor será
el estimador de la proporción, y si lo que obtiene es el promedio, entonces se habrá
obtenido el estimador del promedio, y así para cada medida.
ii) Parámetro. Así como el estimador es la medida calculada a partir de los datos de una
muestra, el correspondiente valor en la población se le llama parámetro, por tanto, las
medidas calculadas a partir de los datos de toda la población son parámetros. Por tanto,
si a partir de los datos de la población completa se calcula el porcentaje, entonces se
habrá obtenido el parámetro del porcentaje; si en cambio, lo que se calcula es la
proporción, se habrá obtenido el parámetro de la proporción; y si lo que se calcula es el
promedio se habrá obtenido el parámetro del promedio.
Ejemplo: Juana Castro, estudiosa del tema de las comunicaciones está interesada
en establecer el porcentaje de hogares de la ciudad de Las Lavas que posee
internet. En la ciudad existe un total de 4,000 hogares y ella decide hacer un censo,
es decir, los estudiará a todos, de modo que visitará a cada hogar y allí preguntará
si existe servicio de Internet. Luego de la visita a los hogares contó aquellos donde
le informaron que ‘‘poseen’’, así como los que ‘‘no poseen’’. Los que ‘‘poseen’’ son
800, mientras que los que ‘‘no poseen’’ son 3,200. Esto significa que el 20% de los
hogares de la ciudad de Las Lavas dispone de servicios de internet.
Para usar muestreo lo primero que debe hacerse es construir el marco de muestreo, el
cual consiste en la lista o mapa contentivo de todas las unidades que constituyen la
población a ser estudiada. Como parte de la construcción del marco muestral, conviene
que cada elemento de la población está identificado con un número único e irrepetible.
Por esta razón, lo que se hace es numerar las unidades en forma correlativa desde 1
hasta n, siendo n el número total de elementos que componen la población en estudio.
Dependiendo de que la selección de la muestra se haga o no mediante procedimientos
basados en el azar, el muestreo puede ser de dos tipos: aleatorio y no aleatorio.
Primero. Elabora una lista con los nombres de los 50 estudiantes del curso y le
coloca un número a cada estudiante, comenzando con el 1 al lado del nombre
del primer estudiante, el 2 al lado del nombre del segundo estudiante, el 3 al
lado del nombre del tercer estudiante hasta terminar con el número 50 al lado
del nombre del último estudiante. De esta forma habrá construido el marco de
muestreo, como se muestra a continuación:
Columnas
Filas 01 a 05 06 a 10 11 a 15 16 a 20 21 a 25 26 a 30 31 a 35 36 a 40 41 a 45 46 a 50
01 54463 22662 65905 70639 79365 67382 29085 69831 47058 08186
02 15389 85205 18850 39226 42249 90669 96325 23248 60933 22927
03 85941 40756 82414 02015 13858 78030 16269 65978 01385 15345
04 61149 69440 11286 88218 58925 03638 52862 62733 33451 77455
05 05219 81619 10651 67079 92511 59888 84502 72095 83463 75577
06 41417 98326 87719 92294 46614 50948 64886 20002 97365 30976
07 28357 94070 20652 35774 16249 75019 21145 05217 47286 76305
08 17783 00015 10806 83091 91530 36466 39981 62481 49177 75779
09 40950 84820 29881 85966 62800 70326 84740 62660 77379 90279
10 82995 64157 66164 41180 10089 41757 78258 96488 88629 37231
11 96754 17676 55659 44105 47361 34833 86679 23930 53249 27083
12 34357 88040 53364 71726 45690 66334 60332 22554 90600 61113
13 06318 37403 49927 57715 50423 67372 63116 48888 21505 80182
14 62111 52820 07243 79931 89292 84767 85693 73947 22278 11551
15 47534 09243 67879 00544 23410 12740 02540 54440 32949 13491
16 98614 75993 84460 62846 59844 14922 48730 73443 48167 34770
17 24856 03648 44898 09351 98795 18644 39765 71058 90368 44104
18 96887 12479 80621 66223 86085 78285 02432 53342 42846 94771
19 90801 21472 42815 77408 37390 76766 52615 32141 30268 18106
20 55165 77313 83666 36028 28420 70219 81369 41943 47366 41067
21 75884 12952 84318 95108 72305 64620 31318 89872 45375 85436
22 16777 37116 58550 42958 21460 43910 01175 87894 81378 10620
23 46230 43877 80207 88877 89380 32992 91380 03164 98656 59337
24 42902 66892 46134 01432 94710 23474 20423 60137 60609 13119
25 81007 00333 39693 28039 10154 95425 39220 19774 31782 49037
26 68089 01122 51111 72373 06002 74373 96199 97017 41273 21546
27 20411 67081 89950 16944 93054 87687 96693 87236 77054 33848
28 58212 13160 06468 15718 82627 76999 05999 58680 96739 63700
29 70577 42866 24969 61210 76046 67699 42054 12696 93758 03283
30 94522 74358 71659 62038 79643 79619 44741 05437 39038 13163
31 42626 86819 85651 88678 17401 03252 99547 32404 17918 62880
32 16051 33763 57194 16752 54450 19031 58580 47629 54132 60631
33 08244 27647 33851 44705 94211 46716 11738 55784 95374 72655
34 59497 04392 09419 89964 51211 04896 72882 17805 21896 83864
35 97155 13428 40293 09985 58434 01412 69124 82171 59058 82859
36 98409 66162 95763 47420 20792 61527 20441 39435 11859 41567
37 45476 84882 65109 96597 25930 66790 65706 61203 53634 22557
38 89300 69700 50741 30329 11658 23166 05400 66669 48708 03887
39 50051 95137 91631 66315 91428 12275 24816 68091 71710 33258
40 31753 85178 31310 89642 98364 02306 24617 09609 83942 22716
41 79152 53829 77250 20190 56535 18760 69942 77448 33278 48805
42 44560 38750 83635 56540 64900 42912 13953 79149 18710 68618
43 68328 83378 63369 71381 39564 05615 42451 64559 97501 65747
44 46939 38689 58625 08342 30549 85863 20781 09284 26333 91777
45 83544 86141 15707 96256 23068 13782 08467 89469 93842 55349
46 91621 00881 04900 54224 46177 55309 17852 27491 89415 23466
47 91896 67126 04151 03795 59077 11848 12630 98375 52068 60142
48 55751 62515 21108 80830 02263 29303 37204 96926 30506 09808
49 85156 87689 95493 88842 00664 55017 55539 17771 69448 87530
50 07521 56898 12236 60277 39102 62315 12239 07105 11844 01117
Una vez seleccionada la fila de inicio, se selecciona el número de la
columna cuya intersección con la fila 18 determinará el punto de partida de
la selección de la muestra. Dado que la tabla también tiene 50 columnas,
pueden usarse los mismos papelitos. Considere que al hacer la extracción
se sacó el papelito cuyo número es 12. Esto indica que la selección inicia a
partir del número correspondiente a la fila 18 y columna 12, es decir, con el
dígito 0 marcado en la tabla.
Primero. Se definen los estratos, los cuales no son más que grupos de
unidades en cuyo interior se supone que el fenómeno se comporta sin
variaciones de consideración.
El señor Jiménez piensa que una forma ágil de conducir su estudio es pedirle al
Director de Agricultura en cada provincia, que le seleccione las personas que él
debe entrevistar en cada una. Así, si la distribución que él hizo de la muestra le
dice que debe entrevistar 10 empleados en Barahona, entonces le pedirá al
Director Provincial de Agricultura en Barahona que le seleccione 10 empleados,
pues su equipo de trabajo irá a entrevistarlos allá en una fecha convenida.