Professional Documents
Culture Documents
UNIDAD I
LA ESTADSTICA EN LA INVESTIGACIN
INTRODUCCIN - DEFINICIONES
La concepcin profana de la Estadstica suele incluir la recopilacin de grandes
masas de datos y su presentacin en cuadros y grficos adems puede incluir tambin
el clculo de totales, promedios, porcentajes, etc.. Esta concepcin tiene unos sesenta
aos de retraso, estas operaciones ms o menos rutinarias constituyen solamente parte
incidental de la Estadstica de hoy.
La Estadstica es la ciencia de la experimentacin; el conocimiento de las
Tcnicas Estadsticas ayuda a tratar datos experimentales y a programar experimentos
de una forma ms eficiente.
Describiremos la Estadstica como la tecnologa del mtodo cientfico que
proporciona instrumentos vlidos para la toma de decisiones cuando prevalecen
condiciones de incertidumbre. Estos instrumentos pueden ser de aplicacin
completamente general y tiles en cualquier campo de la ciencia: fsico, biolgico
social.
Sin discutir lo que se entiende por mtodo cientfico, recordemos sus tres
aspectos principales:
- Ejecucin de experimentos.
- Obtencin de conclusiones objetivas a partir de los experimentos.
- Construccin de leyes que simplifiquen la descripcin de conclusiones fundadas
en amplias clases de experimentos.
La Estadstica Descriptiva est relacionada principalmente con los dos primeros de estos
aspectos que se define:
La Estadstica Descriptiva se puede definir cmo los mtodo que implican
la recoleccin, presentacin y caracterizacin de un conjunto de datos a fin de
describir en forma apropiada las diversas caractersticas de ese conjunto de
datos.
Cuando la finalidad al recopilar informacin deja de ser una actividad solamente
de descripcin de la muestra y lo que se desea es estimar parmetros poblacionales en
base a esos datos observados, teniendo como base la Teora de Probabilidades, esta
actividad define la Estadstica Inferencial.
La Estadstica Inferencial se puede definir cmo los mtodos que
posibilitan la estimacin de una caracterstica de una poblacin o la toma de
una decisin concerniente a una poblacin, trabajando con la informacin
obtenida a partir de una muestra
Definiciones
Poblacin estadstica o universo objeto de estudio, al conjunto de todos los
elementos (personas, animales o cosas) que presentan una o varias caractersticas
definidas, susceptibles de ser observadas: La poblacin queda especificada cuando se
han determinado las caractersticas que la definen, quedando establecido el marco
poblacional al enumerar, de ser posible, sus elementos.
Muestra a un subconjunto de elementos pertenecientes a una poblacin, en la
cual se estudian sus caractersticas; dicha muestra debe ser obtenida de forma.
Unidad Estadstica es cada uno de los elementos que compone la poblacin, por
lo tanto los elementos que componen la muestra tambin son unidades estadsticas.
Variables es cada una de las caractersticas que se le miden u observan a cada
unidad estadstica.
Estadstica Descriptiva
Ctedra Estadstica
Dato es el valor que asume la variable en cada unidad estadstica, deben ser
nmeros que pueden ser comparados, analizados e interpretados y deben estar
presentados en forma ordenada y sistemtica.
Parmetro es el valor que asume la variable en la poblacin (caracterstica de la
poblacin).
Estadstico es el valor que asume la variable en una muestra.
Modelo: es una idealizacin de la realidad (no es una frmula mgica, es un
instrumento). El estadstico considera la probabilidad como una idealizacin de la
proporcin de veces que se presenta un determinado resultado en las pruebas repetidas
de un experimento; luego, un modelo de probabilidad es el tipo de modelo matemtico
elegido por l.
MUESTRA
Es evidente que el empleo de una muestra es el nico medio que permite estudiar una
poblacin infinita o finita pero muy extensa. An en el caso de poblaciones finitas que
podran ser abarcadas en su totalidad, el uso de muestras suele tener ventajas pues no
slo economiza esfuerzos, sino que permite obtener informacin ms detallada que la
que se puede conseguir mediante un examen global de toda la poblacin, reduce costos
y tiempo. En algunos casos se hace imprescindible: aquellos en que el estudio sea
destructivo, por ejemplo a los efectos de calcular el voltaje necesario para que un
dispositivo elctrico falle.
Por supuesto que no siempre se va a recomendar el uso de las muestras. En
ciertos casos, la muestra tiene que ser tan grande que habr pequeas diferencias entre
emplear un censo completo o un muestreo. Es evidente que en el caso de que la
informacin requerida sea sobre todas las unidades individuales, ello no se puede
obtener sino mediante un censo completo. Un factor que evidencia la decisin de usar o
no el muestreo, es la relativa dificultad y costo en organizarlo, ya sea el muestreo o el
censo completo. La cantidad de trabajo y el gasto requerido por unidad para recolectar
informacin, es siempre mayor mediante una muestra que mediante un censo completo.
Toda recopilacin de informacin por muestreo presenta sus propias dificultades,
algunas de ellas, ajenas a los censos completos.
Los errores: afectan los resultados de una investigacin por muestreo, y son
esencialmente de dos tipos distintos.
errores de muestreo
otros errores:
i) errores tendenciales
ii) errores accidentales
Estadstica Descriptiva
Ctedra Estadstica
La Teora de Muestreo busca desarrollar mtodos de seleccin de muestras y
mtodos de estimacin, que proporcionen el menor costo posible, y tambin, valores
estimados que sean lo suficientemente precisos para nuestros propsitos.
Existe una clasificacin de las muestras, en dos grupos:
a) Muestras Probabilsticas: son extradas mediante mtodos de seleccin basados en
la Teora de Probabilidades, y son los nicos mtodos que nos proveen de una
medida de la precisin.
b) Muestras Dirigidas o No probabilsticas: son extradas mediante un muestreo
dirigido, pero no son recomendables pues los errores de muestreo no pueden
calcularse partiendo de la muestra, sino que deben fijarse por propio
discernimiento.
Un mtodo de muestreo, si ha de ser til, debe dar una idea precisa del grado
probable de error que se tendr al hacer una estimacin a partir de una muestra.
La precisin de los resultados obtenidos de la muestra, no slo depende del
tamao de la misma, sino tambin de otras partes del diseo de la muestra, como lo
son: el modo en que la muestra es seleccionada, y el modo en que se realizan las
estimaciones.
Una de las medidas que proporciona la magnitud del error del muestreo es el
error estndar del estimador, que a la vez, da una medida de la seguridad de la
estimacin de la muestra.
Tamao de la Muestra: su clculo vara segn el tipo de muestreo, dependiendo
del error que se admite en las estimaciones, de la probabilidad de dicho error, de el o los
parmetros a estimar y de sus variancias, y en algunos casos, del costo del muestreo.
Mtodo de Seleccin de Muestras: La seleccin de la muestra debe realizarse de
manera tal que sta resulte representativa de toda la poblacin. Previo a la eleccin del
mtodo de muestreo a utilizarse, debe tenerse una idea sobre el material del que se
dispone; es decir, debe conocerse la infraestructura para poder as definir la poblacin
que se va a estudiar, y hacer posible la identificacin de cada una de las unidades de
muestreo. Esta informacin puede estar constituida por mapas, como tambin por listas
de industrias de comercios con sus respectivas direcciones. La calidad y naturaleza de
esta informacin determina en gran parte el mtodo de seleccin de la muestra, como
as tambin su costo y la fiabilidad de las estimaciones obtenidas.
Las Unidades de Muestreo pueden definirse como los elementos o partes en que
se divide la poblacin, y sobre las cuales quiere estimarse una varias caractersticas.
La suma de todas las unidades de muestreo debe comprender el total de la poblacin.
Debe hacerse una distincin entre unidades de muestreo y unidades de
relevamiento.
-
Estadstica Descriptiva
Ctedra Estadstica
La poblacin es el agregado de los elementos, y los elementos son las unidades
bsicas que forman y definen la poblacin. Esta debe definirse en trminos de: a) el
contenido; b) las unidades; c) la extensin, y d) el tiempo. Por ejemplo, en el diseo de
una encuesta de las expectativas de consumidores se podra especificar: a) todas las
personas; b) en unidades familiares; c) en todo un pas, y d) en 1972. A menudo debe
redefinirse la poblacin deseada para obtener una poblacin de encuesta que sea
factible. Por ejemplo, lo anterior podra redefinirse como: a) todas las personas mayores
de 18 aos de edad que vivan en viviendas particulares, b) en unidades de gasto, c) en
determinada regin de un pas, d) el 1' de enero de 1972.
Una encuesta puede dar informacin acerca de varias y diversas poblaciones. La
misma encuesta puede abarcar contenidos diferentes. Por ejemplo, una encuesta de
accidentes en el hogar puede proporcionar informacin acerca de accidentes aislados,
personas lesionadas en accidentes, familias que han sufrido accidentes, y hogares con
accidentes. Se pueden formar unidades diferentes con los mismos datos. Los datos
acerca de consumidores pueden presentarse en trminos de personas, unidades de
gasto, familias o viviendas. Las extensiones (espacios) diferentes aparecen
generalmente en forma de subclases para las que preparan a menudo los resultados de
la encuesta. Las divisiones pueden ser geogrficas, como para datos regionales, o
pueden no serlo, como sucede en las subclases de edades u ocupaciones.
Las caractersticas de los elementos de la poblacin se transforman en variables
mediante las operaciones de medicin de la encuesta. Esto nos permite hablar de
muchas variables (Xi,Yi,Zi,Pi, etc.) de un mismo elemento. Podemos considerar tambin
las relaciones entre las variables de un elemento, los cambios de variables y la exactitud
de las mediciones de las variables. Una estadstica basada en las variables encontradas
en una muestra es una variable aleatoria.
Una misma encuesta puede usar diferentes clases de unidades de muestreo, y en
muestreo polietpico se usa una jerarqua de unidades de muestreo o conglomerados,
de manera que el elemento pertenezca nicamente a una unidad de muestreo en cada
etapa. Por ejemplo, una muestra de los habitantes de un Estado puede tomarse al
seleccionar sucesivamente los municipios, las localidades, los segmentos, las viviendas
y, finalmente, las personas. La poblacin es tambin un agregado de las unidades de
muestreo especificadas para cada etapa. Las unidades de listado (listados) se usan para
identificar y seleccionar unidades de muestreo a partir de listas. Los problemas pueden
ser serios si los elementos no se identifican unvocamente con los listados. Por ejemplo,
una muestra de familias tomada de listados de telfonos puede involucrar serias
dificultades.
La investigacin emprica puede hacerse de diferentes maneras: por medio de
observaciones casuales, de observaciones controladas, de experimentos o de encuestas.
Aqu se tratar el muestreo de encuestas. La investigacin por medio de encuestas tiene
por objetivo estimar valores especficos de la poblacin. Un valor de la poblacin es una
expresin numrica que sintetiza los valores de una o varias caractersticas de los N
elementos de una poblacin completa; es una medida resumida de una cualidad de la
distribucin de la variable o variables en la poblacin definida.
El valor de la muestra, o estadstica, es una estimacin que se calcula a partir de
los n elementos en la muestra. La media de los elementos de la muestra es una variable
aleatoria, que depende del diseo de la muestra y de la combinacin particular de los
elementos que resultaron seleccionados. Por tanto, la estimacin que se hace es
solamente una de las que pudieron haberse obtenido con el mismo diseo de muestra.
Por el contrario, el valor de la poblacin depende de los N valores en dicha poblacin. Es
una constante independiente de las fluctuaciones de la seleccin, aunque por lo general
se desconozca.
Estadstica Descriptiva
Ctedra Estadstica
Procedimientos de seleccin de elementos
Se puede considerar como muestra cualquier censo del 100% por dos razones.
Segn el grado en que est sujeto a errores de observacin, el valor de la poblacin
obtenido de un censo es solamente uno de los muchos que pudieran haber resultado de
realizar esencialmente las mismas operaciones.
Muestreo de encuestas, o el muestreo de poblacin, estudia los mtodos para
seleccionar y observar una parte (muestra) de la poblacin con el fin de hacer
inferencias acerca de toda la poblacin. Una muestra puede tener varias ventajas sobre
un censo completo: a) economa; b) rapidez y oportunidad; c) posibilidad de hacerse
(si la observacin es destructiva, el empleo de un censo no es prctico); d) calidad y
precisin (en algunas situaciones no hay dinero suficiente para pagar el personal
adiestrado y los supervisores necesarios para realizar un buen censo, o aun para obtener
una muestra grande).
Por otra parte, los censos completos poseen ventajas especiales en algunas
situaciones: a) se pueden obtener datos para unidades pequeas; b) la aceptacin
pblica es ms fcil de alcanzar para datos completos; c) la colaboracin y la respuesta
del pblico se pueden obtener ms fcilmente; d) el sesgo de cobertura puede ser ms
fcil de evaluar y de reducir; e) no se requieren estadsticos expertos en muestreo.
Un campo importante del muestreo que est ms all del alcance del muestreo
de encuestas es el del control de calidad. ste trata del muestreo de aceptacin
mediante inspeccin de lotes; esto es consiste en tomar una muestra de cada lote para
juzgar si concuerda con la calidad para todo el universo. Para ello, se hace uso frecuente
del muestreo secuencial, en donde el tamao de la muestra depende de los resultados
de selecciones sucesivas. Pero, en general, los procedimientos de recoleccin
procesamiento y anlisis de las encuestas son largos y complicados poco aptos para ser
utilizados en muestreo secuencial.
El muestreo de encuestas se concentra en el estudio de muestras probabilsticas
para estimar valores de la poblacin.
Frecuentemente hacemos inferencias acerca de poblaciones de muestras
informales y arbitrarias: juzgamos una canasta de uvas probando una de ellas- un
comprador acepta un envo despus de inspeccionar unos cuantos artculos que escoge
casualmente. Hay mucha investigacin en las ciencias fsicas y biolgicas que se basa
en elementos seleccionados de una manera casual. Los investigadores suponen, vaga e
implcitamente, que se han seleccionado elementos tpicos. Esperan que las
caractersticas importantes se distribuyan uniforme o aleatoriamente en la poblacin.
Estos son ejemplos simples de muestreo, que se basa en suposiciones muy amplias
acerca de la distribucin de las variables de la encuesta de la poblacin.
Se pueden distinguir varias formas de muestreo.
MUESTREO PROBABILSTICO Y MUESTREO NO PROBABILSTICO
El muestreo probabilstico se caracteriza porque cada elemento de la poblacin
tiene una probabilidad conocida y no nula de ser seleccionada. La seleccin se hace por
un proceso de aleatorizacin y el valor de la probabilidad se determina de acuerdo a la
naturaleza del diseo muestral.
Se llama muestreo no probabilstico a cualquier mtodo de muestreo en que la
oportunidad de escoger un elemento determinado de la poblacin es desconocida,
independientemente de que existan o no otras especificaciones.
Estadstica Descriptiva
Ctedra Estadstica
Muestreo No Probabilstico
El muestreo de poblaciones mviles suele depender de mtodos de capturamarca-recaptura. La poblacin total se estima de la proporcin de los individuos en la
recaptura (insectos, peces, venados ), que han sido capturados previamente y
marcados. Hay modelos tericos ingeniosos que se utilizan para expresar en forma
explcita las suposiciones del mtodo.
Estos tipos diferentes de muestreo de modelos varan muy ampliamente en grado
y rea de justificacin. Sin embargo, tienen en comn gran dependencia en la validez de
suposiciones muy amplias acerca de las distribuciones de las variables de encuesta en la
poblacin. Por lo contrario, a partir de los resultados de un muestreo probabilstico ideal,
pueden hacerse las inferencias a la poblacin enteramente por mtodos estadsticos, sin
suposiciones acerca de las distribuciones de la poblacin. Se evita la necesidad de
suposiciones de aleatorizacin de la poblacin al introducir la aleatorizacin en el
procedimiento de seleccin. En forma semejante, al jugar a las cartas y en las loteras,
en lugar de confiar en el juicio del que da las cartas para obtener una distribucin justa
insistimos en que se barajen abierta y cabalmente las cartas, y en que las fichas de la
lotera se mezclen de la misma manera.
Estadstica Descriptiva
Ctedra Estadstica
Muestreo Probabilstico
En el muestreo probabilstico, cada elemento de la poblacin tiene una
probabilidad conocida y no nula de ser seleccionado; esto implica conocer el
tamao de la poblacin.
Las propiedades deseadas e idealizadas de las muestras probabilsticas
solamente pueden realizarse en forma aproximada, puesto que se introducen muchas
imperfecciones en la ejecucin real de muestras prcticas.
Por tanto, en la inferencia de valores de la muestra a valores de la poblacin
tambin intervienen suposiciones acerca de los posibles efectos de las imperfecciones;
pero a menudo podemos investigar, reducir con xito y poner algunos lmites a los
efectos posibles o probables de las imperfecciones. Por tanto, es til y se justifica
utilizar los muestreos probabilsticos ya que poseen ventajas con respecto a los no
probabilsticos.
Muestro Estratificado
Muestreo Sistemtico
Estadstica Descriptiva
Ctedra Estadstica
I denota una tienda independiente y C denota una tienda de la cadena. Ha de
hacerse un muestreo sistemtico de una de cada cinco tiendas.
Con un procedimiento de muestreo sistemtico, se obtendra bien la totalidad de
la muestra en tiendas independientes (cuatro veces de cada cinco) o la totalidad en
tiendas en cadena (una vez de cada cinco). Debido a que la lista contiene una
periodicidad igual a un mltiplo del intervalo de muestreo (uno en cinco),ese
procedimiento de muestreo dara un intervalo de muestreo fuera de 1 en 10,1 en 20, o
en cualquier otro mltiplo de cinco, la dificultad seguira persistiendo.
Una variacin del muestreo sistemtico que podra utilizarse cuando existe algn
ordenamiento peridico en la poblacin consiste en aplicar, dentro de cada intervalo de
muestreo, un nmero al azar distinto.
Muestreo de reas
Estadstica Descriptiva
Ctedra Estadstica
como son los perros, las heladeras o jardines. El muestreo por reas tambin se emplea
para seleccionar muchas clases de muestras adems de las de viviendas: tiendas,
granjas, cosechas y flora; tambin la fauna, aunque por su movilidad agrega nuevas
complicaciones. El muestreo por reas constituye un marco conveniente y efectivo para
las viviendas y las personas, esto se debe a varias razones, a) El empleo de mapas
permite identificar claramente a toda la poblacin de viviendas (elementos) con una
lista definida de manzanas y segmentos (conglomerados).
b) Esta identificacin posee permanencia, durante el periodo de encuesta a partir del
momento del listado, c) El trabajador de campo puede identificar con rapidez y claridad
las fronteras de manzanas y segmentos, y a las viviendas dentro de ellos, d) La vivienda
sirve de medio conveniente para el muestreo de personas, puesto que se identifica con
facilidad, es relativamente estable, suele contener pocas personas, y se puede
identificar, de manera nica, a toda persona con una sola vivienda. En consecuencia, la
vivienda sirve de unidad de muestreo nica e identificable para un conglomerado
pequeo de personas, y de otras poblaciones que puedan asociarse fcilmente con las
viviendas.
Las caractersticas del modelo que son deseables estn sometidas a
imperfecciones y excepciones enfadosas que pueden conducir a sesgos de seleccin.
Hace falta tener buenas instrucciones para reducirlas a proporciones manipulables, y el
investigador debe buscar las mejores soluciones prcticas dentro de los recursos de que
disponga
Estadstica Descriptiva
Ctedra Estadstica
- La realizacin de experimentos e investigaciones.
- La obtencin de conclusiones objetivas y generalizaciones de las mismas a partir
de la realizacin de los experimentos e investigaciones.
- La construccin de leyes que simplifiquen la descripcin de esas conclusiones para
ampliar las distintas clases de experimentos.
A la Estadstica le interesan los dos primeros puntos mencionados. e interviene
mediante el seguimiento ordenado de varias fases. Antes de seguir avanzando,
siguiendo a Blalock, sealemos que: "UN ANLISIS ESTADSTICO, POR MUY
ELABORADO QUE SEA, RARAMENTE O NUNCA LLEGARA A COMPENSAR LA FALLAS DE
UN PROYECTO MAL CONCEBIDO O DE UN INSTRUMENTO DE RECOLECCIN DE DATOS
DEFICIENTES".
Sin pretender dar un esquema rgido, podemos considerar las siguientes etapas
metodolgicas:
1- Formulacin o definicin del problema: La investigacin estadstica comienza
plantendose el objeto a investigar. Una vez que conoce el objeto de la investigacin,
debe formular el problema en la forma ms precisa y completa posible para poder
determinar cules sern los datos ms relevantes y necesarios para la puesta en marcha
de la investigacin. Esta formulacin puede hacerse a priori, en cuyo caso deber estar
claramente enunciada y se podr pasar directamente a la etapa siguiente. Si se falla en
este anlisis previo es posible que se utilicen datos totalmente innecesarios que no
hagan a la investigacin, y se omitan o dejen de lado otros relevantes de importancia
bsica.
Como cualquier otro proceso de elaboracin, adems del aspecto operativo, es
necesario saber con que materia prima se trabajar, que equivaldra en el tema que nos
ocupa, a definir que datos deben obtenerse a partir de las conclusiones estadsticas
dependern bsicamente de los datos, los que a su vez dependen de la precisin en la
formulacin del objeto en estudio.
2- Diseo del experimento: Formulado o definido el problema con precisin,
pasamos a esta segunda etapa que hace a la decisin sobre los aspectos de la
investigacin que se refieren al experimento en s.
La decisin tendr que tomarse en primer lugar respecto a si se va a estudiar
toda la poblacin, en cuyo caso deber hacerse una enumeracin completa o censo; o
bien estudiar una parte representativa de esa poblacin, para lo que se usar una
muestra.
En el caso de censo o relevamiento de la poblacin total, no realizaremos
ninguna discriminacin; este procedimiento es el que nos proporciona una informacin
completa y confiable, pero tambin resulta ms oneroso ya que se necesita mayor
cantidad de personas y material.
En el caso del muestreo o eleccin de una parte de la poblacin total, la
confiabilidad es menor, pero es menos costoso y podemos incluir mayor cantidad de
datos.
Cul es la razn por la que el investigador social utiliza muestras? Adems de
las que hemos mencionado, el investigador frecuentemente se encuentra en la situacin
de disponer de gran cantidad de datos, resultndole imposible absorberlos a todos, y
tampoco puede comprender intuitivamente lo que los datos contienen. En este caso se
debe entonces resumir, y lo hace empleando medidas de clculo que le permiten
sustituir la masa total de informacin por algunas pocas cantidades. Al reducir, deben
indicarse claramente las limitaciones a las que queda sujeta la informacin reducida.
En esta situacin lo que se busca es tratar de hacer una inferencia sobre la base
de la informacin proporcionada por la muestra acerca de la poblacin de la que se ha
Estadstica Descriptiva
10
Ctedra Estadstica
extrado la misma. Luego, obtener una muestra representativa es fundamental en Teora
Estadstica; ello supone preguntas como estas:
* Qu tipo de datos se van a recopilar? Cules variables permiten trabajar
operativamente el problema?
* Cmo se obtendr la informacin?
* De qu tamao debe ser la muestra?
* Qu mtodo de seleccin de muestra va a aplicarse?
Estas preguntas son resueltas por lo que se conoce como Diseo de Muestras o
Diseo de Experimentos. El riesgo que se corre de no cumplimentar correctamente esta
etapa, es que no se llegue a ninguna conclusin vlida en la investigacin encarada.
En el caso de que sea necesario reunir informacin procedente de personas, la
confeccin del cuestionario tambin constituye una parte importante del diseo
experimental.
Finalmente corresponde a esta etapa la elaboracin del Plan Tabulatorio, en
directa relacin con las hiptesis establecidas en al etapa anterior.
Resumiendo, la importancia fundamental del Diseo Experimental radica en que
provee las pautas generales que dirigirn la realizacin del experimento eliminando y
disminuyendo al menor grado posible los efectos extraos que no hacen a la
investigacin en s, y posibilita la utilizacin de tcnicas para analizar los resultados de
modo tal que no se vean mezclados los efectos de los factores en estudio con los de
aquellos factores que no interesan a la investigacin.
Adems esta es una etapa decisiva porque es la que asegura que experimento
cumpla con la condicin de aleatoriedad siendo esta la clase de experimentos propios de
la Estadstica, ya que permitan hacer inferencias.
3 -Recopilacin de la informacin: Esta etapa es costosa y rutinaria, en su
desarrollo y estudio se debe emplear generalmente mucho tiempo y personal auxiliar.
Consiste en recopilar o recoger aquella informacin que se adecua al problema
que nos interesa, respetando los lmites que hemos impuesto en las etapas anteriores.
Algunas veces el estudioso se servir de datos disponibles dentro del medio en
que estudia. En otras ocasiones, la recopilacin la efectuarn de materiales publicados,
ya sean peridicos, semanarios econmicos, revistas especializadas, publicaciones
estadsticas oficiales o privadas, etc. En estos casos la recopilacin no involucra grandes
costos ni emplea gran cantidad de tiempo, pero por lo general nos encontramos con que
el problema no es tan simple, ya que se necesita una informacin que no nos es fcil
encontrar, en las formas antes mencionadas, debiendo recoger los datos estadsticos de
la fuente primaria que los origina.
De este modo se puede decir que los datos se recogen de distintas fuentes:
Fuente Directa: cuando los datos son obtenidos
directamente por el
investigador que realiza el relevamiento estadstico. Tema que ms adelante
se explicitar.
Fuente Indirecta: cuando nos valemos de estudios realizados por otros, ya
sean estudios particulares o de organismos oficiales, pudiendo estar
publicados o no.
La fuente indirecta podr ser a su vez: Fuente Primaria, cuando existe una sola
fuente, vale decir, que los datos provienen de un slo recopilador o estudio anterior, que
fue el que originalmente los recogi. Y Fuente Secundaria, cuando los datos han sufrido
una reimpresin realizada por un organismo ajeno al recopilador primigenio .
Al llegar a este punto, es necesario aclarar que la fuente primaria es ms
confiable que la secundaria, generalmente est exceptuada de errores propios de la
Estadstica Descriptiva
11
Ctedra Estadstica
trascripcin , las fuentes primarias no omiten informacin explicitada referente a
trminos, unidades, mtodos utilizados, etc. Al ofrecer ms detalle no omite categoras.
Las fuentes en general deben proporcionar dos elementos de gran importancia:
- Seguridad del dato: o sea que debe ser preciso y confiable , debe utilizarse
un mtodo de muestreo que proporcione una muestra representativa, la
recopilacin usar mtodos imparciales, tabulacin correcta, etc.
- Las fuentes debern ser susceptibles de comparacin, para ello debern
usar las mismas definiciones e igual mtodo de clculos.
Recabar informacin de primera mano (fuente directa) es una de las tareas
importantes con que tiene que enfrentarse el estadstico. Aunque no se vean en la
necesidad de recurrir a la fuente directa para obtener un dato original, sino que lo
obtengan de fuentes ya existentes, el conocimiento del procedimiento a seguir en estos
casos, ser til para hacer un uso inteligente de la informacin estadstica disponible.
Hay dos mtodos de Relevamiento Estadstico:
Relevamiento dinmico: se refiere a los datos obtenidos en operaciones que se
realizan en forma continuada a travs del tiempo y de modo sistemtico
ininterrumpidamente. Podran ser Registros Permanentes como el Registro Civil, la
informacin se proporciona a la autoridad competente cuando ocurre el hecho. La
informacin tambin puede ser interna o sea registros que lleva el mismo organismo
que hace el estudio. O tratarse de muestreos por ejemplo de una lnea de produccin
llamados registro secuencial.
Relevamiento esttico: El procedimiento puede describirse en las siguientes
etapas:
- Elaboracin de un plan general, que incluye ver lo que han hecho otras personas,
reflexionar sobre aspectos generales de lo que se deseara saber, determinar el
marco de la poblacin, determinar el lugar donde se realizar la entrevista, si se
enviar el cuestionario por correo, ver el aspecto legal, etc.
- Formulacin de preguntas y redaccin del cuestionario: hay que considerar que no
pueden incluirse todas las preguntas que quisiramos obtener respuestas. Una
vez seleccionados los puntos que se incluirn, se formularn las preguntas de
modo que puedan ser contestadas con rapidez y exactitud.
En gran medida, el xito de una investigacin depende de la eficiencia del
cuestionario elaborado para la obtencin de datos. Los factores que hay que tener en
cuenta en la preparacin de un cuestionario son numerosos. Puesto que la claridad del
cuestionario es un requisito esencial, habrn de tenerse en cuenta algunas
consideraciones para que las preguntas puedan ser respondidas con rapidez y exactitud.
* No fiarse de la memoria del entrevistado: las preguntas deben limitarse al pasado
inmediato, ayudando al entrevistado a retroceder paso a paso en el tiempo,
recordando la informacin que interesa.
* No hacer preguntas que obliguen al entrevistado a hacer clculos. Es necesario
concretar la pregunta para obtener contestaciones ms exactas con mayor
facilidad.
* Evitar preguntas embarazosas formularlas de manera que se logre la respuesta
en forma indirecta.
* No hacer preguntas que impliquen la respuesta.
* Insertar un conjunto de posibles respuestas entre las que pueda elegir la que ms
concuerde con su opinin, para los casos en que la pregunta no pueda ser
contestada con exactitud.
* Incluir preguntas que puedan complementarse, de forma tal que el si o no de
primera pregunta excluya requiera las siguientes.
Estadstica Descriptiva
12
Ctedra Estadstica
* Incluir preguntas control, para controlar la veracidad de las respuestas.
* Evitar preguntas abiertas, porque dan lugar a una gran cantidad situaciones.
* Ordenar las preguntas
pensamiento.
la secuencia
lgica del
Estadstica Descriptiva
13
Ctedra Estadstica
sea, recurriendo a alguna forma de presentar los datos de modo que cumplan con su
objetivo (descripcin cuantitativa de un fenmeno).
Las formas en que se pueden presentar los datos estadsticos son:
- Prrafos de textos
- Cuadros estadsticos
- Grficos estadsticos.
Analizaremos estos mtodos de presentacin de la informacin recopilada y
organizada previamente.
Prrafos de textos: Consiste en la explicacin escrita de la informacin. Slo es
recomendable cuando se trabaja con pocas cifras o tems. En cambio, cuando se trabaja
con un conjunto numeroso de datos, sta forma de presentacin es poco clara e
ineficiente, debiendo recurrirse a otros mtodos. Tiene ciertas ventajas, como la de
poder expresar con palabras la importancia de ciertas cantidades, as como la de
efectuar y destacar comparaciones que se crean necesarias hacer.
Cuadros estadsticos: Este mtodo suele usarse con mayor frecuencia que el
anterior. Consiste en el arreglo sistemtico de las cifras de una matriz identificando filas
y columnas, o sea, utilizando una tabla de doble entrada. Para su construccin existen
ciertas normas bsicas que permiten que el cuadro cumpla con su objetivo que es
presentar la informacin ordenadamente, facilitando su interpretacin y anlisis.
De acuerdo con el propsito para el que se construyen los cuadros estadsticos,
pueden clasificarse en:
a) Cuadros generales o de referencia: son los usados como fuente de
informacin, no tienen un propsito determinado sino que simplemente proporciona
informacin detallada. Es el tipo de cuadro que presentan las publicaciones de
organismos generalmente gubernamentales, que recogen informacin primaria.
b) Cuadros de texto o de resumen: Son aquellos que tienen un propsito
especfico: generalmente son de menor tamao respecto a los anteriores, son breves y
claros y van acompaados
de algn texto correspondiente
a una investigacin
particular; incluyen datos relacionados entre s y eventualmente algn tipo de
elaboracin propia del autor.
Puede darse la siguiente clasificacin general de las partes principales de un
cuadro: Ttulo, Encabezados, Columna Matriz o Conceptos, Cuerpo, Fuente de
Informacin y Notas de Introduccin y al Pie. Todas ellas son importantes y contribuyen
conjuntamente a que el cuadro que se presente sea claro, preciso y de fcil
interpretacin. Brevemente expondremos qu significan y cmo se confeccionan cada
una de ellas:
Ttulos: debe ir en la parte superior del cuadro y expresar en forma clara y
precisa el contenido (datos) del cuadro, para lo cual resulta til tener en cuanta , al
redactarlo, las siguientes cuestiones: Qu? datos se estn presentando, Dnde? o sea
qu rea geogrfica corresponden esos datos, Cmo? estn clasificados los datos y por
ltimo Cundo? O sea, a qu perodo (meses, aos, etc.) corresponde la informacin.
Encabezados: son los ttulos que corresponden a cada columna componente del
cuadro y se colocan en la parte superior de las mismas. El primer encabezado
corresponde a la columna matriz o concepto, los siguientes corresponden a las columnas
de datos. En algunos casos se presentan encabezados y subencabezados.
Columna Matriz o Conceptos: Es la primer columna que se presenta en un
cuadro, en la cual se colocan los conceptos que identifican cada fila de un cuadro; estos
conceptos corresponden a una determinada clasificacin cuya naturaleza se seala en el
encabezado correspondiente a esta columna. Es posible, si se presenta la necesidad,
dividir cada concepto en subconceptos.
Estadstica Descriptiva
14
Ctedra Estadstica
Cuerpo: Es la parte del cuadro en la que se presenta el conjunto de datos
estadsticos, cuyo arreglo en filas y columnas se har de acuerdo a las clasificaciones
que se presentan en la Columna Matriz y en los Encabezados .
Fuente: es el lugar de donde se obtuvo la informacin y se indica al pie del
cuadro. Si los datos fueron recopilados por el mismo investigador se colocar
elaboracin propia , en caso que los datos fueron proporcionados por otro organismo o
equipos de trabajo o se obtuvieron de publicaciones deber colocarse el origen de los
mismos, indicando autor, nombre de la institucin, ttulo de la publicacin, nmero de
serie, volumen, pgina, edicin, editorial fecha de publicacin, etc., segn corresponda.
Puede ocurrir que sea necesario indicar ms de una fuente. Si se desconoce el origen de
la informacin, se colocar: Fuente: Desconocida. Si la informacin se obtuvo
directamente (personalmente) se colocar: Fuente: Elaboracin Propia, pero en ningn
caso debe faltar esta parte del cuadro.
La indicacin correcta de la fuente de informacin de un cuadro permitir al
lector evaluar la confiabilidad de las cifras presentadas, y obtener informacin adicional
en la fuente original, si as lo deseara.
Notas de Introduccin: son las que tienen por objeto aclarar ciertos aspectos
generales, relativos a todo el cuadro, que no han sido sealados en el ttulo; por
ejemplo: la unidad de medida correspondiente a los datos presentados en el cuadro.
Generalmente se colocan entre parntesis o con letras de menor tamao que las
utilizadas para el ttulo.
Notas al pie: van debajo del cuerpo del cuadro y antes que la fuente; en ellas se
consignarn explicaciones relativas a algn dato particular, o a alguna fila o columna en
especial.
Es necesario tener en cuenta ciertas normas bsicas para las construcciones de
cuadros. Recopilada y organizada la informacin que se desea presentar, ser posible
determinara el propsito de una tabla, estructurando la misma teniendo en cuenta sus
partes componentes. Sealaremos algunos aspectos que hacen a la real utilidad del
cuadro:
- Tener las cifras ordenadas en columnas y filas facilita las comparaciones entre s.
Sin embargo , debe tenerse en cuenta que es ms fcil comparar cifras ubicadas
en columnas que en filas, y que las comparaciones entre columnas adyacentes es
ms factible de hacer que entre columnas separadas, esto ltimo debe tenerse
presente sobre todo cuando existen subencabezados.
- Si hay cifras que por alguna razn deben destacarse del resto de la informacin,
debern colocarse en aqullas posiciones de la tabla adecuadas para tal fin. Como
nuestros hbitos hacen que se lea de izquierda a derecha y de arriba hacia abajo,
resulta que las posiciones de mayor nfasis sern para los encabezados de la
izquierda (columna adyacente a la columna matriz) y de la fila superior. Por lo
tanto, los Totales irn en la primera o ltima fila (o columna) segn se quiera o no
resaltar sus cifras.
- Tanto en la Columna Matriz como en los Encabezados, teniendo en cuenta la
naturaleza de los datos estadsticos que se presentan, es posible ordenar las
clasificaciones de acuerdo a dos arreglos: alfabtico o por magnitud. Las
clasificaciones posibles son: cronolgica, geogrfica, cualitativa y cuantitativa y la
eleccin de una u otra ser de forma tal que facilite el anlisis y las comparaciones
por parte del lector.
- Cuando es necesario presentar la informacin en valor relativo utilizando
porcentajes, debe indicarse: relativo a qu es el porcentaje (si respecto del total,
se de aumento, si e disminucin, etc.) y a qu cifra le corresponde el 100%.
- Si la precisin que presentan las cifras es innecesaria a los fines del cuadro,
debern ser redondeadas siguiendo el mtodo tradicional: si la ltima cifra
significativa es mayor que 5, se la elimina y se agrega una unidad a la cifra
Estadstica Descriptiva
15
Ctedra Estadstica
anterior; en caso contrario, simplemente se la elimina. Incluso, si stas cifras son
nmeros grandes, puede llevarse el dato a miles o millones, en cuyo caso deber
indicarse, dicha unidad utilizada, en las notas de encabezamiento (o introduccin)
o en las de pie.
- Si algn dato se desconoce debe colocarse el smbolo: s/i (aclarando en nota). Y
si algn dato es cero debe colocarse una rayita.
- Por ltimo , hemos de recomendar simplicidad de la presentacin de los cuadros,
para lo cual, tratar el menor nmero posible de temas por tabla; elegir un tamao
y forma adecuadas al informe que se presenta; no trazar ms rayas que las
necesarias para dividir columnas o filas, siendo esenciales aqullas que separan
encabezados, subencabezados, la columna matriz y los totales. Todo el cuadro
debe enmarcarse en un recuadro.
Grficos estadsticos: Tiene por objeto presentar a los datos estadsticos por
medio de figuras: lneas, reas, volmenes, etc.
Este mtodo suele reemplazar o complementar a los cuadros estadsticos, que
slo presentan cifras y que en general resultan inexpresivas; en cambio, un grfico
ayuda a visualizar rpidamente una situacin cualquiera describindola, debido a su
claridad, facilidad de comprensin y retencin de los resultados. Un grfico destaca
ciertos hechos esenciales de los fenmenos observados y sirve como un medio de
control, ya que hace particularmente visible toda variacin anormal y toda
discontinuidad crtica en la marcha del fenmeno en observacin. Es el indicador ptimo
de mximos y mnimos y de evoluciones de tendencia. Es el instrumento ideal para la
comparacin de distribuciones referidas a un mismo fenmeno y representada en la
misma escala de magnitudes. Por ltimo diremos que un grfico resulta siempre ms
atractivo y comprensible para su anlisis, que un cuadro, por lo cual, difcilmente se lo
deje de lado en la lectura de un texto, hecho que puede ocurrir con los cuadros.
Pero debemos sealar ciertas limitaciones del mtodo:
- En un grfico no se puede presentar una gran cantidad de informacin como lo
permite hacer un cuadro, ya que puede resultar confuso si en un mismo grfico
se pretende comparar varias distribuciones.
- Un grfico desprecia necesariamente ciertos detalles y no puede pretender la
misma precisin que los cuadros, que permiten la lectura exacta de las cifras
presentadas.
- En general, la confeccin de un grfico lleva ms tiempo que la elaboracin de un
cuadro.
Las partes componentes de un grfico coinciden en cierto modo con las de un
cuadro: podemos indicarlas en el siguiente orden: ttulo, diagrama, fuente, notas,
referencias y escalas, estas dos ltimas se incluirn cuando sea necesario. Valen las
mismas indicaciones que las hechas para cuadros, salvo respecto al ttulo, el cual puede
ir colocado en la parte superior o inferior del diagrama. El diagrama correspondera al
cuerpo del cuadro, puede presentar distintas formas y su objeto es presentar la
informacin a travs de un grfico; los ms comunes son barras, lneas, dimensiones,
mapas estadsticos y smbolos, que darn lugar a una clasificacin posterior de los
grficos estadsticos. La escala es una de las componentes de un grfico con la que hay
que tener especial cuidado. Los grficos se harn con referencia al sistema de ejes
coordenados cartesianos ortogonales tomando en el eje de las abscisas (X) las
clasificaciones cuantitativas o cronolgicas y en el de las ordenadas (Y) se representarn
las magnitudes que corresponden, para lo cual se necesita tomar como unidad de
medida aqulla cantidad que origina una escala cuyo lmite inferior est por debajo del
menor valor observado y su lmite superior cubra al mayor valor observado; la escala se
marca a partir del origen del sistema (al cual le corresponde el cero); si las magnitudes
tienen un rango alejado del origen, ser necesario cortar el eje. Si la clasificacin es
cualitativa o geogrfica, sta se ubica en el eje de las ordenadas (Y).
Estadstica Descriptiva
16
Ctedra Estadstica
De acuerdo al diagrama que se utilice, los grficos pueden clasificarse de la siguiente
forma:
a) Grficos lineales: entre los cuales encontramos los de series cronolgicas, los de
saldos netos, los semilogartmicos y los logartmicos.
80
70
60
50
40
30
20
10
0
Este
Oeste
Norte
1er trim.
2do trim.
3er trim.
4to trim.
2
1.5
1
0.5
0
1999
2000
2001
1999
2000
2001
b) Grficos de barras: entre los que se encuentran los de barras absolutas simples,
barras porcentuales simples, barras absolutas subdivididas, barras porcentuales
subdivididas, el de barras compuestas, el de barra nica y del de barras
direccionales.
El siguiente es un grfico de barras absolutas simples. Las barras son absolutas porque
representan cantidades netas y no porcentajes, y son simples ya que cada barra indica
una procedencia. Por otro lado, hay que notar que las barras son horizontales porque la
variable clasificatoria (procedencia) es cualitativa. Se observa que el mayor volumen de
exportacin de trigo por va martima procede de Baha Blanca, y que la diferencia con
las otras dos procedencias es muy importante. Un grfico de esta forma pero que utilice
valores en porcentaje es un grfico de barras porcentuales simples.
Estadstica Descriptiva
17
Ctedra Estadstica
Total de exportaciones por va m artim a - 1993
B. Blanca
B. Aires
Rosario
0
50
100
150
200
B. Blanca
B. Blanca
Trigo
Trigo
B. Aires
B. Aires
Girasol
Soja
Rosario
0
50
100
150
Girasol
Soja
Rosario
0%
200
50%
100%
Girasol
Trigo
50
0
1995
1996
1997
Estadstica Descriptiva
18
Ctedra Estadstica
Exportaciones de granos
provenientes de Buenso Aires Aos 95-96-97
100%
Soja
80%
Girasol
60%
Trigo
40%
20%
0%
1995
1996
1997
Los grficos de barras compuestas utilizan una barra para cada una de las
modalidades que la componen. As, la informacin dada anteriormente en un grfico de
barras subdivididas puede representarse como en el grfico siguiente. Estas barras
permiten una mejor comparacin entre las modalidades.
Exportaciones de granos por va m artim a
1993
B. Blanca
Soja
B. Aires
Girasol
Rosario
Trigo
0
20
40
60
80
100
80 - 90
60
60 - 70
Saldo
40
40 - 50
20
20 -30
0 - 10
-2000000 -1000000
1000000
2000000
-20
1er trim.
2do trim.
3er trim.
4to trim.
E
n las barras direccionales, el sentido de las barras tambin tiene un significado. Los usos
ms frecuentes de estas barras son: grficos de datos con saldos que pueden ser
positivos o negativos y pirmides poblacionales donde la direccin indica el sexo. En la
pirmide de poblacin se observa que la mayor cantidad de habitantes tiene entre 10 y
20 aos. Esto indica una preponderancia de la poblacin joven.
Estadstica Descriptiva
19
Ctedra Estadstica
c) Grficos de reas: entre stos se encuentra el grfico de sectores,
comnmente llamado grfico de torta, y el grfico de franjas o partes componentes.
Preferencias deportivas. Alum nos CPEM 23.
2001
bsquet
80
voley
60
ftbol
40
tenis
20
0
1er trim.
Calzado
Ropa
2do trim.
3er trim.
4to trim.
I.
Produccin
Fiat
F
IAT IAT
Ford F
ORDD
= 10.000 unidades
Los grficos lineales son ideales para representar series de tiempo. En caso de
existir ms de una clasificacin se usan distintos trazos, aclarando en las
referencias.
Los grficos de barras verticales se usan para las clasificaciones cronolgicas o
cuantitativas.
Los grficos de barras horizontales se utilizan para clasificaciones cualitativas o
geogrficas.
Las barras son rectngulos horizontales o verticales, todos de igual ancho y cuya
longitud es proporcional al dato que representan.
Las barras no deben ser excesivamente cortas y anchas, ni largas y angostas.
Entre barra y barra debe dejarse un espacio menor que el ancho de la barra y mayor
que la mitad de dicho ancho.
No deben rayarse las barras con lneas horizontales ni verticales.
No debe usarse un nmero excesivo de barras por grfico, (no ms de 6).
Las escalas pueden ser en valor absoluto o porcentual.
Las barras subdivididas son ideales para reflejar el total general aparte de las
subclasificaciones.
Estadstica Descriptiva
20
Ctedra Estadstica
La barra nica generalmente es horizontal, la escala es en valores porcentuales y su
longitud total corresponde al 100%. En valores relativos se representan las partes
componentes del total.
Las barras compuestas se utilizan para comparar dos series de datos
correspondientes a distintos perodos (barras verticales) o a distintos lugares
geogrficos (barras horizontales).
Las barras direccionales se utilizan para reflejar las variaciones en uno y otro
sentido: ingresos y egresos; importaciones y exportaciones; migraciones y
emigraciones; positivo y negativo; masculino y femenino (pirmide de poblacin)
6 Anlisis de la Informacin:
Este paso est relacionado con la definicin de que tipo de anlisis vamos a
realizar, si inferencial o descriptivo. En el anlisis descriptivo se utilizan coeficientes de
asociacin y regresin; medidas de posicin y dispersin, etc. En el rea de la
estadstica inferencial se utilizan tcnicas de estimacin de parmetros, pruebas de
hiptesis, etc.
7 Interpretacin de la Informacin:
En esta etapa el investigador da una explicacin comprensiva de la investigacin
y de los resultados hallados y as llegar a la conclusin. Cules son las conclusiones que
se desprenden del anlisis? Qu nos dicen las cifras que sea nuevo, que refuerce o
arroje dudas sobre hiptesis anteriores, o (si el estudio es lo suficientemente
amplio)que compruebe o refute opiniones anteriores?. Los resultados deben
interpretarse a la luz de las limitaciones del material original. No deben deducirse
conclusiones demasiado precisas de datos que por si mismos no son ms que
aproximaciones. Sin embargo, es de esencial importancia que el investigador descubra y
aclare todo lo que haya de til o aplicable en sus datos.
Estadstica Descriptiva
21