You are on page 1of 22

ANGEL FRANCISCO ARVELO LUJAN

Angel Francisco Arvelo Lujn es un Profesor Universitario Venezolano en el rea de


Probabilidad y Estadstica, con ms de 40 aos de experiencia en las ms
reconocidas universidades del rea metropolitana de Caracas.
Universidad Catlica Andrs Bello : Profesor Titular Jubilado 1970 a 2003
Universidad Central de Venezuela: Profesor por Concurso de Oposicin desde 1993
al presente
Universidad Simn Bolvar: Profesor desde 2005 al presente
Universidad Metropolitana: Profesor desde 1973 a 1987
Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004
Sus datos personales son :
Lugar y Fecha de Nacimiento: Caracas, 16-02-1947
Correo electrnico: angelf.arvelo@gmail.com
Telfono: 58 416 6357636
Estudios realizados:
Ingeniero Industrial. UCAB Caracas 1968
Mster en Estadstica Matemtica CIENES , Universidad de Chile 1972
Cursos de Especializacin en Estadstica No Paramtrica Universidad de Michigan
1982
Doctorado en Gestin Tecnolgica: Universidad Politcnica de Madrid 2006 al
Presente
El Profesor Arvelo fue Director de la Escuela de Ingeniera Industrial de la
Universidad Catlica Andrs Bello (1974-1979) , Coordinador de los Laboratorios
de esa misma Universidad especializados en ensayos de Calidad, Auditor de
Calidad, y autor del libro Capacidad de Procesos Industriales UCAB 1998.
En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en
el rea de Estadstica General y Control Estadstico de Procesos.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

VARIABLES ESTADISTICAS Y SU CLASIFICACION


ESCALAS DE MEDICION
1 Origen y Clasificacin de la Estadstica
No est muy claro el origen etimolgico de la palabra estadstica, ya que segn
unos se deriva del griego (Statera = Balanza), segn otros del latn (Status =
Situacin), y segn unos terceros del alemn (Staat = Estado).
El trmino estadstica es una expresin gramatical que engloba tres acepciones
conceptuales diferentes:
a) Estadstica (generalmente escrito con minscula y en plural estadsticas), en
su acepcin ms comn, es una coleccin de datos numricos ordenados y
clasificados segn un determinado criterio.
Este es el significado de la palabra estadstica cuando nos referimos a las
estadsticas de produccin, las estadsticas de precios, etc., y en este sentido fue
utilizada por primera vez en Alemania hacia mediados del siglo XVII , y se refera
a la recopilacin de datos tiles para la administracin del Estado, aunque ya
antes , en tiempos del Imperio Romano , se haban enumerado o contado las
riquezas, los habitantes, ,etc. La raz status justifica as la palabra estadstica.
b) Estadstica ( generalmente escrito con mayscula) , en su segunda acepcin ,
es la ciencia que, utilizando como instrumento a la Matemtica , y de modo
particular al Clculo de Probabilidades , estudia las leyes de comportamiento de
aquellos fenmenos que, no estando sometidos a leyes rgidas, dependen del
azar.
El trmino Estadstica Matemtica viene a ser el nombre adecuado para esta
acepcin, y puede considerarse a Jacques Bernoulli (1654-1705) con su Ley de
los Grandes Nmeros , y Pierre Simon Laplace (1749-1827) con su obra Teora
Analtica de las Probabilidades, como los precursores de esta ciencia.
c) Estadstica , finalmente, significa en su ltima acepcin , la tcnica o el mtodo
utilizado para recoger , organizar , resumir , presentar , analizar , generalizar y
contrastar los resultados de las observaciones de los fenmenos reales.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

Esta ltima acepcin de Estadstica (tambin escrita con mayscula), pero sin el
calificativo de Matemtica ser el que usaremos en este curso.
Dentro de este significado caen los mtodos utilizados por la Estadstica
Descriptiva y tambin por la Estadstica Inductiva, los cuales sern definidos
ms adelante.
Las estadsticas son tan antiguas como las sociedades humanas. Puede decirse
que ellas existen desde que se han producido censos, relaciones, catastros, etc.,
tendientes a obtener informacin acerca de recursos humanos, econmicos o de
otra ndole. As por ejemplo, se sabe que en el ao 2.000 A.C, existan en China
relaciones de este tipo.
Dentro del mundo de habla hispana se tienen noticias de estadsticas obtenidas
por los rabes en la Pennsula Ibrica en el ao 727, as como tambin de censos
bastantes completos realizados durante la poca de los Reyes Catlicos y de
Felipe II. Merece especial mencin el llamado censo del Marqus de la Ensenada,
y que contiene una informacin bastante detallada acerca de la Espaa de 1748.
Tambin en el Archivo de Indias, se conservan valiossimas estadsticas
econmicas, que an no han sido analizadas por completo.
El origen de la Estadstica se presenta en una poca ms reciente. La creacin
de la primera ctedra y curso de Estadstica, se produce en Alemania durante el
siglo XVII. Posteriormente aparecen tres escuelas diferentes:
a) La Escuela Administrativa: Tiene su origen en Alemania, y se ocupa de analizar
informacin relativa al Estado. Sus principales representantes son Vito de
Seckendoff (1626-1689) , Hermann Conring (1600-1689), y Godofredo de
Achenwall (1772) .
b) La Escuela Probabilstica: Tiene su origen en Italia y Francia, y se dedica al
estudio de los problemas relacionados con los juegos de azar. Sus principales
representantes son Pierre de Fermat (1601-1655), Blaise Pascal (1623-1662),
Pierre Simn Laplace (1749-1827), Simen Denis Poisson (1781-1840), Carl
Friederich Gauss (1777-1855), y la familia Bernoulli .

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

c) La Escuela Demogrfica: Tiene su origen en Inglaterra, y se ocupa de estudiar


los problemas actuariales relacionados con el crecimiento de la poblacin. Sus
principales integrantes son Petty, Halley, King , Davenant y John Graunt (1620 1674) .
Mas tarde, en nuestro siglo, aparece la nocin de probabilidad por Teora de
Conjuntos ,y gracias a los trabajos de franceses como Borel, Frechet y Levy, y
de los rusos Tchevichev, Tchuprov, Markov y Kolmogorov, continu el desarrollo
de la Escuela Probabilstica, llegando en este siglo a consagrarse como una
disciplina matemtica el Clculo de Probabilidades.
La Estadstica como ciencia aplicada al estudio de la realidad puede ser dividida
en dos grandes ramas , perfectamente diferenciadas,

no solamente por el

objetivo que persiguen, sino tambin por los mtodos que utilizan.
Ramas de la Estadstica

Descriptiva
Inductiva

La Estadstica Descriptiva se dedica a describir el conjunto de datos de una


poblacin, o de una muestra , mediante el clculo de ciertas cifras, tales como
promedios, coeficientes de variacin, etc., que resuman la informacin contenida
en ellos, y que a la vez permitan comparar su comportamiento con el de otras
poblaciones o muestras. Tambin se ocupa la Estadstica Descriptiva, del estudio
de una serie de tcnicas de representacin grfica, que son de una gran ayuda a
la hora de analizar los datos, y que de una manera rpida y sencilla suministran
informacin sobre su comportamiento.
La Estadstica Inductiva, que ms comnmente se denomina Inferencia
Estadstica, tiene como objetivo el utilizar los resultados de una muestra, para
estimar o inferir las caractersticas de la poblacin.
Para estudiar la Inferencia Estadstica

es requisito indispensable el

conocimiento previo del Clculo de Probabilidades y la Estadstica Matemtica,


pues los resultados de una muestra no pueden ser extrapolados con certeza a la
poblacin de donde proviene, y es necesario acompaar a la inferencia con el
grado de confianza que posee.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

As por ejemplo, al tomar una muestra de electores, y encontrar que el 32% de


ellos simpatizan por un cierto candidato, no podemos inferir que este mismo
porcentaje es aplicable a toda la poblacin. Solamente podremos inferir que el
verdadero porcentaje es cercano a este 32% , con un cierto nivel de confianza ;
siempre que hayamos tomado la muestra respetando ciertos principios exigidos
por la Inferencia Estadstica.
El conjunto de datos muestrales puede describirse o analizarse de la misma forma
que una poblacin, y por ello, pueden manejarse en un doble sentido; primero
para describir el propio conjunto de observaciones, y segundo, para inferir lo que
ocurre en la poblacin.
Es por ello que la fase descriptiva es comn al anlisis de cualquier conjunto de
observaciones o datos, ya sean stos provenientes de toda una poblacin, o bien
en el caso de que constituyan una muestra de ella, y por esta razn, la
Estadstica Descriptiva constituye la parte ms clsica, ms conocida y ms
elemental de la ciencia Estadstica, y a su estudio, dedicaremos el mayor nfasis
a lo largo de este texto.
2 Poblacin y Muestra
La Estadstica tiene por objeto el estudio de los colectivos, y de las relaciones
que existen entre ellos, entendiendo por colectivo, poblacin o universo, a un
conjunto de elementos, personas o cosas, donde cada uno de ellos posee un
carcter , que ms adelante denominaremos la variable estadstica.
La Estadstica no estudia casos individuales, como el ingreso de una persona , o
la preferencia de un elector, sino conjuntos numerosos de personas en lo
referente a su ingreso , o de electores en lo referente a la preferencia de cada uno
de ellos.
Una poblacin puede tener un nmero finito de elementos, o puede ser tan
grande, que puede ser tratada como si fuera infinita. En Estadstica Matemtica
por lo general, la poblacin se considera infinita, pues el experimento puede ser
repetido una y otra vez, y por lo tanto es posible coleccionar un nmero infinito de
observaciones para la variable en estudio.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

Se llama Parmetro Poblacional a un valor que depende que los caracteres de


cada uno de los elementos que forman la poblacin, como por ejemplo , el
porcentaje de elementos que posee un cierto atributo , o la suma de todos los
caracteres asociados a cada uno de los elementos , en el caso de que ste sea
un valor numrico , como por ejemplo el total de habitantes que residen en una
localidad, que es la suma de los habitantes que residen en cada una de las
viviendas ubicadas en esa localidad.
Para obtener el valor de un parmetro poblacional, es necesario conocer el
carcter de cada uno de los elementos de la poblacin, y como la observacin de
todos ellos resulta prcticamente imposible por el elevado costo que representa,
se procede a analizar slo una parte de ella , con el objeto de inferir de ella el
valor del parmetro poblacional.
Esta parte de la poblacin se denomina muestra ; de manera que en un sentido
amplio , una muestra es un subconjunto cualquiera de la poblacin . El objetivo de
la Inferencia Estadstica tal como se dijo antes, es analizar esta muestra , y de
all obtener conclusiones para la poblacin.

Figura N 1 : Relacin entre la muestra y la poblacin

La forma como se haga la seleccin de los elementos de la poblacin para


integrar la muestra se denomina el plan de muestreo, y determina la
metodologa estadstica a seguir para hacer la inferencia.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

Segn sea el Plan de muestreo, las muestras se clasifican de la siguiente forma:

No Probabilisticas
Aleatoria
Tipos de muestras
Estratificada
Pr obabilisticas
Sistematica
Conglomerados
Una muestra es no probabilstica cuando la seleccin de los elementos de la
poblacin que pasan a formar parte de la muestra se hace a criterio de la persona
que est tomando la muestra, sin que medie ningn tipo de procedimiento
aleatorio para su seleccin. Los procedimientos de Inferencia Estadstica no son
aplicables a este tipo de muestras.
Una muestra se dice probabilstica cuando la seleccin de los elementos que
intervienen en ella se hace a travs de algn procedimiento aleatorio, o sorteo,
que le concede a cada uno de los elementos de la poblacin, un cierto chance de
caer en ella.
Existen diversos tipos de muestras probabilsticas:
Muestra aleatoria simple: Es aquella en que cada elemento de la poblacin tiene
idntica probabilidad de caer en la muestra, y por lo tanto todas las muestras
posibles son igualmente probables.
Para lograr que cada elemento de la poblacin tenga igual probabilidad de caer
en la muestra, es necesario en primer lugar numerarlos por cualquier criterio
desde 1 hasta N = Tamao de la poblacin, y luego hacer un sorteo aleatorio, o
en su defecto, utilizar la tabla de dgitos al azar para simular el sorteo. En la
actualidad, los programas computarizados permiten generar nmeros aleatorios
que hacen la seleccin aleatoria de la muestra.

Muestra Estratificada: Es aquella en donde antes de tomar la muestra se divide


a la poblacin en grupos llamados estratos , y posteriormente dentro de cada
estrato se toma una muestra aleatoria simple.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

Muestra Sistemtica: En este tipo de muestras, la metodologa es como sigue:


a) Se divide la poblacin en bloques de k elementos cada uno, y se numeran
desde 1 hasta k.
b) Se elige un nmero entero al azar entre 1 y k .
c) Dentro de cada uno de los bloques se elige el elemento que corresponda al
nmero aleatorio seleccionado.
d) La muestra queda formada por los elementos elegidos, uno en cada uno de los
bloques.
Ejemplo: Supongamos que en una poblacin de 3.000 elementos queremos tomar
una muestra sistemtica de 10 elementos.
Para definir los elementos que van a formar parte de la muestra dividimos a la
poblacin en 10 bloques de 300 elementos cada uno.
A continuacin se elige un nmero al azar entre 1 y 300 , digamos 158.
La muestra quedar conformada por los elementos que ocupen el puesto N 158
en cada uno de los diez bloques.

Muestra por Conglomerados: Este tipo de muestreo consiste en dividir tambin


a la poblacin en grupos que se denominan conglomerados , y luego elegir
aleatoriamente algunos de ellos .

En los conglomerados que resulten

seleccionados se realiza un censo, es decir , son examinados la totalidad de los


elementos que lo conforman.
La eleccin del Plan de Muestreo a utilizar en cada situacin depende de varios
factores tales como:
La homogeneidad o heterogeneidad de la poblacin en estudio.
La factibilidad de poder identificar a todos los elementos que conforman a un
determinado grupo , estrato o conglomerado.
El costo del muestreo.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

Antes de proceder a seleccionar el Plan de Muestreo a seguir, es necesario


ponderar cada uno de estos factores, as como tambin la precisin del muestreo.

3 Variables Estadsticas y su clasificacin


Hemos visto que la poblacin est formada por elementos, y que cada uno de
estos elementos posee un carcter, que vara de un elemento a otro.
Este carcter puede ser de muy variada ndole; puede ser la estatura de cada uno
de los habitantes de un pas, el canal de televisin que en un momento
determinado estn sintonizados en cada hogar de una ciudad, etc.
Este carcter

en estudio, y que puede ser

diferente para cada uno de los

elementos de la poblacin se denomina la variable estadstica.


Las variables estadsticas se clasifican de la siguiente forma:

Cualitativas
Variables Estadsticas:

Nominales
Ordinales

Cuantitativas

Discretas
Continuas

Se dice que una variable estadstica es cualitativa cuando representa una


cualidad o un atributo, como por ejemplo la ciudad en que reside un habitante de
un pas, o la religin que profesa una persona.
Las variables cualitativas se clasifican en:
a) Variables Nominales o Categricas. Este es el caso en que entre los
distintos valores de la variable no existe ninguna relacin de orden o de jerarqua.
Tal es el caso por ejemplo, en que la variable estadstica en estudio es el estado
civil de los empleados de una empresa. Aqu los posibles valores de esta variable
son: Soltero, Casado , Viudo y Divorciado .
En algunos casos, a ciertas variables nominales, por comodidad en el tratamiento
de los datos se les asignan valores numricos, sin que este artificio le haga perder
su condicin de Variable Nominal. Por ejemplo, en una encuesta se podra
presentar la siguiente situacin:

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

Pregunta:
Respuestas:

10

Cual canal de televisin prefiere Ud. ?.


1- El Canal 2.
2- El Canal 4.
3- El Canal 5.
4- El Canal 8.
5- El Canal 10.

En este caso ni los nmeros que identifican a la respuesta del encuestado (1,2,3,4
5) , ni los nmeros que corresponden a cada uno de los canales de televisin
(2,4,5,8 10), cuantifican una magnitud en s, sino que representan una cualidad
como es la preferencia del televidente.
De forma pues que esta variable, a pesar de tomar valores numricos, es una
Variable Cualitativa, y adems Nominal, puesto que los nmeros mencionados no
sugieren una relacin de orden, debido a que no podemos decir que el televidente
de un determinado canal, es mejor o peor que el televidente de otro canal, porque
el nmero que identifica al canal es mayor o menor que el otro.
b) Variables Ordinales. Este es el caso en que entre las diferentes cualidades
existe una relacin de orden jerrquico entre ellas, y es posible decir que cierta
categora es mayor o menor, o mejor o peor , que otra.
Por ejemplo, al clasificar a un grupo de personas segn sus edades en infantes,
adolescentes, adultos, maduros y ancianos , es posible establecer un orden , o
tambin al clasificar a los miembros del ejrcito segn su rango, es posible
establecer un orden , y decir que ser General de Divisin es ms que ser Coronel,
etc.
Algunas veces, variables estadsticas que pueden ser medidas numricamente
por comodidad de trabajo, son tratadas como variables cualitativas ordinales.
Tal es el caso por ejemplo, de la clasificacin socio - econmica que se suele
hacer en grupos familiares , tomando nicamente como elemento de juicio su
nivel de ingresos, y clasificarla as en Clase Alta, Media Alta, Media, Media Baja o
Marginal . Aqu se est tomando en cuenta una variable numrica, como es el
ingreso familiar, para decidir acerca de una cualidad como es la condicin de vida

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

11

de la familia. En estos casos se presenta el problema de definir cules son las


fronteras numricas, para ubicar a un elemento en una u otra escala.

Las variables cuantitativas son aquellas que se refieren a magnitudes


numricas, tales como la estatura de un grupo de personas, o el nmero de
personas que residen en una vivienda.
Las variables cuantitativas se clasifican en discretas y continuas.
Una variable es discreta cuando el conjunto de valores que puede tomar es finito
o infinito numerable, es decir que puede ponerse en correspondencia con el
conjunto de los nmeros naturales.
Por ejemplo, si en una determinada investigacin estamos analizando el nmero
de vehculos que posee cada una de las residencias de una urbanizacin, el
resultado de nuestras observaciones sern nmeros naturales, o cero; sta es
pues una variable discreta. Otros ejemplos de investigaciones que dan lugar a
variables discretas son: Nmero de hijos que posee un matrimonio, nmero de
clientes que acuden diariamente a un comercio, etc.
Es conveniente aclarar que para que la variable sea considerada como discreta,
no es necesario que los valores que tome sean nmeros enteros, sino que el
nmero de valores que pueda tomar sea numerable. As por ejemplo, si
analizamos el monto de las compras realizadas por un grupo de personas en un
supermercado, el resultado de nuestra observacin puede no ser un nmero
entero, puesto que es posible que una persona realice una compra de digamos
Bs 843,95 ; sin embargo, a pesar de esta situacin dicha variable es discreta,
debido a que si tomamos en consideracin que si la unidad monetaria no se
fracciona ms all del cntimo, entonces no podremos encontrar observaciones
con tres o ms cifras decimales, y el conjunto de los nmeros positivos con dos
cifras decimales es numerable.
El comportamiento de una variable discreta se representa en la siguiente figura:

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

12

Los posibles valores de la variable son puntos aislados.


Entre un punto y el siguiente , la variable no puede tomar valores.
Los puntos no tienen que estar igualmente espaciados.
El conjunto de puntos es numerable.
Figura N 2 : Comportamiento de una variable discreta

Se dice que una variable es continua cuando puede tomar cualquier valor dentro
de un intervalo real.
As por ejemplo, si consideramos el peso de una persona, el resultado de nuestra
observacin ser un nmero real positivo, sin limitacin en el nmero de cifras
decimales.
Hay que advertir que una variable continua no puede ser jams medida en su
exacto valor, pues por ms pequea que sea la unidad de medida que utilicemos,
siempre podremos encontrar valores ms pequeos que esa unidad .
As por ejemplo cuando decimos que un bombillo fall a las 532 horas de uso ,
esto no significa que la falla ocurri en el preciso instante en que cumpla las 532
horas . Lo que significa es que fall en algn instante entre las 532 y las 533
horas , lo que representa un intervalo de tiempo.
La variable discreta por el contrario, si puede ser medida en su valor exacto, y as
por ejemplo , cuando decimos acudieron 532 clientes a un banco durante un da
determinado, sta cifra representa un valor exacto, y es puntual.

La variable continua puede tomar infinitos valores , cualquiera dentro del intervalo
No se puede medir el valor exacto de la variable .
Figura N 3 : Comportamiento de una Variable Continua

Las variables continuas ms frecuentes suelen ser el tiempo , longitud, rea,


volumen, etc.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

13

4 Escalas de Medicin
Una vez que ha sido definida la variable estadstica que va a ser analizada, nos
encontramos con el problema de cmo medirla.
En muchas oportunidades este asunto no presenta ninguna dificultad, pues la
variable considerada ya tiene una unidad de medida perfectamente definida.
Tal es el caso por ejemplo, de una longitud, en donde ya existen varias unidades
de medicin universalmente aceptadas, como pudieran ser el metro, la pulgada, el
milmetro, etc.
En otros casos sin embargo, la situacin no es tan clara, pues no existe tal unidad
de medida, y se hace necesario definir una escala de medicin.
Por ejemplo, si la poblacin estudiada es el conjunto de clientes de una empresa
de servicios , y lo que se quiere estudiar es el nivel de satisfaccin de cada uno
de ellos por el servicio prestado, inmediatamente nos preguntaremos: cmo
medir ese nivel de satisfaccin ?.
La seleccin de una escala de medicin adecuada es una decisin importante en
cualquier investigacin, pues de ella depender la metodologa estadstica a
seguir, y las conclusiones de la investigacin.
En 1948, el cientfico S.S. Stevens propuso una clasificacin lgica para los tipos
de medicin, con la que no todos los estadsticos concuerdan, pero que es la ms
divulgada y conocida.
Stevens seal que si no existieran mediciones el mundo sera catico, y no
existira ciencia estadstica, y si las mediciones fuesen totalmente exactas, habra
una demanda mucho ms reducida para emplear la Estadstica.
Stevens reconoce cuatro tipos de escalas de medicin: nominal, ordinal , de
intervalos, y de razn.
Las escalas nominales se emplean para medir variables cualitativas
nominales, y se utilizan como medidas de identidad. Una escala de este tipo
tendra que ser necesariamente usada para representar los distintos valores
de variables como sexo , religin , etc.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

En una escala nominal, los diferentes valores de la variable se suelen

14

numerar

por orden alfabtico de las categoras, y los nmeros asignados no


corresponden a ninguna medicin, ni entre ellos existe relacin jerrquica
alguna.
La escala ordinal refleja orden o jerarqua entre los distintos niveles de la
variable, y se disponen de la ms alta a la ms baja , o viceversa.
El ejemplo clsico de este tipo de escala es el empleado para evaluar la
dureza de los minerales. Esta propiedad se define como el grado de
resistencia a la abrasin, y en esta escala el nmero 1 corresponde a un
material muy suave y fcil de desmenuzar como el talco, mientras que el
nmero 10 en el extremo opuesto de la escala, corresponde al diamante, que
puede rayar a todos los dems , y no puede ser rayado por ninguno.
Con relacin a este tipo de escalas, hay dos comentarios importantes que
hacer:
a) Iguales diferencias entre los nmeros de la escala , no necesariamente
reflejan iguales diferencias de intensidad para la variable medida.
Consideremos por ejemplo, el siguiente caso: Supongamos que para medir el
grado de satisfaccin de los clientes por un determinado servicio, se propone
la siguiente escala nominal:
1. Totalmente insatisfecho.
2. Bastante insatisfecho.
3. Medianamente satisfecho.
4. Bastante satisfecho .
5. Totalmente satisfecho.
En esta escala, a pesar de que la diferencia 5 - 3 = 3 -1, no podemos decir que
la diferencia entre el grado de satisfaccin entre los clientes del nivel 5 y los del
nivel 3 , es la misma que entre los clientes del nivel 3 y el nivel 1.
b) En una escala nominal tampoco podemos hacer comparaciones de razn
entre los diferentes niveles o nmeros de la escala.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

15

As por ejemplo, en el caso anterior sera absurdo decir que como 4 es el doble
de 2 , entonces los clientes del nivel 4 estn doblemente satisfechos que los
del nivel 2.

La escala de intervalos es para variables cuantitativas, y por lo tanto


proporciona valores numricos .En este tipo de escala hay que seleccionar una
unidad de medida , y la medicin expresa el nmero de unidades que posee el
elemento medido.
En una escala por intervalos hay tres caractersticas fundamentales:
1. El cero es completamente arbitrario, y no significa necesariamente la
ausencia de la cantidad medida.
2. Diferencias iguales reflejan idnticas diferencias, entre los niveles de la
variable en estudio .
3. No se pueden hacer comparaciones de razn.
Un ejemplo de escala por intervalos es la utilizada para medir la hora del da.
En esta escala el cero que corresponde a la medianoche , es completamente
arbitrario, y el tiempo transcurrido entre las 5:00 y las 8:00 , es el mismo que
entre las 14:00 y las 17:00.
Otro ejemplo de escala por intervalos es la utilizada para medir la
temperatura, bien sea en C o en F . En la escala centgrada el cero es
arbitrario, y corresponde a la temperatura de congelacin del agua , y la
diferencia de temperatura entre 10C y 14C es la misma que entre 25C y
29C .
En una escala por intervalos no se pueden hacer comparaciones de razn
entre los valores de la variable, y as por ejemplo si en un da la temperatura
fue de 15C y en otro de 30C, es incorrecto decir que en el segundo da hizo
el doble de calor que en el primero.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

16

La escala de razn o de cociente es tambin para variables cuantitativas, y


se diferencia de la de intervalos en que en ella el cero no es arbitrario, y
corresponde realmente a una total ausencia de la propiedad estudiada.
En una escala de razn, lo mismo que en una de intervalos, a

iguales

diferencias entre los nmeros asignados corresponden iguales diferencias de


intensidad de la variable en estudio, pero ahora si es posible hacer
comparaciones de razn entre los elementos, y decir que en un elemento A el
valor de la variable es tres veces o cuatro veces el valor de otro elemento "B.
El peso y la estatura son ejemplos claros de una escala de razn, pues una
persona que pese 90 Kgs, pesa el triple que un nio que pese 30 Kgs.

5 Datos estadsticos y su clasificacin


Se llama dato estadstico, al resultado de medir el valor de la variable estadstica
en un elemento de la poblacin.
As por ejemplo, si la variable estadstica en estudio es el peso de los estudiantes
universitarios , el peso de un estudiante en particular representa una observacin
de esa variable, y constituye un dato . El peso de cada uno de los estudiantes
universitarios define el conjunto de datos poblaciones, y el peso de aquellos
estudiantes que resulten muestreados el conjunto de datos muestrales.
Segn sea la naturaleza de la variable estadstica analizada, los datos
estadsticos se clasifican de la misma manera en cualitativos y cuantitativos.
Sin embargo, es necesario aclarar que en el caso de datos cuantitativos no existe
la clasificacin en discretos y continuos , pues un dato cuantitativo es siempre
discreto, ya que para medir la variable continua , es necesario definir una unidad
de medida , y por lo tanto no es posible ir ms all de un cierto nivel de precisin
o cifras significativas . Los instrumentos de medida no permiten pasar ms all de
un cierto lmite de precisin, y por lo tanto el dato no podr tener ms cifras
decimales que las que el instrumento de medicin nos permita.
As por ejemplo, si la variable analizada es la duracin de un lote de pilas; sta
variable es evidentemente continua, puesto que la duracin puede ser cualquier

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

17

nmero real positivo. Sin embargo, si al medirla , disponemos de un cronmetro


que no aprecia ms all del minuto, entonces el resultado de la medicin ser el
nmero de minutos transcurridos hasta que la pila falle, que es siempre un
nmero entero, y por lo tanto un dato discreto.
Otra forma importante de clasificar los datos estadsticos, es en univariantes,
bivariantes o multivariantes.
Datos univariantes son aquellos en donde se analiza el comportamiento de una
sola variable, como por ejemplo la tensin arterial de una persona, o las ventas
diarias de una empresa.
Datos bivariantes son aquellos en donde para un mismo elemento ,se analizan
simultneamente dos variables, como pueden ser por ejemplo, la estatura y el
peso de una misma persona.
En este caso los datos vienen dados por pares de observaciones de la forma
(x ,y) , y tambin se les suele llamar datos apareados .
Datos multivariantes son aquellos en donde se toma sobre un mismo elemento,
informacin acerca de ms de dos variables, como puede ser el caso en donde
adems de la estatura y el peso de la persona, se registra su tensin arterial y su
edad.
El anlisis de datos multivariantes, es de gran aplicacin en la investigacin,
debido a que en la mayora de los casos, el investigador est interesado en
conocer el grado de relacin que presentan las variables entre s; por ejemplo, en
la investigacin mdica, se puede estar interesado en determinar la relacin que
existe entre la tensin arterial de una persona, y su estatura, o su peso y edad; o
en una investigacin de mercados, la relacin entre la preferencia del consumidor
hacia determinados productos ,y su sexo, o condicin social,. etc.

Otra distincin que debe considerarse, es la relacionada con el factor de orden


temporal de las observaciones, y tomando en cuenta este factor distinguiremos el
caso atemporal, en donde no se considera las fechas en que fueron tomadas las
observaciones, y el caso temporal en donde si se considera este factor. El anlisis

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

18

de series cronolgicas, por ejemplo, es fundamental para poder analizar las


fluctuaciones en la demanda de ciertos productos, debido a que en muchos
casos, las variaciones en la demanda de un mes a otro, no se deben
exclusivamente al azar, sino tambin a la presencia de factores estacionales que
deprimen la demanda unos meses, y la incrementan otros.
En los captulos sucesivos, nos dedicaremos a estudiar las diferentes tcnicas
estadsticas, para el anlisis de los datos en cada uno de estos casos.

6 Etapas de una Investigacin Estadstica


La Estadstica es una herramienta fundamental en cualquier investigacin, bien
sea cientfica o social , y su aplicacin requiere de una cierta metodologa.
Por lo general los problemas mas frecuentes que hay que resolver a la hora de
aplicar mtodos estadsticos en una investigacin, son en este orden los
siguientes:
1. Formulacin del problema: Esta es la fase conceptual de la investigacin , y
consiste en definir en primer lugar el objetivo de la investigacin que se va a
realizar , las hiptesis que se pretenden probar , la definicin de la poblacin a
considerar, y la seleccin de las variables a medir .
En muchas oportunidades , esta fase tambin exige la creacin de una escala
de medicin , porque la misma no existe para algunas de las variables que van
a ser analizadas.
Esta es quizs la fase ms importante en la investigacin, pues es la que
condiciona todas las posteriores , y la validez de las conclusiones.

2. Diseo del experimento: Una vez que ha sido definido el problema , el


investigador debe decidir si estudiar toda la poblacin o slo una muestra.
En caso de que decida hacer un muestreo, habr que definir el tipo de
muestreo a utilizar , si aleatorio simple , estratificado , por conglomerados, etc.
Tambin ser necesario calcular el tamao de muestra requerido el cual
depender de la precisin que se le quiera dar al muestreo ; y tambin ser

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

19

necesario disear un cuestionario , o formato para ser llenado por la personas


que van posteriormente a recoger la informacin.
El diseo de la encuesta y la redaccin de las preguntas es un aspecto muy
importante en esta fase, pues de la sinceridad de las respuestas depender la
validez de la investigacin.
Este es un problema ms de carcter psicolgico que

estadstico,

pues

la

Estadstica supone que la respuesta obtenida es sincera , y en la prctica no


necesariamente esto es cierto.
La apariencia fsica del encuestador, el momento de realizar la encuesta, y la
forma de hacer las preguntas son aspectos muy importantes a considerar aqu.
Otro aspecto que tambin debe ser analizado en esta fase es el relativo a los
programas de computacin que van a ser utilizados posteriormente para
procesar la informacin recogida en el muestreo.

3. Recoleccin de datos . Esta es la fase de campo propiamente dicha, en la que


el investigador hace el sorteo aleatorio de las unidades de la poblacin que van
a pasar a formar parte de la muestra, y posteriormente las entrevista, o las
ensaya en caso de que se trate de una investigacin hecha en un laboratorio.
En esta fase , el investigador debe poner especial cuidado en que la muestra
quede conformada por estrictamente las unidades que resultaron sorteadas, y
no por otras que le resulten ms cmodas al encuestador .
Cualquier error en este sentido hara que la investigacin pierda fuerza, y
podra incluso invalidar sus conclusiones .

4. Tabulacin y Descripcin de los resultados. Esta es la fase descriptiva de la


investigacin, en donde los datos tomados en la fase anterior son organizados
y resumidos en tablas estadsticas, y tambin representados en grficas que de
una manera rpida permitan visualizar su comportamiento.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

20

En esta fase es indispensable el manejo de las tcnicas de Estadstica


Descriptiva que sern estudiadas ms adelante, y debe contarse con la ayuda
del programa de computacin seleccionado en la fase de diseo.

5. Inferencia Estadstica y Conclusiones : Esta es la fase final de la investigacin,


en donde los resultados obtenidos en la muestra son analizados con los
mtodos de la Inferencia Estadstica, y se obtienen conclusiones para la
poblacin.
Las conclusiones obtenidas en esta fase se refieren a las hiptesis que
haban sido formuladas en la fase inicial, o tambin a la estimacin del valor de
ciertos parmetros poblacionales que eran desconocidos al comienzo de la
investigacin.

Preguntas de Revisin
1. Explique la diferencia entre Estadstica Descriptiva e Inductiva.
2. Explique porque, la Estadstica Descriptiva complementa a la Estadstica
Inductiva.
3. Comente la siguiente expresin: "Todas las observaciones provenientes de
Variables Cuantitativas son discretas" .
4. Identifique las siguientes Variables como Cuantitativas, o como Cualitativas, y
clasifquela segn sea el caso:
a) El nmero de habitaciones que posee una residencia.
b) El pas de nacimiento de una persona
c) El nivel de instruccin de una persona.
d) La emisora de radio preferida.
e) El rea de un apartamento.
f) La temperatura mxima diaria en una ciudad.
g) El sexo de una persona
h) Las zonas de residencia.

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

21

i) El saldo de una cuenta bancaria.


j) El estado civil.
5. Identifique las siguientes Variables Cuantitativas, como Discretas o como
Continuas, segn sea el caso:
a) El nmero de alumnos presentes en un saln de clases.
b) El nmero de automviles que circulan cada da por una cierta calle.
c) El contenido de cemento en un saco.
d) Las ventas diarias de un comercio.
e) El dimetro de una esfera.
f) La duracin de un bombillo.
g) El tiempo de espera en una cola.
h) El precio de una caja de jabn detergente en varios supermercados.
i) El ingreso mensual de una persona.
6. Cmo puede hacerse para pasar de unas estadsticas cuantitativas, a otras
cualitativas ? . Es posible el proceso inverso ? . Justifique su respuesta.
7.Identifique las siguientes Variables como Ordinales, o como Nominales, segn
sea el caso:
a) La marca de cigarrillo preferida por un fumador.
b) Grado de instruccin de una persona, ofreciendo como opciones:
Ninguna, Primaria, Secundaria y Superior.
c) Carrera que cursa un estudiante universitario.
d) Zona en que reside un habitante de una ciudad, clasificndolas en:
Norte, Sur, Este u Oeste
e) Calificacin obtenida por un estudiante en un examen, siendo la escala
de calificaciones: Excelente, Meritorio, Aprobado y Deficiente.
f) Estado civil de una persona.
g) Destreza en un oficio, clasificada como: Ninguna, Poca, Mediana, Buena
y Superior.
h) Opinin de un elector acerca de un candidato, siendo las alternativas de
respuesta:

Gua sobre Variables Estadsticas


Angel Francisco Arvelo L

22

No votar por l.
Me es indiferente.
Quizs vote por l.
Seguramente votar por l.
i) Peridico preferido por un lector.

8. Proponga una escala de medicin para cada una de las siguientes variables ,
y diga si la escala propuesta es nominal , ordinal , de intervalos o de razn.
a) Nivel de instruccin de una persona.
b) Calidad de un artculo.
c) Longitud de un tornillo.
d) Fecha de nacimiento de una persona.
e) Marca de jabn detergente preferido por un ama de casa.
f) Calificacin obtenida por un alumno en un examen de Estadstica.
g) Edad de una persona