You are on page 1of 11

I. CONCEPTOS BÁSICOS.

Dr. Pedro Fernando Pinto Guerrero

Estadística: es una ciencia formal1 que constituye parte de la ciencia matemática aplicada y que estudia
los métodos, técnicas y procedimientos relacionados a la recolección, elaboración y análisis de datos y
su transformación en información que permita tomar decisiones en condiciones de incertidumbre.

Es una parte de la matemática porque emplea todo el conocimiento matemático:

 Aritmética: sumatorias, productorias, potencias y raíces, proporciones, regla de tres, etc.


 Algebra: despeje de fórmulas, resolución de ecuaciones, regresión lineal y no lineal, etc.
 Análisis matemático: derivación e integración en el manejo de modelos de distribución, funciones
bivariantes y multivariantes,
 Probabilidades y geometría analítica (gráficas y regresiones, series cronológicas, etc.).

Y es de la matemática aplicada, porque utiliza los conocimientos teóricos de la matemática formal para la
gestión de los datos en información.

Método2: es un conjunto sistemático y ordenado de normas y de reglas, cuyo cumplimiento facilita


alcanzar metas, objetivos y fines particulares y específicos. Por ejemplo, para la recolección de datos,
podemos aplicar métodos empíricos: la observación o la experimentación, para elegir una población se
puede aplicar el método del muestreo, etc.

Técnica: es el ordenamiento de la conducta o determinadas formas de actuar y usar saberes y herramientas


como medio para alcanzar un fin determinado. Esta conformada por uno o varios procedimientos. Por
ejemplo, para calcular probabilidades se utiliza las técnicas de contar3: combinaciones, permutaciones,
variaciones.

Procedimiento: es una sucesión cronológica de operaciones concatenadas entre sí, que se constituyen en
una unidad de función para la realización de una actividad o tarea específica dentro de un ámbito
predeterminado de aplicación. Todo procedimiento involucra actividades y tareas del personal,
determinación de tiempos de métodos de trabajo y de control para lograr el cabal, oportuno y eficiente
desarrollo de las operaciones. Por ejemplo el procedimiento para estimar la media poblacional a partir de
la media muestral.

Los tres conceptos anteriores tipifican la definición de la estadística, estableciendo una jerarquía de tal
manera que los métodos incluyen técnicas y estos procedimientos.

Incertidumbre: es el grado de desconocimiento de una condición futura, originada en la ausencia,


insuficiencia o contradicción real o aparente de la información disponible.

Ejemplo1. Un paciente muestra signos y síntomas que hacen suponer la presencia de hiperglicemia, el
médico refiere y solicita un examen de sangre para cuantificar el nivel de glucosa en la sangre. Al obtener
una muestra de sangre, desconocemos si el valor de la glicemia esta dentro o fuera de un rango normal,
por lo tanto existe incertidumbre, esta situación se resolverá el instante en el que aplicando:

 El método de Somogyi-Nelson4, sobre la base del principio que el reactivo de Somogyi al actuar
con la glucosa, reduce al ion cúprico en ion cuproso, en medio alcalino caliente,
1
En la clasificación de las ciencias que emplea Mario Bunge (ciencias formales y ciencias fácticas), las formales están
constituidas por la lógica y la matemática, en ese sentido la estadística como parte de la matemática aplicada se constituye en
una ciencia formal.
2
Empleamos modificaciones al concepto desarrollado por Luis Piscoya Hermoza en Investigación Científica y educacional,
p.23.
3
Seymor Lipzshut. Probabilidad, p.
4
http://www.unal.edu.co/ingenieria/revista/revista/articulos/art1.pdf
 La técnica de la espectrofotometría mediante el uso del fotocolorímetro,
 El procedimiento correspondiente,

Se obtendrá un resultado que con cierto nivel de confianza señalará la glicemia de la muestra y por
estimación el nivel de glucosa del individuo, con esta información se procederá a ejecutar un tratamiento5.

Clasificación de la estadística: Se clasifica en descriptiva e inferencial.

La estadística descriptiva se circunscribe al estudio de los métodos, técnicas y procedimientos que


permiten la recolección, elaboración y análisis de los datos y su transformación en información, tanto en
poblaciones como muestras.

De acuerdo al número de variables “descritas” la estadística descriptiva puede ser unidimensional ó


univariante, bidimensional ó bivariante, o finalmente multidimensional ó multivariante. Aunque el
término “descriptiva” es limitante, el alcance de la estadística descriptiva abarca el nivel comparativo, el
correlacional y el experimental.

La estadística inferencial, estudia los métodos, técnicas y procedimientos que permiten la toma de
decisiones sobre la base de información procedente de muestras, respecto a fenómenos de la población.
Inferir es suponer, estimar “algo” a partir de otro conocimiento.

La estadística inferencial, emplea como base de su desarrollo el estudio de la teoría de probabilidades, que
mide el grado de incertidumbre en la toma de decisiones, de allí que los principales temas de estudio son:
la teoría de conjuntos, las técnicas de contar, la teoría de las probabilidades, la teoría del muestreo, la
prueba de hipótesis, las estimaciones, etc.

Uno de los objetivos de la estadística descriptiva es descubrir el tipo de distribución de la frecuencia de


las categorías, clases e intervalos de clase en los que se ha clasificado las variables en estudio, de tal
manera, que cuando dicha distribución a aproxima a un modelo teórico conocido se emplea la estadística
paramétrica (cuyo objetivo es gestionar los parámetros que sintetizan los datos organizados
correspondientes a una variable en estudio). Cuando no se conoce el tipo de distribución de los datos o no
correspondan a una medición de intervalo se emplea la estadística no paramétrica que implica el uso de
varios modelos entre los que destacan los siguientes: Prueba χ² de Pearson, Prueba binomial, Prueba de
Anderson-Darling, Prueba de Cochran, Prueba de Cohen kappa, Prueba de Fisher, Prueba de Friedman,
Prueba de Kendall, Prueba de Kolmogórov-Smirnov, Prueba de Kruskal-Wallis, Prueba de Kuiper, Prueba
de Mann-Whitney o prueba de Wilcoxon, Prueba de McNemar, Prueba de la mediana, Prueba de Siegel-
Tukey, Prueba de los signos, Coeficiente de correlación de Spearman, Tablas de contingencia, Prueba de
Wald-Wolfowitz, Prueba de los rangos con signo de Wilcoxon y otras.

Población y muestra: Población es un conjunto de elementos6 que presentan al menos una


característica7 común. Las poblaciones se clasifican por el número de elementos en finitas e infinitas, las
poblaciones finitas tienen un número determinado de elementos, que pueden ser enumerados, las infinitas
presentan un número ilimitado de elementos, pueden ser numerables (que se pueden contar) y no
enumerables (que no se pueden contar).

Existen poblaciones finitas, pero donde no se puede determinar su número, dichas poblaciones se
consideran finitas hipotéticamente infinitas, ejemplos:
Población finita:
a) Alumnos matriculados en la facultad durante la gestión 2007.
5
http://www4.ujaen.es/~esiles/TEMA%202.pdf
6
Algunas veces se restringe el concepto de población a un conglomerado humano, tal apreciación es errónea, pues se asume el
concepto de población como equivalente al concepto de UNIVERSO, que se estudia en la teoría de conjuntos.
7
Es una propiedad que distingue a un elemento de otro, el color de los ojos, el nivel de glicemia, la tenencia de cerebro, la
opinión sobre un problema, etc.
b) Muestras de orina procesadas en el SELADIS durante el mes de enero de 2008.
c) Tabletas de Bisacodilo envasadas por un laboratorio durante una semana.
Población infinita enumerable:
a) Lanzamientos de una moneda sobre una mesa.
b) Giros completos de una rueda en movimiento permanente.
c) Oscilaciones de un péndulo de movimiento radial constante.
Población infinita no enumerable:
a) Las coordenadas de los puntos que constituyen una línea recta
b) Los valores del nivel de glicemia existentes en el intervalo de normalidad.
c) Los valores del ácido úrico compatible con la vida por encima del intervalo de normalidad.
Población finita hipotéticamente infinita:
a) Las personas con gripe en el presente día en la ciudad de La Paz.
b) Las muestras de agua de 5 ml que se pueden obtener de un río.
c) Las partículas de carbón que desprenden las chimeneas del área industrial en un día determinado.

Muestra es un subconjunto de una población. Se clasifican en aleatoria y determinística, Es aleatoria


cuando la base de selección de sus elementos consiste en la premisa: “todo elemento de la población debe
tener la misma probabilidad de ser elegido como parte de la muestra”. Cuando se rompe este criterio la
muestra se convierte en deterministica. Por lo tanto, una muestra es deterministica cuando los criterios de
selección de los elementos no incluyen la aleatoriedad, en su lugar pueden ser la accesibilidad, la
comodidad, el costo o finalmente la voluntad o conocimiento del “muestrista”.

Se trabaja con muestras cuando no es posible ejecutar el estudio completo de la población 8, pero debe
quedar claro que el objetivo es conocer información sobre la población, por ende la muestra debe ser
“representativa” de la población. Pero, surge una pregunta ¿cómo puede ser “algo” representativo de un
“algo mayor” desconocido?, por ello que el criterio de representatividad se circunscribe a la aleatoriedad,
es decir, para que una muestra sea “representativa estadísticamente” debe ser aleatoria ó sus sinónimos
“estocástica”, “probabilística”.

El proceso de conocer sobre la población a partir de la muestra se conoce como inferencia estadística, es
decir, se pretende conocer los “parámetros poblacionales” a partir de los “estadísticos muestrales”. Esta
acción la realizamos de manera empírica a diario, lo que hace la estadística es medir la “certidumbre” de
la estimación.

Ejemplo 2. En relación al ejemplo 1. para conocer la Glicemia del individuo, le tomamos una “muestra
conveniente” de sangre, y ejecutamos la pericia del laboratorio correspondiente, obtenemos un resultado,
dicho resultado es sobre la muestra de sangre, sin embargo, asumimos (de manera no conciente) que la
muestra es representativa de toda la sangre del individuo y por último afirmamos que el nivel de glicemia
es del individuo, es obvio que el tratamiento lo realizaremos no a la muestra sino al individuo.

Ejemplo 3. Hay la denuncia que el vino “Rica uva” esta provocando trastornos en sus consumidores,
existe la sospecha que el nivel de metanol sobrepasa los máximos permitidos, se remite al laboratorio una
muestra de botellas de vino, a su vez de una de las botellas se toma una muestra que es sometida al
análisis bromatológico, se encuentra que el nivel de metanol esta en los niveles permitidos, la pericia

8
Las razones para estudiar muestras en lugar de la población son varias, entre ellas:
a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
b. Como consecuencia del punto anterior ahorraremos costes.
c. Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser
una tarea inaccesible o imposible de realizar.
d. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a
un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos que realizar a una
población.
La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de
inclusión y/o exclusión.
concluye que el trastorno atribuido al vino no se origina en el contenido de metanol y se infiere (estima)
que el resto del vino producido esta en la misma condición de la muestra.

La estimación es un proceso que se desarrolla sobre la base del análisis de probabilidades, de tal manera
que se mide la “certidumbre” de una decisión tomada, que no es lo mismo que la “adivinación”, donde no
existe medición de la incertidumbre.

Características de una población: constantes y variables . Característica es una peculiaridad


que distingue a un elemento de una población, por ejemplo, en una población de pacientes, la edad es una
característica de cada paciente, el tratamiento al que es sometido, la respuesta a los fármacos
administrados, la opinión acerca del servicio hospitalario, el estado de animo, su frecuencia cardiaca,
nivel de acido úrico, la zona de domicilio, número de hijos vivos (no los tontos), operaciones a las que fue
sometido, etc., etc. Podríamos decir que un paciente es un conjunto de características.

Las características se clasifican en constantes y variables. Las características constantes son aquellas que
admiten un único valor, por ejemplo en una población de mesas de madera, la característica tipo de
material de la mesa, admitirá sólo una respuesta: madera.

Si todas las características fueran constantes, sólo existiría la nada, de esa manera, lo que da la razón de
existencia son las diferencias, que se traducen en las variables.

Variable, son características que pueden asumir mas de un valor, por ejemplo, en una población de
muestras de sangre procesadas en un laboratorio, el nivel de la glicemia puede adoptar diferentes valores.
Las variables se clasifican de diversa manera:

Por la forma de valoración: cualitativa, cuantitativa discreta y cuantitativa continua.


• Variable cualitativa, se valora empleando la “observación9 ”.
• Variable cuantitativa discreta, se valora empleando el “conteo” o recuento.
• Variable cuantitativa continua, se valora empleando la “medición” o mensuración.

Por el tipo de nivel10 de medición11 . Existen cuatro tipos de niveles: nominal, ordinal, de intervalo y de
razón (ratio). La idea empírica de “nivel” nos lleva ineluctablemente a una valoración cualitativa ordinal,
es decir, existe un orden conceptual de ubicación del nivel mas bajo hacia un nivel mas alto.

Esta forma de clasificación surgió al conceptualizar la medición como la aplicación de un valor numérico
a las modalidades en que se presenta una característica variable, por ejemplo, la variable sexo, se puede
clasificar en dos modalidades: masculino y femenino, por razones de codificación se puede asignar un
número 1 a masculino y 2 a femenino, estos números asignados representan sólo una forma numérica de
codificar las categorías de la variable sexo, pero no implican ningún tipo de orden. Otro tanto, ocurre
cuando la variable escala de calificación (nota de aprovechamiento) se transforma de su valoración
cuantitativa a su percepción cualitativa. Estos dos niveles de escala sólo se pueden aplicar cuando la
variable adopta diferentes categorías nominales y por ende sus datos no son numéricos. En cambio, en las
variables cuantitativas el dato es un valor numérico que no requiere transformación y sólo necesita
organización, sin embargo, la variable puede adoptar formas que posibilitan la existencia de un cero
absoluto o de un cero relativo, y que obligan a la existencia de la escala de intervalo (cero relativo) y la
escala de razón (cero absoluto).

9
Se entiende desde el punto de vista amplio, es decir, la observación sensorial (a través de los sentidos) y la que proviene como
respuestas no cuantitativas.
10
En la obra original figura la denominación de “scales” es decir escalas, por esta razón en variados libros emplean en lugar de
niveles de medición el término escalas de medición.
11
Stanley Smith Stevens, desarrollo el análisis de los niveles de medición (level of measurements) de gran uso e influencia no
sólo en el campo de la psicología experimental y que ha originado que otros estudiosos de la estadística rechacen los aportes
del autor.
Stevens S. S. “On the Theory of Scales of Measurement”. In Science v. 103, n. 2384, june 1946.
1) Nominal, cuando la variable se clasifica en categorías que constituyen sustantivos,
adjetivos, etc. literales, es decir nominales , y entre los que sólo se establecen criterios
comparativos de igualdad y no igualdad. Ej. Sexo, estado civil, procedencia de colegio,
zona de domicilio, color de la orina, aspecto de las heces, etc.
2) Ordinal, cuando la variable se clasifica en categorías nominales, pero entre las que existe
un orden relativo a un criterio de ordenamiento. De esa manera, se establece entre las
categorías, además de los juicios de igualdad y no igualdad, los criterios de desigualdad
(mayor y menor) y de orden. Ej. Departamento de origen del nacimiento (Chuquisaca,
Potosí, La Paz, Santa Cruz, Cochabamba, Oruro, Tarija, Beni, Pando) el orden relativo es a
la fecha de fundación. Otros autores clasifican a los departamentos por abecedario, zona
geográfica o criterios conjugados. Lo que es cierto que se establece un orden relativo entre
los departamentos. Si asignamos un valor numérico, este puede cambiar de acuerdo al tipo
de ordenamiento elegido.

En algunos casos se realiza un procedimiento inverso, es decir a un valor numérico


convencional se le asigna una percepción cualitativa, es el caso de la variable escala de
calificación vigente hasta junio 1972 en certificados de estudios universitarios en la
UMSA: 1 = pésimo; 2 = malo; 3 = deficiente; 4 = regular; 5 = bueno; 6 = muy bueno y 7 =
excelente ó la variable escala de calificación vigente en la UMSA a partir de julio 197212.

Se puede verificar que la categoría muy bueno es mayor que la categoría bueno, pero, no es
posible diferenciar numéricamente.

Estos dos tipos de escala son exclusivos de las variables cualitativas.

3) De intervalo, cuando los datos de la variable son números, que pueden formar parte de
intervalos en los que se clasifica la escala de la variable, de tal manera, que la diferencia
entre valores de la variable se puede comparar con la diferencia de otro par de valores, es
decir si los valores son 2, 5 y 8, puedo establecer que 8 – 5 = c ( 5 – 2), en otras palabras
podemos establecer una razón geométrica al despejar el valor de “c”.

Lo anterior, lleva a que se establezca un “cero relativo”, es decir un valor origen, que sólo
representa una valoración de la variable, por ejemplo en la escala de temperatura el 0º C es
una temperatura, es un cero relativo, es un valor, pero de ninguna significa que no exista
temperatura. Otros ejemplos, los años de la era cristiana, el año 0 (nacimiento de Cristo) no
significa que no exista dicho año; la calificación porcentual de un examen, el que obtiene 0
% no es igual al que no ha asistido, 0% es una nota, no significa que no rindió el examen.

En la escala ordinal no se puede conocer cuanto mayor es “excelente” de “muy bueno”, en


cambio, en la escala ordinal 35ºC es mayor en 5ºC a la temperatura de 30ºC. De igual
manera, se puede multiplicar y dividir las diferencias entre dos valores de la escala, sin
embargo, no tiene sentido interpretativo la multiplicación y división entre los valores
mismos de la escala de intervalo.

4) De razón (ratio o proporcional), es una escala de intervalo en la que existe un cero


absoluto, que significa ausencia de la característica, y se puede multiplicar o dividir los
valores mismos de la escala, ejemplo: la variable número de cigarrillos diarios que una
persona fuma. El valor cero significa que la persona “no fumo”, La variable número de
hermanos varones vivos, el dato 0 significa ningún hermano.

12
La escala de calificación vigente da primacía a la forma porcentual, sin embargo, existe la equivalencia cualitativa siguiente:
1-50 reprobado; 51-63 suficiente; 74-76 bueno; 77-89 distinguido; 90-100 sobresaliente, este aspecto se encuentra detallado al
pie de las certificaciones de estudio.
La escala de razón es el mas alto nivel de escalas, con sus valores se puede sumar, restar,
multiplicar y dividir.

Por el tipo de relación: dependiente e independiente

Cuando se relacionan dos conjuntos de elementos, es posible establecer correspondencia univoca y


biunívoca, entre los elementos de los conjuntos, asimismo se puede caracterizar a uno de los conjuntos
como de partida y el otro de llegada. Si la relación adopta la forma biunívoca se establece una función, de
tal manera que esta constituida por pares ordenados, en los que el primer elemento corresponde al
conjunto de partida y el segundo al conjunto de llegada. Se denomina función al conjunto de pares
ordenados, donde la única restricción es que no pueden existir dos o mas pares ordenados con el mismo
primer elemento.

Los conjuntos se simbolizan por letras a las que denominamos variables, de tal manera que el conjunto de
partida corresponde a la variable independiente y el conjunto de llegada a la variable dependiente, esto se
explica por la regla de correspondencia y = f (x).

Estadística unidimensional y multidimensional : La estadística se puede clasificar por el


número de variables estudiadas. Unidimensional o univariante cuando el objeto de estudio es una sola
variable, y multidimensional o multivariante cuando se estudian las relaciones entre varias variables,
destaca en este grupo la estadística bidimensional o bivariante, que estudia las relaciones entre dos
variables.

EJERCICIOS Y PROBLEMAS UNO.

1. Establecer 5 poblaciones finitas relacionadas al campo de la bioquímica.


2. Establecer 5 poblaciones infinitas numerables relacionadas al campo de la bioquímica
3. Establecer 5 poblaciones infinitas no enumerables relacionadas al campo de la bioquímica.
4. Establecer 5 poblaciones finitas hipotéticamente infinitas relacionadas al campo de la bioquímica.
5. Identificar en cada una de las poblaciones de los anteriores ejercicios a) 4 variables cualitativas
nominales b) Cuatro variables cualitativas ordinales c) Cuatro variables cuantitativas discretas y cuatro
variables cuantitativas continuas.
6. En cada caso del ejercicio 5. establecer: a) la definición b) dimensión c) escala de medición, d)
Clasificación de la escala de medición.
7. Identificar en una población de a) pacientes, b) muestras de sangre y c) muestras de orina
Dos variables en escala nominal, dos en escala ordinal, dos en escala de intervalo y dos en escala de
razón.

On the Theory of Scales of Measurement


Author(s): S. S. Stevens
Source: Science, New Series, Vol. 103, No. 2684 (Jun. 7, 1946), pp. 677-680
Published by: American Association for the Advancement of Science
Stable URL: http://www.jstor.org/stable/1671815
Accessed: 26/11/2008 09:14

Your use of the JSTOR archive indicates your acceptance of JSTOR's Terms and Conditions of Use, available at
http://www.jstor.org/page/info/about/policies/terms.jsp . JSTOR's Terms and Conditions of Use provides, in part, that unless
you have obtained prior permission, you may not download an entire issue of a journal or multiple copies of articles, and you
may use content in the JSTOR archive only for your personal, non-commercial use.

Please contact the publisher regarding any further use of this work. Publisher contact information may be obtained at
http://www.jstor.org/action/showPublisher?publisherCode=aaas .

Each copy of any part of a JSTOR transmission must contain the same copyright notice that appears on the screen or printed
page of such transmission.

JSTOR is a not-for-profit organization founded in 1995 to build trusted digital archives for scholarship. We work with the
scholarly community to preserve their work and the materials they rely upon, and to build a common research platform that
promotes the discovery and use of these resources. For more information about JSTOR, please contact support@jstor.org.

American Association for the Advancement of Science is collaborating with JSTOR to digitize, preserve and
extend access to Science.

http://www.jstor.org

You might also like