Professional Documents
Culture Documents
INTRODUCCIÓN A LA ESTADÍSTICA
GUIÓN HISTÓRICO
La palabra estadística procede del vocablo “estado” pues era función principal de
los gobiernos establecer de los estados establecer registros de población, naci-
mientos, defunciones, etc. Hoy en día la mayoría de las personas entienden por
estadística al conjunto de datos, tablas, gráficos, que suelen publicar en los perió-
dicos.
VARIABLE
Característica que puede tomar diferentes valores. Generalmente se simbolizan
con las últimas letras del alfabeto X, Y, Z, etc. Si la variable toma solamente un
valor, se llama constante.
Una variable que teóricamente puede tomar cualquier valor entre dos valores da-
dos, se llama variable continua, si no es así se llama variable discreta. Como
ejemplo de variables continuas podemos mencionar la duración de los productos
industriales, el peso, la talla, etc. Para discretas, el número de televisores en colo-
res que se venden en un tiempo determinado; el número de construcciones esco-
lares hechas en 1977; el número de cesáreas practicadas en el hospital de mater-
nidad durante un tiempo determinado, etc.
Una regla práctica para distinguir una variable discreta de una continua es: si son
el resultado de medir, son variables continuas y si son el resultado de contar, son
discretas.
CAUSA EFECTO
Más años de educación Gano un mejor salario
Variable Discreta: puede tomar un número finito de valores. Ejemplo: Número
de hijos, número de pupitres de una aula.
Variable Continua: puede tomar todos los valores posibles dentro de un inter-
valo. Ejemplo: temperatura, altura.
MUESTRA
3
PARÁMETRO
Cualquier característica de una población que sea medible por ejemplo, el salario
de todos los obreros de la industria manufacturera; la proporción de personas que
mueren de cáncer, etc.
ESTADÍSTICO
Medida resultante del análisis de una muestra. Por ejemplo, el salario promedio
de los obreros de la industria manufacturera, calculado a partir de una muestra; la
proporción de personas que mueren de cáncer, calculada a partir de una muestra
tomada de la población de personas que fallecen.
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva estudia el mundo real; narra una realidad; trata con da-
tos numéricos concretos que sirven de base al proceso estadístico de descripción;
para esto se vale de la recolección, presentación, tabulación y análisis de estos
datos. De acuerdo a lo anterior, quiere decir que hablar de estadística descriptiva
nos estamos refiriendo al análisis de un fenómeno colectivo. Es decir, que al cal-
cular los valores del fenómeno o variable en estudio: medidas de tendencia cen-
tral, medidas de dispersión, etc., estas medidas describen el fenómeno completa-
mente.
ESTADÍSTICA INFERENCIAL
ellos, poder hacer estimaciones y proyecciones, de gran utilidad para los investi-
gadores, para la toma de decisiones en cualquier actividad del hombre, que sea
susceptible de observarse y medirse. Se dice inferencial, porque a través de una
pequeña parte representativa del universo se infiere lo que está ocurriendo. La
mayor importancia de la inferencia estadística, además de la señalada, radica en
la economía de tiempo, dinero y trabajo en cualquier tipo de estudio. Imagínese
usted el tiempo, el costo y el trabajo que se llevaría un médico investigador al
querer estudiar la relación entre el consumo de cigarrillos y las enfermedades del
corazón, investigando todos los fumadores de un país.
ESCALAS DE MEDIDA
Las escalas de medida constituyen una metodología o convención para medir dis-
tintas magnitudes.
Las escalas de medida, se dividen en cuatro: Nominal, Ordinal, De Intervalo y de
Razón.
Las operaciones matemáticas aplicadas a la estadística, dependen del nivel de
medición. Estos niveles de medición generan datos, los cuales pueden ser:
a) Cualitativos o no métricos, y
b) Cuantitativos o métricos.
Los no métricos pueden ser: atributos, características y propiedades categóricas
que se usan para identificar y describir a un conjunto de cosas o sujetos.
Las métricas, se usan para medir o determinar las posibles diferencias en el de-
sempeño de los sujetos, en cantidad y grado.
Escala
Nominal
Cualitativas no Escala
métricas Ordinal
Datos
Escala de
Intervalo
Cuantitaivas
métricos
Escala de
Razón
ESCALA NOMINAL
ESCALA ORDINAL
ESCALA DE INTERVALO
Estas escalas tienen las características de las anteriores, y además las distancias
relativas; por tanto no sólo interesa conocer si un elemento es superior, igual o in-
ferior a otro en relación con una propiedad, sino también en qué medida; es decir,
que la distancia entre 40 y 50, es la misma que entre 80 y 90. Esta escala requie-
re la medida de la diferencia entre pares de elementos; es decir, requiere infor-
mación sobre la amplitud de la diferencia entre elementos, lo cual se consigue
mediante el establecimiento de una unidad común de medición. Por ejemplo, es
posible que el sujeto A es 10 libras más pesado que el sujeto B. De este modo se
puede tomar medidas de las posiciones relativas de los elementos dentro de la
7
Esta escala constituye el nivel más alto de medición; contiene las características
de una escala de intervalo, con la ventaja adicional de poseer el cero absoluto; es
decir, casos que en verdad se da una situación de cero como ausencia total de
una característica; por ejemplo en las variables: peso, talla, número de personas
con SIDA en una zona determinada, se da el cero absoluto, ya que su peso de
cero, realmente significa total ausencia de esta característica; lo mismo sucede
con la talla y el número de personas con SIDA. Sin una variable permite o se da el
cero absoluto, esto permite determinar la proporción o razón conocida de dos va-
lores de la escala. Por esta propiedad de la escala, se puede establecer razones
tales como se dan en la variable peso, en la cual se dice que un peso de 80 libras
es el doble que uno de 40 libras, o un peso de 60 libras, es 3 veces mayor que
uno de 20 libras. Contrario a ésto, las variables inteligencia y temperatura, entre
otras, son ejemplos que utilizan escalas de intervalo, debido a que el punto cero
es arbitrario; tomando el caso de la temperatura, se puede decir que el cero no
representa la ausencia de calor (recuerde que hay temperaturas bajo cero); sin
embargo, la distancia entre cualesquiera dos puntos de la escala es igual, o sea,
que el cambio de temperatura entre 38 y 39 grados centígrados es igual al cam-
bio de entre 40 y 41 grados centígrado. Puede notarse, entonces, que en esta es-
cala la temperatura, no se puede obtener razones o proporciones; es decir no se
puede decir que 30°C sea el doble de 15°C.
La siguiente figura presenta un resumen de las cuatro escalas de medida:
8
Datos
ESCALA DE RAZÓN
ESCALA DE INTERVALO
ESCALA ORDINAL
ESCALA NOMINAL
EJERCICIOS RESUELTOS
9
1) Suponga que usted desea ser accionista de una fábrica de camisas para hom-
bres adultos, cuyo mercado sea el área centroamericana. La fábrica está en
proceso de montarse, y se están haciendo los estudios de factibilidad; entre
otros problemas, está el determinar las cantidades adecuadas de producción
de camisas para hombres adultos de acuerdo con las diversas medidas. Se
pregunta:
a) ¿Cuál es la variable importante a estudiar?
b) ¿Cuál sería su población?
c) ¿Será esta población finita o infinita?
d) Para bajar los costos de esta investigación qué decisión tomaría
e) ¿Será la variable a estudiar continua o discreta?
f) ¿En qué caso estaría manejando parámetros?
g) ¿En qué caso estaría manejando estadísticos?
Respuestas:
Ejercicio N°1:
a) La medida del cuello de los hombres adultos.
b) La medida del cuello de los hombres adultos del área centroamericana.
c) Es población finita, aunque sea grande.
d) Hacer el estudio utilizando las técnicas del muestreo.
e) La variable es continua.
f) Las medidas serían parámetros en el caso de trabajar con toda la
población.
g) En el caso de trabajar a base de muestreo.
Ejercicio N° 2:
a) Variable.
b) Constante.
c) Variable.
d) Variable.
e) Constante.
Ejercicio N° 3:
a) Inferencia estadística.
b) Inferencia estadística.
c) Inferencia estadística.
d) Estadística descriptiva.
11
e) Inferencia estadística.
Ejercicio N° 4:
a) Discreta.
b) Continua.
c) Continua.
d) Discreta.
e) Continua.
6) ¿Qué escala de medida se ha usado cuando el atributo “profesiones académi-
cas”, se clasifica de la siguiente manera? Economistas, ingenieros, médicos, psi-
cólogos, sociólogos, otros.
Respuesta: Escala nominal.
EJERCICIOS PROPUESTOS.
1- Establezca la diferencia entre estadística descriptiva y estadística inferencial.
Ponga ejemplos:
R/ La diferencia fundamental estriba en que la descriptiva describe la característi-
ca principal de los datos reunidos, mientras que la inferencial, extrae conclusiones
útiles sobre la totalidad de las observaciones posibles en la información recabada.
Ejemplo: Un maestro desea analizar el rendimiento escolar de los alumnos de su
curso (Descriptiva).
El Ministerio de Educación desea conocer como anda la enseñanza de matemática
moderna en los novenos grados del sistema educativo del país (inferencial)
13
Ejemplos: se desea conocer la proporción de paginas defectuosas que traen los li-
bros de un lote de cincuenta libros, y al examinarlos todos ellos, resultó ser la pro-
porción de 2%, esta medida constituye un parámetro. Si se desea conocer la pro-
porción, antes señalada, examinando una muestra aleatoria de diez libros y la
proporción resulta ser el 1.8%, esta medida constituye un estadístico.
11-Los números peden ser usados de, al menos, en cuatro maneras distintas a sa-
ber:
a) Como rótulos, identificaciones o etiquetas. R/ Escala nominal
b) Como signos para indicar la población de un grado dentro de una serie. R/
Escala ordinal.
c) Como signos para indicar las diferencias entre dos o más instancias en una
escala. R/ Escala de intervalos
d) Como signos para indicar proporciones entre dos o más instancias en una
escala. R/ Escala de razón
Escriba el nombre de las escalas de medida, correspondientes a cada una
de las proporciones: a, b, c y d.
12-Si clasificamos las siguientes variables: estado civil, religión, sexo, alfabetismo,
ocupación de acuerdo a la presencia o ausencia de frecuencias en sus categorí-
as: ¿Qué tipo de escala de medida se estaría manejando?.
R/ Escala nominal.
15-A continuación se presenta los pesos de dos personas: Juan tiene un peso de
200 libras y Pedro uno de 100 libras. Determine la relación de los pesos entre
Juan y Pedro; luego diga qué escala se ha usado en esta situación. R/ Razón de
2 a 1; escala de razón.
16-Si los candidatos en una contienda electoral se les clasifica según el grado de
popularidad; ¿Qué tipo de escala se estaría manejando?. R/ Escala ordinal.
19-Si en una clasificación de variables se mantiene una relación entre sí; es decir,
relaciones que se expresan en términos algebraicos de desigualdades : x < b;
x > y; ¿A qué tipo de escala corresponde estas relaciones?. R/ Escala ordinal.
21-Si una variable se clasifica de tal suerte que se pueden establecer proporcio-
nes, por tener cero absoluto; ¿Qué tipo de escala se estaría usando?. R/ Escala
de razón.
18
22-¿Se podría utilizar escala de razón para clasificar la variable temperatura? Jus-
tifique su respuesta. R/ No, porque no tiene cero absoluto.
24-En qué escala de medida están basadas las respuestas al siguiente cuestiona-
rio:
a) ¿Cuál es su nombre?. R/ Escala nominal.
b) ¿Cuál es ti estatura?. R/ Escala de intervalo.
c) ¿Cuál es su peso?. R/ Escala de intervalo.
d) ¿Cuál es su estado civil?. R/ Escala nominal.
e) ¿Cuál es su ocupación?. R/ Escala nominal.
f) ¿Cuál es su CUM (rendimiento promedio). R/ Escala de intervalo.
g) ¿Cómo compara su rendimiento académico con respecto al de sus compa-
ñeros?. R/ Escala de razón.
R/ A) Escala de intervalo.
19
B) Escala ordinal.
C) Escala nominal.
Distribución de frecuencias
La siguiente información corresponde al peso de, en libras de un grupo de 50 es-
tudiantes.
100 103 113 110 110 107 108 110 114 115
116 117 118 117 117 120 117 121 120 120
124 124 124 124 127 125 125 128 128 130
131 131 131 132 133 134 135 136 138 138
140 141 142 145 148 146 145 162 152 150
El conjunto de datos de esta tabla constituye una serie estadística simple. La serie
no da mayor información, convertiremos la serie en agrupada (incluye clases y
frecuencias).
El primer paso es ordenar la serie de menor a mayor ver la tabla ordenada.
100 110 116 118 124 125 131 134 140 146
103 110 117 120 124 127 131 135 141 148
107 113 117 120 124 128 131 136 142 150
108 114 117 120 124 128 132 138 145 152
110 115 117 121 125 130 133 138 145 162
Los datos ordenados en esta forma nos dan una pequeña información: a) conoce-
mos rápidamente el menor y mayor valor que toman la variable: 100 y 162 res-
pectivamente; b) el valor más frecuente es 117 y 124.
Construyendo una tabla de frecuencias con los datos ordenados.
Con la siguiente fórmula se puede construir una tabla de clases y frecuencias.
iC LS Li 1
De donde :
iC Ancho de clase
LS Límite superior
Li Límite inf erior
Construyendo una tabla de clases y frecuencias.
Ancho de clase: IC = 7
Libras f
100 – 106 2
20
107 – 113 6
114 – 120 11
121 – 127 8
128 – 134 9
135 – 141 6
142 – 148 5
149 – 155 2
156 - 162 1
Construya una tabla de clases y frecuencias con los datos anteriores, hacerlo con
una ancho de clase de iC = 10
Continuas
Frecuencias absolutas, relativas y acumuladas.
Usando la tabla anterior, la frecuencia absoluta se define como el número de
casos que caen dentro de la clase, así la frecuencia absoluta de la quinta clase es
9, lo que significa que hay 9 estudiantes que pesan entre 128 y 134 libras.
Libras f
100 – 106 2
107 – 113 6
114 – 120 11
121 – 127 8
128 – 134 9
135 – 141 6
21
142 – 148 5
149 – 155 2
156 - 162 1
Las frecuencias relativas
Se encuentran dividiendo la frecuencia absoluta entre la sumatoria de las frecuen-
cias absolutas, multiplicadas por 100.
f
fr x100
N
Por ejemplo la frecuencia relativa de la primera clase es:
2
fr x100
50
fr 4%
En la siguiente tabla se muestra las frecuencias absolutas y relativas
Libras f fr
%
100 – 106 2 4
107 – 113 6 12
114 – 120 11 22
121 – 127 8 16
128 – 134 9 18
135 – 141 6 12
142 – 148 5 1
149 – 155 2 4
156 - 162 1 2
Las frecuencias acumuladas
La construcción de las frecuencias acumuladas se obtiene sumando las frecuen-
cias absolutas anteriores con las posteriores así:
La frecuencia acumulada de la segunda clase será:
2+6=8
La frecuencia acumulada de la tercera clase será:
8 + 11 = 19
La siguiente tabla muestra las frecuencias absolutas, relativas y acumuladas
Libras f fr fa
%
22
100 – 106 2 4 2
107 – 113 6 12 8
114 – 120 11 22 19
121 – 127 8 16 27
128 – 134 9 18 36
135 – 141 6 12 42
142 – 148 5 1 47
149 – 155 2 4 49
156 - 162 1 2 50
50
Por razones metodologías vamos a dividir el estudio de las gráficas, en dos gran-
des ramas: para variables continuas y gráficas para variables discretas.
1. Histograma
El histograma es una serie de rectángulos, de base igual al intervalo de clase y al-
tura correspondiente a las frecuencias respectivas. Para que los rectángulos que-
den yuxtapuestos escribiremos, en el eje de las abscisas, los límites reales inferio-
res de cada clase, como se muestra en la gráfica 1.
Histograma
12
10
8
Frecuencia
0
100-106
107-113
114-120
128-134
142-148
149-155
163-169
93-99
121-127
135-141
156-162
Libras
5) Clic en Aceptar
6) En la siguiente ventana en Rango de Entrada :, seleccione A1 hasta
A50
7) En Rango de Clases:, seleccione B1 hasta B12
8) Rellene Rótulos
9) En Opciones de Salida, rellene Rango de salida, escoja G5
10) Rellene Crear Gráfico
11) Clic en Aceptar, ver la figura.
26
19) Dar un clic derecho sobre el Área del gráfico, en el menú que apare-
ce de clic sobre Opciones del gráfico… esto servirá para cambiar el
título del eje X ver la figura.
29
21) De doble clic sobre el eje de las “x” (Eje de categorías) del gráfico,
ver la figura.
30
23) De doble clic sobre cualquier barra del histograma, seleccione la pes-
taña Opciones, y en la opción Ancho de rango, escriba 0, de clic en
Aceptar ver la figura
31