You are on page 1of 11

2 ORGANIZACIÓN Y PRESENTACIÓN DE DA-

TOS.

LOGRO DE LA SESIÓN

Al finalizar la sesión de clase, el estudiante comprende la importancia de organizar y presentar los datos de
manera adecuada.

Una vez recopilada la información de los datos, lo mas conveniente es resumirlos y ordenarlos en una tabla de
distribución de frecuencias para luego presentarlos en gráficos, lo que permitirá obtener conclusiones para la
toma de decisiones.
Una tabla de distribución de frecuencias, es una tabla donde se presentan los diferentes valores de la variable en
clases, con sus correspondientes frecuencias absolutas, relativas y porcentuales.
Las tres frecuencias que se definen a continuación, se pueden calcular para cualquier tipo de variable que se ha
estudiado en la sección anterior.

Definición 2.1 (Frecuencia absoluta)

Es la cantidad de datos que pertenecen a una clase. La suma de todas las frecuencias absolutas es igual al
total de n datos observados. Se representa simbólicamente por f i .

Definición 2.2 (Frecuencia relativa)

Es la razón entre el número de elementos que pertenecen a una clase y el número de elementos de la mues-
tra. Se representa simbólicamente por h i .
fi
hi =
n
donde n : número de elementos en la muestra.
La suma de todas las frecuencias relativas es igual a uno.

Definición 2.3 (Frecuencia porcentual)

Es la frecuencia relativa multiplicada por 100 %, representa el porcentaje de elementos de la muestra que
pertenecen a una clase. Se representa simbólicamente por p i .

p i = h i × 100 %

La suma de todas las frecuencias porcentuales es igual al 100 %.

UTP Sede Arequipa 1 Guia 02


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.

Ejemplo 2.1

Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que
la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados
por modelos, artistas o por la publicidad comercial. Durante el mes de marzo del año 2012, en el colegio
“Alcántara” de la ciudad de Talca, después de las vacaciones de verano, se observó con precaución a 25
alumnos con síntomas de anorexia, registrándose los siguientes signos visibles:
Dieta severa Miedo a engordar Hiperactividad Hiperactividad Miedo a engordar
Uso de ropa holgada Dieta severa Uso de laxantes Uso de laxantes Uso de ropa holgada
Miedo a engordar Dieta severa Uso de ropa holgada Uso de laxantes Uso de laxantes
Dieta severa Uso de ropa holgada Dieta severa Uso de ropa holgada Dieta severa
Dieta severa Dieta severa Uso de ropa holgada Uso de laxantes Hiperactividad

a. Indique la variable y el tipo de variable.


. ..........................................................................................................
. ..........................................................................................................

b. Organice los datos en una tabla de distribución de frecuencias. (indicar título y fuente)

fi hi pi

Total

c. Interprete
f3 : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
h1 : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p4 : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

d. Realice un gráfico para los datos.

UTP Sede Arequipa 2 Guia 02


E STADÍSTICA D ESCRIPTIVA Y P ROBABILIDADES

A continuación, se dan las definiciones de los tres tipos de frecuencias acumuladas. Estas frecuencias acumuladas
no tiene sentido calcularlas cuando la variable es de tipo cualitativa nominal.

Definición 2.4 (Frecuencia absoluta acumulada)

La frecuencia absoluta acumulada, es el número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable. Se representa simbólicamente por F i y se calcula de la siguiente manera.

k
X
Fi = fi
i =1

F1 = f1
F2 = F1 + f 2 = f 1 + f 2
F3 = F2 + f 3 = f 1 + f 2 + f 3
..
.
Fk = F k−1 + f k = f 1 + f 2 + · · · + f k

Donde k indica el número de clases o intervalos.

Definición 2.5 (Frecuencia relativa acumulada)

Es la razón del número de valores menores o iguales que el valor de la variable y el número de elementos de
la muestra. Se representa simbólicamente por Hi y se calcula de la siguiente manera.

Fi
Hi =
n
Esta frecuencia relativa acumulada también se puede calcular de la siguiente forma:

k
X
Hi = hi
i =1

H1 = h1
H2 = H1 + h 2 = h 1 + h 2
H3 = H2 + h 3 = h 1 + h 2 + h 3
..
.
Hk = Hk−1 + h k = h 1 + h 2 + · · · + h k

Donde k indica el número de clases o intervalos.

Definición 2.6 (Frecuencia porcentual acumulada)

Es el porcentaje de valores menores o iguales que el valor de la variable. Se representa simbólicamente por
P i y se calcula de la siguiente manera.
P i = Hi 100 %

UTP Sede Arequipa 3 Guia 02


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.

Otra forma de calcular:


k
X
Pi = pi
i =1

P1 = p1
P2 = P1 + p2 = p1 + p2
P3 = P2 + p3 = p1 + p2 + p3
..
.
Pk = P k−1 + p k = p 1 + p 2 + · · · + p k

Donde k indica el número de clases o intervalos.

Ejemplo 2.2

En la ciudad de Arequipa se construirá una vía rápida que conectará el cono norte y el cono sur de la
ciudad. Para estudiar el impacto que tendrá sobre los conductores, se tomó una muestra de 25 calles de
las más transitadas, en donde se observó la cantidad de vehículos que transitaban por cada minuto. Los
resultados de la observación se muestran a continuación.

10 12 13 14 10 13 15 13 15 12 11 13 14 13 12
14 11 12 11 11 14 12 14 14 15

a. Indique la variable que se ha observado y el tipo de variable.


. ..........................................................................................................
. ..........................................................................................................

b. Construya la tabla de distribución de frecuencias.

fi hi pi Fi Hi Pi

Total

c. ¿En qué porcentaje de calles se han observado que circulan 12 vehículos por minuto? . . . . . . . . . . . . . . . .
. ..........................................................................................................

d. ¿En qué porcentaje de estas calles se observa que circulan 15 vehículos o menos por cada minuto?. . .
. ..........................................................................................................

e. ¿En cuántas calles circulan al menos de 13 vehículos por minuto?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


. ..........................................................................................................

f. ¿En qué número de estas calles circulan 14 o menos vehículos por minuto? . . . . . . . . . . . . . . . . . . . . . . . . . . .
. ..........................................................................................................

UTP Sede Arequipa 4 Guia 02


E STADÍSTICA D ESCRIPTIVA Y P ROBABILIDADES

g. Realice un gráfico para los datos.

Cuando la variable es cuantitativa continua y si es necesario agrupar los datos, esto se realiza por intervalos, tam-
bién se agrupa por intervalos cuando la variable es cuantitativa discreta pero con muchas categorías (generalmen-
te más de 20). Para construir la distribución de frecuencias por intervalos existen varios procedimientos, nosotros
utilizaremos la técnica que se desarrolla lineas abajo, donde el número de intervalos recomendable no debe supe-
rar a 20 ni inferior a 5, consideraremos también la amplitud de los intervalos igual para todos, lo que no siempre
es así.
Sean n valores de alguna variable cuantitativa continua X , podemos agrupar los datos usando los siguientes pa-
sos:

Distribución de frecuencias para variables cuantitativas continuas

I Determinar el rango (R), que está definido por:

R = x max − x mi n

donde:
x max : es el mayor de los datos observados.
x mi n : es el menor de los datos observados.

II Determinar el número de intervalos (k), que está definido por la regla de Sturges:

k = 1 + 3.3 log(n)

donde n > 10. Si k no es un número entero se debe redondear.

III Determinar la amplitud del intervalo (C ), se obtiene dividiendo el rango entre el número de interva-
los, como sigue:
R
C=
k
Importante:

La amplitud C se aproxima por exceso de manera que se cubra todo el rango, ya que se debe
tener kC > R.

UTP Sede Arequipa 5 Guia 02


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.

Si los datos son enteros, C puede ser entero, si los datos tienen un decimal, C tiene al menos un
decimal, etc. Por ejemplo, si los datos tienen dos decimales y si C = Rk = 5.3416, se elige C = 5.35
y no 5.34.

IV Determinar los extremos de los intervalos de la siguiente manera:

I1 = [x mi n ; x mi n +C [
I2 = [x mi n +C ; x mi n + 2C [
I 3 = [x mi n + 2C ; x mi n + 3C [
..
.
Ik = [x mi n + (k − 1)C ; x mi n + kC [

Definición 2.7 (Marca de clase)

Es la denominación que se le da al punto medio de un intervalo en una tabla de frecuencias de datos agru-
pados. Hay tantas marcas de clase como intervalos tenga la variable. Simbólicamente se representa por x i .

L i n f + L sup
xi =
2
donde L i n f y L sup es el límite inferior y superior del intervalo i -ésimo.
La marca de clase es el número que representa a todos los datos contenidos en el intervalo.

Ejemplo 2.3

Parte de un estudio de control de calidad tuvo como objetivo mejorar una línea de producción, se midieron
los pesos (en onzas) de 25 barras de jabón. Los resultados son los siguientes, ordenados del más pequeño al
más grande.
11.6; 12.7; 13.1; 13.6; 14.1; 14.3; 14.6; 15.1; 15.6; 15.8; 15.8; 15.9; 16.2; 16.3; 16.5; 16.5; 17.0; 17.3; 17.4; 17.6;
17.7; 18.3; 18.3; 18.5; 20.3.

a. Indique la variable que se ha observado y el tipo de variable.


Variable X: Peso de una barra de jabón.
Tipo de variable: Cuantitativa continua.

b. Construya la tabla de distribución de frecuencias.

I. Rango: R = x max − x mi n = 20.3 − 11.6 = 8.7


II. Número de intervalos:

k = 1 + 3.3 log(n)
= 1 + 3.3 log(25)
= 5.6132.

Redondeando k = 6, ya que debe ser un número entero.


R 8.7
III. Amplitud del intervalo: C = = = 1.45, como los datos tiene un decimal se puede usar la
k 6
amplitud del intervalo con un decimal, entonces C = 1.5
Verifique si se cumple: kC > R.

UTP Sede Arequipa 6 Guia 02


E STADÍSTICA D ESCRIPTIVA Y P ROBABILIDADES

IV. Cuadro de distribución de frecuencias:


Cuadro 03: Distribución de frecuencias del peso de las barras de jabón.
Peso (oz) fi hi pi Fi Hi Pi
[11.6; 13.1[ 2 0.08 8% 2 0.08 8%
[13.1; 14.6[ 4 0.16 16 % 6 0.24 24 %
[14.6; 16.1[ 6 0.24 24 % 12 0.48 48 %
[16.1; 17.6[ 7 0.28 28 % 19 0.76 76 %
[17.6; 19.1[ 5 0.20 20 % 24 0.96 96 %
[19.1; 20.6[ 1 0.04 4% 25 1.00 100 %
Total 25 1 100 %
Fuente: Propia

c. Escriba algunas interpretaciones respecto al cuadro 03.


. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................

d. Graficar un histograma

e. Escriba algunas interpretaciones a partir del histograma.


. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................

UTP Sede Arequipa 7 Guia 02


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.

f. Graficar el polígono de frecuencias

. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................

g. Graficar la Ojiva

. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................

UTP Sede Arequipa 8 Guia 02


E STADÍSTICA D ESCRIPTIVA Y P ROBABILIDADES

Ejercicios adicionales

1. La compañía de estudios de mercado INFLUYE tiene la necesidad de conocer el tipo de red social que
usan los habitantes de cierta población, para responder a esta interrogante se tomó una muestra de 50
habitantes a quienes se les preguntó por la red social que con mayor frecuencia usan, los resultados se
muestran a continuación:

F W I h5 F T I h5 W T W F T W I W F T W F
W I F F F F F W W W F I F F F W I F W I
I W I F I F F W F F

Donde:
F: Facebook W: Whatsapp
I: Instagram h5: hi5
T: Twitter

a) Indique la variable y el tipo de variable.


b) Elabore la tabla de distribución de frecuencias.
c) Mencione tres interpretaciones o conclusiones a partir de la tabla de distribución de frecuencias.
d) Construya un gráfico adecuado al tipo de variable.

2. Un investigador, al tratar de conocer la motivación que han tenido los estudiantes para estudiar una carrera
universitaria, en el cuestionario que está utilizando, agregó la siguiente afirmación: Voy a la universidad
porque los estudios me permitirán aprender muchas cosas que me interesan. Sobre esta afirmación los
estudiantes dieron su opinión de la siguiente forma:
1:Totalmente de acuerdo, 2: Muy de acuerdo, 3: Bastante de acuerdo, 4: Medio de acuerdo, 5: Poco de acuer-
do, 6: Muy poco de acuerdo.
La encuesta a cuarenta estudiantes dio el siguiente resultado:
1 1 3 1 2 1 1 1 1 2 1 2 1 1 1 2 1 1 1 1
2 1 2 1 1 5 1 6 1 1 4 1 6 1 1 1 1 1 1 6

a) Indique la variable.
b) Construya la tabla de distribución de frecuencias. (Tenga cuidado con el orden ya que el tipo de varia-
ble es cualitativa ordinal)
c) Dibuje un gráfico adecuado a la variable que se está estudiando.
d) ¿Qué porcentaje de estudiantes están en muy de acuerdo con la afirmación?
e) ¿Cuántos estudiantes están muy poco de acuerdo con la afirmación presentada en el cuestionario?
f ) ¿Cuál es la razón o proporción de estudiantes que están muy de acuerdo con la afirmación que plantea
el investigador?

3. El ingeniero Elmer Días es un supervisor de mantenimiento de aeronaves. Una entrega reciente de pernos
por parte de un nuevo proveedor llamó la atención de uno de los empleados. El ingeniero Días envió una
muestra de 25 de esos pernos a un laboratorio de pruebas para determinar la fuerza necesaria para romper-
los. A continuación presentamos los resultados en miles de libras de fuerza:
157.8 147.4 135.2 151.1 155.7 152.0 140.8 139.8 151.2 144.9
129.9 143.3 152.3 148.7 135.7 135.0 138.9 152.0 127.6 143.0
161.6 135.7 136.3 150.9 148.2

a) Indique la variable en estudio y el tipo de variable.

UTP Sede Arequipa 9 Guia 02


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.

b) Construya el cuadro de distribución de frecuencias e indique algunas interpretaciones.


c) Elabore un histograma.
d) Indique cuatro interpretaciones a partir del gráfico.
e) Elabore un polígono de frecuencias.
f ) Elabore la Ojiva.

4. En la siguiente tabla se muestra las calificaciones de 120 alumnos del curso de estadística.

Calificación fi hi Fi Hi pi Pi
0.15
[6, [ 0.45
70 %

[15, [ 0.1
Total

a) Indique la variable.
b) Complete la tabla.
c) ¿Cuántos alumnos salieron aprobados con calificación mínima 12?
d) ¿Cuál es el porcentaje de estudiantes que desaprobaron?
e) Si el estudiante tiene calificación de 17 o más es sobresaliente ¿Qué porcentaje de estos estudiantes
son sobresalientes?

UTP Sede Arequipa 10 Guia 02


E STADÍSTICA D ESCRIPTIVA Y P ROBABILIDADES

Tarea domiciliaria

1. Se pretende abrir una bodega en el barrio, para esto se está estudiando los productos que consumen con
mayor frecuencia las familias de este barrio en este tipo de negocio. Entre los distintos productos que se
pretende comercializar, al propietario le interesa saber con urgencia la cantidad de litros de leche que com-
pran estas familias en una semana; en una muestra de 25 familias del barrio se obtuvieron los siguientes
resultados:
0 2 3 2 0 3 1 3 2 2 1 3 2 3 2
2 1 2 1 1 4 2 4 4 5

a) Indique la variable que le interesa estudiar con urgencia al propietario y el tipo de variable.
b) Construya la tabla de distribución de frecuencias.
c) ¿Qué porcentaje de familias compran dos litros o menos de leche por semana?
d) Elabore un gráfico adecuado a la variable que se está estudiando.

2. La tabla muestra la distribución del ingreso familiar (diario en soles) correspondiente a 80 familias.
Ingreso Familiar (soles) fi Fi hi Hi pi Pi
[ 160 – 170[
[ 170 – 180[ 48 60
[ 180 – 190[ 0.125
[ 190 – 200[ 0.075
[ 200 – 210[
Total

a) Completar la distribución de frecuencias:


b) Qué información brinda F 4 .
c) Qué porcentaje representa las familias con ingresos de al menos 190 soles.

3. Se dispone del beneficio anual de 38 empresas madrileñas.

a) Identifica la variable estudiada y su tipo.

b) ¿Cuántas empresas tienen una ganancia a lo


sumo de 380 000 euros?

c) ¿Qué porcentajes de empresas tienen una ga-


nancia entre 330 000 y 530 000 euros?

d) ¿Qué porcentajes de empresas tienen una ga-


nancia entre 300 000 y 400 000 euros?

4. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución de
frecuencias simétrica de cinco intervalos de igual amplitud, resultando: Ingreso mínimo $ 120, marca del
clase del cuarto intervalo x 4 = $ 295. Si el 8 % de los ingresos son menores que $ 160 y el 65 % de los ingresos
son menores a $ 270. (Sugerencia: utilice interpolación)

a) ¿Cuál es la variable que se está observando? Indique el tipo de esta variable.


b) ¿Qué porcentaje de ingresos son superiores a $ 280?
c) ¿Qué porcentaje de ingresos son superiores a $ 270?

UTP Sede Arequipa 11 Guia 02

You might also like