You are on page 1of 10

Diagrama de caja

Es una representacin grfica que permite establecer simetra o asimetra


de una distribucin se necesita valor mximo, valor mnimo, Q1, Q2, Me y
Q3 representacin grafica basada en cuartiles que ayuda a ilustrar un
conjunto de datos para elaborarlo
Elaboracin:
Es una representacin grfica formada por una caja rectangular en la cual
los lados ms largos nos muestran el recorrido intercuartlico, esta caja
rectangular se divide por un segmento vertical en la cual nos da a conocer
la posicin de la mediana y su relacin con el primer y tercer cuartil ya que
el segundo cuartil coincide con el valor de la mediana
En la grfica rectangular se ubican en una escala sobre un segmento en la
cual sus extremos estn los valores mximos y mnimos de la variable cuyas
lneas que sobresalen son denominadas bigotes y tienen un lmite de
prolongacin de tal manera que si un valor no se encuentre en el rango
determinado es identificado y marcado individualmente.
Ejemplo:
Ingresos de 60 ejecutivos de Marketing

V. mx. : 90
V. min. : 31

Q1: 51,31 Q3: 74.3


Me: 65,7
Q1

Me

Q3

V. min---------------------------------------------------------------------------- v.
mx.

30

35

40

45

50

55

60

65

70

75

80

85

90
Interpretacin:
El diagrama anterior nos muestra que el 50 % central de ejecutivos percibe
ingresos entre 51,31 y 74,3 miles de dlares, la diferencia entre los ingresos
de es 22,9 miles de dlares, equivalente a la Q3-Q1 que corresponden al
rango interctuartlico. Esta distribucin representa una asimetra negativa
representada de dos formas en distribucin.

1. De acuerdo con la lnea punteada, ser asimetra negativa puesto


que la distancia entre Q1 y el Valor minino es mayor que la distancia
entre Q3 y el valor mximo es mayor a la distancia entre Q3, dicho
de otra forma, el 25% de los datos menores a Q1 se encuentran ms
dispersos que el 25% de los datos mayores a Q3
2. Desde otro punto de vista, la distribucin ser tambin asimtricas
negativa puesto que la distancia de Me a Q1 estn ms dispersos que
los de Me a Q3, de igual forma podemos establecer que el nmero de
ejecutivos que tienen ingresos entre 51,31 y 65,7 miles de dlares,
es igual al nmero de ejecutivos que tienen entre 65,7 y 74,3 miles
de dlares.

Rango intercuartlico
Se dice que es una estimacin estadstica de la dispersin de una
distribucin de datos y busca la diferencia entre el tercer y el primer cuartil.
Adems se puede decir que esta medida busca eliminar valores que estn
muy alejados y es muy recomendable cuando la medida de tendencia
central que se
utiliza es la mediana ya que es poco tolerable a
irregularidades que se presenta en los extremos.
El rango intercuartlico no se indica la dispersin en el sin cuento porciento
central de la distribucin y su clculo es diferente tanto para datos
originales como para datos agrupados

Rango Intercuartilico

Q1

Q2

Q3
25%

25%

25%

25%
P25
P75
Para datos originales:
Frmula del Rango intercuartlico:

IQR= Q3-Q1

P50

Edades:

20, 49, 59, 18, 32, 32, 63, 24, 20,


32, 53, 48

Q1 = 1/ 4n = 0,25 *12 = 3

Q3 =3/4n =0,75*12=9

2 = 3 Q3 =3/4n =0,75*12=9
18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63

Q1

Q3

Q1=(20+24)/2= 22 aos

Q3=(49+53)/2= 51 aos

R=51-22=29 aos
Interpretacin:

A partir desde los 22 aos hasta los 51 aos se ubica el 50% central
de la distribucin.
29 aos de edad es la distancia existente en el 50% central de la
distribucin.

Para datos agrupado:

N
Fi1)
4
Q1=lim , I +
fi
(

x Ai

Lim,I: lmite inferior del intervalo que contiene al primer cuartil (Fr% supera
al 25%)
N: total de casos
Fi-1: frecuencia acumulada absoluta de la clase anterior a la que contiene
el primer cuartil
Fi: frecuencia absoluta simple de la clase que contiene al primer cuartil
Ai: amplitud el intervalo que contiene al primer cuartil

Distribucin de pases segn porcentaje de la poblacin de 15 y ms aos


de edad analfabeta, Amrica Latina y el Caribe. Ao 2 0 1 0
Li - Ls
0-5
5-10

xm
2,5
7,5

fi
14
8

fr(%)
50
28

FI
14
22

Fr(%)
50
78

Ai
5
5

10-20
20-42

15
31

3
3
28

11
11
100

25
28

89
100

10
22

1
280 )
(
4
Q1=0+
5=25
14

3
2814 )
(
4
Q3=5+
5=9,4
14

RI = 9,4 2,5 = 6,9


Rango o recorrido:
Su ventaja es que es fcil de calcular, adems posee una interpretacin
intuitiva y su desventaja es que es muy general y solo nos da una leve idea
de la amplitud de variacin en puntajes extremos y descarta los valores
intermedios de la distribucin.
Rango intercuartlico:
Tiene la ventaja de un clculo fcil y no sufre la influencia de sus valores
extremos y su desventaja es que solo mide la dispersin en el centro de
distribucin y tambin mide slo la distancia entre Q3 y Q1 y no la forma en
la que estn distribuidos los datos.

Diagrama de dispersin
El diagrama de dispersin nos permite analizar si existe alguna relacin
entre dos variables, es una herramienta grfica para facilitar una mejor
visin de los datos de interpretarlos, adems simplificada el anlisis
complejo en situaciones cmicas y da una mejor comunicacin tambin nos
brinda mayor informacin que una anlisis matemtico de correlacin y nos
da la oportunidad de posibilidades y alternativas para un estudio.
Para realizar un diagrama de dispersin es necesario seguir una serie de
pasos:
1. Se debe elaborar una teora vlida con una relacin entre dos
variables.
2. Se debe obtener los pares de datos que correspondan a las dos
variables.

3. Se deben determinar los valores mximo y mnimo para cada una de


las variables.
4. Ubicar en que eje irn cada una de las variables.
5. Graficar en el eje horizontal y vertical.
6. Se debe marcar en el diagrama de dispersin los ares de datos.
7. Se debe incluir la informacin relevante en el grfico.
8. Interpretar los resultados.
El diagrama de dispersin es muy importante para estudiar las relaciones de
causa y efecto que vienen de una causa que no se posee informacin y es
muy difcil de medir por lo tanto no sirve para actuar de una manera ms
simple en los procesos que son complejos. Pero hay que tener en cuenta
que las relaciones que existen no son causa de otra.
Anlisis de un diagrama de dispersin
1.
2.
3.
4.

Elaborar una teora vlida con la relacin entre dos variables.


Levantamiento de datos y construccin del diagrama.
Identificar y clasificar la correlacin
Realizar un anlisis y buscar explicaciones.

La utilizacin del diagrama de dispersin es muy ocupada para ensayar


teoras y buscar sus causas, buscar soluciones y obtener resultados de su
calidad.

Ejemplo:
Errores en las facturas
Un equipo busca analizar las causas de los frecuentes errores en las
facturas. El nmero de datos a rellenar variaba segn el tipo de factura. Un
miembro dio la idea de simplificar las facturas que son muy complicadas, lo
que segn el criterio genera la mayora de errores. El equipo investigara en
primer lugar la teora en la que el nmero de errores en una factura
dependa de la cantidad de datos a incluir en la misma. El equipo tomo los
datos relativos a los meses ltimos y los represent en un Diagrama de
Dispersin.
Numero de datos
de la factura
8
15
15
12
10
25
20
17
18

Numero de errores
en factura
3
2
5
4
7
2
3
9
3

23
27
8
18
20
18
15
26
20
10
10
9
13
20
23
20
23
20
13
24
13
13
23
15
22
24
19
12
27
12
17

4
1
0
6
1
0
7
1
5
2
3
5
3
9
10
12
12
8
9
0
0
1
6
6
9
8
6
12
1
2
4
Errores de facturas
15

Nro. de errores de factura

13
.

11
.

9
.

7
.

. 0

...

.
.

..
.

5
25

10

15

20

30

El diagrama de dispersin no pareca confirmar la teora en la relacin del


nmero de das respecto a la cantidad de errores.

Tabla de contingencias:
Es una manera muy til que sirve para clasificar los autos mediante un
recuento traspasando los valores a una tabla de contingencia, dicha tabla se
divide en celdas en las cuales figuran probabilidades y es una de las formas
de manera ms comn para resumir datos categricos cuyo inters se basa
en que si existe alguna relacin entre una variable (fila) y otra
variable(columna) para calcular la intensidad de esa asociacin sea as X y Y
dos variables categricas e I y J respectivamente y se pueden clasificar
como categoras
Se le conoce con el nombre de tabla de contingencia gracias al autor
Pearson que dio su nombre 1904, tambin se le conoce como una tabla de
clasificacin cruzada.
Ejemplo
Se va a sortear un viaje a Italia entre los 120 mejores usuarios de una
agencia de autos.los cuales 65 son mujeres, 80 estn casados y 45 son
mujeres casadas. Se pide:

1. Cul es la probabilidad de que le toque el viaje a un hombre soltero?


2. Si del ganador se sabe que es casado, cul ser la probabilidad de que
sea una mujer?

Casados
Solteros

Hombres
45
65

Hombres

Mujeres
80
120

Mujeres

Total

Casados
Solteros
Total

35
20
505

45
20
65

80
40
120

P(hombre soltero)= 20/120 = 1/6


P(mujer/ casada)=45/80= 0,5625

Bibliografa:

http://www.estadisticaparatodos.es/taller/graficas/cajas.html
http://www.fder.edu.uy/contenido/rrii/contenido/curricular/estadisti
ca/010102.pdf
http://www.universoformulas.com/estadistica/descriptiva/rangointercuartilico/
http://www.fundibeq.org/opencms/export/sites/default/PWF/downlo
ads/gallery/methodology/tools/diagrama_de_dispersion.pdf
http://www.vitutor.com/pro/2/a_14.html

UNIVERSIDAD DE CUENCA
FACULTAD DE CIENCIAS ECONOMICAS
CARRERA MARKETING

Trabajo de:
Estadstica

Profesor:
Javier vila
Temas:
Diagrama de caja
Rango Intercuartilico
Diagrama de dispersin
Tabla de contingencias

Realizado por:
Juan Pablo Avils
Byron Campoverde
Jos Vinueza

UNIVERSIDAD DE CUENCA
FACULTAD DE CIENCIAS ECONOMICAS
CARRERA MARKETING

Trabajo de:
Estadstica

Profesor:
Javier vila
Temas:
Diagrama de caja
Rango Intercuartilico
Diagrama de dispersin
Tabla de contingencias

Realizado por:
Juan Pablo Avils

You might also like