You are on page 1of 21

UNIVERSIDAD TECNOLÓGICA DEL PERÚ

Estadística Inferencial

ESTUDIO DE MERCADO SOBRE PREFERENCIAS DE CINE

Trabajo de investigación como parte del curso de


Estadística Descriptiva y Probabilidades presentado por
los alumnos:

 Castillo Saldaña, Diego Alonso


 Villanueva Dominguez, Carol
 Guerrero Obregon, Marco Antonio
 Cordova Davila, Ashley Aranzazu

2018-1
Objetivo:

Conocer las necesidades e incomodidades de las personas que


van al cine y así mismo dar a conocer puntualmente las
soluciones a estos problemas que presentan dicho
establecimiento.
Encuesta de preferencias del cine
Nombre completo:
DNI:
Edad:
Sexo:

 ¿Qué género de película es de tu preferencia? (escoger solo uno)

Comedia
Aventura y acción
Ciencia ficción
Drama
Terror

 ¿Cómo calificarías los servicios de venta de la confitería del cine? (escoger solo
uno)

Excelente
Bueno
Regular
Malo
Pésimo

 ¿Cuál es la cantidad que gasta en una salida al cine?

___________ Soles

 ¿Con que acompáñate frecuentas más para ir al cine ? (escoger solo uno)

Familia
Pareja
Amigos

 ¿Cuántas veces saliste al cine durante los últimos 1 meses?

___________ Veces.

 ¿Cuál de esos cines es de tu preferencia?

Cinepolis
Cinemark
UVK
IDENTIFICACÍON DE LOS TÉRMINOS ESTADÍSTICOS

Población: Todos los personas que visitan el cine regularmente en lima


metropolitana en el año 2018.

Muestra: 60 personas que visitan el cine regularmente en lima metropolitana


en el año 2018.

Unidad de análisis: Una persona que va al cine regularmente en lima


metropolitana en el año 2018.

Variables:
 Edad
 Preferencia de genero de película
 Calidad del servicio
 Costo por salida
 Acompañante
 Cantidad de salidas al cine al mes
 Cine de preferencia

2.- TIPOS DE VARIABLES:

 Cuantitativa discreta: Cantidad de salidas al cine al mes


 Cuantitativa continúa: Edad
 Cualitativa nominal: Preferencias de Películas
 Cualitativa ordinal: Calidad de servicio (escala de Liker)
VARIABLE CUANTITATIVA CONTINUA
Tabla 1. Edades mayores a 18 años de las 60 personas
encuestadas.

Xi- (Xi- fi(Xi- fi(Xi-


EDAD xi fi Fi hi Hi hi% Hi% xifi (Xi-X)^2
media media)^2 media)^2 media)
[ 18 ; 24 > 21 11 11 0,183 0,183 18,33% 18,33% 231 156,25 -12,5 156,25 1718,75 137,5
[ 24 ; 30 > 27 17 28 0,283 0,467 28,33% 46,67% 459 42,25 -6,5 42,25 718,25 110,5
[ 30 ; 36 > 33 10 38 0,167 0,633 16,67% 63,33% 330 0,25 -0,5 0,25 2,5 5
[ 36 ; 42 > 39 11 49 0,183 0,817 18,33% 81,67% 429 30,25 5,5 30,25 332,75 60,5
[ 42 ; 48 > 45 3 52 0,05 0,867 5,00% 86,67% 135 132,25 11,5 132,25 396,75 34,5
[ 48 ; 54 > 51 5 57 0,083 0,95 8,33% 95,00% 255 306,25 17,5 306,25 1531,25 87,5
[ 54 ; 60 > 57 3 60 0,05 1 5,00% 100,00% 171 552,25 23,5 552,25 1656,75 70,5
TOTAL 60 2010 1219,75 6357 506

Fuente : propia

Medida de tendencia central:

2010
 Media = = = 33.5
60

El 50% de los encuestados tienen edades menores o iguales a 34 años, y el 50%


restante tienen mayor a 34 años.

Medidas de dispersión:

6357
 Varianza = = = 107.746
59

 Desviación = √𝑠 2 = 10.38
Tabla 2. Edades mayores a 18 años de las 30 primeras
personas encuestadas.

Xi- (Xi- fi(Xi- fi(Xi-


EDAD Xi fi Fi hi Hi hi% Hi% Xifi (Xi-X)^2
media media)^2 media)^2 media)
[ 18 ; 25 > 21,5 8 8 0,267 0,267 26,67% 26,67% 172 136,111 -11,67 136,111 1088,889 -93,333
[ 25 ; 32 > 28,5 8 16 0,267 0,533 26,67% 53,33% 228 21,778 -4,667 21,778 174,222 -37,333
[ 32 ; 39 > 35,5 6 22 0,2 0,733 20,00% 73,33% 213 5,444 2,333 5,444 32,667 14
[ 39 ; 46 > 42,5 4 26 0,133 0,867 13,33% 86,67% 170 87,111 9,333 87,111 348,444 37,333
[ 46 ; 53 > 49,5 2 28 0,067 0,933 6,67% 93,33% 99 266,778 16,333 266,778 533,556 32,667
[ 53 ; 60 > 56,5 2 30 0,067 1 6,67% 100,00% 113 544,444 23,333 544,444 1088,889 46,667
Total 30 995 1061,667 3266,667 0

Fuente: propia

Medida de tendencia central:

995
 Media = = = 33.17
30

De los primeros 30 personas encuestadas, el 50% de ellas tienen menor o igual a 33


años de edad, mientras que el otro 50% tienen mayores a 33

Medidas de dispersión:

3266.667
 Varianza = = = 112.6
29

 Desviación = √𝑠2 = 10.6


Tabla 3. Edades mayores a 18 años del resto de los
encuestados

Xi- (Xi- fi(Xi- fi(Xi-


EDAD Xi fi Fi hi Hi hi% Hi% Xifi (Xi-X)^2 media media)^2 media)^2 media)
[ 19 ; 26 > 22,5 8 8 0,267 0,267 26,67% 26,67% 180 115,204 -10,733 115,204 921,636 -85,867
[ 26 ; 33 > 29,5 11 19 0,367 0,633 36,67% 63,33% 324,5 13,938 -3,733 13,938 153,316 -41,067
[ 33 ; 40 > 36,5 3 22 0,1 0,733 10,00% 73,33% 109,5 10,671 3,267 10,671 32,013 9,8
[ 40 ; 47 > 43,5 4 26 0,133 0,867 13,33% 86,67% 174 105,404 10,267 105,404 421,618 41,067
[ 47 ; 54 > 50,5 3 29 0,1 0,967 10,00% 96,67% 151,5 298,138 17,267 298,138 894,413 51,8
[ 54 ; 61 > 57,5 1 30 0,033 1 3,33% 100,00% 57,5 588,871 24,267 588,871 588,871 24,267
Total 30 997 1132,227 3011,867 0

Fuente: propia

Medidas de tendencia central:

997
 Media = = = 33.23
30

De los primeros 30 personas encuestadas, el 50% de ellas tienen menor o igual a 33


años de edad, mientras que el otro 50% tienen mayores a 33

Medidas de dispersión:

3011.867
 Varianza = = = 103.8
29

 Desviación = √𝑠2 = 10.18


VARIABLE CUANTITATIVA DISCRETA
Tabla 4. Calidad de servicio con 60 encuestas.

CALIDAD DE SERVICIOS fi Fi hi Hi p% P%
Excelente 1 1 0.017 0.017 1.7 1.7
Bueno 20 21 0.33 0.347 33 34.7
Regular 23 44 0.383 0.73 38.3 73
Malo 10 54 0.17 0.9 17 90
Pésimo 6 60 0.1 1 10 100
TOTAL 60

Fuente: propia
Tabla 5. Calidad de servicio con las primeras 30 encuestas.

CALIDAD DE SERVICIOS fi Fi hi Hi p% P%
Excelente 1 1 33 33 3.333 3.333
Bueno 12 13 400 433 40.000 43.333
Regular 9 22 300 733 30.000 73.333
Malo 4 26 133 867 13.333 86.667
Pésimo 4 30 133 1 13.333 100
TOTAL 30 1 100

Fuente: propia
Tabla 6. Calidad de servicio con el resto de 30 encuestas.

CALIDAD DE SERVICIOS fi Fi hi Hi p% P%
Excelente 0 0 0 0 0 0
Bueno 8 8 0.27 0.27 27 27
Regular 14 22 0.47 0.74 47 74
Malo 6 28 0.2 0.94 20 94
Pésimo 2 30 0.06 1 6 100
TOTAL 30 100

Fuente: propia
 Intervalo de confianza para la media de una población:

α 0.05
X 33.5 α/2 0.025
N 60 Z( α/2 ) 0.975
S 10.38 1.96
Z( α/2 )
-1,96

𝑠 𝑠
𝑥 − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑥 + 𝑍𝛼/2
√ 𝑛 √𝑛

10.38 10.38
33.5 − 1.96 ∗ ≤ 𝜇 ≤ 33.5 + 1.96 ∗
√60 √60

30.873 ≤ 𝜇 ≤ 36.127

El intervalo de confianza al 95% para la


poblacion de 60 de las edades entre 18
a 60 años en la cuidad de Lima, se
encuentra en el intervalo
30.873 ≤ 𝜇 ≤ 36.127

 Intervalo de confianza para la diferencia de 2 medias


poblacionales:
α 0.05
n1 = 30 n2 = 30 α/2 0.025
x1= 33.233 x2 = 33.167 Z( α/2 ) 0.975
S1 = 10.191 S2 = 10.613 1.96
Z( α/2 )
-1,96
𝑍𝛼 𝑆12 𝑆22 𝑍𝛼 𝑆12 𝑆22
(𝑥1 − 𝑥2) − ∗√ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥1 − 𝑥2) + ∗√ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

10.1912 10.6132
(33.233 − 33.167) − 1.96 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ + ⋯
30 30

−5.199 ≤ 𝜇1 − 𝜇2 ≤ 5.331

Dado que 𝜇1 − 𝜇2 = 0 ∈ [-5.199; 5.331]. Se concluye


que μ1 ≠ μ2 además que μ1 es menor que μ2 por lo
tanto concluimos que no hay diferencia significativa
cuando se encuentra el valor 0.

 Prueba de hipótesis para la media de una población:

α 0.05
Z( α ) 0.950 n 60
1,645 x 33.500
Z( α ) S 10.38
-1,645
Ho µ ≤ 30.873 X µ 30.873
Ha µ > 30.873 ✓

𝑥−µ 33.500−30.873
𝑧= 𝑆⁄ = 10.38⁄ = 1.96
√𝑛 √60

Como z = 1.96 se sitúa en la zona de crítica, rechazamos la hipótesis nula y aceptamos la


alternativa por lo tanto la media poblacional comprendida entre los años 18 a 60 es mayor
que la media muestra.
 Prueba de hipótesis para dos medias poblacionales:

X1 = 33.233 X2 = 33.167 α 0.05


N1 = 30 N2 = 30 α/2 0.025
S1 = 10.191 S2 = 10.613 Z( α ) 0.950
1.645
Z( α/2 )
-1.645
Ho µ1 ≥ µ2 ✓
Ha µ1 < µ2 X

(𝑥1−𝑥2)−(µ1−µ2) (33.233−33.167)−(0)
𝑍𝑐 = 2 2
= 𝑍𝑐 = 2 2
= 0.025
√𝑆1 +𝑆2 √10.191 +𝑆10.6132
𝑁1 𝑁2 30 30

Como z = 0.025 se ubica en la región de aceptación, entonces aceptamos la hipótesis nula y


rechazamos la alternativa por la que no se puede afirmar que existe una diferencia
significativa entre las dos poblaciones

 Intervalo de confianza para la proporción de una población:

α 0.05 p 0,38
α/2 0.025 q 0,62
Z( α/2 ) 0.975
1.96
Z( α/2 )
-1,96

pq pq
𝑝 − Zα/2 ∗ √ < π < p + Zα/2 ∗ √
n n

0.38∗0.62 0.38∗0.62
0.38 − 1.96 ∗ √ < 𝜋 < 0.38 + 1.96 ∗ √
60 60

0.257 ≤ 𝜋 ≤ 0.503
Con un 95% de confianza la verdadera proporción
de encuestados a las que la calidad de servicio les
parece regular se encuentra entre 25.7% y 50.3%.

 Intervalo de confianza para la diferencia de proporciones de 2


poblaciones:

α 0.05 P1 0,47
α/2 0.025 q1 0,53
Z( α/2 ) 0.975
P2 0,3
1.96
Z( α/2 ) q2 0,7
-1,96
P1-P2 0,17

𝑝1𝑞1 𝑝2𝑞2
(𝑝1 − 𝑝2) − Zα/2√ + ≤ 𝜋1 − 𝜋2 ≤ (𝑝1 − 𝑝2) + Zα/2 …
𝑛1 𝑛2

0.47∗0.53 0.3∗0.7
(0.47 − 0.3) − 1.96√ + ≤ 𝜋1 − 𝜋2 ≤ (0.47 − 0.3)..
30 𝑛230

−0.072 ≤ 𝜋1 − 𝜋2 ≤ 0.412

A un nivel del 95% de confianza la verdadera diferencia de proporciones en la eficacia de


respuesta de los encuestados a la calidad del servicio se encuentra en el intervalos -7.2% y
41.2%
 Prueba de hipótesis para la proporción de una población:

P 0,47 α 0.05
Po 0,38 Z( α ) 0.950
1-Po 0,62 1,645
Z( α )
-1,645

Ho P = 0,38
Ha P ≠ 0,38

𝑃−𝑃𝑜 0.47−0.38
𝑍𝑐 = = = 1.436
𝑃𝑜(1−𝑃𝑜) 0.38(0.62)
√ √
𝑛 𝑛60

Como el estadístico de la prueba cae, en la región de aceptación. A un nivel de significancia


del 5%, no existe evidencia estadística para rechazar la calidad del servicio del cine es a lo
mas 38%.

 Prueba de hipótesis para las proporciones de dos poblaciones:


α 0.05
x1 14
Z( α ) 0.950
x2 9
1,645
n1 30
n2 30 Z( α )
-1,645
p1 0,47
p2 0,3
Ho P1 ≤ P2
pc 0,383
1-pc 0,617 Ha P1 > P2

𝑃1−𝑃2 𝑥1+𝑥2
𝑍𝑐 = ; 𝑃=
1 1 𝑛1+𝑛2
√𝑃(1−𝑃)( + )
𝑛1 𝑛2
0.47−0.3 14+9
𝑍𝑐 = ; 𝑃= = 0.383
1 1 30+30
√0.383(0.617)( + )
30 32

𝑍𝑐 = 1.354

El estadístico de prueba 1.354 cae en la región de aceptación. A un nivel de significancia del


5% no existe suficiente evidencia estadística para rechazar Ho. Es decir concluimos que la
calidad del servicio en las 2 muestras si son significativamente diferentes, ya que la P2 es
mayor a P1.

 Intervalo de confianza para la varianza de una población:

n 30 α 0.05
gl 29 α/2 0.025
S 107.746 1- α/2 0.975

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
α ≤𝜎 ≤ α
𝑥 2 (1 − , n − 1) 𝑥 2 (− , n − 1)
2 2

(29)𝑆 2 2
(29)𝑆 2
≤𝜎 ≤
45.722 16.047

68.340 ≤ 𝜎 2 ≤ 194.718

Por lo tanto diremos que el intervalo de confianza del 95% para la variabilidad de las edades
esta entre 68.340 ℎ𝑎𝑠𝑡𝑎 194.718.
 Intervalo de confianza para el coeficiente de la varianza de dos
poblaciones:

𝑆 2 1 = 112.644 𝑆 2 2 = 103.837
α 0.05
N1 = 30 N2 = 30
α/2 0.025
V1 = 29 V2 = 29

𝑆 21 1 𝜎2 1 𝑆 2 1
∗ ≤ ≤ ∗ 𝑓α/2(v2, v1)
𝑆 2 2 𝑓α/2(v1, v2) 𝜎2 2 𝑆 2 2

112.644 1 𝜎2 1 112.644
∗ ≤ 2 ≤ ∗ 2.101
103.857 2.101 𝜎 2 103.857

𝜎2 1
0.516 ≤ 2 ≤ 2.279
𝜎 2

𝜎21
Entonces el intervalo de confianza del 95% es 0.516 ≤ ≤ 2.279, dado que el intervalo
𝜎22
𝜎21
contiene la unidad es decir = 1 en algún momento pueden ser iguales.
𝜎22

 Prueba de hipótesis para una varianza de una distribución normal:

n 30
s 103.857 Ho 𝜎 2 = 𝜎 2o ✓
α 0.05 Ha 𝜎 2 ≠ 𝜎 2o X
α/2 0.025
1- α/2 0.975

(𝑛−1)𝑆 2 (29)857
𝑥 2 𝑐𝑎𝑙𝑐 = = = 44.072
𝜎2o 68.340

Entonces como 𝑥 2 < 45.722 aceptamos la hipótesis nula y rechazamos la hipótesis


alternativa, lo que quiere decir que si son iguales.
 Prueba de hipótesis para la razón de dos varianzas:

𝑆21 10.513
𝑆22 10.891 Ho 𝜎 21 ≥ 𝜎 22 ✓
V1 = 29 V2 = 29 Ha 𝜎 21 < 𝜎 22 X

𝑆 21 10.6132
𝐹𝑐𝑎𝑙𝑐 = = = 1.085
𝑆 22 10.1912

Como F = 1.085 está en la zona de aceptación, aceptamos la hipótesis nula y rechazamos la


alternativa lo que quiere decir que la varianza muestral 1 es mayor que la varianza muestral
2.

 Prueba de bondad de ajuste Chi-cuadrado:

Nª de veces Frecuencia
1 4
2 13 La forma de la distribución de defectos es de
Ho poison
3 13
La forma de la distribución de defectos es de
4 1 Ha poison
5 11
6 4
7 a mas 14

4 ∗ 1 + 13 ∗ 2 + 13 ∗ 3 + 1 ∗ 4 + 5 ∗ 11 + 4 ∗ 6 + 14 ∗ 7
μ= λ= = 4.167
60

𝑒 − λ ∗ λ𝑥
𝑝(𝑥) =
𝑥!

Nª de veces Probabilidad Frecuencia esperada Frecuencia


observada
1 0.065 3.9 4
2 0.135 8.1 13
3 0.187 11.22 13
4 0.195 11.7 1
5 0.162 9.72 11
6 0.113 6.78 4
7 a mas 0.143 8.58 14

Grado de libertad = k-1-m= 7-1-1=5 //


Regla de decisión de rechazo Ho si 𝑥 2 > 11.07

𝑥 2 (0.95,5)=11.07

(4−3.9)2 (13−8.1)2 (13−11.22)2 (1−11.7)2 (11−9.72)2 (4−6.78)2 (14−8.58)2


𝑥2 = + + + + + + =17.767
3.9 8.1 11.22 11.7 9.72 6.78 8.58

Como 𝑥 2 = 17.767 es mayor que 11.87 se rechaza la nula y se concluye que la distribución
no es de poison.

You might also like