You are on page 1of 8

MODELO DE GENERACIÓN UTILIZANDO RLM Y CLASIFICACIÓN CRUZADA

LUIS ALEJANDRO BORNACHERA LEMUS

UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA


FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA DE TRANSPORTE Y VÍAS
TUNJA
2016
MODELO DE GENERACIÓN UTILIZANDO RLM Y CLASIFICACIÓN CRUZADA

LUIS ALEJANDRO BORNACHERA LEMUS

Presentado al Ingeniero:
LUIS ALFREDO VEGA BAEZ

UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA


FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA DE TRANSPORTE Y VÍAS
TUNJA
2016
ESTADÍSTICAS DESCRIPTIVAS TÍPICAS DE VIAJES

TAMAÑO MEDIO DE HOGAR POR


ESTRATO
N° DE INTEGRANTES PROMEDIO

5.000
4.000
3.000
2.000
1.000
0.000
1 2 3 4 5
BARRIO

Se identificó que en promedio en el estrato 1 hay mayor porcentaje de integrantes por hogar
haciendo que este estrato sea representativo en un modelo de generación de viajes para estos
datos.

POSESIÓN DE VEHÍCULOS POR


ESTRATO
N° DE VEHÍCULOS

500
400
300
200
100
0
1 2 3 4 5
ESTRATO SOCIO-ECONÓMICO

El estrato con mayor índice de posesión vehicular es el estrato 3 para estos datos aunque no
será muy tenida en cuenta esta cifra a la hora de elegir el modelo y la discretización de las
variables.
VIAJES POR ESTRATO
1 2 3 4 5
(1)
2576
(2)
8801
(5)
247
(3)
9338
(4)
1854

El estrato que realiza mayor cantidad de viajes es el estrato 3 y es de tener en cuenta que estos
viajes son basados en el hogar (HB)

VIAJES POR HOGAR SEGUN SU # DE


INTEGRANTES
1 2 3 4 5 6 7 8 9 10 11 12
2%
1% 1% 0% 0% 3%
4%
9% 9%
20%
19%

32%

Los hogares con un número de 4 integrantes por hogar para esta base de datos son los que
realizan una mayor cantidad de viajes.
MODELOS GENERADOS

MODELO 1. DISCRETIZACIÓN DE LA VARIABLE ESTRATO

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.92093626
Coeficiente de determinación
R^2 0.84812359
R^2 ajustado 0.84763838
Error típico 3.40613238
Observaciones 3004

Estadístico
Coeficientes Error típico t
Intercepción 0 #N/A #N/A
Variable X 1
(Estrato) 0.72592041 0.13032826 5.56993866
Variable X 2
(integrantes) 1.67432125 0.03022403 55.3970262
Variable X 3
(Ingreso) 0.48699456 0.05945913 8.19040798
Variable X 4
(Autos) 0.28180788 0.13160777 2.14127073

Promedio de Viajes= 7.59587217 Y= 9.013365792

MODELO 2. DISCRETIZACIÓN DE LA VARIABLE INGRESO

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.92071714
Coeficiente de determinación
R^2 0.84772005
R^2 ajustado 0.84723443
Error típico 3.4106545
Observaciones 3004

Estadístico
Coeficientes Error típico t
Intercepción 0 #N/A #N/A
Variable X 1
(Estrato) 0.45749192 0.04971892 9.20156655
Variable X 2
(Integrantes) 1.67989303 0.029633 56.6899322
Variable X 3
(Ingreso) 0.81826688 0.1457128 5.61561446
Variable X 4
(Autos) 0.26283894 0.13367722 1.96622094
Promedio de Viajes= 7.59587217 Y= 9.0852251

MODELO 3. DISCRETIZACIÓN DE LA VARIABLE AUTOS/HOGAR

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.9209139
Coeficiente de determinación
R^2 0.84808241
R^2 ajustado 0.84759716
Error típico 3.40659414
Observaciones 3004

Estadístico
Coeficientes Error típico t
Intercepción 0 #N/A #N/A
Variable X 1
(Estrato) 0.30650609 0.06163876 4.97261948
Variable X 2
(Integrantes) 1.61383271 0.03186762 50.6417737
Variable X 3
(Ingreso) 0.3981236 0.06947968 5.73007252
Variable X 4
(Autos/hogar) 0.48277159 0.14986931 3.22128395

Promedio de Viajes= 7.59587217 Y= 7.616794

ANÁLISIS DE CLASIFICACIÓN CRUZADA

Número de autos por hogar


<ó=1 >ó=2
<ó= N° de hogares 650 10
3
N° de viajes 3505 56
integrantes por hogar

Promedio de viajes 5 6
4 N° de hogares 390 5

N° de viajes 3394 60
Promedio de viajes 9 12

>ó= N° de hogares 314 9


5 N° de viajes 3465 92
Promedio de viajes 11 10
MODELO ESCOGIDO Y ANÁLISIS DE LA INFORMACIÓN Y CONCLUSIONES

Para esta base de datos se obtuvo una serie de modelos en los cuales ningún coeficiente que
acompaña la variable es negativo, por lo tanto se tiene un incremento por cada unidad de la
variable, es decir que a mayor residentes, a mayor cantidad de vehículos o a mayor ingreso los
viajes por hogar incrementan, lo que parece ser lógico, y por lo tanto todos los modelos pueden
ser viables para aplicar; pero es de vital importancia tener en cuenta datos que nos ofrece cada
uno como su R2 y la prueba del modelo para verificar si este se ajusta a la realidad.

Al realizar un modelo lineal, la que mejor se acopla a este comportamiento es la variable


independiente n° de personas por hogar, ya que es la más representativa para el modelo y además
el resto de variables presentan un desfase con respecto al comportamiento lineal.

En esta ocasión, para elegir el modelo, este se basó en varias decisiones que llevaron a que el
mismo fuera más viable y se ajustara más a la realidad. Algunos de los criterios en los que se basó
esta decisión fueron:

 El contexto de la toma de decisiones: Implicó adoptar una perspectiva, en este caso no tan
particular para elegir el alcance o la amplitud del sistema de interés. No fue tan relevante una
perspectiva particular debido a que en este caso se buscó adoptar un modelo que fuera más
representativo para toda la población en general.
 Exactitud deseada: La exactitud deseada normalmente es justo la necesaria para discriminar
entre una buena solución y otra menos buena. En este caso fue de vital importancia aplicar
este criterio a la elección del modelo definitivo debido a que se busca obtener el modelo más
preciso y calibrado posible con los datos existentes y un factor influyente en este criterio de
decisión fue la confiabilidad en la regresión lineal (R2).
 La disponibilidad de datos adecuados: Se analizó su estabilidad, consistencia y las dificultades
asociadas a pronosticar sus valores futuros debido a que una inconsistencia en los mismos
puede generar bastante dificultades a la hora de calibrar el modelo.

Con base en lo anteriormente mencionado y algunos criterios estadísticos tenidos en cuenta, el


modelo escogido más representativo y confiable fue:
Donde:

X1 es la variable Estrato.

X2 es la variable integrantes.

X3 es la variable Ingreso.

X4 es la variable discretizada Autos/hogar.

Este modelo fue el que mejor se ajustó a los datos, ofreció un porcentaje de confiabilidad de los
datos bastante alto y además los coeficientes fueron consistentes y algo muy importante en la
toma de la decisión de la elección de este modelo fue que al probar el mismo fue que se comportó
de una forma bastante buena siendo el modelo más consistente.

Para la discretización del término Autos/hogar fue tenido en cuenta que esta desajustaba un poco
el modelo en la regresión sin discretizar y por eso fue necesario un ajuste de esta tomando como 0
a los hogares sin ningún vehiculo y como 1 a los que tenga un vehículo o más. Además de que era
poco representativa en el modelo inicial sin discretizar y al proceder a discretizar esta variable fue
el mejor resultado de un modelo adecuado.

Análisis de Clasificación Cruzada

A partir de la clasificación cruzada de variables se puede determinar los hogares que mejor
representen los viajes, elaborando una categorización de hogares tomando intervalos que se
ajustan al número de integrantes que pertenecen a estos, divido en menores e iguales a tres,
iguales a cuatro y mayores e iguales a cinco. Los cuales se relaciona con una categorización de
posesión de vehículos menores e iguales a uno y mayores e iguales a dos.

Como se observa en la tabla, los hogares que mejor representan la demanda de viajes son los que
están conformados por cinco o más personas y que pueden o no poseer un solo vehículo, donde
existen 314 hogares que realizan alrededor de 3465 viajes y representan un promedio de 11
viajes, este comportamiento puede justificarse teniendo en cuenta que al aumentar el número de
integrantes del hogar, aumenta el número de necesidades y deseos individuales, que a su vez la
posición de vehículos en estos hogares facilitan realizar estos viajes.

A pesar que el promedio de viajes de los hogares que tienen cuatro integrantes y poseen dos o
más vehículos es mayor, se debe tener en cuenta que el número de hogares es mucho menor que
el grupo seleccionado.

You might also like