Professional Documents
Culture Documents
ESTADISTICA DESCRIPTIVA
PRESENTADO POR:
GRUPO
204040_94
TUTOR
SERGIO ANDRES DURAN JAIMES
MAYO DE 2016
2
Contenido
INTRODUCCION ............................................................................................................................................. 3
JUSTIFICACIÓN............................................................................................................................................... 4
OBJETIVOS ..................................................................................................................................................... 5
FASE 1 - CARACTERIZACION DEL PROBLEMA DE ESTUDIO............................................................................ 6
MODA VARIABLES CUALITATIVAS ................................................................................................................ 8
DISPERSIÓN ................................................................................................................................................. 10
FASE 3 – REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE ............................................................................... 12
REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE .......................................................................................... 14
ANALISIS SEGÚN PERFIL PROFESIONAL DE RESULTADOS ESTADISTICOS ................................................... 16
CONCLUSIONES ........................................................................................................................................... 19
RECOMENDACIONES ................................................................................................................................... 20
REFERENCIAS BIBLIOGRAFICAS ................................................................................................................... 21
3
INTRODUCCION
Mediante el presente trabajo se desarrolla un informe descriptivo de las actividades realizadas
sobre la problemática planteada para el periodo académico del curso, accidentalidad vial en la
ciudad de Medellín durante el año 2015, para caracterizar el problema de estudio. Esto como
parte del cumplimiento de la guía de actividades correspondiente a la Fase Final (Evaluación
Nacional).
Iniciando con el análisis de los resultados obtenidos durante la primera fase del curso, Fase 1 -
Caracterización Del Problema De Estudio, se identifican los conceptos y componentes
relevantes a la muestra; se complementa este contexto con el análisis de las variables
cuantitativas, Edad y Grados de alcohol del conductor, determinando su rango, varianza,
desviación típica y coeficiente de variación, esto dentro del desarrollo de la Fase 2 – Medidas
Univariantes de Tendencia Central y de Dispersión. Posteriormente y por último se
desarrolla la Fase 3 – Regresión y Correlación Lineal Simple y Regresión y Correlación
Lineal Múltiple; mediante la descripción de la relación bidimensional entre las variables Edad y
Velocidad, determinando el grado de correlación entre dichas variables y proponiendo un modelo
matemático que permita asociar las variables cuantitativas Número de heridos, Edad del
conductor y Velocidad del vehículo.
4
JUSTIFICACIÓN
Recientemente se han implementado medidas políticas, económicas y legales procurando
eliminar, o por lo menos reducir, los índices de accidentalidad vial a nivel nacional, sin embargo
la poca eficacia de estas medidas evidencian, entre otras falencias, la necesidad de analizar la
problemática desde contextos diferentes, estableciendo políticas de intervención más dinámicas
que nos permitan comprender el comportamiento de esta problemática para en consecuencia
determinar la mejor solución posible.
OBJETIVOS
Definir, a partir del desarrollo de los contenidos de la actividad, los conceptos de:
población, muestra, instrumento de recolección de la información, ubicación espacio
temporal de un estudio, unidad estadística del mismo, variables y sus diferentes
clasificaciones.
Determinar la moda para cada una de las variables cualitativas de la muestra y asociarlas
con la situación que está siendo objeto de estudio.
Determinar la relación entre dos o más variables inscritas en una situación específica a
partir del análisis de regresión lineal simple y múltiple.
6
3
3
Cualitativas Cuantitativas
2
7… 7… 2
0
Nominal Ordinal Discreta Continua
8%
8%
mujeres
30% 40%
hombres 44%
70%
Vemos en las gráficas (Figura 3 y 4) como en un 70% los accidentes han sido ocasionados por
hombres, se evidencia también que los carros y las motos son responsables del 84% de los
accidentes de tránsito ocurridos en la ciudad de Medellín durante el año 2015.
8
Tras el análisis de las variables anteriores podemos concluir que la mayor accidentalidad se da en
los meses de Diciembre y Mayo, por su parte los meses de Enero y Febrero representan los
registros con menor accidentalidad, así como el día en el cual se registraron más accidentes fue el
día sábado; luego entonces esto nos permite inferir que la accidentalidad en dichos meses
obedece a la celebración de las festividades de navidad y del día de la madre respectivamente, por
consiguiente es evidente que dichos accidentes estuvieron relacionados con conductores
alcoholizados.
DISPERSIÓN
Media 𝑥̅ = 0.86
Mediana 𝑀𝑒 = 0.5
Moda 𝑀𝑜 = 1
Cuartil Posición Valor
𝑄1 30 2
𝑄2 60 0.5
𝑄3 90 1
Decil Posición Valor
𝐷5 60 0.5
𝐷7 84 2.5
Percentil Posición Valor
𝑃30 36 1.5
𝑃50 60 0.5
Fuente: Base de Datos STM
11
Media 𝑥̅ = 1.42
Mediana 𝑀𝑒 = 0.76
Moda 𝑀𝑜 = 0.29
0.68
Asimetría
Asimétrica Positiva
En base a las gráficas 7, 8 y los datos recopilados en la información anterior, producto del
análisis de las Medidas Univariantes de Tendencia Central para la variable, se evidencia que el
40% de los accidentes no produjo víctimas mortales lo cual si bien no minimiza la gravedad del
mismo, infiere y aumenta el margen de error en el análisis general de los datos de la muestra ya
que alrededor del 50% de los estos equivalen a cero (0).
Debido al resultado anterior el cual no permite generar una conclusión certera y orientada a la
solución del problema, realizó un nuevo análisis de Medidas Univariantes de Tendencia Central
y de Dispersión, esta vez a la variable continua Grados de Alcohol; tomada del registro de
accidentes de tránsito ocurridos en la ciudad de Medellín durante el año 2015. Estos valores,
media, mediana, moda, cuartiles, deciles y percentiles permite evidenciar que la mayor
accidentalidad en la ciudad ha sido causada por conductores con un relativo bajo nivel de alcohol,
presentando dispersión en los datos hacia los diferentes valores de alcoholemia.
Para complementar el análisis anterior se analizaron las variables cuantitativas, Edad (discreta) y
Grados de alcohol del conductor (continua), para estas se determinará el rango, la varianza,
desviación típica y el coeficiente de variación.
12
FRECUENCIA
Estándar 30 33
31
25
20 24
Coeficiente de 𝐶. 𝑉. = 0.048% 21
15
Variación 10
5
5 2
0
17-24 25-34 35-44 45-54 55-59 60
EDAD
Para el desarrollo de la tercera fase se realizó en primer lugar un análisis bidimensional sobre las
variables Edad y Velocidad, tomadas del registro de accidentalidad en la ciudad de Medellín
durante el año 2015, para luego en base a parámetros ya establecidos determinar la existencia o
no de un grado de correlación entre dichas variables. Se propone entonces para este análisis un
13
modelo matemático que nos muestra que con un grado de confiablidad (1%), no es posible
establecer algún tipo de asociación entre las variables, ya que los datos se dispersan de forma
aleatoria a lo largo del eje de coordenadas sin evidenciar ninguna tendencia ordenada en su
comportamiento.
Modelo matemático ̂ = 𝑎𝑥 + 𝑏
𝒚 En base al análisis bidimensional anterior
realizado sobe la existencia o no de una
̂ = 0,121𝑥 + 68,33
𝒚
correlación entre las variables Edad del
Error estándar 𝒔𝒆𝟐 = 311,78 conductor que ocasiona el accidente y
Velocidad a la cual se desplazaba el vehículo
Varianza 𝒔𝒚 𝟐 = 308,65 al momento, tomadas del registro de
accidentes de tránsito ocurridos en la ciudad
Coeficiente de 0,010 de Medellín en el año 2015, podemos
determinación evidenciar que los datos se dispersan de
% Confiabilidad %𝑪 = 1% forma aleatoria a lo largo de su rango por lo
cual no presentan correlación lineal ni una
Grado de 0,1 dependencia en su comportamiento, luego
correlación entonces el modelo matemático desarrollado
% Explicación %𝑬 = 10% no permite inferir conclusiones confiables
sobre la influencia de la edad del conductor
14
sobre la velocidad a la cual se desplazan los vehículos en la ciudad, esto teniendo en cuenta que
esta última es una de las principales causales de accidentalidad vehicular.
Figura 12: Análisis de Regresión y Correlación Figura 13: Análisis de Regresión y Correlación
EDAD VELOCIDAD
Curva de regresión ajustada Curva de regresión
20 ajustada
N° de HERIDOS
15
N° de HERIDOS 20
HERIDOS 15
10 HERIDOS
10
5 5
Pronóstico
HERIDOS Pronóstico
0 0
HERIDOS
0 50 100 0 100 200
EDAD VELOCIDAD
Gráfico de probabilidad
20
normal
N° de HERIDOS
15
10
5
0
0 20 40 60 80 100 120
Muestra percentil
Modelo ̂ = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2
𝒚
matemático ̂ = 1.04 − 0.003𝑋1 + 0.027𝑋2
𝒚
Coeficiente de 𝑅 2 = 0,00001
determinación
Grado de 000,3
correlación
% Explicación %𝑬 = 0.37%
Tras el desarrollo del modelo matemático propuesto para el análisis de la muestra tomada del
registro de accidentes de tránsito ocurridos en la ciudad de Medellín en el año 2015, se puede
evidenciar que no existe una correlación entre las variables independientes Edad y Velocidad con
respecto a al comportamiento de la variable dependiente, Número de heridos; por lo tanto este
modelo no permite generar conclusiones que permitan dar solución al problema planteado; se
deban entonces tomar una serie de variables diferentes de la muestra y realizar un nuevo análisis
de regresión y correlación lineal múltiple sobe los datos de la muestra.
16
Si bien la media aritmética representa un punto de equilibrio que nivela la serie de datos, para
este caso el registro de accidentes de tránsito ocurridos en el año 2014 en la ciudad de Medellín,
disminuyendo el exceso en los datos superiores a este punto medio y aumentando el valor de los
datos inferiores; el valor calculado para la moda y la gráfica que representa la tabla de
frecuencias de la variable soportan el hecho de que en el 40% de los casos no hubo mortalidad en
los accidentes ocurridos; esto indica que si bien la gravedad del accidente se puede determinar
analizando el número de muertos que estos ocasionan, para este caso en particular casi la mitad
de los datos equivalen a un valor cero, por lo cual no permite un análisis concluyente en este
aspecto. De otro lado podemos evidenciar como alrededor del 40% de los datos restantes reflejan
que hubo por lo menos 1 muerto en dichos accidentes y esta tendencia si nos permite concluir que
el conducir un automóvil es una actividad de alto riesgo y no debe ser asumida por personas
inexpertas o que no comprender la gravedad de las consecuencias que esta puede llegar a
ocasionar.
Los valores de la media, mediana, moda, cuartiles, deciles y percentiles; al igual que la asimetría
en la distribución de los datos de esta variable, permite evidenciar como la mayor accidentalidad
automovilística en la ciudad de Medellín ha sido causada por conductores con un relativo bajo
nivel de alcohol, 1.5 grados o menos, lo cual demuestra que no necesariamente se debe estar
“borracho” para que se vea afectada la habilidad de conducción de un vehículo, queda claro
entonces que con el consumo más mínimo de alcohol se genera un alto riesgo de accidentalidad.
Por lo tanto para afrontar esta situación no basta con endurecer los castigos, se hace necesario un
programa de prevención que genere un cambio de mentalidad en la ciudadanía, y desarraigue el
consumo de alcohol como parte de las celebraciones, festividades e interacciones sociales en la
ciudad.
En esta interpretación del problema de estudio vemos que a diferencia del caso tomado en la
variable continua, este tiene un crecimiento general mayor entre sus unidades, podemos apreciar
de la muestra tomada que su variación parcial es del 43,50%.
por el porcentaje de alcohol en el oxígeno del vehículo y a su vez una cámara detectora de
movimiento, esta última analizara el patrón de movimientos y reflejos del conductor.
Como medida de seguridad este sistema no permitirá el funcionamiento normal del vehículo
hasta que no detecte un conductor apto para la conducción.
19
CONCLUSIONES
Tras realizar la actividad correspondiente a la Fase Final (Evaluación Nacional) del curso,
y consolidar los diferentes análisis hechos sobre las variables contenidas en la muestra,
los estudiantes integrantes del grupo colaborativo hemos logrado consolidar de igual
manera los conocimientos construidos a lo largo del desarrollo del curso y contextualizar
cada uno de estos mediante un análisis estadístico serio que analice y sustente una posible
solución a una determinada problemática propia de nuestros campos de acción
profesional.
RECOMENDACIONES
Mediante los resultados obtenidos para cada una de las variables seleccionadas, analizadas y
relacionadas; hemos logrado evidenciar que en el contexto de la accidentalidad en la ciudad de
Medellín, según los registros de la secretaria de tránsito para el año 2015, no hay una tendencia o
relación marcada entre la información que representan los datos y su comportamiento con
respecto al accidente, que permita inferir de forma clara una solución a la problemática estudiada.
Cualitativas Cuantitativas
21
REFERENCIAS BIBLIOGRAFICAS
Como hacer un gráfico de dispersion en Excel. (10 de Diciembre de 2012). Obtenido de Youtube
-Canal Irlanda Rodriguez: https://www.youtube.com/watch?v=egCYS0YdC84
Cuartiles Deciles y Percentiles. (12 de Marzo de 2015). Obtenido de Youtube - Canal hector
fabio amaya: https://www.youtube.com/watch?v=GgXi00GbCnQ
Cuartiles y percentiles en el excel. (12 de Abril de 2015). Obtenido de Youtube - Canal Ruben
Sebastian: https://www.youtube.com/watch?v=sc9u5NXNJjI
Estadística, tabla de frecuencias, gráficos, media, mediana, moda. (10 de Febrero de 2015).
Obtenido de Youtube - Canal Academia Internet:
https://www.youtube.com/watch?v=zAGn--QNmg8
Regresión Lineal Multiple. (18 de Mayo de 2015). Obtenido de Youtube - Canal Diego cortes:
https://www.youtube.com/watch?v=rOEKkRcd3hM