Professional Documents
Culture Documents
Académico
Escuela Profesional de PSICOLOGÍA HUMANA 2018-I
2003-20402 ESTADISTICA APLICADA A LA INVESTIGACION
Nota:
Docente: Mg. Miguel Vásquez Calderón
Uded de matrícula:
Hasta el Domingo 27 de Mayo 2018
huaraz Hasta las 23.59 PM
Recomendaciones:
1. Recuerde verificar la
correcta publicación de
su Trabajo Académico
en el Campus Virtual
antes de confirmar al
sistema el envío
definitivo al Docente.
Revisar la
previsualización de su
trabajo para asegurar
archivo correcto.
2. Las fechas de publicación de trabajos académicos a través del campus virtual DUED LEARN están definidas
en la plataforma educativa, de acuerdo al cronograma académico 2018-I por lo que no se aceptarán
trabajos extemporáneos.
3. Las actividades de aprendizaje que se encuentran en los textos que recibe al matricularse, servirán para su
autoaprendizaje mas no para la calificación, por lo que no deberán ser consideradas como trabajos
académicos obligatorios.
5. Estimado alumno:
El presente trabajo académico tiene por finalidad medir los logros alcanzados en el desarrollo del curso.
Para el examen parcial Ud. debe haber logrado desarrollar hasta 5 y para el examen final debe haber
desarrollado el trabajo completo.
1TADUED20181DUEDUAP
Trabajo
Académico
Criterios de evaluación del trabajo académico:
Este trabajo académico será calificado considerando criterios de evaluación según naturaleza del curso:
Confección de gráficos.
b) Cálculo de parámetros.
* Parámetros de posición
* Parámetros de dispersión
* Correlación
4) Interpretación de a) Establecimiento de predicciones.
resultados.
b) Test de causa - efecto.
2TADUED20181DUEDUAP
Trabajo
Académico
3. ¿Cuáles son los aspectos que nos obligan a utilizar la estadística de forma
constante en nuestra actividad profesional?
(1 punto)
Validar datos es el proceso de confirmar que los valores que se especifican en los
objetos de datos son compatibles con las restricciones dentro de un esquema del
conjunto de datos, al igual que las reglas establecidas para su aplicación. Validar datos
antes de enviar actualizaciones a la base de datos subyacente es una buena práctica
que reduce los errores y la cantidad potencial de acciones de ida y vuelta entre una
aplicación y la base de datos.
Confiabilidad significa, entonces, estabilidad o constancia (exactitud) de los
resultados, o sea, es sinónimo de consistencia, fidelidad, precisión, etc.
24 ¿Cuales son los factores que determinan la validez y confiabilidad de los datos?
Validar datos antes de enviar actualizaciones a la base de datos subyacente es una
buena práctica que reduce los errores y la cantidad potencial de acciones de ida y vuelta
entre una aplicación y la base de datos. Para confirmar que son válidos los datos que
se escriben en un conjunto de datos, se puede construir comprobaciones de validación
en el propio conjunto de datos. El conjunto de datos puede comprobar los datos
independientemente de cómo se esté realizando la actualización, ya sea directamente
mediante los controles de un formulario, desde dentro de un componente o de alguna
otra manera. Dado que el conjunto de datos forma parte de la aplicación, es lógico
construir una validación específica de la aplicación (a diferencia de integrar las mismas
comprobaciones en el servidor de bases de datos).
5. ¿Cuáles son los factores que determinan la validez y confiabilidad de los datos?
3TADUED20181DUEDUAP
Trabajo
Académico
Hay diversos factores que pueden afectar la confiabilidad y la validez de los instru-
mentos de medición.
Un cuarto factor que puede influir esté constituido por las condiciones en las que se
aplica el instrumento de medición. Si hay ruido, hace mucho frío (por ejemplo en una
encuesta de casa en casa), el instrumento es demasiado largo o tedioso, son
cuestiones que pueden afectar negativamente la validez y la confiabilidad. Normal-
mente en los experimentos se puede contar con instrumentos de medición más largos
y complejos que en los diseños no experimentales. Por ejemplo, en una encuesta
pública sería muy difícil poder aplicar una prueba larga o compleja.
Por otra parte, aspectos mecánicos tales como que si el instrumento es escrito, no se
lean bien las instrucciones, falten páginas, no haya espacio adecuado para contestar,
no se comprendan las instrucciones, también pueden influir de manera negativa.
4TADUED20181DUEDUAP
Trabajo
Académico
La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a
partir de la información empírica proporcionada por una muestra, cual es el
comportamiento de una determinada población con un riesgo de error medible en
términos de probabilidad.
5TADUED20181DUEDUAP
Trabajo
Académico
Para su realización se representan los tres cuartiles y los
valores mínimo y máximo de los datos, sobre un rectángulo, alineado
horizontal o verticalmente.
Construcción:
Comparar distribuciones
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por
un segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero(recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mínimo y máximo de la variable. Las lineas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen tienen un límite de prolongación, de modo
que cualquier dato o caso que no se encuentre dentro de este rango es marcado
e identificado individualmente
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
CALCULO DE CUARTILES
6TADUED20181DUEDUAP
Trabajo
Académico
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el
valor de la variable que ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y
el siguiente:
Q2=(39 + 39) / 2 = 39
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que
las edades comprendidas entre el 25% y el 50% de la población está más
dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello
el 25% de los más jóvenes están más concentrados que el 25% de los mayores.
7TADUED20181DUEDUAP
Trabajo
Académico
Medidas de tendencia central
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o
promedio aritmético. Se representa por la letra griega µ cuando se trata del promedio
del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la
muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio
de la muestra es variable puesto que diferentes muestras extraídas de la misma
población tienden a tener diferentes medias. La media se expresa en la misma unidad
que los datos originales: centímetros, horas, gramos, etc.
Ejemplo de desviaciones:
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable
que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es
decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el
otro 50% tiene valores iguales o superiores a la mediana.
Moda
La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo
el punto más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
8TADUED20181DUEDUAP
Trabajo
Académico
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.
Fórmulas
Donde µ es el promedio de la población.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.
Ejemplo 1
9TADUED20181DUEDUAP
Trabajo
Académico
El gobierno desea averiguar si el número medio de hijos por familia ha descendido
respecto a la década anterior. Para ello ha encuestado a 50 familias respecto al número
de hijos y ha obtenido los siguientes datos:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Ejemplo 2
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio
de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la
misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:
3.9 4.7 3.7 5.6 4.3 4.9 5.0 6.1 5.1 4.5
5.3 3.9 4.3 5.0 6.0 4.7 5.1 4.2 4.4 5.8
3.3 4.3 4.1 5.8 4.4 3.8 6.1 4.3 5.3 4.5
4.0 5.4 3.9 4.7 3.3 4.5 4.7 4.2 4.5 4.8
Ejemplo 3:
xi ni fi Ni Fi
0 2 0.04 2 0.04
1 4 0.08 6 0.12
2 21 0.42 27 0.54
3 15 0.3 42 0.84
4 6 0.12 48 0.96
5 1 0.02 49 0.98
6 1 0.02 50 1
(1 punto)
10. ¿Qué significado tiene un coeficiente correlación cero entre dos variables?
10TADUED20181DUEDUAP
Trabajo
Académico
Correlación En este artículo trataremos de valorar la asociación entre dos
variables cuantitativas estudiando el método conocido como correlación. Dicho
cálculo es el primer paso para determinar la relación entre las variables. La
predicción de una variable. La predicción de una variable dado un valor
determinado de la otra precisa de la regresión lineal que abordaremos en otro
artículo. La cuantificación de la fuerza de la relación lineal entre dos variables
cuantitativas, se estudia por medio del cálculo del coeficiente de correlación de
Pearson (1-3). Dicho coeficiente oscila entre –1 y +1. Un valor de –1 indica una
relación lineal o línea recta positiva perfecta. Una correlación próxima a cero
indica que no hay relación lineal entre las dos variables. El realizar la
representación gráfica de los datos para demostrar la relación entre el valor del
coeficiente de correlación y la forma de la gráfica es fundamental ya que existen
relaciones no lineales. El coeficiente de correlación posee las siguientes
características (4): a. El valor del coeficiente de correlación es independiente de
cualquier unidad usada para medir las variables. b. El valor del coeficiente de
correlación se altera de forma importante ante la presencia de un valor extremo,
como sucede con la desviación típica. Ante estas situaciones conviene realizar
una transformación de datos que cambia la escala de medición y modera el
efecto de valores extremos (como la transformación logarítmica). c. El coeficiente
de correlación mide solo la relación con una línea recta. Dos variables pueden
tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña.
Por tanto cuando analicemos las relaciones entre dos variables debemos
representarlas gráficamente y posteriormente calcular el coeficiente de
correlación. d. El coeficiente de correlación no se debe extrapolar más allá del
rango de valores observado de las variables a estudio ya que la relación
existente entre X e Y puede cambiar fuera de dicho rango. e. La correlación no
implica causalidad. La causalidad es un juicio de valor que requiere más
información que un simple valor cuantitativo de un coeficiente de correlación (5).
El coeficiente de correlación de Pearson (r) puede calcularse en cualquier grupo
de datos, sin embargo la validez del test de hipótesis sobre la correlación entre
las variables requiere en sentido estricto (4): a) que las dos variables procedan
de una muestra aleatoria de individuos. b) que al menos una de las variables
tenga una distribución normal en la población de la cual la muestra procede. Para
el cálculo válido de un intervalo de confianza del coeficiente de correlación de r
ambas variables deben tener una distribución normal. Si los datos no tienen una
distribución normal, una o ambas variables se pueden transformar
(transformación logarítmica) o si no se calcularía un coeficiente de correlación
no paramétrico (coeficiente de correlación de Spearman) que tiene el mismo
significado que el coeficiente de correlación de Pearson y se calcula utilizando
el rango de las observaciones.
(1 punto)
11TADUED20181DUEDUAP
Trabajo
Académico
65 63 60 78
60 62 65 75
56 58 60 90
78 80 83 65
90 79 92 58
(2 punto)
12. A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada (tanto en clase como fuera de ella),
obteniéndose los siguientes resultados:
36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
12TADUED20181DUEDUAP
Trabajo
Académico
Ítems I II III
Sujetos
Campos (1) 3 5 5
Gómez (2) 5 4 5
Linares (3) 4 4 5
Rodas (4) 4 5 3
Saavedra (5) 1 2 2
Tafur (6) 4 3 3
13TADUED20181DUEDUAP