Professional Documents
Culture Documents
PROCESAMIENTO DE LA INFORMACIN
Pgina 1 de 30
NDICE
INTRODUCCIN .................................................................................................................. 3
1. MEDICIN ESTADSTICA.............................................................................................. 4
1.1. Tcnicas para el Anlisis Univariable ..................................................................... 5
2. MEDIDAS DE TENDENCIA CENTRAL ......................................................................... 6
2.1. Media Aritmtica ( X ) .............................................................................................. 6
2.2. Mediana (Me) .......................................................................................................... 8
2.3. Moda (Mo) ............................................................................................................ 11
3. MEDIDAS DE VARIABILIDAD O DISPERSN ........................................................... 13
3.1. Amplitud o Rango (R) ........................................................................................... 13
3.2. Desviacin Estndar (S) ........................................................................................ 14
3.3. Varianza (S2) ......................................................................................................... 15
4. ANLISIS CON PRUEBAS ESTADSTICAS .............................................................. 18
4.1. Paramtricas ........................................................................................................ 18
4.2. No paramtricas ................................................................................................... 19
4.3. Tcnicas para el Anlisis Bivariable ..................................................................... 20
ANEXOS ............................................................................................................................ 26
Pgina 2 de 30
MDULO 4
PROCESAMIENTO DE LA INFORMACIN
INTRODUCCIN
Consiste
en
procesar
los
datos
(dispersos,
desordenados,
Pgina 3 de 30
Tcnicas estadsticas
Frecuencia
Describir
variables
diferencias
entre
grupos
Demostrar causalidad
Estimaciones y predicciones
Los anlisis de datos segn el nmero de variables pueden ser univariable, bivariable y
multivariable.
1. MEDICIN ESTADSTICA
Precisar las clases de variables es importante en el anlisis de datos, porque estas van a
determinar las tcnicas estadsticas que se van emplear.
Variables
Tcnicas estadsticas
NOMINALES
Distribucin de frecuencias
Coeficiente de contingencia
Prueba de Chi cuadrado
Moda
ORDINALES
Coeficiente de rango
Mediana
Gamma
INTERVALARES
Mediana
Media aritmtica
Desviacin estndar
Correlacin mltiple
Coeficiente de correlacin de Pearson
PROPORCIONALES
Pgina 4 de 30
En el anlisis de una sola variable se puede emplear tcnicas estadsticas que nos describan
las propiedades de una variable: posicin, dispersin y forma.
a) Posicin.
ubicacin
de
grupo
de
datos,
son
expresados
En la siguiente tabla se resume los estadsticos que se emplean para describir las
propiedades de las variables.
Propiedad
Posicin
Tipo de medida
Tendencia central
Tendencia no central
Dispersin
Medidas de dispersin o
variabilidad
Simetra
Forma
Modalidad
Curtosis
Estadsticos
Media aritmtica
Mediana
Moda
Cuartiles
Recorrido
Varianza
Desviacin estndar
Coeficiente de variacin
Asimtrica
Simtrica
Modos de una distribucin
Razn de momentos de
Pearson
Pgina 5 de 30
2.
El objetivo de las medidas de tendencia central es, determinara los valores que pueden ser
considerados como representativos de un conjunto de datos buscando siempre el punto
medio de los datos. Las medidas que se usan con mayor frecuencia son la media aritmtica,
mediana y moda.
==
=1
=1
X =
=1
Pgina 6 de 30
Ejemplo: Se tiene que en un grupo de seis alumnos el nmero de horas acceso semanal al
internet es el siguiente: 2- 3- 4- 4- 6 5
=1
=
2 + 3 + 4 + 4 +6 + 5
24
X =
=
4
6
6
Los resultados sealan que en promedio los alumnos acceden 4 horas a la semana al
Internet.
=1
=
=1 ()
X =
Pgina 7 de 30
(hi)
Frecuencia
relativa
acumulada
(Hi)
Frecuencia
relativa
porcentual
(hi%)
Frecuencia
relativa
acumulada
porcentual
(Hi%)
0.25
0.25
25.0
25.0
10
16
0.67
0.92
67.0
92.0
24
0.33
1.00
33.0
100.0
Marca
de clase
(xi)
Frecuencia
absoluta
(fi)
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
1-3
4-6
7-9
Intervalo
24
1.00
100.00
Intervalo
(Xi)
(fi)
Xi (Fi)
1-3
12
4-6
10
50
7-9
64
n = 24
= 116
X =
=1
=1
()
=
116
24
= 4.83
Los resultados sealan que en promedio los alumnos acceden 4.83 horas a la semana al
Internet.
Pgina 8 de 30
apareados aparezcan cargados en un extremo, se trata de un valor que esta entre 50% de
unos y 50% de otros.
Se tiene que en un grupo de siete alumnos el nmero de horas acceso semanal al internet es
el siguiente: 2- 3 - 4 - 4 - 5 - 6 5 - 7
Se observa que los valores centrales son el 4 y 5, siendo el promedio 4.5. Por lo tanto, la
mediana es 4.5
4+5
9
= = 4.5
2
2
b) Mediana para datos agrupados
Para casos de datos agrupados por clases se calcula de la siguiente forma:
Tenemos las edades de un grupo de pobladores de la comunidad X.
Pgina 9 de 30
Frecuencia
absoluta
(fi)
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
(hi)
Frecuencia
relativa
porcentual
(hi%)
12
0.03
3.00
14
0.07
7.00
15
0.20
20.00
16
14
0.17
17.00
17
21
0.24
24.00
18
25
0.13
13.00
19
29
0.13
13.00
23
30
0.03
3.00
1.00
100.00
Clase
n=30
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
Intervalo
Frecuencia
absoluta
(fi)
(hi)
Frecuencia
relativa
porcentual
(hi%)
[60, 63)
0.05
3.00
[63, 66)
18
23
0.18
7.00
[66, 69)
42
65
0.42
20.00
[69, 72)
27
92
0.27
17.00
[72, 75)
100
0.08
24.00
1.00
100.00
N=100
Pgina 10 de 30
encuentre ( )
2
1
= 2
.
100/ 2 = 50
Clase de la mediana (66 - 69)
= 66 +
50 23
3 = 67.93
42
Se define como el valor, clase o categora que ocurre con mayor frecuencia en los datos, es
decir, es el valor que ms se repite.
La moda se puede hallar par variables cualitativas y cuantitativas, trabaja preferentemente
con las escalas nominales, se orienta a solo a casos en los cuales se pretende ofrecer una
idea aproximada a cerda de donde est la mayor concentracin de observaciones.
Mo = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.
Pgina 11 de 30
Ejemplo: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9
Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
Ejemplo: 2, 2, 3, 3, 6, 6, 9, 9
Se calcula aplicando la siguiente formula cuando los intervalos tienen la misma amplitud.
( 1 ) ( +1 )
Ejemplo: Para los datos de las edades de un grupo de pobladores de una comunidad.
Frecuencia
absoluta
(fi)
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
Intervalo
Frecuencia
absoluta
(fi)
(hi)
Frecuencia
relativa
porcentual
(hi%)
[60, 63)
0.05
3.00
[63, 66)
18
18
23
0.18
7.00
[66, 69)
42
42
65
0.42
20.00
[69, 72)
27
27
92
0.27
17.00
[72, 75)
100
0.08
24.00
N=100
N=100
1.00
100.00
Pgina 12 de 30
= 66 +
(4218)
(4218)+(4227)
3 = 67.8
El rango es el tamao del intervalo en el cual se ubican todos los valores que pueden tomar
los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor
estando incluidos ambos extremos. El rango de una distribucin de frecuencia se designa con
la letra R.
Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms
dispersos estn los datos de un conjunto.
Pgina 13 de 30
a) Datos No Agrupados:
R = max min
Ejemplo, el rango de la siguiente distribucin es: 25, 36, 64, 20, 48, 59.
R = 64 - 20 = 44
b) Datos Agrupados:
R = Lmite superior del ltimo intervalo Lmite inferior del primer intervalo
Ejemplo: Para los datos de las edades de un grupo de pobladores de una comunidad.
Frecuencia
absoluta
(fi)
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
[60, 63)
0.05
3.00
[63, 66)
18
23
0.18
7.00
[66, 69)
42
65
0.42
20.00
[69, 72)
27
92
0.27
17.00
[72, 75)
100
0.08
24.00
1.00
100.00
Intervalo
N=100
(hi)
Frecuencia
relativa
porcentual
(hi%)
R = 75 60 = 15
1( X )2
1
Pgina 14 de 30
Donde:
S = representa la desviacin estndar,
Xi = representa cada uno de los valores,
9+3+8+8+9+8+9+18
8
=9
= 17.1428
= 4.140
Para el caso de datos agrupados primero hallamos la varianza y luego sacamos la raz
cuadrada y obtenemos la desviacin estndar.
Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los
valores respecto a su punto central (Media ).
Pgina 15 de 30
a)
2 =
1(
1
)2
Donde
S2 = representa la varianza,
Xi = representa cada uno de los valores,
9+3+8+8+9+8+9+18
=9
2 =
120
= 17.1428
7
2 =
1(
)2
Ejemplo: Para los datos de las edades de un grupo de pobladores de una comunidad.
Pgina 16 de 30
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
(xi)
Frecuencia
absoluta
(fi)
(hi)
Frecuencia
relativa
porcentual
(hi%)
[60, 63)
61.5
0.05
3.00
[63, 66)
64.5
18
23
0.18
7.00
[66, 69)
67.5
42
65
0.42
20.00
[69, 72)
70.5
27
92
0.27
17.00
[72, 75)
73.5
100
0.08
24.00
1.00
100.00
Punto
medio
Intervalo
N=100
Intervalo
(Xi)
(fi)
Xi (fi)
[60, 63)
61.5
307.5
[63, 66)
64.5
18
1161.0
[66, 69)
67.5
42
2835.0
[69, 72)
70.5
27
1903.5
[72, 75)
73.5
588.0
N=100
= 6795
=1 ()
6795
X =
=
= 67.95
100
Calculo de la varianza
Intervalo
(Xi)
(fi)
(Xi- X )2. fi
[60, 63)
61.5
208.01
[63, 66)
64.5
18
62.10
[66, 69)
67.5
42
8.50
[69, 72)
70.5
27
175.57
[72, 75)
73.5
246.42
N=100
= 7006
Pgina 17 de 30
2 =
4.
7006
100
= 7.006
4.1 Paramtricas
Las pruebas paramtricas son un tipo de pruebas de significacin estadstica que cuantifican
la asociacin o independencia entre una variable cuantitativa y una categrica. Las pruebas
paramtricas exigen ciertos requisitos previos para su aplicacin: la distribucin normal de la
variable cuantitativa en los grupos que se comparan, la homogeneidad de varianzas en las
poblaciones de las que proceden los grupos y una n muestral no inferior a 30. Su
incumplimiento conlleva la necesidad de recurrir a pruebas estadsticas no paramtricas. Las
pruebas paramtricas se clasifican en dos: prueba t (para una muestra o para dos muestras
relacionadas o independientes) y prueba ANOVA (para ms de dos muestras
independientes).
b. Prueba t para dos muestras independientes. Esta opcin debe utilizarse cuando la
comparacin se realice entre las medias de dos poblaciones independientes (los individuos
de una de las poblaciones son distintos a los individuos de la otra) como, por ejemplo, en
el caso de la comparacin de las poblaciones de hombres y mujeres. Por lo tanto, compara
las medias de una variable para dos grupos de casos.
c. Prueba t para dos muestras relacionadas. Existe una segunda alternativa para contrastar
dos medias. Esta se refiere al supuesto caso en el que las dos poblaciones no sean
independientes, es decir, el caso en el que se trate de poblaciones relacionadas. Esta
situacin se encuentra, por ejemplo, en los diseos apareados, diseos en los que los
mismos individuos son observados antes y despus de una determinada intervencin, o
en los diseos en los que las muestras son emparejadas de acuerdo a una serie de
variables para controlar su efecto (como, por ejemplo, en los diseos de casos y controles).
Pgina 18 de 30
4.2.
NO PARAMTRICAS
Las pruebas no paramtricas son aquellas en las que no existen supuestos sobre la
distribucin de los parmetros de la poblacin. Por esta razn es comn referirse a ellas como
pruebas de distribucin libre. Se aplican con mayor frecuencia a los datos nominales y
ordinales, si bien pueden emplearse tambin para analizar datos continuos transformados a
una escala ordinal.
c) Prueba para dos muestras con datos relacionados (T de Wilcoxon). Esta prueba se utiliza
cuando queremos averiguar si dos tratamientos o niveles de la variable independiente se
diferencian entre s (prueba bilateral) o uno es mejor que otro (prueba unilateral). En este
caso, los sujetos han de ser los mismos sujetos o estar apareados en los dos tratamientos.
Pgina 19 de 30
d)
e)
Prueba
para
varias
muestras
con
datos
relacionados
4.3.
Se usan para describir las dos variables conjuntamente o una variable en funcin de
la otra
En los estudios de relaciones entre variables, una de las dos variables juega un papel
ms importante que la otra, sta ser la variable dependiente que denotaremos por y,
Pgina 20 de 30
La correlacin determina la relacin o dependencia que existe entre las dos variables que
intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de
las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las
variables estn correlacionadas o que hay correlacin entre ellas.
La correlacin puede decir algo acerca de la relacin entre las variables. Se utiliza para
entender:
la fuerza de la relacin.
Valor de r
Fuerza de relacin
Fuerte
Moderada
Dbil
-0,1 A 0,1
En general, r> 0 indica una relacin positiva y r <0 indica una relacin negativa, mientras que
r = 0 indica que no hay relacin (o que las variables son independientes y no estn
relacionadas). Aqu, r = 1,0 describe una correlacin positiva perfecta y r = -1,0 describe una
correlacin negativa perfecta.
Pgina 21 de 30
Cuanto ms cerca estn los coeficientes de +1,0 y -1,0, mayor ser la fuerza de la relacin
entre las variables.
Es una medida de la relacin lineal entre dos variables aleatorias cuantitativas, que mide el
grado de relacin de dos variables, cuantifica la fuerza de la relacin.
=1
)
= ( )( )
(
=
[( 2 ) ( )2 ][( 2 ) ( )2 ]
Estudiantes
X (Inteligencia)
Y (Rendimiento
acadmico)
105
116
103
124
137
126
112
129
10
118
10
105
Pgina 22 de 30
Estudiantes
X2
Y2
XY
105
11025
16
420
116
13456
64
928
103
10609
206
124
15376
49
868
137
18769
81
1233
126
15876
81
1134
112
12544
336
129
10
16641
100
1290
118
13924
49
826
10
105
X=
1175
11025
36
Y= 65
X2= 139245
Y2= 489
630
XY=
7871
n=10
10 (7871) (1175)(65)
[10(139245) (1175)2 ][10(489) (65)2 ]
78710 76375
(1392450 138625)(4890 4225)
=
2335
17863625
2335
2804.2155
= 0.83267
Coeficiente de determinacin
R2 = r2 x 1000
R2 = 69.33%
De los resultados podemos decir que la correlacin es fuerte y positiva, que el 69.33% de la
inteligencia est relacionada con el rendimiento acadmico.
Pgina 23 de 30
= 1 =1
= (21)
Dnde:
2 = sumatoria de las diferencias existentes entre los rangos de las dos variables,
elevadas al cuadrado.
= tamao de la muestra expresada en parejas de rangos de las variables.
Ejemplo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin (X) y
el rango o puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la
asignatura de Estadstica. Calcular el coeficiente de correlacin por rangos de Spearman.
Estudiante
Dyana
Elizabeth
Mario
Orlando
Mathas
Josu
Anita
Luca
Pgina 24 de 30
Estudiante
d= X-
d2= (X-Y)2
Dyana
-2
Elizabeth
-2
Mario
-2
Orlando
-1
Mathas
-1
Josu
16
Anita
-1
Luca
1
2
=32
= 1
632
8(82 1)
=1
192
504
= 1 0.381 = 0.619
Del resultado, se observa que existe una correlacin positiva moderada entre la primera y
segunda evaluacin.
Pgina 25 de 30
ANEXOS
ASPECTOS ADMINISTRATIVOS Y BIBLIOGRAFIA DEL PROYECTO
1. RECURSOS
Todo proyecto requiere para su realizacin una serie de recursos. Los recursos necesarios
para el desarrollo del proyecto generalmente se clasifican en:
1.1 Humanos.
Para poner en marcha cualquier tipo de proyecto hay que disponer de personas adecuadas
y capacitadas para realizar las actividades y tareas previstas. En el caso de la investigacin
participan investigadores, co investigadores, auxiliares de investigacin, asesor temtico,
asesor metodolgico, expertos, correctores de estilo. Es necesario identificarlos para calcular
posteriormente el valor de sus honorarios e insertarlos para determinar el costo del proyecto.
Ejemplo:
a) Asesoramiento
- 01 Asesor metodolgico
- 01 Psicologo
b) Apoyo
- 02 encuestadores
1.2 Econmicos
Los recursos econmicos hacen referencia al presupuesto necesario para la operacin del
proyecto. Sabemos que cualquier accin tiene un costo que es asumido por todas las partes
comprometidas en su puesta en marcha. En este aspecto se debe considerar la valorizacin
de los recursos humanos y materiales, adems de los servicios requeridos para el proyecto.
Ejemplo:
ITEM
a) Personal
- Honorarios del asesor
- Pago a encuestadores
b) Equipos
- Computador
- Impresora
c)Materiales
- Material de escritorio
- Material de enseanza
TOTAL
5,000.00
4,000.00
1,000.00
2,190.00
1,990.00
190.00
245.00
25.00
40.00
Pgina 26 de 30
- Material de impresin
d) Alimentos
- Alimentos para personas
e) Viajes
- Pasajes Lima - Huacho
- Viticos
f) Servicios
- Fotocopias
- Empastado
TOTAL
180.00
200.00
200.00
500.00
100.00
400.00
180.00
50.00
130.00
8,315.00
1.3 Fsicos
Los recursos fsicos o denominados materiales, tradicionalmemte comprenden varios tems
como terrenos, edificios, maquinaria, equipos (computadora, impresora), infraestructura,
vehculos, material de escritorio, documentos, bibliografa, entre otros necesarios para el
desarrollo de la investigacin.
Se debe realizar un listado de ellos para poder ser valorizados e insertados en el costo del
proyecto.
Ejemplo:
a). Equipamiento
-
10 computadores personales
01 impresora lasser
c) Material de enseanza
-
d) Material de impresin
-
2. CRONOGRAMA
Es una descripcin especfica de las actividades y del tiempo que se va a emplear para la
ejecucin del proyecto. Se debe organizar el trabajo en fechas probables, para saber cunto
tiempo requerir elaborar el trabajo definitivo. Para su presentacin se utilizan generalmente
diagramas, lo que permite visualizar mejor el tiempo de cada actividad, y sobre todo en
aquellos casos en que hay varias actividades en un mismo tiempo
Para realizar el cronograma de las actividades se utilizan diversas tcnicas grficas, la ms
simple y utilizada es el Diagrama de Gantt.
Pgina 27 de 30
El diagrama de Gantt consiste en una tabla de doble entrada, en las filas se anota el listado
de las actividades descritas en el apartado correspondiente del proyecto y en las columnas,
el tiempo que durar cada una de ellas, marcando con una X a lo largo de qu periodo de
tiempo (semanas, meses, trimestres, etc) est previsto realizar dicha actividad. Una barra
horizontal frente a cada actividad va a representar su duracin.
Ejemplo:
Actividades
Revisin bibliogrfica
Formulacin del proyecto de
investigacin
E
x
Meses
M J J A
x
x
Organizacin de la
informacin
Anlisis de la informacin
Interpretacin y discusin
x
x
x
x
x
Redaccin de la tesis
Presentacin de la tesis
3. FUENTES DE INFORMACIN
La lista de referencias cita las fuentes de informacin que sustentan nuestra investigacin y
que se utilizaron para la preparacin del trabajo, comprende un inventario de los materiales
consultados citados, ordenados alfabticamente a partir del apellido del autor. En cuanto a
las normas para su presentacin stas sern desarrolladas aplicando las Normas APA 6ta
edicin.
Pgina 28 de 30
Tesis en la Web:
Apellidos, A. A. (Ao). Ttulo. (Tesis indita de maestra o doctorado, Nombre de la
institucin). Recuperado de http://www.xxxxxx.xxx
Pgina 29 de 30
Pgina 30 de 30