You are on page 1of 62

II TCNICAS DE

INVESTIGACIN EN
COMUNICACIN
Tema 4: Tcnicas cuantitativas
de investigacin

EL DISEO DE LA INVESTIGACIN SOCIAL APLICADO


AL CAMPO DE LA COMUNICACIN

FASES EN LA INVESTIGACIN
2)Definicin, medicin y
clasificacin de las variables
Clasificacin de las variables:

V
. ariable independiente

CAUSA

Variable dependiente

EFECTO

Tipos de escala de las variables

Coeficiente de Correlacin entre dos


variables cuantitativas r:
Valorar la asociacin entre dos variables
cuantitativas estudiando el mtodo conocido
como correlacin. Dicho clculo es el primer paso
para determinar la relacin entre las variables.
La prediccin de una variable.
La prediccin de una variable dado un valor
determinado de la otra precisa de la regresin
lineal .La cuantificacin de la fuerza de la
relacin lineal entre dos variables cuantitativas,
se estudia por medio del clculo del coeficiente
de correlacin de Pearson. Dicho coeficiente
oscila entre 1 y +1.

Coeficiente de Correlacin entre dos


variables cuantitativas (r):
Coeficiente de correlacin de Pearson.
El coeficiente de correlacin oscila entre
1 y +1 encontrndose en medio el valor 0
que indica que no existe asociacin lineal
entre las dos variables a estudio.

El coeficiente de correlacin posee las


siguientes caractersticas (r):
a.Elvalor del coeficiente de correlacin es
independiente de cualquier unidad usada para
medir las variables
.b.El valor del coeficiente de correlacin se
altera de forma importante ante la presencia
de un valor extremo, como sucede con la
desviacin tpica. Ante estas situaciones
conviene realizar una transformacin de datos
que cambia la escala de medicin y modera el
efecto de valores extremos (como la
transformacin logartmica).

El coeficiente de correlacin posee las


siguientes caractersticas (r):
c.Elcoeficiente de correlacin mide solo la relacin
con una lnea recta. Dos variables pueden tener
una relacin curvilnea fuerte, a pesar de que su
correlacin sea pequea. Por tanto cuando
analicemos las relaciones entre dos variables
debemos representarlas grficamente y
posteriormente calcular el coeficiente de
correlacin. As por ej. Un coeficiente de valor
reducido no indica necesariamente que no exista
correlacin ya que las variables pueden presentar
una relacin no lineal como puede ser el peso del
recin nacido y el tiempo de gestacin.

El coeficiente de correlacin posee las


siguientes caractersticas
d.Elcoeficiente de correlacin no se debe
extrapolar ms all del rango de valores
observado de las variables a estudio ya
que la relacin existente entre X e Y puede
cambiar fuera de dicho rango.
e. La correlacin no implica
causalidad. La causalidad es un juicio
de valor que requiere ms informacin
que un simple valor cuantitativo de un
coeficiente de correlacin

Coeficiente de correlacin entre


dos variables cuantitativas (r): NO
El clculo del coeficiente de correlacin (r) entre peso y talla de 20
nios varones se muestra en la tabla 1. La covarianza, que en este
ejemplo es el producto de peso (kg) por talla (cm), para que no
tenga dimensin y sea un coeficiente, se divide por la desviacin
tpica de X (talla) y por la desviacin tpica de Y (peso) con lo que
obtenemos el coeficiente de correlacin de Pearson que en este
caso es de 0.885 e indica una importante correlacin entre las dos
variables. Es evidente que el hecho de que la correlacin sea fuerte
no implica causalidad. Si elevamos al cuadrado el coeficiente de
correlacin obtendremos el coeficiente de determinacin
(r2=0.783) que nos indica que el 78.3% de la variabilidad en el
peso se explica por la talla del nio. Por lo tanto existen otras
variables que modifican y explican la variabilidad del peso de estos
nios. La introduccin de ms variable con tcnicas de anlisis
multivariado nos permitir identificar la importancia de que otras
variables pueden tener sobre el peso.

Diseo muestral
El muestreo es el proceso de
seleccin de una parte representativa
de la poblacin que permita estimar
los parmetros de la poblacin.

Tipologa de los datos:

Elementos que necesitamos para poder


hacer una buena muestra:
UNIDAD DE MUESTREO: Es la unidad donde realizamos
la muestra. Ej. Profesiones sanitarias, Municipio de Njar
UNIDAD DE OBSERVACIN: Es el objeto o poblacin
sobre los cuales se realiza una medicin. sta es la unidad
bsica de la observacin, a veces llamada elemento. El
elemento que voy a contar: Enfermeros, mdicos,
podlogos / Campohermoso, Njar, San Isidro....
MARCO DE MUESTREO. Es la lista de las unidades de
muestreo. Lista de direcciones y nombres de los Colegios
Oficiales. Listado del Padrn Municipal de Njar. Para las
encuestas telefnicas, el marco de muestreo podra ser
una lista de todos los nmeros telefnicos residenciales
de la ciudad........

VENTAJAS Y DESVENTAJAS DEL MUESTREO

TIPOS DE MUESTREO:
MUESTREO NO PROBABILISTICO: Los
individuos de las muestras se
seleccionan en base a la opinin
personal del investigador.
MUESTREO PROBABILSTICO: Son
aquellas muestras en que cada
individuo de la poblacin tiene una
probabilidad (diferente de cero)
conocida de ser incluido en la
muestra

TIPOS DE MUESTREO
MUESTREO NO
PROBABILSTICO

MUESTREO
PROBABILISTICO

Muestreo por
cuotas (estratos)
Muestreo
intencional o de
conveniencia
(grupos
supuestamente
tpicos)
Bola de nieve
Muestreo
discrecional

Muestreo aleatorio
simple
Muestreo
Sistemtico
Muestreo
estratificado
Muestreo por
conglomerados
Muestreo por
etapas

Muestreo no probabilstico:
Muestreo por cuotas: Presupone un buen
conocimiento de los estratos de la poblacin y se
selecciona a los elementos ms representativos.
Muestreo intencional o de conveniencia: Es
donde deliberadamente se obtienen muestras de
grupos supuestamente tpicos.
Bola de nieve: Se localiza a algunos individuos,
los cuales conducen a otros, y as hasta conseguir
una muestra suficiente.
Muestreo
discrecional:
A
criterio
del
investigador los elementos son elegidos sobre lo
que l cree que puede aportar al estudio.

Muestreos no probabilsticos
a. en la vida corriente, sobre todo en
el comercio y en las encuestas de
opinin (que en caso de equivocacin
las consecuencias no sean
demasiado graves)
B. Se utilizan cuando slo se
necesitan estimaciones toscas sobre
las que no se toman grandes
decisiones
C. Ante presupuestos pequeos

En las encuestas en que hayan de


proporcionarse resultados importantes se
exige la utilizacin del muestreo
probabilstico que permita una evaluacin
objetiva de los resultados.
Muestreo aleatorio simple (m.a.s.)
Muestreo Sistemtico
Muestreo estratificado
Muestreo por conglomerados
Muestreo por etapas

Muestreo probabilstico
Conocido tambin como muestreo de
seleccin aleatoria, utiliza el azar como
instrumento de seleccin, pudindose calcular
de antemano la probabilidad de que cada
elemento sea incluido en la muestra. Para
Marn Ibaez (1985) este tipo de muestreo es
el que alcanza mayor rigor cientfico, y se
caracteriza porque se cumple el principio de
la equiprobabilidad, segn el cual todos los
elementos de la poblacin tienen la misma
probabilidad de salir elegidos en una muestra.

Muestreo probabilstico
Algunos autores exigen que todos los elementos tengan la
misma probabilidad de ser seleccionados. En la prctica real
puede haber diversos grados de probabilidad, lo importante
es que la conozcamos. De hecho si de un listado de
papeletas con cien personas seleccionamos uno, ste tiene
1/100 de posibilidad de ser elegido, el segundo 1/99, y as
sucesivamente... Para que esto no hubiera ocurrido
tendramos que haber empleado el procedimiento que se
conoce de obtencin de la muestra con reemplazo, es decir
volviendo a colocar los que salen, para que se mantuviera la
proporcin del 1/100. Este ltimo caso puede tener inters
en determinadas circunstancias, pero no en el caso de
consultar, por ejemplo, varias veces a un mismo alumno. Lo
importante, para Marn Ibez (1985) es que conozcamos el
grado de probabilidad y, en lo posible, procurar que sea la
misma.

Muestreo aleatorio simple (m.a.s.)


En cuando todos los elementos de la poblacin
tienen la misma probabilidad de ser seleccionados
en la muestra y esta probabilidad es conocida.
Este tipo de muestreo es ms recomendable, pero
resulta mucho ms difcil de llevarse a cabo y, por
lo tanto, es ms costoso.
Clculo del Tamao de la muestra: Con frecuencia,
un investigador mide distintas variables y tiene
varios objetivos pero solo debe centrarse en una
respuesta que sea de inters fundamental y
utilizarlas para estimar el tamao muestral.

Elementos que necesitamos para hacer una


Muestra aleatoria simple (m.a.s.):

Parmetro:
Estimador:
El error muestral
El nivel de confianza
La varianza poblacional

Elementos que necesitamos para hacer una


Muestra aleatorio simple:
Parmetro: se refiere a la caracterstica de la
poblacin que es objeto de estudio y si queremos
encontrar una media aritmtica (_), una proporcin
poblacional (p), diferencias de medias (_ 1- _2), o una
diferencia de proporciones (p1-p2)
Estimador: es la funcin de la muestra que se usa
para medir el parmetro
El error muestral: se comete siempre por la
prdida de representatividad al escoger los
elementos de la muestra
El nivel de confianza:
La varianza poblacional:

Elementos que necesitamos para hacer una


Muestra aleatorio simple:

El nivel de confianza: en relacin


al estimador (que caiga dentro de un
intervalo determinado basado en el
estimador)

La varianza poblacional:

Si la seguridad
sera 1.645
Si la seguridad
sera 1.96
Si la seguridad
sera 2.24
Si la seguridad
sera 2.576

Za fuese del 90% el coeficiente


Za fuese del 95% el coeficiente
Za fuese del 97.5% el coeficiente
Za fuese del 99% el coeficiente

Nivel de confianza:
Influye en el tamao que debamos dar a la muestra.
Entre +2 y -2 sigmas de la curva de distribucin
normal de Gauss, a partir de la media, est incluido
el 95.5% de la poblacin.
Esto quiere decir que tenemos una probabilidad de
que 955/1000 coincidan con los de la poblacin
total. Si queremos alcanzar una mayor certidumbre
hemos de abarcar entre +3 y -3 sigmas, en cuyo
caso el riesgo de que exista diferencia entre los
estadsticos de la muestra y los parmetros de la
poblacin sean distintos ser de 997/100, pero
naturalmente tendremos que elevar el numero de
elementos de la muestra.

Nivel de confianza:

. Para determinar el volumen de la


muestra, de acuerdo con el nivel de
confianza, existen tablas. Bugeda
(1974) recoge tablas que permiten
determinar el volumen de la muestra y
el nivel de estimacin para los niveles
de confianza del 99.7% y del 95%.
BUGEDA, J. (1974): Manual de tcnicas
de investigacin social. Instituto de
Estudios Polticos, Madrid.

Calcular el tamao de la
muestra

Frmula para calcular el tamao de muestra

Pp

. p: proporcin de una
categora de la variable

Tamao de muestra
estimar

Tamao muestra
estimar p:

Ejemplo 1:
Un medico quiere estimar el
peso promedio de los recin
nacidos en cierto hospital. Un
estudio anterior de diez
nios mostr que la
desviacin estndar de sus
pesos es de 150 gr. Qu
tan grande debe ser una
muestra para que el mdico
tenga el 95% de confianza de

Solucin: Entonces se necesita


aproximadamente una muestra de 54 recin
nacidos para estimar el peso promedio con
una confianza del 95% y un error mximo de
40 gr.

Ejemplo 2:
Un medico quiere estimar el peso
promedio de los 200 recin
nacidos en cierto hospital en mes
x. Un estudio anterior de diez
nios mostr que la
desviacin estndar de sus
pesos es de 150 gr. Qu tan
grande debe ser una muestra
para que el mdico tenga el 95%
de confianza de que el error de
estimacin es a lo ms de 40

La muestra es de 43 recin
nacidos

Ejemplo 3:
A cuntas familias tendramos
que estudiar para conocer la
preferencia del mercado en
cuanto a las marcas de shampoo
para beb, si se desconoce la
poblacin total? Asumamos los
siguientes datos nivel de
confianza 95%, una precisin
(error muestral) del 3% y la
proporcin esperada es de 5%.

Solucin ejercicio 3:
Z: 1.96 (95% de
confianza)
p: 0.05 (en este
caso 5%)
q=1-p=1-
0.05=0.95 e:
0.03 (3% error
mximo)
203 familias para
tener la
seguridad del
95%

Ejercicio 4:

A cuntas familias tendramos que


estudiar para conocer la
preferencia del mercado en
cuanto a las marcas de shampoo
para beb, si se desconoce la
poblacin total? Asumamos los
siguientes datos nivel de
confianza 95%, una precisin
(error muestral) del 3% y la
proporcin esperada se desconoce

Solucin 4: Cuando se desconoce la


proporcin esperada, se tiene que utilizar el
criterio conservador (p=q=0.5=50%)

Z: 1.96 (95% de
confianza)
p: 0.5 (en este
caso 50%)
q=1-p=1-
0.5=0.50
e: 0.03 (3% error
mximo)

ppp

Tres preguntas bsicas:


1. Cmo se presentan los datos? Cul
es la ubicacin o localizacin de los
datos?
Lo que se pretende es describir ciertas
caractersticas de un conjunto de datos. El
procedimiento ms utilizado, para dar
respuesta a este interrogante, son las
medidas de tendencia central, que permiten
resumir el comportamiento de un conjunto
de datos alrededor de un punto prefijado tal
como:
La Moda; la Media; la Mediana

Tres preguntas bsicas:


2. Los datos respecto a sus puntos de
agrupacin y localizacin estn
concentrados o dispersos?
Para determinar la concentracin de los
datos o su dispersin alrededor de la media,
en una distribucin, se usa frecuentemente
los conceptos de:
RANGO DE VARIACIN

Valorespercentiles
DESVIACINestndar o tpica

Tres preguntas bsicas:


3. Existe relacin en el comportamiento
de las variables? Para establecer la relacin,
es decir, cunto de una variable es explicada
por las dems, cuyas observaciones han sido
registradas en una escala de intervalo o de
razn continua-, se utiliza
:Coeficientes de asociacin entre variables
cualitativas
Coeficientes de correlacin entre
variables cuantitativas
Los modelos de regresin

Tres preguntas bsicas:


1. Cmo se presentan los datos? Cul
es la ubicacin o localizacin de los
datos?
Lo que se pretende es describir ciertas
caractersticas de un conjunto de datos. El
procedimiento ms utilizado, para dar
respuesta a este interrogante, son las
medidas de tendencia central, que permiten
resumir el comportamiento de un conjunto
de datos alrededor de un punto prefijado tal
como:
La Moda; la Media; la Mediana

Estadsticas para medir la localizacin de un conjunto de


datos:

Una tarea bsica del anlisis de los datos consiste


en obtener una descripcin global de las
caractersticas de los sujetos o procesos objetos
del estudio-. Esta primera informacin mostrar
cmo se distribuyen los valores de la variable.
Frecuentemente se necesita resumir
descriptivamente un conjunto de valores numricos
para lo cual es apropiado recurrir a medidas de
tendencia central. Todas estas estadsticas darn
una descripcin global de la poblacin estudiada y
permitirn orientar el anlisis.
Existen 3 medidas que pueden ser asociadas a este
concepto y ellas son: LA MODA, LA MEDIANA y la
MEDIA.

Moda o valor modal:


Se utiliza para medir la localizacin
de los datos en una escala nominal.
Es aquel valor que se repite con ms
frecuencia en un conjunto de datos.
La moda es simplemente el valor que
aparece ms veces.
Se puede hallar la moda para
variables cualitativas y cuantitativas.

Moda o valor modal:


La moda es el valor que tiene
mayor frecuencia absoluta. M
Mira estos nmeros:
3,7,5,13,20,23,39,23,40, 23, 14,12,
56, 23, 29
Ordenados quedan:
3,5,7,12,13,14,20,23,23,23,23,29,30,
40,56
M =23
0

Moda: bimodal o multimodal


Si en un grupo hay dos o varias puntuaciones con la
misma frecuencia y esa frecuencia es la mxima, la
distribucin es bimodal o multimodal, es decir, tiene
varias modas
1,1,1,4,4,5,5,5,7,8,9,9,9, Mo = 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda
2,2,3,3,6,6,9,9
Si dos puntuaciones adyacentes tienen la misma
mxima, la moda es el promedio de las dos
puntuaciones adyacentes:
0,1,3,3,5,5,7,8 Mo = 4

http://www.v

www.vitutor.com/estadistica/descripti
va/a_8.html

La mediana
Es el valor que ocupa el lugar central de todos los datos
cuando stos estn ordenados de menor a mayor.
La mediana se puede hallar slo para variables
cuantitativas.
La mediana se representa por Me
Para calcular la mediana se tienen que ordenar los datos
y determinar el que est a la mitad. Sirve para datos
propios de los niveles de medicin ordinal, por
intervalos y de razn o proporcionales. No es lgico usar
sta medida con variables nominales, porque en este
nivel no hay jerarquas, no existe la nocin de un
escalafn superior o inferior.

La mediana:
Si la serie tiene un nmero impar de medidas la
mediana es la puntuacin central de la misma.
2,3,4,4,5,5,5,6,6
Me= 5
Si la serie tiene un nmero par de medidas la
mediana es la media entre las dos puntuaciones
centrales
7,8,9,10,11,12
Me= 9,5

La mediana

La Media: media aritmtica X


La Media. Llamada tambin media
aritmtica es la medida de
localizacin o tendencia ms
utilizada. Con ella se calcula el
promedio de los datos. En el lenguaje
cotidiano, se le conoce como
promedio aritmtico.
La media aritmtica es el valor obtenido al
sumar todos los datos y dividir el
resultado entre el nmero total de datos.

Tres preguntas bsicas:


2. Los datos respecto a sus puntos de
agrupacin y localizacin estn
concentrados o dispersos?
Para determinar la concentracin de los
datos o su dispersin alrededor de la media,
en una distribucin, se usa frecuentemente
los conceptos de:
Rango de variacin
Valorespercentiles
Desviacin estndar o tpica

Estadsticas para analizar la dispersin o


variabilidad de un conjunto de datos
En el anlisis de unas caractersticas, se necesita
algo ms que la distribucin de los valores de unas
respuestas preestablecidas (frecuencias) o el
clculo de unos promedios; tambin es necesario
determinar el grado de variabilidad diseminacin dispersin- de los datos con
respecto a ese promedio. Para tales efectos las
medidas de dispersin, tales como el rango, la
varianza y la desviacin estndar son de extrema
utilidad. Estas medidas de variabilidad indican la
dispersin y distancias de los valores en la escala
de medicin.

Rango:
Se define como la "diferencia o
distancia" entre los valores del dato
mayor y el dato menor. Este
estadstico mide la dispersin de los
valores en una serie. Cuando ms
amplio grande sea el rango, mayor
ser la dispersin de los datos en
una distribucin.

Ej. Rango. N de consultas diarias en los 2


consultorios

Consultorio AConsultorio B

Mdico
A 10 F
B 20 G
C 30 H
D 40 I
E 50 J

N Consultas
28
29
30
31
32

Mdico N Consultas

X= 30 X= 30 (promedio)

Rango de consultas en el Consultorio A es de 40


(10 el mnimo y 50 el mximo).
Rango de consultas es de slo de 4 (32 consultas
menos 28 consultas)

Desviacin estndar o tpica


Estadsticamente, cuando se
mide la dispersin lo que se est
midiendo es el alejamiento de
los valores en relacin con la
Media. La desviacin estndar es
la medida de dispersin ms
usada y se interpreta con
relacin a la media o promedio.
Tiene la desventaja que los
valores extremos en el conjunto

La desviacin tpica
Se trata de una medida de dispersin
que, en un conjunto de datos, indica,
cunto pueden alejarse los valores
respecto a la media o promedio.
Es una medida muy til, por tanto,
para averiguar las probabilidades de
que un evento ocurra.
Es la raz cuadrada de la varianza