You are on page 1of 27

CMO REDACTAR EL ANLISIS DE LOS

RESULTADOS
ANLISIS DE LOS RESULTADOS

Lic. Jos Prez Leal

El anlisis de resultados es lo ms difcil de redactar, aunque los resultados obtenidos sean validos
y muy interesantes, si el anlisis de resultados est redactado de manera deficiente, esto afectar
seriamente el trabajo. Usualmente cuando se llega a esta parte del trabajo, el investigador suele
estar un poco cansado por eso es importante tomar esta parte del trabajo con tranquilidad. El
anlisis de resultados es sencillamente entrelazar los datos y resultados que se encontraron en la
investigacin con los datos o informacin de la base terica y los antecedentes.

Por otra parte, al consultar libros sobre metodologa de la investigacin, pocos de ellos se clarifican
a nivel de los proyectos de investigacin. Sin embargo, segn mi experiencia conviene precisar la
forma como se llevar a cabo el anlisis o procesamiento e interpretacin de los datos, recomiendo
hacer un pequeo diseo esquemtico, teniendo en cuenta para ello las respuestas a las
siguientes preguntas:

- Cul es la postura epistemolgica que subyace al mtodo seleccionado por el investigador para
estudiar la realidad precisada en el problema?,
- Cul ser la forma de anlisis de los datos de acuerdo con el mtodo seleccionado?

En este sentido, la respuesta a estas preguntas presuponen explicar y describir la forma como
sern procesados los datos, describiendo en la argumentacin el nfasis por un anlisis
cuantitativo o cualitativo de stos y detallando el nivel de medicin al que se pretende llegar a
acceder siguiendo las escalas nominales, ordinales, de intervalo y de razn.

Como se puede apreciar, la primera interrogante obedece esencialmente al lenguaje de la
cualificacin, mientras que las escalas ordinal y de intervalo implican un mayor desarrollo
cuantitativo en los procesos de medicin; la escala de razn corresponde a las ciencias fsicas. Si
bien esta actividad no parece tan importante como la formulacin del problema, los objetivos o la
metodologa del estudio, conviene saber que la gran mayora de los proyectos comienzan a definir
sus posibilidades de financiacin cuando su resumen muestra con claridad y suficiencia de qu
trata la investigacin y cmo se llevar a cabo.

As, el anlisis de resultados consistir en explicar los resultados obtenidos y comparar estos con
datos obtenidos por otros investigadores, es una evaluacin crtica de los resultados desde la
perspectiva del autor tomando en cuenta los trabajos de otros investigadores y el propio.

Cabe sealar que el anlisis de resultados se propone interpretar y analizar los resultados de la
investigacin de donde saldrn los elementos para plantear las conclusiones, teniendo cuidado de
no caer en repeticiones de los resultados. Es una relacin entre hechos y explicaciones, sin
sintetizar todo lo que se ha dicho. Este espacio en el trabajo est destinado de un cierto modo a
respaldar la hiptesis general o de discutirla, y explicar y comparar los resultados obtenidos con la
teora para as hallar las conclusiones. Por supuesto, antes de discutirlos ya se ha hecho la
descripcin y por lo tanto se pueden ir mencionando un poco esos resultados a medida que se van
discutiendo, pero no repetirlos en detalle.

Por lo tanto, cuando se repiten los resultados en lugar de compararlos y discutirlos genera dbiles
comparaciones, as como la ausencia de lgica en el anlisis de resultados empricos o se hace
excesivamente terica.

En este mismo orden de ideas, los resultados deben compararse con estudios que sean
objetivamente comparables, con estudios que compartan la hiptesis, o que la contradicen. Pues
sobre ellos es que se construye el anlisis se parecen los resultados? Por qu se considera
que difieren los resultados? Vale la pena comparar los resultados con estudios que apoyan y
comparten ideas importantes del trabajo que se estn realizando.

Todas estas comparaciones y anlisis deben sealar la fuente citando los autores empleando las
normas de la Asociacin Americana de Psiclogos o Normas APA. Lo ideal es hacer una discusin
puntual, no prolongar innecesaria del anlisis de resultados de manera redundante, esto distrae al
lector y perturba lo importante de l anlisis de resultados. El hecho de que sea larga y exuberante
no implica que sea una buena discusin.

De all que el anlisis de resultados sea apropiado para hacer cuestionamientos sobre el tema
estudiado y proponer nuevas corrientes y perspectivas para futuras investigaciones. No tiene
necesidad de ser muy larga pero si lo suficientemente claro ya que estas lneas orientaran a
futuros investigadores del mismo campo. De este modo es conveniente seguir una lnea
organizada para el abordaje del anlisis de resultados:

1. Comenzar con las relaciones y generalizaciones que los resultados indican.
2. Sealar las faltas de correlacin y delimitar los aspectos no resueltos. No ocultar o alterar los
datos que no cuadren.
3. Mostrar la relacin que existe o que no existe entre los resultados con trabajos anteriormente
publicados.
4. Exponer las consecuencias tericas de la investigacin y las posibles aplicaciones prcticas de
la misma.
5. Dar alguna recomendacin o sugerencia en caso de considerarlo necesario.
6. Formular las conclusiones de la forma ms clara posible.
7. Resumir las pruebas que respaldan cada conclusin.

Finalmente, en el anlisis de resultados los tiempos verbales que se utilizan son el presente y el
pasado. Se redacta en presente los conocimientos ya preestablecidos y en pasado los resultados
obtenidos por el autor durante el trabajo de investigacin. Existen trabajos en los que el anlisis de
resultados se realiza junto con las conclusiones como un solo punto (discusin y conclusiones).

BIBLIOGRAFA Y FUENTES DOCUMENTALES
Abello, R. (2009) La investigacin en Ciencias sociales: sugerencias prcticas sobre el proceso.
Barranquilla-Colombia. (Artculo en lnea) disponible
en: http://www.gratispdf.com/?url=http%3A%2F%2Fciruelo.uninorte.edu.co%2Fpdf%2Finvest_desa
rrollo%2F17-
1%2F10%252520LA%252520INVESTIGACION%252520EN%252520CIENCIAS%252520SOCIAL
ES.pdf&t=LA+INVESTIGACI%C3%93N+EN+CIENCIAS+SOCIALES%3A+SugerenciaS+pr%C3%A
1cticaS+Sobre+... (Consulta: 2010, noviembre 02)
Arias, F. (1999) el proyecto de investigacin; Gua para su elaboracin (3
ra
. Edicin) Caracas-Venezuela,
Editorial Espteme
Balestrini, M. (1997). Cmo se elabora el proyecto de investigacin para los estudios formulativos o
exploratorios, descriptivos, diagnsticos, evaluativos, formulacin de hiptesis causales,
experimentales y los proyectos factibles. Caracas: BL Consultores Asociados, Servicio Editorial.
Rena.edu.ve (2006) Discusin de los Resultados. (Documento en lnea) disponible
en:http://www.rena.edu.ve/cuartaEtapa/metodologia/Tema17.html(Consulta: 2010, noviembre 02)

CAPITULO IV ANALISIS DE DATOS

PLAN DEL CAPITULO IV
Objetivo: En el presente captulo se expone un panorama conceptual sobre el anlisis
de datos. Se describen de manera no exhaustiva algunos elementos estadsticos tiles
tanto para la organizacin y presentacin de los datos como para el anlisis de los
resultados de investigacin.


4.1 Procedimientos de Anlisis de Datos
Una vez concluidas las etapas de coleccin y procesamiento de datos se inicia con una
de las ms importantes fases de una investigacin: el anlisis de datos. En esta etapa
se determina como analizar los datos y que herramientas de anlisis estadstico son
adecuadas para ste propsito. El tipo de anlisis de los datos depende al menos de
los siguientes factores.
a) El nivel de medicin de las variables (los niveles de medicin fueron explicados en la
seccin 2.4 del captulo II).
b) El tipo de hiptesis formulada (ver seccin 2.2, captulo II).
c) El diseo de investigacin utilizado indica el tipo de anlisis requerido para la
comprobacin de hiptesis.
El anlisis de datos es el precedente para la actividad de interpretacin. La
interpretacin se realiza en trminos de los resultados de la investigacin. Esta
actividad consiste en establecer inferencias sobre las relaciones entre las variables
estudiadas para extraer conclusiones y recomendaciones (Kerlinger, 1982). La
interpretacin se realiza en dos etapas:
a) Interpretacin de las relaciones entre las variables y los datos que las sustentan con
fundamento en algn nivel de significancia estadstica.
b) Establecer un significado ms amplio de la investigacin, es decir, determinar el
grado de generalizacin de los resultados de la investigacin.
Las dos anteriores etapas se sustentan en el grado de validez y confiabilidad de la
investigacin. Ello implica la capacidad de generalizacin de los resultados obtenidos.
Analizar significa establecer categoras, ordenar, manipular y resumir los datos,
(Kerlinger, 1982, p. 96). En esta etapa del proceso de investigacin se procede a
racionalizar los datos colectados a fin de explicar e interpretar las posibles relaciones
que expresan las variables estudiadas.
El diseo de tablas estadsticas permite aplicar tcnicas de anlisis complejas
facilitando este proceso. El anlisis debe expresarse de manera clara y simple
utilizando lgica tanto inductiva como deductiva.
Los resultados de una investigacin basados en datos muestrales requieren de una
aproximacin al verdadero valor de la poblacin (Zorrilla, 1994). Para lograr lo anterior
se requiere de una serie de tcnicas estadsticas. Estas tcnicas se derivan tanto de la
estadstica paramtrica como de la estadstica no paramtrica. La primera tiene como
supuestos que la poblacin estudiada posee una distribucin normal y que los datos
obtenidos se midieron en una escala de intervalo y de razn. La segunda no establece
supuestos acerca de la distribucin de la poblacin sin embargo requiere que las
variables estudiadas se midan a nivel nominal u ordinal (ver Weiers, 1993).
Las tablas diseadas para el anlisis de datos se incluyen en el reporte final y pueden
ser tiles para analizar una o ms variables. En virtud de ste ltimo criterio el anlisis
de datos puede ser univariado, bivariado o trivariado dependiendo de la cantidad de
variables que se analizan.
4.1.1 Anlisis Univariado.
Consiste en el anlisis de cada una de las variables estudiadas por separado, es decir,
el anlisis esta basado en una sola variable. Las tcnicas ms frecuentes de anlisis
univariado son la distribucin de frecuencias para una tabla univariada y el anlisis de
las medidas de tendencia central de la variable. Se utiliza nicamente en aquellas
variables que se midieron a nivel de intervalo o de razn (ver Therese L. Baker, 1997).
La distribucin de frecuencias de la variable requiere de ver como estn distribuidas las
categoras de la variable, pudiendo presentarse en funcin del nmero de casos o en
trminos porcentuales.
4.1.2 Anlisis Bivariado.
El anlisis bivariado disea tablas con tabulaciones cruzadas, es decir, las categoras
de una variable se cruzan con las categoras de una segunda variable. Se les conoce
como tablas de contingencia. Los requisitos que debe cubrir son:
1 El ttulo debe reflejar la informacin que contiene la tabla.
2 Incluir un subttulo para cada columna y subcolumna que se integre a la tabla.
3 Indicar el 100 % cuando la tabla se exprese en trminos porcentuales.
4 Indicar al final de cada columna el nmero total de casos o categoras que
comprende.
4.1.3 Anlisis Trivariado
El anlisis trivariado incluye una tercer variable que se utiliza como variable control.
Esto permite analizar la asociacin entre las dos variables, controlando el efecto de una
tercer variable mediante la observacin de las dos primeras sobre cada condicin que
presenta la tercera.
Por ejemplo si se analiza el ingreso econmico de los ejecutivos de la micro, pequea y
mediana empresa regional con estudios de licenciatura y los ingresos de aquellos
ejecutivos con estudios de posgrado (maestra), es posible incluir en el anlisis la
variable dicotmica sexo.
4.2 Elementos Estadsticos
El anlisis e interpretacin de datos requiere de un profundo conocimiento de la
estadstica, es decir, para que una investigacin pueda arrojar luz sobre el PON, el
investigador tendr que someter los datos a la prueba estadstica y para ello necesita
tener conocimiento de los supuestos que involucra la metodologa estadstica que
habr de utilizar.
La herramienta utilizada para el anlisis de datos es la estadstica. Esta disciplina
proporciona innumerables beneficios a la investigacin cientfica y tecnolgica. La
estadstica descriptiva se entiende como el conjunto de mtodos para procesar
informacin en trminos cuantitativos de tal forma que se les de un significado. La
estadstica inferencial estudia la confiabilidad de las inferencias de que los fenmenos
observados en la muestra son extensivos a la poblacin de donde se obtuvo la
muestra, es decir, facilita el establecimiento de inferencias de la muestra analizada
hacia la poblacin de origen.
4.2.1 Elementos de Estadstica Descriptiva
Como ya fue explicado la estadstica descriptiva permite organizar y presentar un
conjunto de datos de manera que describan en forma precisa las variables analizadas
haciendo rpida su lectura e interpretacin.
Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la
distribucin de frecuencias y b) la representacin grfica. Estos sistemas de
organizacin y descripcin de los datos permiten realizar un anlisis de datos
univariado, bivariado o trivariado, dependiendo de los objetivos y de la naturaleza de
la investigacin que se realiza.
Distribucin de Frecuencias. Comunmente llamada tabla de frecuencias, se utiliza para
hacer la presentacin de datos provenientes de las observaciones realizadas en el
estudio, estableciendo un orden mediante la divisin en clases y registro de la cantidad
de observaciones correspondientes a cada clase. Lo anterior facilita la realizacin de un
mejor anlisis e interpretacin de las caractersticas que describen y que no son
evidentes en el conjunto de datos brutos o sin procesar. Una distribucin de
frecuencias constituye una tabla en el mbito de investigacin.
La distribucin de frecuencias puede ser simple o agrupada. La distribucin de
frecuencias simple es una tabla que se construye con base en los siguientes datos:
clase o variable (valores numricos) en orden descendente o ascendente, tabulaciones
o marcas de recuento y frecuencia. Por ejemplo, si se construye una distribucin de
frecuencias sobre los resultados finales que arroj la evaluacin de un curso de
planeacin estratgica para estudiantes de administracin correspondientes al
semestre agosto-diciembre de 1998, se tienen los siguientes datos brutos: 86, 80, 84,
84, 74, 88, 87, 84, 74, 77, 77, 82, 68, 78, 67, 74, 66, 86, 65, 88,69 se procede a
organizarlos en forma ascendente o descendente y se tiene en orden descendente: 88,
88, 87, 86, 86, 84, 84, 84, 82, 80, 78, 77, 77, 74, 74, 74, 69, 698, 67, 66, 65
posteriormente se registran en una tabla de distribucin de frecuencias simple (ver
Tabla 4.1). Cuando se pretende ... determinar el nmero de observaciones que son
mayores o menores que determinada cantidad, (Webster, 1998, p. 27) se utiliza la
distribucin de frecuencias agrupadas tambin conocida como distribucin de
frecuencias acumuladas. La distribucin de frecuencias agrupadas es una tabla que
contiene las columnas siguientes: intervalo de clase, puntos medios, tabulacin
frecuencias y frecuencias agrupadas. Los pasos para disearla son:

Tabla 4.1 Distribucin de Frecuencias de los Resultados Finales obtenidos de la Evaluacin de Planeacin
Estratgica correspondientes al semestre agosto-diciembre de 1998.


1 Se localizan el computo mas alto y el mas bajo de la serie de datos.
2 Se encuentra la diferencia entre esos dos cmputos.
3 La diferencia obtenida se divide entre nmeros nones tratando de encontrar un
cociente cercano a 15 pero no mayor. Lo anterior indica cuantas clases va a tener la
distribucin de frecuencias agrupadas y cul va a ser la magnitud del intervalo de
clase.
4 Se determina el primer intervalo de clase y posteriormente se van disminuyendo los
lmites del intervalo de clase de acuerdo al valor de la magnitud establecida
previamente.
El ejemplo planteado en la distribucin de frecuencias simples se utilizar tanto para
efectos de ejemplificacin de la distribucin de frecuencias agrupadas como para el
diseo de grficas tipo polgono de frecuencias, histograma y ojiva. En la Figura 4.2 se
presenta un ejemplo de una distribucin de frecuencias agrupada.

Tabla 4.2 Distribucin de Frecuencias Acumuladas de los Resultados Finales
obtenidos de la Evaluacin de Planeacin Estratgica correspondientes al semestre
agosto-diciembre de 1998.


Los computos mayor y menor son las puntuaciones 88 y 65, la diferencia es 88-65=23
y el nmero de intervalos de clase es 23/3= 7.68.
b) Representacin Grfica. A partir de la distribucin de frecuencias se procede a
presentar los datos por medio de grficas. La informacin puede describirse por medio
de grficos a fin de facilitar la lectura e interpretacin de las variables medidas. Los
actuales sistemas computacionales como Excel, Lotus Smart Suite, Minitab, SAS-PC,
Stath Graph, entre otros permiten obtener representaciones grficas de diversos
conjuntos de datos. Las grficas pueden ser tipo histograma, polgono de frecuencias,
grfica de series de tiempo, etc,
b1) El Histograma. El histograma ... es una grfica de barras que permite describir el
comportamiento de un conjunto de datos en cuanto a su tendencia central, forma y
dispersin, (Gutirrez, 1998, p.79). De acuerdo con Glass y Stanley (1994) un
histograma no debe ser demasiado plano o esculpado. El ancho es de dos tercios de su
altura. Los pasos para elaborar un histograma son (ver Figura 4.1):
1 Se trazan los ejes horizontal y vertical.
2 Se registran marcas equidistantes sobre ambos ejes.
3 Se marcan los puntos medios de cada intervalo de clase sobre el eje horizontal.
b2) El Polgono de Frecuencias. Un mtodo ampliamente utilizado para mostrar
informacin numrica de forma grfica es el polgono de frecuencia o grfica de lnea.
La construccin es similar a la del histograma pero la diferencia radica en que para
indicar la frecuencia solo se utiliza un punto sobre el punto medio de cada intervalo.
Los pasos para construirlo son (ver Figura 4.2):

Figura 4.1 Nmero de Empresas de la Industria Grfica de Estados Unidos por
Segmento. (EPA, 1997).



Figura 4.2 Resultados de la Aplicacin de una Prueba Matemticas con 100 tems al
Grupo de 2. de Ingeniera en Sistemas.

1 Se trazan los ejes horizontal y vertical.
2 Se registran marcas equidistantes sobre el eje horizontal y se anotan debajo de cada
una de ellas los puntos medios de los intervalos de clase en un orden de menor a
mayor.
3 Se registran marcas equidistantes sobre el eje vertical y se anotan a la izquierda de
cada una de ellas las frecuencias en orden ascendentes. A partir de ellas se disea la
cuadrcula del espacio enmarcado, trazando las abscisas y ordenadas.
4 Se representa con puntos las frecuencias de cada intervalo de clase. Se toma en
cuenta el punto medio de cada intervalo de clase como base y las frecuencias como
altura.
5 Se unen con lnea gruesa los puntos as determinados. 6 Se registra el ttulo
expresando en resumen el asunto o cuestin sobre la que informa la grfica.
b3) Grfica de Series de Tiempo. Es una grfica de lnea en la que la lnea horizontal
representa el tiempo. Es utilizada para representar tendencias como puede ser el tipo
de cambio peso-dlar, el ndice de precios al consumidor, etc. (ver Figura 4.3).
los anteriores elementos de estadstica descriptiva son utilizados en investigacin para
disear tablas y figuras que presenten de manera resumida y organizada n conjunto de
datos obtenidos mediante la observacin y medicin de las variables estudiadas.


Figura 4.3 Tendencias de Crecimiento de la Industria Grfica de Estados Unidos para el
periodo 1990- 2000, (EPA, 1997).

c) Medidas de Tendencia Central. Las medidas de tendencia central son tiles para
encontrar indicadores representativos de un colectivo de datos. Los tres mtodos que
permiten obtener el punto medio de una serie de datos son la media, la mediana y la
moda.
c1) Media Aritmtica. Medida de tendencia central que se define como el promedio o
media de un conjunto de observaciones o puntuaciones. En aquellas situaciones en que
la poblacin de estudio es pequea suele utilizarse la media poblacional mediante la
expresin:

(Ec. 4.1)
donde:
= media poblacional
Xi = Sumatoria de las puntuaciones
N = Nmero de casos
En cambio si la poblacin de estudio es muy numerosa se procede a obtener la media
muestral definida matemticamente por la expresin:

(Ec. 4.2)
donde:
X = media muestral
Xi = Sumatoria de las puntuaciones
N = Nmero de casos
Al obtener la media alcanzada por la compaa XYZ que comercializa computadoras
personales. Las ventas diarias realizadas por la compaa durante una semana indican
las siguientes cantidades: 4, 12, 7, 9, 11, 7, 8, el clculo de la media es:


el anterior resultado sugiere que el promedio semanal de ventas de la compaa XYZ
es de 8.29 computadoras personales.
c2) La Moda. En una serie de puntuaciones se denomina moda a la observacin que se
presenta con mayor frecuencia. As en el ejemplo anterior de la
compaa XYZ la moda es la puntuacin 7. Para obtener la moda a partir de una
distribucin de frecuencias agrupadas se utiliza la expresin:

(Ec. 4.3)
donde:
Mo = Moda
Lmo = Lmite inferior del intervalo de clase modal
Da = Diferencia entre la frecuencia de la clase modal y la de la clase que la precede.
Db = Diferencia entre la frecuencia de la clase modal y la de la clase que l la sigue.
i = Intervalo de clase.
La moda para una distribucin de frecuencias agrupadas se obtiene a partir de los
datos de la Tabla 4.2:

la moda tiene un valor de 86.10.
c3) La Mediana. Tambin conocida como media posicional en virtud de que se localiza
en el centro de un conjunto de observaciones presentadas en una serie ordenada de
datos. Lo anterior sugiere que el 50 % de los casos se encuentra por encima de la
mediana y el resto por debajo de ella. La posicin central de la mediana se obtiene
mediante la expresin matemtica.

(Ec. 4.4)
donde:
PMd = Posicin de la Mediana
N = Nmero de casos.
el procedimiento para obtener la mediana a partir de una distribucin de frecuencias
simple o agrupada requiere de aplicar la expresin:

(Ec. 4.5)
donde:
Md = Mediana
N = Nmero de casos.
FA = Frecuencia agrupada.
FS = Frecuencia del intervalo adyacente superior.

Al aplicar la ecuacin 4.5 a los datos de la Tabla 4.2 se obtiene un valor de 83 para la
mediana:


De las tres medidas de tendencia central la media es mas exacta que la mediana por
ser una estadstica obtenida a travs de una medicin ordinal o de razn mientras que
la mediana se obtiene a un nivel de medicin nominal.
La principal caracterstica de la media consiste en tomar en cuenta al 100 % de las
puntuaciones de una distribucin de frecuencias. No obstante cuando se analizan
medidas extremas esta medida pudiera ser afectada por desviaciones que se
posicionan por debajo o por arriba de ella. Ni la mediana ni la moda tienen este
problema (Webster, 1998; Hopkins, Hopkins y Glass 1997; Kazmier, 1998).
a) Medidas de Dispersin.
Las medidas de dispersin son ndices que se utilizan para describir una distribucin de
frecuencias a partir de la variacin de los valores obtenidos. Los ndices ms utilizados
son el rango, la varianza y la desviacin estndar.
d1) El Rango. Indice conocido como recorrido. Se le define como la diferencia existente
entre la puntuacin mayor y la menor en una serie de datos. Tiene como desventaja
que solo toma en cuenta para su clculo las puntuaciones extremas, es decir la mayor
y la menor omitiendo el resto de los datos u observaciones. Debido a lo anterior no es
una medida confiable dado que se obtiene prcticamente por inspeccin.
d2) La Varianza. La varianza es una medida de variabilidad que toma en cuenta el 100
% de las puntuaciones de manera individual. Webster (1998) la define como la media
aritmtica de las desviaciones respecto a la media aritmtica elevada al cuadrado, (p.
83). La definicin matemtica de la varianza se expresa por medio de la ecuacin 4.6:

(Ec. 4.6)
donde:

2
= Varianza.
= Suma de
X
2
= Desviacin de las puntuaciones de la media (X-X)
N = Nmero de casos.

d3) La Desviacin Estndar. Dada la dificultad inherente de interpretar el significado de
una varianza en virtud de que expresa valores elevados al cuadrado, para efectos de
investigacin es ms adecuado utilizar la desviacin estndar o desviacin tpica,
definida como la raz cuadrada de la varianza. La desviacin estndar se expresa
mediante la ecuacin 4.7:


(Ec. 4.7)
donde:
X
2
= Suma de los cuadrados de cada puntuacin
(X)
2
= Suma de las puntuaciones elevadas al cuadrado
N = Nmero de casos.
= Desviacin Estndar

La desviacin estndar es una medida obtenida mediante una escala de intervalo o de
razn basada en la magnitud de las puntuaciones individuales de la distribucin
(DAry, Jacobs y Razavieh, 1982). Es de mucha utilidad en ... en conjuncin con
la...distribucin normal, (Kazmier, 1998).
e) Correlacin.
La correlacin es un mtodo estadstico que permite determinar la presencia o
ausencia de asociacin entre dos variables sometidas a investigacin. Por ejemplo se
puede medir el grado de asociacin entre el rendimiento acadmico y el nivel
socioeconmico de una muestra de unidades de observacin. La correlacin se
describe por medio de ndices estadsticos denominados coeficientes de correlacin que
pueden sugerir si el cambio de una variable se asocia con el cambio de la otra variable.
Los ndices mas utilizados para medir la asociacin entre dos variables es el coeficiente
de correlacin producto-momento que se aplica a escalas de medicin de intervalo o
de razn y el coeficiente de correlacin de rangos que se utiliza en escalas de medicin
ordinal.
Al analizar la correlacin de una serie de datos el resultado que arroja un coeficiente
de correlacin flucta entre 1.00 y + 1.00. Una puntuacin de 1.00 sugiere una
correlacin negativa perfecta. Una puntuacin de 0.00 sugiere ausencia de asociacin
entre las variables y una puntuacin de + 1.00 sugiere una correlacin positiva
perfecta. Una correlacin positiva perfecta indica que si una variable aumenta la otra
tambin aumenta, por ejemplo cabe esperar que si el tipo de cambio peso-dlar
aumenta el volumen de exportaciones del sector manufacturero del pas tambin
aumenta.
En el caso de una correlacin negativa perfecta ocurre el aumento de una variable y el
decremento o disminucin de la otra variable. Por ejemplo ante el aumento del tipo de
cambio peso-dlar cabe esperar una disminucin o decremento en el volumen de
importaciones del pas. Una adecuada tcnica para leer e interpretar los valores de
correlacin son las grficas de dispersin. La Tabla 4.3 muestra algunos valores de
coeficientes de correlacin con su respectiva descripcin y grfica de dispersin.
Determinar la existencia de asociacin entre las variables no indica existencia de
causalidad. Esto es, un coeficiente de correlacin nicamente sugiere el grado de
relacin entre las variables y no una situacin causal.
e1) Correlacin Producto-Momento. La correlacin producto-momento es conocida
como r de Pearson en virtud de que el estadstico Karl Pearson desarrollo este
procedimiento. Se define como la media de los productos

de las puntuaciones Z y se expresa matemticamente mediante la ecuacin:
donde:
rxy = coeficiente de correlacin producto-momento.
ZxZy = Sumatoria de los productos de puntuacin Z.
n = Nmero de casos o puntuaciones pareadas.
en situaciones en las que el conjunto de observaciones es muy numeroso se omite la
aplicacin de la ecuacin 4.8 y es sustituida por la expresin:


(Ec. 4.9)

donde:
rxy = coeficiente de correlacin producto-momento.
n = Nmero de casos. Xi = Sumatoria de las puntuaciones de la variable X.
Yi = Sumatoria de las puntuaciones de la variable Y.
XY = Sumatoria de los productos de las puntuaciones apareadas XiYi.
Xi
2
= Sumatoria de los cuadrados de las puntuaciones de la variable X.
Yi
2
= Sumatoria de los cuadrados de las puntuaciones de la variable Y.

Tabla 4.3 Ejemplo de Grficas de Dispersin.
Grfica de Dispersin
Coeficiente de
correlacin
Interpretacin

+ 1.00
Correlacin positiva perfecta.

- 1.00
Correlacin negativa perfecta.

+ 0.60
Correlacin positiva moderada

0.00 Ausencia de correlacin

Para ejemplificar el coeficiente de correlacin producto-momento se desarrollar el
anlisis de correlacin al volumen de exportaciones del Sector de Servicios de
Impresin (SSI) de Mxico en el periodo comprendido entre 1991 y 1995 en relacin
con el tipo de cambio peso-dlar. El volumen de exportaciones se expresa en millones
de dlares. La Tabla 4.4 muestra los datos del ejemplo. Al aplicar la ecuacin 4.9 se
obtiene:


Tabla 4.4 Volumen de Exportaciones en relacin con el Tipo de Cambio peso- dlar del
Sector de Servicios de Impresin Mexicano.

Fuente: Avila, H. L. (1999). Determinacin de la Productividad Total del Sector de
Servicios de Impresin de Cd. Cuauhtmoc, Chih. Tesis para obtener el grado de M. C.
en Comercio Exterior, Instituto Tecnolgico de Cd. Jurez, Jurez, Chih.

al calcular el coeficiente de determinacin (ver seccin 5.3) se obtiene un valor de:

el anlisis de correlacin arroj un coeficiente de correlacin de 0.28 para la
asociacin del valor total de exportaciones con el tipo de cambio peso-dlar, esto
indica una dbil correlacin inversa entre ambas variables, con un coeficiente de
determinacin de 0.06. Lo anterior sugiere la conclusin lgica de que mientras el
volumen de exportaciones se incrementa, el tipo de cambio peso-dlar decrece, sin
que lo anterior indique una relacin causstica, dado que para tal efecto sera necesario
un anlisis marginal con soporte en algn modelo econmico. El anlisis de correlacin
simple es susceptible de someterse a prueba de hiptesis estadstica mediante la
distribucin t con gl = n 2 (gl = grados de libertad). Para lo anterior se procede a:
a) Establecer la hiptesis nula expresada en trminos estadsticos (ver seccin 2.2 del
captulo II). La hiptesis es:


b) Determinar el nivel de significancia estadstica al que se someter a contrastacin la
hiptesis nula y que pudiera ser en nivel de:

c) Calcular la prueba de signifitica mediante el

(Ec. 4.10)
d) estadstico t expresado en la ecuacin:
donde:
t = prueba t para prueba de hiptesis de correlacin simple
r = coeficiente de correlacin
r
2
= coeficiente de determinacin
n = nmero de casos
al aplicar la ecuacin 4.10 al anlisis de correlacin anterior se obtiene un valor t
calculado de:

el valor t calculado de 0.90 se compara con el valor t crtico a una significacin de
= 0.05 consultado en el apndice A, procediendo previamente a obtener los grados de
libertad para la distribucin t con la ecuacin:
gl = n - 2
(Ec. 4.11)

en el problema son cinco casos por lo que gl = 5 2 = 3. Con tres grados de libertad
el valor t crtico es de 3.182. La regla de decisin es que si el valor t calculado es
mayor que el valor t crtico entonces se rechaza la hiptesis de nulidad. En este caso
se acepta la hiptesis de nulidad en virtud de que el valor to = - 0.90 < tc = 3.182 y
se concluye que si existe asociacin entre las variables volumen de exportaciones y
tipo de cambio peso-dlar.
e2) Coeficiente de Correlacin por Rangos. El coeficiente de correlacin por rangos
conocido como coeficiente de Spearman (rho) se obtiene por medio de la expresin:

(Ec. 4.10)
donde:
= Coeficiente de correlacin por rangos.
D
2
= Sumatoria de los cuadrados de las diferencias entre los rangos.
N = Nmero de casos.

e3) Coeficiente de Determinacin. El coeficiente de determinacin (rXY2) se define
como el cuadrado del coeficiente de correlacin y se utiliza para medir la variacin de
la variable dependiente (Y) explicada por la variacin de la variable independiente (X).
Es ms adecuado aplicarlo en modelos de regresin lineal para medir el poder
explicativo de modelos de regresin lineal.
5.2.2 Elementos de Estadstica Inferencial
a) Anlisis de Varianza. El anlisis de varianza (ANOVA) es una tcnica estadstica
diseada para comparar la varianza de dos poblaciones a partir del anlisis de las
varianzas de las muestras respectivas. Webster (1998) aplica el concepto de ANOVA al
contexto de un experimento y la define como ... el procedimiento [que] se puede
aplicar a la determinacin de si un tratamiento en particular aplicado a una poblacin
tendr efecto significativo sobre su media, (p. 595). Aplicar el ANOVA requiere
cumplir con dos criterios especficos:
a1) Las poblaciones de estudio deber ser normales y tener varianzas iguales.
a2) Seleccionar las muestras independientemente.
La varianza total de todos los tratamientos (observaciones) se puede dividir en dos
fuentes:
a) Variacin Intermuestral. Factor que representa la variacin entre los diversos
tratamientos administrados durante el desarrollo de un experimento.
b) Variacin Intramuestral o debida al Error. Factor que representa la variacin dentro
de un mismo tratamiento administrado durante la realizacin de un experimento.
En este contexto se entiende que la variacin total es igual a la variacin intermuestral
+ la variacin intramuestral o debida al error. Para obtener la comprobacin de una
hiptesis de nulidad mediante el ANOVA se tienen que calcular los siguientes factores:
a) La suma total de cuadrados expresada por la ecuacin:

(Ec. 4.11)
donde:
xt
2
= Suma total de cuadrados
x
2
=Suma de los cuadrados de las puntuaciones
( x)
2 =
Suma de las puntuaciones elevadas al cuadrado
N = Nmero de casos.
b) La suma de los cuadrados entre grupos (varianza intermuestral) se expresa por la
ecuacin:

(Ec. 4.12)
donde:
xi
2
= Suma de los cuadrados entre los grupos
(X1)
2
= Suma de las puntuaciones elevadas al cuadrado del tratamiento1
n = Nmero de casos

c) La suma de cuadrados dentro de grupos (varianza intramuestral) se expresa por la
ecuacin:

(Ec. 4.13)

donde:
Xd
2
= Suma de cuadrados dentro de grupos
X1
2
= Suma de los cuadrados de las puntuaciones del grupo 1
(X1)
2
= Suma de las puntuaciones elevadas al cuadrado del tratamiento1
Lo anterior refleja que se cuenta con tres varianzas y solo es posible realizar la
comparacin de la varianza intermuestral con la varianza intramuestral mediante el
anlisis del comportamiento de las mismas con respecta a la distribucin F que supone
la independencia de las varianzas. La distribucin F se expresa por la ecuacin:


(Ec. 4.14)
donde:
F = Distribucin F.

d) Los grados de libertad para la varianza del error se obtienen mediante la ecuacin:
gl =c-1
(Ec. 4.15)
donde:
gl = grados de libertad
c = columnas

e) Los grados de libertad para la varianza intramuestral se obtienen por medio de la
ecuacin:
gl =n-c
(Ec. 4.16)
donde:
gl = grados de libertad
c = columnas
n = nmero de casos

Para ejemplificar el ANOVA se tomarn los datos siguientes: Con el propsito de
determinar que las medias de las puntuaciones obtenidas por tres grupos de
menonitas provenientes de los campos menonitas del municipio de Riva Palacio, Chih.,
en un experimento de lectura veloz en indioma espaol utilizando un vocabulario
tcnico-cientfico. El rendimiento de cada uno de los grupos se muestra en la Tabla
4.5.

Tabla 4.5 Resultados de un experimento de lectura veloz con una muestra de
menonitas del Municipio de Riva Palacio, Chih.




Para obtener la razn F se recomienda elaborar la siguiente tabla a fin de facilitar el
anlisis de resultados:

Tabla 4.6 Formato para Obtener la Razn F.


La razn F crtica para 2 y 15 grados de libertad a un nivel = 0.05 se obtiene
consultando el apndice B. Para el presente caso tiene un valor de F = 3.68. La
interpretacin requiere de aplicar la regla de decisin: Si la razn F calculada es mayor
que la razn F crtica entonces se rechaza la hiptesis nula, en caso contrario se
acepta.
Para el problema anterior la razn F calculada es de 0.44 valor que esta muy por
debajo de la razn F crtica con valor de 3.68 para = 0.05 por consiguiente es posible
aceptar la hiptesis de nulidad concluyendo que no existe evidencia de que las tres
medias de calificaciones obtenidas por los grupos en lectura veloz sean diferentes.
b) Anlisis Multifactorial de Varianza. El anlisis multifactorial de varianza (ANCOVA)
tambin denominado anlisis de covarianza permite la comparacin de ms de dos
variables entre si con el propsito de comprobar tanto el efecto de las variables como
el efecto de interaccin entre ellas.
El ANCOVA es utilizado para analizar los resultados de investigaciones de tipo
experimental que aplican un diseo factorial (ver seccin 3.4 del captulo III). En este
tipo de diseos se analizan los efectos combinados de dos o ms variables
independientes. Para realizar un ANCOVA se necesita obtener:
b1) La suma total de cuadrados mediante la ecuacin 4.11.
b2) La suma de cuadrados entre grupos mediante la ecuacin 4.12.
b3) La suma de cuadrados dentro de grupos mediante la ecuacin 4.13.
b4) La suma de cuadrados entre columnas que se define por la ecuacin:

(Ec. 4.17)
donde:
X
ec
2
= suma de cuadrados entre columnas
n
c1
= nmero de casos en la columna 1.
N = nmero total de casos
b5) La suma de cuadrados entre hileras que se expresa matemticamente mediante la
ecuacin:

(Ec. 4.18)
donde:
X
ec
2
= suma de cuadrados entre columnas
nr1 = nmero de casos en la hilera 1.
N = nmero total de casos
b6) La suma de la interaccin de los cuadrados ... es la parte de la desviacin entre
las medias de los grupos y la media total que no se debe ni a las diferencias de las
hileras ni a las diferencias de las columnas, (DAry, Jacobs y Razavieh, 1982, p. 164).
Se define matemticamente mediante la expresin:

(Ec. 4.19)
donde:
X
int
2
= suma de cuadrados entre hileras
X
i
2
= suma de cuadrados entre grupos
X
ec
2
= suma de cuadrados entre columnas
X
er
2
= suma de cuadrados entre hileras
b7) Determinar el nmero de grados de libertad asociados a cada puntuacin de
variacin:
1 Suma de cuadrados entre columnas utilizando la ecuacin 4.15
2 Suma de cuadrados entre hileras mediante la ecuacin:
gl = r-1
(Ec. 4.20)
donde:
gl = grados de libertad
r = hileras

3 Suma de la interaccin de los cuadrados por medio de la expresin:
gl =(c-1)(r-1)
(Ec. 4.21)
donde:
gl = grados de libertad
c = columnas
r = hileras

4 Suma de cuadrados entre grupos mediante la ecuacin:
gl =G-1
(Ec. 4.22)
donde:
gl = grados de libertad
G = grupos
5 Suma total de cuadrados definido por la expresin:
gl =N-1
(Ec. 4.23)
donde:
gl = grados de libertad
N = columnas

b8) Obtencin de la razn F mediante la ecuacin 4.14.
Para ejemplificar el ANCOVA se aplicar el procedimiento al siguiente caso: Se desea
investigar como influye un programa de incentivacin econmica en la productividad
de la mano de obra de una compaa de servicios de impresin, formando cuatro
grupos de trabajadores aleatoriamente. Los integrantes de dos de los grupos son
menores de 24 aos y los integrantes del resto del grupo mayores de 24 aos. Los
datos obtenidos se muestran en la Tabla 4.7.
Tabla 4.7 Valores de la Productividad de la Mano de Obra de la Empresa de Servicios
de Impresin.


los clculos son:

para obtener la razn F se sugiere disear la siguiente tabla con el propsito de
facilitar


el anlisis:
Tabla 4.8 Formato para Obtener la Razn F.


Para la varianza entre columnas la razn Fo = 5.69 > Fc = 4.49 por consiguiente no se
acepta la hiptesis de nulidad. La razn F calculada (Fo) es significativa a nivel =
0.05. Para la varianza entre hileras la razn Fo = 15.13 > Fc = 4.49 por lo que no se
acepta la hiptesis nula. La razn F es altamente significativa a nivel = 0.05. Para la
varianza de la interaccin la razn Fo = 15.03 > Fc = 4.49 por lo que no se acepta la
hiptesis de nulidad. La razn F es altamente significativa a nivel = 0.05. Los
anteriores resultados permiten concluir que existe evidencia estadstica para establecer
como conclusin que la incentivacin econmica tiene influencia significativa en el
aumento de la productividad de los empleados de la compaa de servicios de
impresin. Este efecto se presenta tanto en trabajadores menores de 24 aos como en
los mayores de 24 aos.
c) La Distribucin Xi2. La Xi2 (chi cuadrada) es una prueba de estadstica no
paramtrica que se utiliza para la contrastacin de hiptesis. De acuerdo con Webster
(1998) las pruebas no paramtricas son procedimientos estadsticos que se pueden
utilizar para contrastar hiptesis cuando no es posible fijar ningn supuesto sobre
parmetros o distribuciones poblacionales, (p. 836). Las aplicaciones de la prueba Xi2
son dos: c1) las pruebas de bondad del ajuste y c2) las pruebas de independencia.
c1) Xi2 de bondad del ajuste. Esta prueba se utiliza para apreciar si las distribuciones
observadas se ajustan a las esperadas. La prueba es adecuada para realizar pruebas
de variancia sin que interese el tipo de distribucin que tiene (Glass y Stanley, 1994;
Kazmier, 1998).
Lo anterior significa que esta prueba permite determinar si los datos empricos de
alguna distribucin especfica corresponde a una distribucin terica como la binomial,
la poisson o la normal. Se emplea en el muestreo con el propsito de precisar si los
valores obtenidos de una muestra corresponden a las frecuencias poblacionales (ver
Hopkins, Hopkins y Glass, 1997; Kazmier, 1998).
Para Webster (1998) presenta una definicin muy completa de las pruebas de bondad
del ajuste. ... estas pruebas miden el grado en que los datos muestrales observados
cumplen una distribucin hipottica determinada. Si el grado de cumplimiento es
razonable, se puede deducir que la distribucin hipottica existe, (p. 838).
La hiptesis de nulidad en la prueba de bondad del ajuste se expresa:
Ho: fo = fe. (No hay diferencia entre las frecuencias observadas y las esperadas)
H1: fo fe. (Existe diferencia entre las frecuencias observadas y las esperadas.
Para someter a prueba estas hiptesis se utiliza la expresin matemtica:

(Ec. 4.24)
donde:
Xi
2
= prueba chi cuadrada
k = nmero de categoras o clases
fo = frecuencias observadas
fe = frecuencias esperadas

Para ejemplificar la Xi2 de bondad del ajuste se utilizarn los siguientes datos: El Sr.
David Neufeld es gerente de ventas de la fbrica de queso menonita tipo chester
ubicada en la Colonia Manitoba en la regin noroeste del Estado de Chihuahua. En
particular el Sr. Neufeld tiene que desplazar la produccin de queso en el mercado
nacional. Recientemente se da cuenta de la existencia de una fuerte competencia de
otras marcas de queso provenientes de otras entidades del pas y del extranjero. Le
resulta cada vez ms difcil comercializar la produccin de queso y decide someter a
comprobacin la hiptesis de nulidad a un nivel = 0.05:
Ho: fo = fe. La demanda real es uniforme a la esperada
H1: fo fe. La demanda real no es uniforme a la esperada.
el Sr. Neufeld toma como muestra el volumen de ventas mensual en toneladas de
queso correspondientes a un periodo de 12 meses. Las frecuencias son:

Tabla 4.9 Frecuencias Esperadas y Observadas de las Ventas de Queso


El valor de Xi
2
es:

Con el propsito de analizar e interpretar el valor encontrado de Xi
2
se necesita
obtener los grados de libertad. Para ello se utiliza la expresin matemtica:
gl = n - 1
donde:
gl = grados de libertad
n = nmero de casos

para el anterior problema los gl = 11. Posteriormente se obtiene el valor de Xi2
crtica(consultar apndice C) aplicando la regla de decisin: Se rechaza la hiptesis
nula s Xi2 calculada > Xi2 crtica, no se rechace en caso contrario. Para el caso
anterior se puede concluir que Xi2 calculada = 42.57 > Xi2 crtica =19.675 a nivel =
0.05 por consiguiente no se acepta la hiptesis de nulidad que expresa que la
demanda de queso menonita tipo chester en el mercado nacional es uniforme. Las
diferencias entre la demanda observada y la esperada son significativas por lo que es
posible refutar la hiptesis de nulidad.
c2) Xi
2
de Independencia. Es una excelente herramienta estadstica para comprobar la
independencia de variables categricas. Analiza dos factores con el propsito de
determinar la existencia o no de relacin entre ellos. Para lo anterior utiliza tablas de
tabulaciones cruzadas o de contingencia (ver seccin 4.3 del captulo IV).
As por ejemplo si se analizar el rendimiento de alumnos con resultados por arriba o
por debajo del promedio en la prueba coeficiente intelectual se estaran comparando
dos factores: rendimiento y coeficiente intelectual. La Xi2 de independencia aplica la
ecuacin 4.23 para analizar la diferencia entre las frecuencias observadas y las
esperadas.
Para ilustrar esta prueba se utilizar un ejemplo segn el cual a una muestra aleatoria
de 90 estudiantes recin egresados y prximos a egresar de educacin media superior
se les pregunta si prefieren estudiar una carrera profesional en la Universidad
Autnoma de Chihuahua (UACH), en el Instituto Tecnolgico de Cd. Cuauhtmoc
(ITCC) o si tienen preferencia por alguna Institucin de Educacin Superior Particular.
Los resultados se muestran en la Tabla 4.9.

Tabla 4.10 Frecuencias Observadas para la Preferencia por Educacin Superior.

como puede observarse la Tabla 4.9 contiene 6 casillas integradas por tres columnas y
dos hileras. Para realizar la comparacin se plantea la hiptesis:
Ho: fo = fe. No existe preferencia por alguna institucin especfica
H1: fo fe. Existe preferencia por alguna institucin especfica.
para someter a comprobacin la hiptesis de nulidad se elige un nivel de = 0.05
procedindose a obtener las frecuencias esperadas en funcin de las frecuencias
observadas por medio de operaciones aritmticas. Se multiplica el valor de cada casilla
por el total de la columna dividido por el total de casos.
As por ejemplo la frecuencia esperada de los estudiantes que prefieren la UACH es 20
(36/90) = 8. Se realiza la misma operacin para obtener el resto de frecuencias
esperadas. La Tabla 4.10 presenta las frecuencias esperadas.


Tabla 4.11 Frecuencias Esperadas para la Preferencia por Educacin Superior.

el valor de Xi
2
es:
Finalmente se compara el valor de Xi
2
observada con el valor de Xi
2
crtica. Para lo cual
se requiere obtener los grados de libertad mediante la expresin:
gl = (r-1) (c-1)
(Ec. 4.25)
donde:
gl = grados de libertad
r = nmero de renglones en la tabla
c = nmero de columnas en la tabla
por consiguiente los grados de libertad son gl = (2 1) (3 1) = 2 que a un nivel =
0.05 el valor de Xi
2
crtica es de 5.99. Como Xi
2
=87.20 > Xi
2
crtica = 5.99 es posible
afirmar con cierto grado de confianza que existen diferencias significativas acerca de la
relacin de la variable estudiantes recin egresados y prximos a egresar de educacin
media superior y la variable preferencia por alguna institucin de educacin superior.
La hiptesis de nulidad no se acepta a nivel = 0.05.
RESUMEN DEL CAPITULO
La etapa de anlisis de datos es una de las ms importantes en el proceso de
investigacin en virtud de que se procede a racionalizar los datos colectados con el
propsito de explicar las posibles relaciones que expresan las variables estudiadas. El
anlisis puede ser univariado, bivariado o trivariado. El anlisis e interpretacin
requiere del conocimiento de la estadstica.
La estadstica proporciona innumerables beneficios a la investigacin cientfica y
tecnolgica. Esta disciplina aporta elementos estadsticos descriptivos e inferenciales.
Los primeros representan un conjunto de procedimientos que permiten procesar y
presentar la informacin de manera organizada y resumida. Los segundos facilitan el
establecimiento de inferencias de la muestra estudiada hacia la poblacin de origen a
travs de una serie de pruebas de hiptesis aplicando estadstica paramtrica y no
paramtrica.

You might also like