You are on page 1of 56

0

ANTOLOGIA
(Sntesis)


A S I G N A T U R A : E S T A D I S T I C A S P A R A
L A I N V E S T I G A C I O N
A N T O L O G I A . A u t o r : M . I . M a r i o
G o n z l e z

E l a b o r a c i n d e R e s u m e n : L . C . P .
S i l v i a A u r o r a C a s t i l l o M e d i n a
0 1 / 0 2 / 2 0 1 4
Resumen de la Antologa en donde se abordan
los diferentes mtodos estadsticos en la investigacin
cientfica, desde la recopilacin de datos, su anlisis
hasta la prediccin.

1

CONTENIDO




INTRODUCCIN....3

1.- MTODOS CUANTITATIVOS EN LA INVESTIGACIN CIENTFICA......4
1.1. La importancia de las investigaciones mixtas.4
1.1.1. El mtodo de evaluacin clsico ex post...6
1.1.2. Modelo experimental clsico..7
1.1.3. El mtodo costo/beneficio...7
1.1.4. Relacin modificada C/B....8
1.1.5. El mtodo costo eficacia socioeconmica y el de anlisis del valor til..8
1.1.6. El mtodo de anlisis multicriterio.9
1.1.7. El mtodo de la valoracin hipottica....10
1.1.8. El mtodo de Leopold...11
1.1.9. El mtodo Delphi...12
1.1.10. El mtodo de impacto diferencial..12
1.2. Los sondeos y Las encuestas en la investigacin cientfica..12
1.3. Las grficas, histogramas y polgonos de frecuencia en la representacin de los datos....13
1.4.- Conceptos Bsicos de Estadstica.....14

2.- LAS VARIABLES DE ANLISIS...18
2.1. El objeto de Estudio en la investigacin...18
2.1.1. Las Variables cualitativas....19
2.1.2. Las Variables cuantitativas..19
2.1.2.1. Variables Discretas...19
2.1.2.2. Variables Continuas......20
2.2. La variable Independiente...20
2.3. La variable Dependiente..20
2.4. La Estadstica descriptiva e inferencial.20
2.5. La hiptesis Sustantiva e hiptesis nula......21

3.- EL MUESTREO: PORCIONES REPRESENTATIVAS EN LA INVESTIGACIN....23
3.1. Anlisis de la Poblacin.....23
3.2. Definicin del tamao de la muestra...23
3.3. Tipos de muestreos (Ventajas y Desventajas)...24
3.3.1. Muestreos Probabilsticos..24
3.3.2. Muestreos No probabilsticos26
3.4. El Error Estndar....27
3.5 Diferencias Absolutas y Relativas.27

4.-LA TEORA DE CONJUNTOS....27
4.1. Definicin, caractersticas y clasificacin....27
4.2. Tipos de Conjuntos.....28
4.3. Propiedades de los Conjuntos..29
4.4. Leyes de los Conjuntos..30
4.5. El Diagrama de Venn..30

5.- ESTADSTICA: PROPSITO, APROXIMACIN, MTODO31
2

5.1. La aproximacin bsica.31
5.2. Definicin y propsito de la estadstica.....32
5.3. Curva normal de probabilidad y desviacin estndar..32
5.4. Interpretacin de datos, usando la tabla normal de probabilidad; datos de frecuencia.34
5.5. Interpretacin de datos usando la curva normal de probabilidad; datos continuos....36
5.6. Varianza y Covarianza.....37
5.7. Anlisis de varianza..39
5.7.1. Fundamentos......39
5.7.2 Anlisis de varianza: un ejemplo sencillo39
5.7.3. Mtodo de anlisis de varianza...39
5.8. Anlisis de Frecuencias....40
5.8.1. Terminologa de datos y variables..........41
5.8.2. Clculo de porcentajes..43
5.8.3. Niveles de significacin estadstica.43
5.9. Estadstica Binomial.....43

6. ANLISIS, INTERPRETACIN, ESTADSTICA E INFERENCIA..44
6.1. Principios de anlisis e interpretacin44
6.1.1 Frecuencias y medidas continuas....45
6.1.2 Reglas de categorizacin..45
6.1.3 Clases de anlisis estadsticos....45
6.1.4 ndices..46
6.1.5 Indicadores sociales..46
6.1.6 Interpretacin de datos de investigacin....46

7. PROBABILIDAD.....47
7.1. Definicin de probabilidad......... 47
7.2. Espacios y puntos muestrales y eventos.....49
7.3. Eventos compuestos y sus probabilidades ..48
7.4. Independencia, exclusividad mutua y exhaustividad.....49
7.5. Probabilidad condicional.....49

8. MODELOS DE PREDICCIN.........50
8.1 Introduccin....... ..50
8.2 Mtodos ecomomtricos de prediccin....50
8.3 El modelo senoidal de minimos cuadrados..50
8.4 El modelo autorregresivo de prediccin....51
8.5 El modelo de prediccin de suavizamiento exponencial....53
8.6 El modelo de prediccin de promedios mviles exponencialmente ponderados....53
8.7 Otros modelos y mtodos de pronstico...53
8.7.1. El modelo de Rielly.......53
8.7.2. El modelo de Huff..54

CONCLUSIONES54

BIBLIOGRAFA55






3



INTRODUCCIN


Como proceso de indagacin, la ciencia supone un sistema de acciones y
procedimientos en constante perfeccionamiento, para alcanzar cada vez mayor eficiencia en sus
objetivos; es tambin, por tanto, objeto del proceder cientfico.


La ciencia debe ser capaz, como lo ha indicado Popper, de describir, predecir y eventualmente
controlar los fenmenos de que se trata. Para ello cualquier rama de ciencia ha de contar con los
tres elementos bsicos que la caracterizan: instrumentos, tcnicas o mtodos, y teoras,
debidamente interrelacionados. Pero no solamente bastan los instrumentos y los mtodos o
tcnicas para su uso, sin el apoyo de teoras. La mayora de las disciplinas cientficas tienen
ricas conexiones entre sus ramas tericas y experimentales.


A su vez, podemos decir con Ackoff que la metodologa puede ser considerada
como un tipo especial de solucionador de problemas, uno de los cuales lo constituyen los
problemas de investigacin.

El mtodo cientfico es la forma de abordar la realidad, de estudiar los fenmenos de la naturaleza,
la sociedad y el pensamiento, con el propsito de descubrir su esencia y relaciones.

Por otra parte, la tcnica constituye una operacin especial para recolectar, procesar o analizar
los datos, realizada bajo orientacin definida y, en consecuencia, est ms directamente
ligada a las etapas empricas de la investigacin.




























4


1.- MTODOS CUANTITATIVOS EN LA INVESTIGACIN CIENTFICA


1.1. LA IMPORTANCIA DE LAS INVESTIGACIONES MIXTAS

Con la publicacin en 1849 del Discurso sobre el espritu positivo de Augusto Comte, se inicia
en las ciencias sociales un paradigma denominado positivista. Las ideas esenciales del
positivismo provienen de las denominadas ciencias exactas como la Fsica, la Qumica y
la Biologa; por tal motivo, los positivistas se fundamentaron en cientficos como Galileo Galilei,
Isaac Newton, Nicols Coprnico, Thomas Robert Malthus y Charles Darwin.

Por ello, para el positivismo, la objetividad es muy importante, el investigador observa, mide y
manipula variables; adems de que se desprende de sus propias tendencias (la relacin entre
ste y el fenmeno de estudio es de independencia). Lo que no puede medirse u observarse con
precisin se descarta como objeto de estudio.

El positivismo (muy rgido) fue remplazado por el pospositivismo, fundamentado en el anterior,
pero ms abierto y flexible; es una especie de padre del enfoque cuantitativo y le otorga
tres principales elementos que lo caracterizan:

1) Recolectar datos en la forma de puntuaciones (que se origina en las matemticas). Es
decir, los atributos de fenmenos, objetos, animales, personas, organizaciones y colectividades
mayores son medidos y ubicados numricamente.

2) Analizar tales datos numricos en trminos de su variacin.

3) La esencia del anlisis implica comparar grupos o relacionar factores sobre tales
atributos mediante tcnicas estadsticas (en el caso de las ciencias del
comportamiento, mediante experimentos y estudios causales o correlacionales). El enfoque
cuantitativo se consolida a lo largo del siglo XX y tiene momentos claves como los que
se presentan a continuacin.

En 1901 Pearson junto con Weldon y Galton fundan Biometrika, una revista que se
dedic al desarrollo de anlisis estadsticos en el campo de la Biologa. A finales del siglo XIX ha
nacido un pilar del enfoque cuantitativo: LA ESTADSTICA.

Durante los aos de 1930, se contina el desarrollo de pruebas psicomtricas y de logro, as como la
estadstica inferencial (conclusiones de la muestra a la poblacin) se comienza a utilizar y diversos
procedimientos se fortalecen.

En 1938, Elton Mayo publica junto con F. Yates, las tablas estadsticas para la
investigacin en la Agricultura, la Biologa y la Medicina. Asimismo, la Asociacin de
Educacin Progresiva en EE. UU. Comienza a realizar estudios longitudinales.

Durante la dcada de 1950, la investigacin cuantitativa se encuentra en su
5

apogeo, surgen diversas encuestas, experimentos, revistas cientficas, diseos, etc.
Tambin comienzan a desarrollarse las mquinas para calificar pruebas y la computadora.

En la dcada comprendida entre 1970 y 1980 se identifican diversos modelos causales multivariados
(por ejemplo, el modelamiento de ecuaciones estructurales), se desarrolla el meta-anlisis
(tcnica para analizar datos provenientes de distintos estudios con mediciones similares) y se
sugieren los tipos de validez (Thomas Dixon Cook y Donald T. Campbell, 1979), que
ms recientemente se conciben como clases de evidencia acerca de la validez.

En la ltima dcada del siglo XX surgen mediciones y anlisis multivariados ms
complejos, adems se consolida la idea de poder de medicin mediante la
utilizacin de diferentes instrumentos para medir las variables de investigacin. Los
programas de anlisis se sofistican y comercializan, y es aqu donde ahora estamos.

De acuerdo con Tashakkori y Teddlie (2003) adems de Mertens (2005), el enfoque mixto se basa
en el paradigma pragmtico. Esta visin evita utilizar conceptos como verdad y realidad que han
causado, desde el punto de vista de sus autores, conflictos entre los enfoques cuantitativo y
cualitativo.

Hacia el final de los aos de 1970, T. D. Jick introdujo los trminos bsicos de los diseos mixtos,
propuso recabar datos mediante tcnicas cuantitativas y cualitativas, e ilustr la triangulacin
de datos (Jick, 1979). Por tanto, el concepto de triangulacin fue clave para la concepcin de los
diseos mixtos


SNTESIS HISTRICA


CARACTERSTICAS Y
SUPUESTOS
POSPOSITIVISMO CONSTRUCTIVISTA TRANSFORMATIVO PRAGMTICO
Etiquetas
asociadas con el
Paradi gma
Experi mental,
Cuantitati vo, Causal
y Comparativo
Naturalista,
Fenomenolgico,
Hermenuti co,
Interaccioni sta
si mbli co
(interacti vo),
Etnogrfi co y
Cualitativo
Teora Crti ca,
Neo- Marxista,
Femini sta,
Parti cipativo y
Emancipatorio
Mtodos y model os
mixtos o hbridos
Supuesto de realidad Una realidad
conocida en trminos
de probabilidad
Mltipl es
realidades
construidas
social mente
Mltipl es
realidades
formadas por el
Contexto social.
Poltico,
econmi co o tni co
Lo que es til para
explicar un fenmeno
es lo verdadero
6


Supuesto del
conoci miento y
relacin entre el
Observador y el
Fenmeno
La objetividad es
importante, el
investigador
observa, mide y
manipula variables,
se desprende de
sus tendencias.
El conoci mi ento es
interacti vo
producto entre el
vnculo entre el
investigador y los
participantes. Los
valores y
tendencias entre
todos los
involucrados son
hechas explicitas,
generan
descubri mi entos
El conoci mi ento es
interacti vo
producto entre el
vnculo entre el
investigador y los
participantes. Se
sita social e
histricamente.
Las relaciones entre el
investigador y el
fenmeno, o
participantes del
estudio, estn
determinadas por lo
que el investigador
consi dera como
apropiado para cada
estudio en parti cular
Supuesto
Metodolgico
Bsicamente
cuantitativo e
intervencionista
Bsicamente
cualitati vo,
Hermenuti co y
dialectico
Con bases
cualitativas pero
pueden usarse
Mtodos
cuantitativos y
mixtos, los factores
histri cos estn
incluidos.
El mtodo depende
del planteamiento
especfico del
estudio. Son vlidas
las tcnicas,
cualitativas
cuantitativas y mixtas.





1.1.1. EL MTODO DE EVALUACIN CLSICO EX POST


Este mtodo se lleva a cabo durante la etapa de explotacin del proyecto para
determinar si es conveniente continuar con l o definir los requerimientos de reprogramacin
necesarios para lograr los objetivos de impacto perseguidos. La medicin de los
impactos se realiza mediante la comparacin entre el estado "inicial" de la poblacin
objetivo (lnea de base, LB) y otro de "comparacin" que es la situacin existente despus
de un tiempo de explotacin del proyecto (lnea de comparacin, LC), eliminando (o tratando
de minimizar) la incidencia de factores externos. Adems tambin permite efectuar una
comparacin antes y despus en grupos de similares caractersticas que no hayan estado
influenciados por una intervencin similar a la del proyecto.

En el Modelo antes despus, si tenemos que: X' - X = Impacto en la poblacin beneficiaria en base
a la diferencia entre LB y LC. Es posible aumentar la confiabilidad de la estimacin a travs de la
incorporacin de variables de control. Es decir, hacer que los dos grupos sean los ms
parecidos posible en todas las variables externas al proyecto que pudieran incidir en el impacto (Uso
de series temporales), si se cuenta con informacin sobre indicadores de cambio en un conjunto de
perodos previos y posteriores al proyecto, es posible hacer un anlisis de series
temporales, para extraer conclusiones sobre los efectos imputables al mismo. Para ello, se
pueden construir curvas sobre la base de mediciones peridicas efectuadas "antes",
"durante" y "despus" de la realizacin del proyecto. Segn las formas que stas adopten se
trata de determinar la magnitud del impacto que el proyecto produjo.

GRUPOS TIEMPO
LB LC
Con Proyecto (C/P) X X

7

1.1.2. MODELO EXPERIMENTAL CLSICO


El modelo experimental clsico exige seleccionar aleatoriamente una muestra que se divide,
tambin aleatoriamente, en dos sub-muestras, el grupo con proyecto o poblacin
beneficiaria (grupo experimental) y el grupo sin proyecto (grupo de control). Estas sub-muestras se
seleccionan antes de iniciarse la operacin del proyecto (en la situacin de lnea de base) y deben
diferir slo en que la primera recibe los bienes o servicios del proyecto y la segunda no. Tomando
en cuenta la seleccin aleatoria de ambos grupos, las diferencias iniciales entre ellos, si las hay,
debieran ser mnimas. Es decir, entre X e Y no deben existir diferencias
estadsticamente significativas. As, el modelo compara la situacin en que se encontraban los
dos grupos en la lnea de base (L B), con la situacin en la lnea de comparacin (L C). A
partir de ello se verifican los cambios generados por el proyecto.

El siguiente cuadro permite apreciar la lgica del modelo experimental y el tipo de clculo que se
efecta al evaluar el proyecto.

GRUPOS TIEMPO
LB LC
Con Proyecto (C/P) X X
Sin Proyecto (S/P) Y Y


X, X', Y, Y' = Valores del indicador de impacto de un objetivo

La magnitud en que difieran los cambios producidos en el grupo con proyecto (X' - X), en
cada objetivo de impacto, respecto a los del grupo sin proyecto (Y' - Y), ser una medida del
Impacto del proyecto en dicho objetivo.


1.1.3. EL MTODO COSTO/BENEFICIO

El mtodo CostoBeneficio(C/B) se basa en la relacin de los costos (C) y los beneficios (B)
asociados con un proyecto particular. Su fin es maximizar el valor actual de la diferencia
entre beneficios y costos totales, sujeto a restricciones especficas. Un proyecto se considera
atractivo cuando los beneficios derivados desde su implantacin exceden a los costos
asociados. Por tanto, el primer paso en el anlisis C/B es determinar qu elementos
constituyen los beneficios y cules son sus costos.

Como el anlisis C/B siempre se utiliza en los estudios econmicos realizados por el Estado, es til
pensar que el propietario es el pblico y el que incurre en los costos es el gobierno. La consideracin
de s un tem dado debe considerarse como B, D o C, depende, por lo tanto, de a quin afectan
sus consecuencias. Es decir, situaciones en las que la produccin o el consumo imponen otros
costos por los que no se recibe compensacin alguna.

Antes de calcular una relacin C/B, todos los beneficios, perdidas, y costos que se utilizarn en el
8

clculo, deben convertirse a una unidad monetaria comn, como en los clculos de valor
presente, valor futuro, o unidades monetarias por ao, como en las comparaciones de costo anual.

Independientemente del mtodo utilizado en el anlisis C/B, es importante expresar
tanto el numerador (C) y el denominador (B, D) en los mismos trminos, as como dinero presente
o dinero futuro.

Hay varias formas de relaciones de C/B. La relacin convencional C/B, es probablemente la ms
utilizada y se calcula como sigue:
C/B = C / B D

Una relacin C/B menor de 1, indica la viabilidad del proyecto y, entre ms se aproxime a cero, la
relacin expresar que el proyecto evaluado es econmicamente ms ventajoso. En los anlisis
de C/B, los costos no van precedidos por el signo negativo.


1.1.4. RELACIN MODIFICADA C/B

La relacin modificada C/B, es un soporte valiossimo, pues incluye los costos de
operacin y mantenimiento (O & M) en el denominador y se trata de manera similar a
un D. El numerador, entonces, contiene solamente el costo de la inversin inicial. Una vez que
todas las cantidades sean expresadas en trminos de valor presente, valor anual o valor futuro, la
relacin modificada de C/B
se calcula como:

C/B Modificado = Inversin inicial / (B D (O+M))


1.1.5. EL MTODO COSTO EFICACIA SOCIOECONMICA Y EL DE ANLISIS
DEL VALOR TIL

El anlisis costoeficacia y el anlisis del valor til, son dos mtodos de evaluacin que facilitan la
eleccin de proyectos o alternativas de proyecto. En los dos mtodos, los diferentes efectos de un
proyecto son medidos segn las diversas dimensiones para ser transformados,
seguidos del intermediario de las funciones de valor til en escalones para la realizacin de un
objetivo. Haciendo una abstraccin de las dimensiones tomadas en cuenta al origen
(evaluacin bajo la forma de puntos). Los efectos individuales evaluados de esta forma,
son todos ponderados por coeficientes que revelen la importancia del objetivo y los anexos por
obtener un valor til global.

Ahora bien, el anlisis costoeficacia, se distingue del anlisis del valor til esencialmente por el
hecho que, en el primer caso, los costos son medidos en unidades monetarias y confrontados a
los valores tiles, los costos son igualmente transferidos sobre escalas de ndices
desprovistos de dimensiones. As, el anlisis costo eficacia tiene dimensiones diferentes del lado
de los costos y de las ventajas, que en algunos casos, pueden presentar dificultades, por lo cual se
precisa establecer un orden de prioridades fiables por los proyectos alternativos.
9

1.1.6. EL MTODO DE ANLISIS MULTICRITERIO

Se aplican diversos mtodos que permiten establecer un orden de prioridad sobre las alternativas a
comparar.Para la determinacin de los resultados a menudo se utiliza un modelo de forma de matriz,
donde las filas representan las alternativas de los proyectos y las columnas los
objetivos y los criterios correspondientes. La determinacin del orden de prioridades se
efecta normalmente durante una serie ordinal. As, las alternativas se confrontan, por ejemplo:
individualmente para cada criterio y se evalan con los criterios mejor o peor.

Proyecto A > Proyecto C
Proyecto B > Proyecto A
Proyecto B > Proyecto C

El orden de prioridades en este caso es B > A > C.

La evaluacin multicriterio permite organizar por orden de deseabilidad (de menor a
mayor impacto) un conjunto de alternativas de inversin (por lo general mutuamente
excluyentes) Sin embargo, no nos dice nada sobre la deseabilidad en s de cada alternativa,
(excepto en determinadas variantes), sino que slo informa de las deseabilidades relativas entre
alternativas. Existen muchas variantes del mtodo de evaluacin multicriterio, de las dos grandes
familias son:

La que utiliza pesos (anglosajona)
La que utiliza algoritmos sin requerir pesos (francesa),

En la confeccin de un anlisis multicriterio se pueden seguir los siguientes pasos:

1. Se deciden las alternativas a ordenar, un nmero habitual de alternativas es 2, 3, 4

2. Se deciden los criterios relevantes para la ordenacin, un nmero habitual de criterios es 3, 4, 5, 6

3. Se deciden los pesos relativos de cada criterio por decisin propia, por Delphi, por indicacin de las
autoridades o cualquier otro procedimiento. Un mtodo mixto es el de ordenacin completa,
donde se decide a priori el orden de importancia de los criterios y se obtienen los pesos segn la
frmula:

= peso relativo,
r = nmero de orden en la ordenacin, y
j = criterios, hasta n

4. Se valoran los impactos en sus propias unidades, de forma cuantitativa o cualitativa.

5. Se normalizan estos valores para que sean comparables las unidades. Hay muchas formas de
normalizar, por ejemplo:

10

El valor normalizado del impacto de la alternativa i = valor de i / suma de valores del criterio:
Da valores entre 0 y 1.
El valor normalizado del impacto de la alternativa i = valor de i / valor mximo del criterio:
Da valores entre 0 y 1 y por funciones de transformacin del tipo Battelle.

6. Se agregan los valores individuales (de cada alternativa) de cada criterio; Por ejemplo con:

aij= valor normalizado del criterio j por la alternativa i,
j= peso relativo del criterio j, y siendo
IP= el ndice de pertinencia o valor agregado.

7. Se ordenan de acuerdo con los IP de las distintas alternativas.


1.1.7. EL MTODO DE LA VALORACIN HIPOTTICA

El mtodo consiste en simular un mercado hipottico por un bien en el precio del
cual puede observarse en un mercado real. A travs de una encuesta, que acta como
mercado, se simula la oferta, representada por el entrevistador, y la demanda, que revela la
intensidad.

El entrevistador pregunta al entrevistado si estara dispuesto a pagar ms, igual o
menos de una cantidad determinada por el bien pblico, y este proceso es repetitivo a fin de
arribar a la cantidad exacta de la disposicin del pago de la persona entrevistada. Mediante
encuesta busca encontrar el comportamiento de las personas ante el cambio (impacto).

Se puede preguntar de dos formas, abierta o cerrada.
De forma abierta
Cunto pagara como mucho por...?
En cunto le deberan compensar como mnimo por...?

De forma cerrada
Pagara esta cantidad por...?
Aceptara esta cantidad en compensacin por...?

En la forma abierta, se calcula la media o la mediana de la mxima disposicin a pagar por obtener o
evitar el impacto. Tambin, se calcula la media o la mediana de la mnima
disposicin a ser compensado por permitir o renunciar al impacto. En la forma cerrada, se ofrece
el impacto por una cantidad econmica determinada (a pagar o a ser compensado). La cantidad
econmica vara de una sub-muestra a otra y se calcula la proporcin de personas que dicen s al
pago (o compensacin) y se dibuja la curva de supervivencia correspondiente, calculndose la
media (rea bajo la curva) o la mediana (valor que corresponde a una probabilidad de 0,5).

Ventajas
Muy flexible en su aplicacin
11

Permite medir exactamente el impacto deseado
Puede medir situaciones ex-ante y ex-post
Puede medir valores de uso y no uso

Limitaciones
Suele ser bastante costoso
Suele requerir mucho tiempo
A veces se basa en situaciones hipotticas que no incentivan a dar respuestas pensadas
Puede utilizarse como alternativa a la valoracin contingente
Sustituye las cantidades monetarias por una escala de puntos
Suele utilizarse para medir impactos paisajsticos, pero puede aplicarse a cualquier impacto

Pasos habituales en una encuesta

1. Definir el objeto de (valoracin de un impacto) con toda claridad
2. Decidir el tipo de entrevistas (telefnica, cara a cara, correo...)
3. Redactar estructuradamente un cuestionario
4. Probar el cuestionario en grupos reducidos y realizar una o varias pruebas piloto
5. Rectificar el cuestionario de acuerdo con el punto anterior, y volver al punto
anterior si las modificaciones han sido sustanciales
6. Decidir la poblacin, el tamao de la muestra y la forma de muestreo (aleatorio, sistemtico, por
cuotas, mixto...)
7. Realizar las entrevistas
8. Tabular los datos
9. Explotacin estadstica; valores con intervalos de confianza
10. Presentacin de resultados; valores expresados con sus unidades completas


1.1.8. EL MTODO DE LEOPOLD

Este mtodo est ms enfocado al anlisis de los impactos ambientales. En su versin original,
Leopold propona una matriz con acciones en las filas y caractersticas ambientales en las
columnas. En realidad se trataba de dos matrices, dado que cada elemento contena dos valores
normalizados (entre 1 y 10):

Magnitud
Importancia

Con los valores normalizados, y utilizando la magnitud como el valor del impacto y la importancia
como su peso, se puede proceder a la agregacin de impactos de forma similar
al anlisis multicriterio. La agregacin de impactos puede hacerse por filas (acciones),
columnas (medio) o para el total de impactos de la inversin. De esta forma se pueden ordenar
las distintas alternativas de inversin segn la severidad del impacto.


12

1.1.9. EL MTODO DELPHI

Se trata de un procedimiento de consulta a expertos que suele pretender la prediccin, cuantificacin
o calificacin de impactos (u otras caractersticas) por consenso. Suele aplicarse como prospectiva y
en otros contextos. Sus dos elementos ms caractersticos son: la consulta, la cual se
restringe a expertos y la vocacin de consenso. Toma su nombre del proyecto Delphi (Delfos)
de la empresa Rand que pretenda predecir por medio de un consenso un futuro escenario
militar despus de la segunda guerra mundial.

Tiene diversas variantes, la ms utilizada es la de encuestas sucesivas a expertos; tambin se
pueden realizar sesiones de discusin annima o no. En cada nueva ronda se suele informar a los
expertos de los resultados estadsticos de las respuestas del conjunto de expertos en la ronda
anterior, y se pide a cada experto la reconsideracin de su postura. Habitualmente, dos, tres o
cuatro rondas son suficientes para llegar a un consenso o a una situacin sin cambios. La seleccin
de expertos se suele realizar con criterios de diversidad. El nmero vara bastante entre los ejercicios
aunque suele ser de unas pocas decenas (una, dos, tres).

Ventajas:
Muy flexible en su aplicacin
Permite medir exactamente el impacto deseado
Puede medir situaciones ex-ante y ex-post
Suele ser poco costoso
Puede hacer apreciaciones cuantitativas o cualitativas
Puede cuantificar en cualquier unidad

Limitaciones:
Suele requerir bastante tiempo (excepto en la modalidad de sesiones simultneas)
Excepto si se remunera. La colaboracin de expertos puede ser relativamente limitada.
Slo recoge la visin de expertos (tiende a utilizarse como ltimo recurso)


1.1.10. EL MTODO DE IMPACTO DIFERENCIAL

El impacto diferencial mide la diferencia entre el impacto con proyecto (inversin) y el impacto sin
proyecto (que es la evolucin que se espera del status quo de no realizarse la
inversin). Ello implica:

1. Calcular la diferencia directamente (Ej. lugares de trabajo adicionales)
2. Calcular el valor de la variable sin y con proyecto (Ej. lugares de trabajo totales
con proyecto menos lugares de trabajo totales sin proyecto).


1.2. LOS SONDEOS Y LAS ENCUESTAS EN LA INVESTIGACIN CIENTFICA

a) La Encuesta.- Es uno de los mtodos que permite obtener informacin sobre fenmenos y
13

procesos, que no puede ser adquirida a partir de la observacin directa ni de los
distintos documentos existentes. Una encuesta planificada y realizada de manera
metdicamente correcta facilita el anlisis de muchos hechos y situaciones sociales, de
ah el peso tan grande que poseen en las investigaciones sociales. La informacin
proveniente de ellas es fuente de datos fundamental, por ejemplo, para el estudio de diferentes
fenmenos sociales como la poblacin econmicamente activa o los niveles y tendencias de variables
tales como la fecundidad y la migracin.

b) El Sondeo.- Es un mtodo para realizar investigaciones con fines de diagnstico o
caracterizacin de sistemas.

Se reportan como ventajas de este mtodo:
1. Su costo relativamente bajo (tanto en el sentido institucional como en la magnitud del retorno de
los recursos empleados).
2. Es rpido (una a dos semanas) y se obtienen resultados inmediatos.
3. Bien realizado, ha demostrado ser tan til como una encuesta aleatoria con cuestionario.
4. Es conducido directamente por los miembros del equipo del proyecto.
5. Permite fcilmente la integracin inmediata al equipo, de productores de las
comunidades investigadas. Por ello y no por utilizar cuestionarios, reduce sesgos (respecto a
otros mtodos) en la informacin lograda.

6. Permite, exige y de cierta manera fuerza a una relacin interdisciplinaria entre los miembros del
equipo y con la comunidad objetivo.

7. Es un proceso secuencial, iterativo y dinmico.

8. Permite iniciar el conocimiento sobre la cosmovisin del productor. (Aqu se destaca la necesidad
de que participen cientficos sociales en el trabajo).

9. En funcin de los sistemas de produccin presentes, permite indagar de inmediato
sobre el proceso histrico-social que los ha definido, entenderlos mejor y as prever resultados
a futuro, de acuerdo con las modificaciones y soluciones que se propongan.

1.3. LAS GRFICAS, HISTOGRAMAS Y POLGONOS DE FRECUENCIA EN LA
REPRESENTACIN DE LOS DATOS

La importancia y utilidad que las representaciones grficas pueden alcanzar en el proceso de anlisis
de datos. La mayora de los textos estadsticos hacen hincapi en los distintos tipos de grficos que
se pueden crear, como una herramienta imprescindible en la presentacin de resultados y el
proceso de anlisis estadstico. No obstante, es difcil precisar cundo es ms apropiado utilizar
un grfico que una tabla. Ms bien podremos considerarlos dos modos distintos pero
complementarios de visualizar los mismos datos. La creciente utilizacin de distintos programas
14

informticos hace especialmente sencillo la obtencin de las mismas. La mayora de los paquetes
estadsticos (SPSS, STATGRAPHICS, S-PLUS, EGRET,...) ofrecen grandes posibilidades en este
sentido, siendo posible elaborar otros grficos, incluso tridimensionales, permitiendo grandes
cambios en su apariencia y facilidad de exportacin a otros programas para presentar finalmente
los resultados del estudio.


EJEMPLOS GRFICOS




Figura 3. GRAFICO DE SECTORES GRAFICO DE BARRAS


Ejemplo de un histograma correspondiente a los datos de la















HISTOGRAMA POLIGONO DE FRECUENCIAS


















GRAFICO DE LINEAS DIAGRAMA DE BARRAS AGRUPADAS












15


DIAGRAMA DE DISPERSION DIAGRAMA DE LINEAS SUPERPUESTAS




















DIAGRAMA DE DISPERSION CURVA ROC
(Regresin Logstica)

















1.4.- CONCEPTOS BSICOS DE ESTADSTICA

Una MEDIDA DE CENTRALIZACIN es un valor, que es representativo de un conjunto
de datos y que tiende a situarse en el centro del conjunto de datos, ordenados segn su
magnitud.

a) Mediana.- Es el valor de la variable estadstica que divide en dos partes iguales a los
individuos de una poblacin, supuestos ordenados en orden creciente. En general, es el valor
donde la funcin de distribucin F(x) toma el valor 1/2, pero as definida puede no ser nica en
cuyo caso se toma la media aritmtica de los valores de mediana, o no existir en cuyo
caso se toma como mediana el valor de la poblacin ms cercano a esa mediana 'ideal'.

b) Moda.- Es el valor ms frecuente de la variable estadstica; valor que se corresponde
al mximo del histograma. Si la variable es discreta, puede darse el caso de que haya ms de una
mediana.

16

c) Media Aritmtica.- Es la suma de los productos de los posibles valores que tome la variable x
i
,
entre el nmero de valores que esa variable contenga.


Las MEDIDAS DE DISPERSIN son medidas que representan el grado en el que los valores
numricos tienden a extenderse alrededor de un valor medio.

1) Recorrido.- Es la diferencia entre el mayor y menor valor de una variable estadstica.


2) VARIANZA.- Una forma natural de medir la dispersin en torno a la media es calcular la media
de las diferencias:

Pero como habr valores por encima y por debajo de la media que se compensarn,
calcularemos mejor el cuadrado de las diferencias. Se define as varianza de una variable
estadstica, como la media de los cuadrados de las desviaciones de sus valores respecto a su
media. Se representa por
s
2
:


Se distingue aqu entre los casos de variable estadstica y variable aleatoria. En el
primer caso, tendremos una serie de valores concretos, de los que vamos a calcular su
varianza, la varianza muestra. En el caso de variable aleatoria, estaremos calculando una
varianza estimada, ya que no estamos tomando muestras de un conjunto de datos inmenso y
por lo tanto la media y varianza son estimadas, no conocidas. La expresin que la define cambia en
un pequeo detalle: en vez de dividir el resultado de la suma entre (n-1), se divide entre
(n), as:


La varianza es una medida de tendencia central. Esto quiere decir que te ayuda a determinar qu
tan alejados o cercanos estn tus datos del centro; es decir, del promedio o de la media.

3) Desviacin Tpica (o Estndar).- Es la raz cuadrada de la varianza.




Al igual que con la varianza, se distinguen los casos de variables aleatorias y estadsticas. En
esta frmula se expresa tambin la desviacin tpica muestra, que es la que usaremos.
17

4) Coeficiente De Variacin.- Es el cociente entre la desviacin tpica y la media. Eliminamos
con esta medida la influencia de la escala escogida en las mediciones efectuadas.


5) Poblacin.- Es el conjunto de todos los elementos que cumplen ciertas propiedades y
entre los cuales se desea estudiar un determinado fenmeno (pueden ser hogares,
nmero de tornillos producidos por una fbrica en un ao, lanzamientos de una moneda, etc.
). Llamamos poblacin estadstica o universo al conjunto de referencia sobre el cual van a recaer
las observaciones.

6) Muestra.- Es el subconjunto de la poblacin que es estudiado y a partir de la cual se sacan
conclusiones sobre las caractersticas de la poblacin. La muestra debe ser
representativa, en el sentido de que las conclusiones obtenidas deben servir para el total
de la poblacin.

7) Individuo.- Cada uno de los elementos de la muestra o de la poblacin (personas, tornillos,
hospitales, comercios) y sobre los que recaer la observacin.

8) Variable.- Cada uno de los rasgos o caracterstica de los elementos de una
poblacin y que varan de un individuo a otro (salario, color de ojos, sexo, nmero de hijos).
Las variables pueden corresponder a cuatro niveles de medicin:

Nominal: hace referencia a datos que slo pueden clasificarse en categoras; existen slo
conteos; no existe orden particular para los grupos. Ejemplo: color de ojos.
Ordinal: corresponde a aquellos datos que se pueden agrupar en categoras y ordenarlas
segn algn tipo de gradacin. Ejemplo; nivel de dolor, nivel de preferencia.
de Intervalo: incluye todas las caractersticas de la escala ordinal, pero adems la
distancia entre valores es constante pues los valores que toma este tipo de variables
corresponde al orden de los nmeros naturales. Ejemplo: nmero de hijos.
de Razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero
absoluto tal que significa ausencia del atributo y la razn o cociente de dos
nmeros es significativo pudindose aplicarles todo tipo de instrumental matemtico.
Ejemplo: ingreso familiar.

9) Marco.- Conjunto de elementos de la poblacin total disponibles para la eleccin de la
muestra. En ocasiones todos los elementos de la poblacin estn disponibles y
por lo tanto marco = poblacin. Ej. Poblacin total alumnos, marco alumnos presentes

10) Unidad Muestral.- Unidad seleccionada de la poblacin para la aplicacin de la tcnica de
investigacin. Puede ser un elemento poblacional nico o un conjunto de elementos. Ej.
Personas, filas., etc.

11) Parmetro.- Es una medida de resumen que se calcula para describir una caracterstica de
toda la poblacin. Ej. Censo, promedio de notas.
18


12) Cuartiles.- Se llaman cuartiles a tres valores que dividen la serie de datos
en cuatro partes iguales. Se representan por Q
1
; Q
2
;
Q
3

Observacin : El cuartil segundo, Q
2
corresponde a la mediana, y los dems cuartiles, Q
1
;Q
3
,
se calcularan con la misma frmula de la mediana
sustituyendo N/2 por N/4, y 3N/4, ya
que equivale al 25%, y al 75% de los datos.

13) Estadstica.- Ciencia que trata de la recoleccin, clasificacin y presentacin de
los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin
y comparacin de los fenmenos. (Yale y Kendal, 1954).



2.- LAS VARIABLES DE ANLISIS


2.1. EL OBJETO DE ESTUDIO EN LA INVESTIGACIN

De acuerdo al Dr. Guillermo Orozco Gmez, en el proceso de investigacin el primer paso es
intuitivo; uno tiene una intuicin de que por aqu hay algo que vale la pena explorar, es como una
intuicin de por dnde y cmo agarrar un determinado objeto de estudio.

Despus viene un momento en el cual se tiene que pasar de la intuicin a ponerlo en
forma de problematizacin; es decir, se constatan algunos indicios o algunos hechos y se pregunta
sobre eso, se cuestiona, se problematiza un cuerpo de conocimientos para tratar de ir
encontrando una manera de llegar a una pregunta.

A partir de all hay que volver a la parte ms racional de plantear una pregunta coherente
con esta aproximacin inicial, plantear un objetivo, y cul es la metodologa ms apropiada para
dar cuenta de ese objetivo.

Ya se trate de una hiptesis o de una premisa, yo creo que es mucho la intuicin
ilustrada del investigador lo que hace que uno pueda ir quitando cosas y
aproximndose.

Cuando no sabes, tienes que empezar de manera muy inductiva, no puedes empezar de manera
deductiva. En la investigacin cualitativa uno va haciendo sentidos, es muy importante el hacer
sentido, porque uno no tiene claro desde el principio, ni debiera tener desde el principio de la
investigacin, una especie de modelo de investigacin, porque uno encasilla lo que puede ser un
proceso mucho ms rico que va a desbordar eso.

19

El proceso de construccin del objeto ocurre ms o menos de la misma manera, con estas dos
grandes vertientes: la de teora fundada donde uno tiene una mnima informacin sobre lo que
quiere, y otra donde ya hay mucha informacin y t ya sabes, y simplemente quieres ver un
aspecto, profundizar en algo, hacer un cambio y ver si tambin, en este sentido, se
sigue manteniendo la misma comprensin del fenmeno.


2.1.1. LAS VARIABLES CUALITATIVAS

Las variables pueden ser clasificadas como cuantitativas (intervalares) o cualitativas
(categricas), dependiendo si los valores presentados tienen o no un orden de magnitud natural
(cuantitativas), o simplemente un atributo no sometido a cuantificacin (cualitativa).

Una variable es medida utilizando una escala de medicin. La eleccin de la(s)
escala(s) de medicin a utilizar depende, en primer lugar, del tipo de variable en estudio, y,
adems, del manejo estadstico a la que se someter la informacin. En trminos prcticos, existe
una correspondencia directa entre el concepto de variable y escala de medicin. Un atributo
corresponde a un valor especfico de una variable.

Normalmente la descripcin de datos comienza con la tabulacin de estos. El objetivo de las tablas
de frecuencias es ordenar y clasificar los datos observados. Estas tablas permiten,
adems de sintetizar la informacin contenida en los datos, extraer de forma rpida una descripcin
bsica de la muestra; como la moda o modalidad de mayor frecuencia o el nmero de
modalidades distintas observadas.

Hay variables cualitativas cuyas modalidades pueden ser ordenadas segn cierta escala
y que se llaman ordinales. Estas variables son de uso muy frecuente en encuestas
sociolgicas cuando se quiere investigar el grado o nivel con que cierto fenmeno se presenta en
un conjunto de individuos. Algunos ejemplos pueden ser los siguientes: nivel de estudios, nivel de
aceptacin de cierta medida del gobierno o nivel de satisfaccin con la labor docente de un
profesor.


2.1.2. LAS VARIABLES CUANTITATIVAS

2.1.2.1. VARIABLES DISCRETAS

Se trata ahora de describir variables numricas que toman valores enteros. Si con
variables cualitativas las frecuencias se han calculado para cada modalidad
aisladamente, ahora tambin podemos calcular frecuencias acumuladas. La diferencia con la
situacin anterior es que ahora las clases son numricas que podemos ordenar en la
escala de los nmeros enteros. Una frecuencia acumulada de una clase es la suma de
frecuencias de la propia clase y de las clases inferiores a ella. Es por lo que carece de sentido
calcular frecuencias acumuladas en variables cualitativas.

20

2.1.2.2. VARIABLES CONTINUAS

Una variable es continua si toma valores en cualquier intervalo de la recta real. El nmero de valores
distintos observados suele ser alto o casi coincidir con el tamao de la muestra, de forma que
para construir una tabla de frecuencias hay necesariamente que agrupar stos en clases de intervalo.


2.2. LA VARIABLE INDEPENDIENTE

Variable que puede cambiar libremente su valor, as como el primero, sin que su
valor se vea afectado por alguna otra(s) variable(s). Generalmente, una variable independiente
es la entrada de una funcin y normalmente se denota por el smbolo x, en tanto que
frecuentemente y se reserva para la variable dependiente.

Por ejemplo, en y = f(x) = x
2
, x es la variable independiente y y es la variable dependiente.
Se permite que la variable x cambie libremente, en tanto que el valor de y tiene que cambiar conforme
cambia x.

Las variables independientes son las que se manipulan deliberadamente para invocar un cambio en
las variables dependientes. En fin, si x se da, entonces y ocurre ", donde x representa las variables
independientes y y representa las variables dependientes.

Dependiendo del contexto, las variables independientes tambin se conocen como
variables del predictor, regressors, variables controladas, variables manipuladas, o variables
explicativas. Tambin se conoce como variable de la respuesta, regressand, variable medida,
variable que responde, variable explicada, o variable del resultado.


2.3. LA VARIABLE DEPENDIENTE

Es aquella cuyos valores dependen de los que tomen otra variable. Siendo el objeto,
proceso o caracterstica a estudiar y que modifica su estado con la modificacin de la variable
independiente (es decir que depende de ella y que en esa medida es un efecto).


2.4. LA ESTADSTICA DESCRIPTIVA E INFERENCIAL

La estadstica se emplea en aquellos casos en los que se tiene una gran cantidad de
observaciones y cuya aparicin se rige por las leyes del azar. Es decir, se aplica a fenmenos cuya
medicin requiere una coleccin de observaciones, pues hay algunos fenmenos que se presentan
en masa, pero para los que no se requiere observacin alguna, pues se conocen a priori.

Para que sean de utilidad los datos estadsticos tienen que tener dos caractersticas bsicas:

1) Deben ser pertinentes: deben guardar una relacin con el tema en cuestin.
21

2) Deben ser insesgados: no deben tener deformaciones provenientes de prejuicios o de
errores de los instrumentos empleados.

Se puede dividir la estadstica en dos grandes ramas: la estadstica Descriptiva y la
estadstica Inferencial.

Estadstica Descriptiva: procedimientos empleados para organizar y resumir
conjuntos de observaciones en forma cuantitativa. El resumen de los puede hacerse mediante
tablas, grficos o valores numricos. Los conjuntos de datos que contienen observaciones
de ms de una variable permiten estudiar la relacin o asociacin que existe entre ellas.

Estadstica Inferencial: mtodos empleados para inferir algo acerca de una poblacin basndose
en los datos obtenidos a partir de una muestra. Los datos estadsticos son
clculos aritmticos realizados sobre los valores obtenidos en una porcin de la poblacin,
seleccionada segn criterios rigurosos.

2.5 LA HIPTESIS SUSTANTIVA E HIPTESIS NULA

Las hiptesis cientficas son, en general, suposiciones, esto es, enunciados tericos
supuestos, no verificados pero probables, referentes a variables o a relacin entre variables. Desde
el punto de vista del problema a investigar, las hiptesis se pueden definir como soluciones
probables, previamente seleccionadas, al problema planteado, que el cientfico propone para ver, a
travs del proceso de investigacin, si son confirmadas por los hechos.

Los elementos estructurales de las hiptesis son las unidades de observacin, las variables
y las relaciones que unen a ambas y las variables entre s. [Las unidades de observacin
son las personas, grupos, objetos, actividades, instituciones y acontecimientos sobre los
que versa la investigacin social] En ltimo trmino la relacin entre los distintos elementos
estructurales y, a su vez, el conjunto de hiptesis, pueden ser expresadas mediante
diagramas lgicos.

Cualquier hiptesis formulada ha de cumplir, si se quiere evitar el fracaso, una serie de condiciones:

Deben ser conceptualmente claras y fcilmente comprensibles (conceptos definidos
previamente, de forma que se excluya toda ambigedad).
Los trminos usados deben poseer una realidad emprica (nunca han de
utilizarse trminos morales y trascendentes).
Deben ser especficas o susceptibles de especificacin a travs de sub-hiptesis (cuando
es muy amplia o general).
Deben hallarse en conexin con las teoras precedentes, en forma de confirmacin,
precisin, revisin, etc.
Deben poseer un cierto alcance general (no referirse a uno o unos pocos hechos, sino
presentar un valor de generalidad en el campo o sector al que se refieren)
Deben ofrecer una respuesta probable al problema objeto de la investigacin.

22

Se pueden clasificar como sigue:

1. Segn su naturaleza, las hiptesis se pueden distinguir, en:
Las hiptesis de sentido comn
Las hiptesis cientficas
Las hiptesis metafsicas

2. De acuerdo con su estructura, las hiptesis se pueden referir a una sola variable, a dos o ms. A
su vez, en el caso de referirse a ms de dos, pueden establecer una relacin de asociacin
simple entre las variables en cuestin o una relacin de dependencia. Por tanto,
es posible distinguir los siguientes tipos de hiptesis:
hiptesis de una sola variable,
hiptesis con dos o ms variables,
hiptesis con dos o ms variables y relacin de dependencia

3. Teniendo en cuenta su forma lgico-lingstica, las hiptesis pueden ser simples o
compuestas, segn estn formadas por un solo enunciado o por dos o ms.

Las simples se pueden dividir, a su vez, en
atributivas que implican la asignacin a un sujeto de una caracterstica, atributo o
variable y
relacionales que relaciona entre s diversos sujetos o variables.
Las compuestas, que implican el establecimiento de una relacin entre los
enunciados simples que comprenden, se dividen en
copulativas
disyuntivas
alternativas
condicionales

4. Conforme a su generalidad, se pueden clasificar en:
singulares si se refieren a un solo individuo;
particulares que ataen a slo una parte de una poblacin o conjunto;
universales limitadas, que aluden a toda una poblacin, pero dentro de un espacio o
tiempo definidos, y
universales estrictas que no tienen lmite alguno, ni en la poblacin, ni en el tiempo ni en
el espacio.

5. Por su funcin, se distinguen los siguientes tipos de hiptesis:
Hiptesis sustantivas que relacionan variables conceptuales o generales. Las hiptesis
sustantivas son las iniciales, las que motivan la investigacin.
Hiptesis que relacionan los indicadores derivados lgicamente de las hiptesis sustantivas.
Son las que se contrastan empricamente. Son hiptesis de segundo grado o sub-hiptesis
en relacin a las hiptesis sustantivas. Concretan stas en relacin a variables ms cercanas
a la realidad que las variables generales o conceptuales.
Hiptesis auxiliar de validez que supone hay una relacin entre los indicadores y las
23

variables conceptuales o generales. Las hiptesis auxiliares son necesarias, por ejemplo, en la
operacin de variables. Son las que conectan entre s conceptos de distinto nivel de
abstraccin.
Hiptesis auxiliar de generalizacin de la muestra a la poblacin. El cuarto tipo se refiere a
las investigaciones hechas con muestras. En ellas se observa la muestra en lugar y
representacin de las poblaciones enteras.

Una hiptesis generalmente se especifica por la estructura SI - ENTONCES (cuando intervienen dos
variables). Cuando las variables son ms de dos, las estructuras ms frecuentes son: Si P,
entonces Q, bajo las condiciones R y S. Si P1, P2 y P3, entonces Q.


3.- EL MUESTREO: PORCIONES REPRESENTATIVAS EN LA INVESTIGACIN

3.1. ANLISIS DE LA POBLACIN:

Cada dato numrico es un elemento de la poblacin o universo. Una Muestra es un
subconjunto pequeo de observaciones extradas de un universo o poblacin.


La Estadstica trabaja con poblaciones de
datos y con muestras extradas de las
mismas. Los conceptos de poblacin y
muestra a veces resultan ambiguos en su
aplicacin prctica.


Por ejemplo, supongamos que en una ciudad de 5000 habitantes se realiza un censo mdico en
el cual se mide el peso, la altura y se relevan otros datos de todos los habitantes
de la ciudad. Alguien podra referirse al universo o poblacin censada teniendo en
mente el conjunto de los habitantes de la ciudad. Pero cuando hablamos en trminos
estadsticos, nos referimos a poblaciones o universos de datos.


3.2. DEFINICIN DEL TAMAO DE LA MUESTRA

Como todo el mundo sabe, en un estudio comparativo podemos cometer dos tipos de
errores, un error tipo I o a, que ocurre cuando se afirma que existe diferencia y en realidad sta es
cero, y un error tipo II o B, que consiste en declarar que no hemos encontrado diferencias
estadsticamente significativas cuando s que son diferentes los dos grupos. Obviamente la realidad
no la conocemos, y precisamente vamos a efectuar un trabajo para intentar saber ms sobre sta.

Por tradicin se suele fijar en 0.05 y la potencia de la prueba 1- a entre 0.8 y 0.9, y salvo
que tengamos alguna razn poderosa para cambiarlo ms nos vale no luchar con una
tradicin tan slidamente asentada en el mbito editorial cientfico.
24


En el caso de que estemos comparando dos proporciones, la varianza se puede
expresar en funcin de esas proporciones, con lo que podemos formular el tamao de muestra
necesario de la siguiente manera




El problema radica en que para determinar el tamao de muestra necesitamos conocer P1 y P2,
las proporciones en los dos grupos, que es precisamente lo que deseamos saber y para lo que
pensamos efectuar un trabajo de investigacin. La forma habitual de proceder consiste en
suponer un orden de magnitud de la tasa de respuesta en el grupo de control P1, basada en
la experiencia previa, en la literatura, en un estudio piloto o simplemente en la intuicin, y postular
qu diferencia D en esa respuesta se puede empezar a considerar ya de inters, de tal
manera que P2=P1+D. A partir de esos datos se calcula ya el tamao de muestra
necesario.

3.3. TIPOS DE MUESTREOS (VENTAJAS Y DESVENTAJAS)

3.3.1. MUESTREOS PROBABILSTICOS

Los mtodos de muestreo probabilsticos son aquellos que se basan en el
principio de equiprobabilidad. Slo estos mtodos de muestreo probabilsticos aseguran la
representatividad de la muestra extrada y son, por tanto, los ms recomendables. En los
muestreos aleatorios todos los elementos tienen la misma probabilidad de ser elegidos.

Muestreo Aleatorio Simple.- Es el mtodo conceptualmente ms simple. Consiste en extraer todos
los individuos al azar de una lista (marco de la encuesta). En la prctica, a menos que se
trate de poblaciones pequeas o de estructura muy simple, es difcil de llevar a cabo de forma
eficaz. El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de
la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de
nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc) se eligen
tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este
procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy grande.

Ejemplo: Se pretende determinar la prevalencia de Miedo en una explotacin de 250 ovejas: para
ello se deben examinar 61 animales (se supone una prevalencia del 30% y se desea una precisin
del 10% para un nivel de confianza del 95%): se obtienen 61 nmeros.

Muestreo Estratificado.- Diferentes razones orientan a tomar la decisin de dividir la poblacin total
en estratos o clases, y elegir en cada uno una muestra aleatoria. Los elementos en cada estrato
deben ser ms semejantes entre s que respecto a la poblacin. Ello conduce a un tamao ms
pequeo de la muestra total, o ante igual tamao, a una mayor precisin que si se selecciona a
partir del total de la poblacin. El resultado se conoce como un muestreo aleatorio estratificado.
25


El total de sub-muestras, constituye el total de la muestra de la poblacin. Y para cada una de ellas,
son aplicables los procedimientos expuestos para un muestreo aleatorio simple. En una muestra
aleatoria simple, la fraccin de muestreo es f=n/N, En un estrato hi ser f
hi
=n
hi
/N
hi.


El criterio de la asignacin proporcional al tamao es el de f
h1
=f
h2
=f
h3
=... De esta
manera, se reconoce un mayor peso a los estratos de mayor tamao. Se le conoce tambin como
el criterio de una asignacin uniforme de muestreo.

La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser
de diferentes tipos:

Afijacin Simple: A cada estrato le corresponde igual nmero de elementos muestrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso
(tamao) de la poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo
que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no
se suele conocer la desviacin.

Muestreo Sistemtico.- Cuando los elementos de la poblacin estn ordenados en fichas
o en una lista, una manera de muestrear consiste en

Sea
Elegir aleatoriamente un nmero m, entre 1 y k;
Tomar como muestra los elementos de la lista:



El mtodo tal como se ha definido anteriormente es sesgado si no es entero, ya que los ltimos
elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema
consiste en considerar la lista como si fuese circular (el elemento N+1 coincide con el
primero) y:

Sea k el entero ms cercano a ;
Se selecciona un nmero al azar m, entre 1 y N;
Se toma como muestra los elementos de la lista que consisten en ir saltando de k elementos
en k, a partir de m, teniendo en cuenta que la lista es circular.

Se puede comprobar que con este mtodo todos los elementos de la lista tienen
la misma probabilidad de seleccin.

Muestreo por Conglomerados.- En este muestreo, las unidades muestrales no son simples, sino
que son colectivos. Por ejemplo, las escuelas, los hospitales, etctera. Cada uno de
estos colectivos reciben el nombre de conglomeraciones.

26

Una vez elegidos los conglomerados:

Si son pequeos, el estudio de realiza con todas las unidades que lo componen.
Si son grandes, es imposible realizar el estudio con todos los elementos. Hay que recurrir a la
eleccin de una muestra de ese conglomerado.

Se pretende que los conglomerados sean homogneos entre s; sin embargo, que las unidades que
las componen sean heterogneas. Por ejemplo, la Facultad de Ciencias Polticas y la Facultad
de Derecho, como conglomerados son homogneos, en cambio, dentro de ellos, dentro del
conglomerado hay heterogeneidad porque hay alumnos, profesores, secretarios, etctera. La
diversidad se encuentra dentro del conglomerado.


3.3.2. MUESTREOS NO PROBABILSTICOS

A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente costoso y se
acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven
para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea
representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad
de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados
criterios procurando que la muestra sea representativa.

Muestreo por Cuotas.- Tambin denominado en ocasiones accidental. Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los
individuos ms representativos o adecuados para los fines de la investigacin. Mantiene,
por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de
aleatoriedad de aqul. Este mtodo se utiliza mucho en las encuestas de opinin.

Muestreo por Conveniencia.- Este tipo de muestreo se caracteriza por un
esfuerzo deliberado de obtener muestras representativas mediante la inclusin en la muestra
de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

Muestreo por Criterio.- ste procedimiento se basa en el criterio o juicio del
investigador para seleccionar unidades muestrales representativas

Muestreo por Bola de Nieve.-Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales, delincuentes, sectas,
determinados tipos de enfermos, etc. Se aplica en la ltima fase del muestreo, y consiste en
facilitar al entrevistador el perfil de las personas que tiene que entrevistar dejando su criterio,
la eleccin de las mismas, siempre y cuando cumplan con el perfil. Consiste a la vez, en
pedir a los informantes que recomienden a posibles participantes.

Tambin se denomina muestreo en cadena. Es ms prctico y eficiente que el anterior en cuanto
27

al costo, adems, gracias a la presentacin que hace el sujeto ya incluido en el
proyecto, resulta ms fcil establecer una relacin de confianza con los nuevos participantes,
tambin permite acceder a personas difciles de identificar.

3.4. EL ERROR ESTNDAR

Un mismo estimador ofrece distintos valores para distintas muestras del mismo tamao extradas de
la misma poblacin. Por lo tanto deberamos tener una medida de la variabilidad del
estimador respecto del parmetro que se trata de estimar. Esta variabilidad se mide
en trminos de la desviacin estndar del estimador, la cual recibe el nombre de error estndar.

El error estndar de un estimador T de un parmetro es la desviacin estndar del estimador.
As por ejemplo, si tomamos como estimador, entonces el error estndar est dado por:

Error de estimacin es el valor absoluto de la diferencia entre una estimacin particular y el valor
del parmetro.

En realidad por cada valor estimado del parmetro se tiene un error de estimacin por lo
general diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarn la
mayora de los valores de error de estimacin para un estimador y parmetro dados.
Los estimadores se usan cuando los parmetros que se incluyen en las frmulas
de los errores de estimacin son desconocidos.

3.5 DIFERENCIAS ABSOLUTAS Y RELATIVAS

Se llama frecuencia relativa de un valor x
j
, y la representamos por h
j
, al cociente entre la
frecuencia absoluta de x y el nmero total de datos que intervienen en la
distribucin:

siendo N el nmero total de datos

Se llama frecuencia relativa acumuladas de un valor x
j
, y la representamos
por H
j
, al cociente entre la frecuencia absoluta acumulada de x
j
y el nmero total de
datos que intervienen en la distribucin :





4.-LA TEORA DE CONJUNTOS

4.1. DEFINICIN, CARACTERSTICAS Y CLASIFICACIN

El trmino conjunto juega un papel fundamental en el desarrollo de las matemticas modernas;
Adems de proporcionar las bases para comprender con mayor claridad algunos aspectos de la teora
de la probabilidad. Su origen se debe al matemtico alemn George Cantor (1845 1918).
28


Se puede definir de manera intuitiva a un conjunto, como una coleccin o listado de
objetos con caractersticas bien definidas que lo hace pertenecer a un grupo determinado.
Para que exista un conjunto debe basarse en lo siguiente:

a) La coleccin de elementos debe estar bien definida.
b) Ningn elemento del conjunto se debe contar ms de una vez, generalmente, estos elementos
deben ser diferentes, si uno de ellos se repite se contar slo una vez.
c) El orden en que se enumeran los elementos que carecen de importancia.

A los conjuntos se les representa con letras maysculas A, B, C, ... y a los elementos
con letras minsculas a, b, c, ..., por ejemplo, el conjunto A cuyos elementos son los
nmeros en el lanzamiento de un dado.
A = {1, 2, 3, 4, 5, 6}

En base a la cantidad de elementos que tenga un conjunto, estos se pueden clasificar en conjuntos
finitos e infinitos.

Finitos.- Tienen un nmero conocido de elementos, es decir, se encuentran determinados por
su longitud o cantidad. Ejemplo: El conjunto de das de la semana.
Infinitos.- Son aquellos en los cuales no podemos determinar su longitud. Ejemplo: El conjunto
de los nmeros reales.

Existen dos formas comunes de expresar un conjunto y la seleccin de una forma
particular de expresin depende de la conveniencia y de ciertas circunstancias siendo:

Extensin.- Cuando se describe a cada uno de los elementos. A = {a, e, i, o, u}
Comprensin.- Cuando se enuncian las propiedades que deben tener sus elementos.

A = {x | x es una vocal}

Para describir si un elemento pertenece o no a un conjunto, se utiliza el smbolo de pertenencia o es
elemento de, con el smbolo , en caso contrario .
A = {1, 2, 3}

2 A; 5 A

4.2. TIPOS DE CONJUNTOS

Conjunto Vaci o Nulo.- Es aquel que no tiene elementos y se simboliza por o { }.

A = {x + 1 = 0 | x R}

El conjunto A, es un conjunto vaco porque no hay ningn nmero real que satisfaga a x+1 = 0

29

Conjunto Universal.- Es el conjunto de todos los elementos considerados en una poblacin o
universo, en un problema en especial. No es nico, depende de la situacin, denotado por U o .


4.3. PROPIEDADES DE LOS CONJUNTOS

a) Igualdad De Conjuntos.- Considerando el conjunto A y el conjunto B, si ambos tienen los
mismos elementos, es decir, si cada elemento que pertenece a A tambin pertenece a B y si
cada elemento que pertenece a B pertenece tambin a A.

b) Subconjunto.- S A = B, entonces B=A

Si todo elemento de un conjunto A es tambin elemento de un conjunto B, entonces se dice que A
es un subconjunto de B. Representado por el smbolo A B o B A

c) Subconjuntos Propios.- Se dice que es un subconjunto propio de A s todos los elementos
de un conjunto B se encuentran incluidos en l A, denotado por .
A B o B A

d) Conjunto Potencia.- La familia de todos los subconjuntos de un conjunto se llama conjunto
potencia. Si un conjunto es finito con n elementos, entonces el conjunto potencia tendr 2
subconjuntos.
A = {1, 2}
El total de subconjuntos es:

e) Conjuntos Disjuntos.- 2 = 4 {1,2}, {1}, {2}, { }
Son aquellos que no tienen elementos en comn, es decir, cuando no existen
elementos que pertenezcan a ambos.

f) Particin.- F = {1, 2, 3, 4, 5, 6} G = {a, b, c, d, e, f}
Cuando un conjunto es dividido en subconjuntos mutuamente excluyentes y
exhaustivos, se le denomina particin.

g) Operaciones de Conjuntos.-
Unin.
Interseccin.
Diferencia.
Complemento.
Producto cartesiano.

h) Unin de Conjuntos.- Sean A y B dos subconjuntos cualesquiera del conjunto
universal. La unin de A y B, expresada por A U B, es el conjunto de todos los elementos
que pertenecen a A o pertenecen a B.

i) Interseccin de Conjuntos.- A U B = {x | x A o x B}
30

Sean A y B dos conjuntos cualesquiera del conjunto universal. La interseccin de A y B,
expresada por AB, es el conjunto de todos los elementos que pertenecen a A y a B
simultneamente, es decir:
A B = {x | x A y x B}

i) Diferencia de Conjuntos o Complemento Relativo.- Sean A y B dos conjuntos
cualesquiera del conjunto universal. La diferencia o complemento relativo de B con respecto a A,
es el conjunto de los elementos que pertenecen a A, pero no pertenecen a B.
Nota: A - B B - A
A - B = {x | x A, x B}

j) Complemento Absoluto o Simplemente Complemento.- Sea A un subconjunto
cualesquiera del conjunto universal. El complemento de A es el conjunto de elementos que
perteneciendo al universo y no pertenecen al conjunto A, denotado por A o A .
A = {x | x U, x A}
Nota: A = U - A

k) Producto Cartesiano.- Sean A y B dos conjuntos, el conjunto producto o producto
cartesiano expresado por A x B est formado por las parejas ordenadas (a, b) donde a A y b
B.
A x B = {(a, b) | a A y b B}


4.4. LEYES DE LOS CONJUNTOS



4.5. EL DIAGRAMA DE VENN

Un diagrama de Venn es una representacin pictrica de conjuntos en el plano. El
31

conjunto universal U se representa por un rectngulo, cualquier otro conjunto se representa con
un crculo. Una operacin se representa mediante el sombreado de los elementos del conjunto.







Experimento Estadstico.- Es el proceso mediante el cual se genera un conjunto de datos y
puede ser determinstico o aleatorio.

Espacio Muestral.- Son todos los posibles resultados que se obtienen de un
experimento denotado por S o .
S = {1, 2, 3, 4, 5, 6}

Evento Simple.- Son los eventos constituidos por un slo elemento.
A = {4}

Evento Compuesto.- Es cualquier evento que se puede descomponer en dos o ms
eventos simples.
B = {2, 4, 6}

Eventos Mutuamente Excluyentes.- Llamados tambin disjuntos, no pueden ocurrir
simultneamente, es decir, la ocurrencia de ellos excluye la ocurrencia de los otros.
A B =

Eventos Independientes.- Cuando la ocurrencia o no ocurrencia de un evento no afecte la
ocurrencia de otro evento.

Eventos Dependientes.- Si los eventos A y B estn relacionados de tal modo
que la ocurrencia de B depende de la ocurrencia de A, entonces A y B son independientes.



5- ESTADSTICA: PROPSITO, APROXIMACIN, MTODO.


5.1. LA APROXIMACIN BSICA

Las medidas de razn, en donde un valor cero y distancias entre diferentes mediciones son
definidas, dan la mayor flexibilidad en mtodos estadsticos que pueden ser usados para
analizar los datos. Las medidas de intervalo tienen distancias interpretables entre
mediciones, pero un valor cero sin significado (como las mediciones de coeficiente
intelectual o temperatura en grados Celsius). Las medidas ordinales tienen imprecisas diferencias
32

entre valores consecutivos, pero un orden interpretable para sus valores. Las medidas nominales
no tienen ningn rango interpretable entre sus valores.

5.2 TIPOS DE MEDICIONES O ESCALAS DE MEDICIN EN ESTADSTICA

La escala de medida nominal, puede considerarse la escala de nivel ms bajo. Se trata de
agrupar objetos en clases.

La escala ordinal, por su parte, recurre a la propiedad de orden de los nmeros.

La escala de intervalos iguales est caracterizada por una unidad de medida comn y constante.
Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems
de poseer las caractersticas de la escala ordinal, permite determinar la magnitud de los intervalos
(distancia) entre todos los elementos de la escala.

La escala de coeficientes o Razones es el nivel de medida ms elevado y se diferencia de las
escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que
el valor cero de esta escala significan ausencia de la magnitud que estamos midiendo. Si se
observa una carencia total de propiedad, se dispone de una unidad de medida para el
efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias
en el grado de atributo presente en el objeto de estudio.


5.3. CURVA NORMAL DE PROBABILIDAD Y DESVIACIN ESTNDAR

Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene forma
de campana. En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo
valor de p y valores de n cada vez mayores, se ve que sus polgonos de frecuencias se
aproximan a una curva en "forma de campana".

Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la funcin de
densidad que corresponde a tales distribuciones viene dado por la frmula













33












La distribucin normal queda definida por dos parmetros, su media y su desviacin tpica
y la representamos as







La Funcin de Distribucin.-
Puede tomar cualquier valor
Son ms probables los valores cercanos a uno central que llamamos media
Conforme nos separamos de ese valor , la probabilidad va decreciendo de igual
forma a derecha e izquierda (es simtrica).
Conforme nos separamos de ese valor la probabilidad va decreciendo de forma
ms o menos rpida dependiendo de un parmetro , que es la desviacin tpica.









En sntesis, la distribucin normal es una distribucin de una variable aleatoria continua,
cuyas caractersticas son:

1. La curva tiene un solo pico, por consiguiente es unimodal. Presenta una forma de campana.
2. La media de una poblacin distribuida normalmente se encuentra en el centro de su curva
normal.
34

3. A causa de la simetra de la distribucin normal de probabilidad, la mediana y la
moda de la distribucin tambin se hallan en el centro, por tanto en una curva normal, la
media, la mediana y la moda poseen el mismo valor.
4. Las dos colas (extremos) de una distribucin normal de probabilidad se extienden
de manera indefinida y nunca tocan el eje horizontal.
5. La forma de la campana de Gauss depende de los parmetros y .
6. Tiene una nica moda que coincide con su media y su mediana.
7. La curva normal es asinttica al eje de X.
8. Es simtrica con respecto a su media . Segn esto, para este tipo de
variables existe una probabilidad de un 50% de observar un dato mayor que la media,
y un 50% de observar un dato menor.



reas bajo la curva normal.










El rea total bajo la curva normal ser de 1.00 por lo cual podemos considerar que las reas bajo la
curva son probabilidades.

Z= Nmero de desviaciones estndar de x respecto a la media de esta distribucin.
Z= x-m / s
X=valor de la variable aleatoria que nos interesa.
m= media de la distribucin de esta variable aleatoria.
s = desviacin estndar de esta distribucin.

Las variables aleatorias distribuidas en forma normal asumen muchas unidades diferentes de
medicin, por lo que hablaremos de forma estndar y les daremos el smbolo de Z.


5.4. INTERPRETACIN DE DATOS, USANDO LA TABLA NORMAL DE PROBABILIDAD;
35

DATOS DE FRECUENCIA
Una de las herramientas de mayor uso en las empresas es la utilizacin de la curva
normal para describir situaciones donde se pueden recopilar datos. Estos permiten tomar
decisiones que vayan a la par con las metas y objetivos de la organizacin.

Se puede decir que hay una familia de distribuciones con una forma comn, diferenciadas por los
valores de su media y su varianza. Por tanto, la desviacin estndar ( ) determina el
grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos
en torno a la media y la curva ser ms plana. Y finalmente la media indica la posicin de la
campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje
horizontal.

Vemos que tienen en comn que se distribuyennormalmente, por ejemplo, si hacemos una
estadstica para conocer la altura de 1400 mujeres y representamos los resultados en
un diagrama de barras, obtenemos:
.
Figura 3.1: Distribucin de estaturas de 1400 mujeres








Una distribucin de probabilidad sigue una distribucin normal de media x y desviacin tpica ,
y lo representaremos por N(x; ) cuando la representacin grfica de su funcin de densidad es una
curva positiva continua, simtrica respecto a la media, de mximo en la media, y que tiene 2
puntos de inflexin, situados a ambos lados de la media (x y x + respectivamente) y a
distancia de ella, es decir de la forma:








En el caso de la distribucin normal de parmetros x y , dicha funcin viene dada por:






Propiedad:
36

El rea encerrada bajo la curva normal N(x; ) siempre es 1.
La demostracin de este resultado no es nada sencilla e implica el uso de resultados
matemticos que exceden el nivel de este curso. De entre todas las curvas normales N(x; ), la ms
sencilla, usada y conocida es aquella que tiene por media 0 y por desviacin tpica 1, N (0, 1).

Esta normal estndar se suele representar por Z. La grfica de esta curva se denomina campana
de Gauss y se puede observar en la figura:









Su funcin de densidad ser:



Puesto que el rea bajo esta curva normal es 1, podemos definir una probabilidad de la
siguiente manera:

Para un valor cualquiera k, definimos la probabilidad de que la distribucin Z, N (0;1) , sea menor o
igual que k como: p (Z k)= rea encerrada bajo la curva normal N (0,1) desde hasta k (Es decir
la parte rayada de la figura siguiente).







Ahora bien, cmo calcular dicha rea? Fcil: Dichas reas o probabilidades se
encuentran tabuladas. Si no tenemos una distribucin N (0; 1), sino una N(x; )
cualquiera, cmo calcular probabilidades, si no tenemos tabla salvo para N (0;1)?. El siguiente
resultado nos da la respuesta.

Propiedad:
Si X sigue una distribucin N(x; ), entonces la variable Z = X x sigue una distribucin N (0,1).
(El paso de la variable X N(x; ) a la Z N (0; 1) se denomina tipificacin de la variable X).


5.5. INTERPRETACIN DE DATOS USANDO LA CURVA NORMAL DE PROBABILIDAD;
DATOS CONTINUOS
37


Cuando registramos los valores de una variable observados en cierto nmero de casos,
obtenemos diferentes valores de la variable repetidos. Y estos valores observados pueden
ser agrupados de diversas maneras segn sean estas variables discretas o continuas.

Tabla 1

Ejemplo de distribuciones de frecuencia de variables discretas y continuas:











Los datos presentados en la tabla anterior, son datos reales que se refieren a una
observacin en particular. Los podemos representar en grficos de frecuencia absoluta, frecuencia
relativa, frecuencia acumulada "a ms de" o "a menos de", etc.

Probabilidad emprica.- En el caso de variables continuas se representa la frecuencia en
funcin de reas situadas debajo de una curva de manera que la probabilidad se
puede expresar en trminos de proporcin de cierta rea por debajo de la curva respecto
al rea total bajo la curva.

En el caso de las variables continuas, el rea debajo de la curva representa la totalidad de casos y
la probabilidad est definida por la razn que resulta de dividir el rea bajo una parte de la curva
entre el rea total de la curva. Los valores z y la curva normal son muy tiles
para calcular las probabilidades referentes a variables normalmente distribuidas.

5.6. VARIANZA Y COVARIANZA

Una vez que hemos calculado el valor medio, puede ser a veces interesante describir a qu distancia
en torno a la media estn diseminados los valores singulares. Para este fin, podemos elegir
entre diversas estadsticas. La eleccin depende del tipo de media que hayamos usado:

En conexin con la moda la dispersin de valores raramente es interesante.

En lugar de ello, si hemos calculado una mediana, muchas veces querremos
sealar
l
a diseminacin de valores en torno a ella. Una forma adecuada para esto es la desviacin de
cuartiles. Un "cuartil ms alto" es aquel valor que es sobrepasado por el 25% del conjunto de
todas las mediciones; del mismo, modo el 25% de todos los valores son ms bajos que el "cuartil
bajo". La desviacin media de los cuartiles [marcadas con Q verde en la diagrama] a partir de
Variable
discreta
Variable continua
Hermanos Frecuencia Salario Frecuencia

1 3 400 - 699 34
2 4 700 - 999 45
3 6 1 000 - 1 299 33
4 5 1 300 - 1 599 26
5 3 1 600 - 1 899 19
38

la mediana es llamada desviacin de cuartiles y es calculada con facilidad
dividiendo por la mitad la diferencia de los cuartiles.

Una estadstica alternativa y muy simple es el rango: la diferencia entre el mayor y el menor
valor.
En conexin con la media aritmtica muchas veces querremos calcular la
desviacin estndar. Si los valores se miden a partir de una poblacin, la formula ser,



Sin embargo, si la desviacin estndar slo se refiere a una muestra, la frmula es,

En ambas frmulas, n es el nmero de los valores, y los valores de cada variable sustituirn a x uno
tras otro. Raramente un investigador se molestar en realizar por s mismo el clculo,
porque el algoritmo necesario para esto existe incluso en calculadoras de bolsillo.
A la raz cuadrada de la desviacin estndar se llama varianza, y tambin sta es
usada con frecuencia para describir y analizar la dispersin.

La covarianza estadstica entre dos variables:

Cociente de contingencia puede aplicarse a todo tipo de variables incluyendo aquellas que
se han medido solo con una escala de clasificacin. Una estadstica alternativa
es Chi cuadrado.
Correlacin ordinal es adecuada cuando al menos una de las variables se han medido con
una escala ordinal. La otra puede ser u ordinal o aritmtica.
Para variables sobre escalas aritmticas, el mtodo usual es la correlacin estndar,
mejor dicho la correlacin del momento-producto o correlacin de Pearson.

La correlacin del momento-producto suele abreviarse con la letra r. Si el coeficiente de correlacin es
bajo, por ejemplo algo entre -0.3 y +0.3, las dos variables no tienen mucho que ver entre s (ms
exactamente, no tienen casi ninguna covariacin lineal). Si es alto, en otras palabras, si su valor se
aproxima ya sea a +1 o a -1, esto significa que la relacin entre las dos variables se aproxima a la
ecuacin y = ax + b. El signo del coeficiente de correlacin no es importante; el signo siempre es
idntico al signo del coeficiente a en la ecuacin de arriba.








Un aspecto dbil del anlisis de correlacin es que no puede detectar otras relaciones lineales entre
las variables. Por ejemplo, una relacin que obedece a la ecuacin y = ax
2
+ bx + c
pasara inadvertida.
39

5.7. ANLISIS DE VARIANZA

5.7.1. FUNDAMENTOS

El anlisis de varianza (en ingls ANOVA, ANalysis Of VAriance) examina dos o ms conjuntos de
mediciones, especialmente sus varianzas, e intenta detectar diferencias estadsticamente
representativas entre los conjuntos. Estos conjuntos podran ser, por ejemplo, reacciones
medidas para dos grupos experimentales, y el investigador quiere examinar si hay una
diferencia en las reacciones, tal vez causada por los distintos estmulos a los grupos.

5.7.2 ANLISIS DE VARIANZA: UN EJEMPLO SENCILLO

La varianza (que es el cuadrado de la desviacin estndar:
2
) se define as: Es la media
de las diferencias con la media elevadas al cuadrado. En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los nmeros)
2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia elevada al
cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (Por qu al cuadrado?)

Elevar cada diferencia al cuadrado hace que todos los nmeros sean positivos (para evitar que los
nmeros negativos reduzcan la varianza) Y tambin hacen que las diferencias grandes se
destaquen. Por ejemplo 100
2
=10,000 es mucho ms grande que 50
2
=2,500. Pero elevarlas al
cuadrado hace que la respuesta sea muy grande, as que lo deshacemos (con la raz cuadrada) y
as la desviacin estndar es mucho ms til.


5.7.3. MTODO DE ANLISIS DE VARIANZA

El mtodo de anlisis de varianza se basa en el hecho matemticamente probado de que
hay una diferencia entre los grupos slo si la varianza inter-grupos es mayor que la varianza
intra-grupo. El anlisis se inicia calculando la varianza intra-grupo para cada grupo, y la media de
todas estas varianzas de grupo.

El siguiente paso es calcular la media para cada grupo, y entonces la varianza de estas medias.
Esa es la varianza inter-grupos. Entonces calculamos la proporcin de las dos cifras que
acabamos de obtener es llamada F. En otras palabras, = (varianza de las medias de
grupo) / (media de las varianzas de grupo).

Finalmente nos referimos a la tabla (en manuales estadsticos) que muestra qu
valores puede alcanzar el coeficiente F cuando slo acta el azar. Si el F obtenido del ANOVA es
mayor que el valor de la tabla, hay una diferencia entre los grupos que es significativa segn muestra
la tabla.


40

5.8 ANLISIS DE FRECUENCIAS

Queremos hacer un estudio estadstico del nmero de Tcnicos Superiores en
Electricidad (TSE) que existen en las empresas elctricas de una determinada ciudad. Para
ello se ha encuestado a 50 empresas y se han obtenido los siguientes datos:





Se pide:
a) Cul es la poblacin objeto de estudio?
b) Qu variable estamos estudiando?
c) Qu tipo de variable es?
d) Construir la tabla de frecuencias?
e) Cul es el nmero de empresas que tiene como mximo 2 TSE?
f) Cuntas empresas tienen ms de 1 TSE, pero como mximo 3?
g) Qu porcentaje de empresas tiene ms de 3 TSE?

SOLUCIN:

a) La poblacin objeto de estudio es las empresas de electricidad de una ciudad.
b) La variable que estamos estudiando es el nmero de TSE por empresa.
c) El tipo de variable es discreta ya que el nmero de TSE solo puede tomar
determinados valores enteros.
d) Para construir la tabla de frecuencias tenemos que ver cuantas empresas tienen
un determinado nmero de TSE. Podemos ver que el nmero de TSE, toma los valores existentes
entre 0 TSE, los que menos y 6 TSE, los que ms y tendremos:

xi ni Ni fi Fi
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.30 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.024 1
N = 50 1

e) El nmero de empresas que tienen dos o menos TSE es: 2+4+21 = 27
f) El nmero de empresas que tienen ms de un TSE pero tres como mximo es: 21 + 15 = 36

Por ltimo el porcentaje de empresas que tiene ms de tres TSE, son aquellos que tienen 4; 5
y 6 es decir 6+1+1= 8

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
41

El porcentaje ser el tanto por uno multiplicado por cien es decir, la frecuencia
relativa de dichos valores multiplicado por 100: (0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 %

5.8.1. TERMINOLOGA DE DATOS Y VARIABLES

Este conjunto o coleccin es lo que anteriormente hemos llamado grupo o colectivo,
pero la denominacin que se utiliza tcnicamente es la de poblacin. El tamao de una
poblacin viene dado por el nmero de elementos que componen dicha poblacin.
Puede ser finito o infinito.

Los elementos de la poblacin presentan ciertas propiedades o cualidades, que se conocen
con el nombre de caracteres. Por tanto, se llama carcter estadstico a una
propiedad que permite clasificar a los individuos de la poblacin. Los caracteres de los
elementos que componen una poblacin los dividiremos en: cuantitativos y cualitativos.

a) Caracteres cuantitativos o variables: Son aquellos que se describen numricamente,
y son medibles, tales como peso, edad, renta per cpita, etc.
b) Caracteres cualitativos o atributos: Son los que se describen mediante palabras, como la
profesin, el estado civil o la nacionalidad.

La Variable discreta supone que entre dos puntos de la escala de medida existe un nmero finito de
valores potenciales de la caracterstica que estamos midiendo.

La Variable continua sin embargo, establece el presupuesto terico de que entre
dos puntos cualesquiera de la escala existen un nmero infinito de valores potenciales de la
caracterstica que estamos midiendo.

Dada una poblacin de tamao N, de los que estudiaremos un carcter estadstico A que puede
tomar K posibles valores A, A, A,......, AK 1 2 3. Designamos por ni el nmero de individuos que
presenta cada modalidad Ai.

La Frecuencia absoluta del valor xi de la variable x al nmero de veces que aparece repetido dicho
valor en el conjunto de observaciones realizado ni.

La Frecuencia relativa del valor xi de la variable x fi.


Cuando los valores que puede tomar un carcter estadstico son incompatibles, se cumple
que la suma de las frecuencias absolutas es igual al total de la poblacin estudiada, y
la suma de las frecuencias relativas es igual a 1, es decir:


Frecuencia absoluta acumulada
Frecuencia absoluta del valor xi de la variable x Ni.
42


Si los datos estn ordenados de menor a mayor x1, x2,...,xn Nn=N
Frecuencia relativa acumulada
Frecuencia relativa del valor xi de la variable x Fi.

Si los datos estn ordenados de menor a mayor x1, x2,...,xn Fn=1
Tabla o distribucin de frecuencias de la variable discreta x











Ejemplo. Supongo que tiramos un dado 12 veces y obtenemos los siguientes resultados:

1 , 2 , 2 , 6 , 1 , 5 , 3 , 6 , 4 , 4 , 1 , 2.

Est claro que estamos trabajando con una variable estadstica cuantitativa discreta, cuyos
posibles valores son 1, 2, 3, 4, 5, 6; es decir 6 posibles modalidades o posibles resultados, por
tanto en este ejercicio N = 12 y K = 6









En el caso continuo se particiona el conjunto de valores que toma la variable en clases o intervalos y x
agrupa las observaciones segn pertenezcan o no a la misma clase Ei [li,Li). Se llama marca de clase
al valor medio de dicha clase:



Tabla o distribucin de frecuencias de la variable continua x
43










5.8.2. CLCULO DE PORCENTAJES

Un porcentaje es una forma de representar cunto es una cantidad respecto a otra (la de
referencia). En trminos absolutos el valor correspondiente al porcentaje a% de b se calcula
multiplicando el resultado del cociente a: 100 por b. As el 5% de 200 se obtiene
realizando el clculo: 5:100 x 200=0.05 x 200 = 10.

El clculo del a% de una cantidad se puede representar mediante una mquina multiplicativa, donde
su factor multiplicativo es el nmero resultante de dividir a entre 100, es decir, el
porcentaje expresado en forma decimal.








5.8.3. NIVELES DE SIGNIFICACIN ESTADSTICA:

Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a correr el
riesgo de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por
se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra
eleccin.

En la prctica es frecuente un nivel de significancia de 0.05 0.01, si bien se usan otros valores. Si,
por ejemplo, se escoge un nivel de significancia del 5% 0.05 al disear una regla
de decisin entonces hay unas cinco oportunidades entre cien de rechazar la hiptesis cuando
debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la
decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel de significancia
0.05 lo cual quiere decir que la hiptesis tiene una probabilidad del 5% de ser falsa.


5.9. ESTADSTICA BINOMIAL

Una distribucin binomial tiene estas caractersticas:
44


1.- Slo hay dos resultados posibles en cada ensayo de un experimento. Los resultados son
mutuamente excluyentes, ejemplo: verdadero/falso, xito o fracaso etc.
2.- La variable aleatoria cuenta el nmero de xitos en una cantidad fija de ensayos.
3.- La probabilidad de un xito permanece igual en todos los ensayos. Lo mismo sucede con la
probabilidad de un fracaso.
4.- Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta el
resultado de algn otro.

La distribucin de probabilidad binomial puede describirse utilizando la frmula


Donde:
C es una combinacin
n es el nmero de ensayos
x es el nmero de xitos
P es la probabilidad de xito en cada ensayo
Q es la probabilidad de fracaso



6. ANLISIS, INTERPRETACIN, ESTADSTICA E INFERENCIA


6.1. PRINCIPIOS DE ANLISIS E INTERPRETACIN

Antes de comenzar el anlisis hay que llevar a cabo una cantidad considerable de trabajo
preparatorio.
Anlisis objetivos principales

1. Evaluar y realzar la calidad de los datos
2. Describir la poblacin de estudio y su relacin con alguna supuesta
3. Evaluar la posibilidad de
4. Estimar las medidas de frecuencia y extensin (prevalencia, incidencia, media, mediana)
5. Estimar medidas de fuerza de asociacin o efecto
6. Evaluar el grado de incertidumbre a partir del azar (ruido)
7. Controlar y analizar los efectos de otros factores relevantes
8. Buscar una mayor comprensin de las relaciones observadas o no observadas
9. Evaluar el impacto o importancia

En esta fase, cuando se realiza el tratamiento estadstico-matemtico de toda la masa de los
datos clasificados y tabulados. Esto conduce su primer lugar a la formacin de lo que se llama
finding, que consiste en afirmaciones sobre propiedades estadstica de los datos.

El objetivo de la interpretacin en cambio es buscar un significado ms amplio a las
45

respuestas mediantes su trabazn con otros conocimientos disponibles; generalizaciones, leyes,
teoras etc. se trata de poner los datos en una perspectiva de contextos de relaciones
mutuas etc., que permitan profundizar la compresin de "que est pasando" en este punto hay que
referirse a las leyes y teoras que existen para explicar y entender.


6.1.1 FRECUENCIAS Y MEDIDAS CONTINUAS

Para la organizacin de la informacin, la mejor tcnica es la Tabla de Distribucin de
Frecuencias. Pero, en esta ocasin veremos cmo aparecen dos nuevos conceptos:

Para la frecuencia absoluta acumulada se utiliza la expresin Ni y para la
frecuencia relativa acumulada, se utiliza la expresin Hi. Las frecuencias absolutas son
siempre valores enteros, mientras que las frecuencias relativas son siempre valores
decimales o fraccionarios. El ltimo valor de las frecuencias absolutas
acumuladas siempre ser igual al tamao del universo o de la muestra, as como el
ltimo valor correspondiente a las frecuencias relativas acumuladas siempre debe dar uno cien
en caso de estar trabajando con valores porcentuales.


6.1.2 REGLAS DE CATEGORIZACIN

Una escala es un esquema especfico para asignar nmeros o smbolos con el objeto de
designar caractersticas de una variable (Ary, Jacobs, Razavieh, 1984). La taxonoma ms conocida
sobre las escalas de medicin las presenta Stevens (1951) quien las clasifica en
nominales, ordinales, de intervalos y de razn. A continuacin veamos los cuatro tipos de escalas
de medicin.

Las escalas nominales son aquellas donde se clasifican los objetos, personas o
variables en categoras cualitativamente distintas. .

Las escalas ordinales son las que clasifican a las personas, eventos u objetos en una posicin
con relacin a cierto atributo, pero sin indicar la distancia que hay entre las
posiciones.

Las escalas de intervalos son aquellas que ordenan los objetos o eventos segn la
magnitud del atributo que representan y proveen intervalos iguales entre las unidades
de medida.

6.1.3 CLASES DE ANLISIS ESTADSTICOS

El estadgrafo se calcula a partir de una muestra y las encuestas polticas se realizan basndose
en entrevistas que se llevan a cabo con una muestra de electores. Durante las ltimas
encuestas han figurado cerca de 15% a 20% que se consideran indecisos y este mimo por ciento
coincide con el por ciento de electores que no votan en las elecciones. A nivel poblacional el dato
46

de 15% - 20% se considera como un parmetro y a nivel muestral en las encuestas es un
estadgrafo. Por tanto, el estadgrafo de la muestra sirve como un estimador del parmetro.

6.1.4 NDICES

No existe una definicin oficial por parte de algn organismo nacional o internacional, slo algunas
referencias que los describen como: Herramientas para clarificar y definir, de forma ms precisa,
objetivos e impactos (...) son medidas verificables de cambio o resultado (...) diseadas para contar
con un estndar contra el cual evaluar, estimar o demostrar el progreso (...) con respecto a
metas establecidas, facilitan el reparto de insumos, produciendo (...) productos y alcanzando
objetivos. Si bien los indicadores pueden ser cualitativos o cuantitativos, en este
trabajo nos abocaremos nicamente a los segundos.

Existen, al menos, dos criterios para clasificar a los indicadores:

a) A partir de la dimensin o valoracin de la realidad econmica, social, poltica
o humana que se pretende expresar.
b) Partiendo del tipo de medida o procedimiento estadstico necesario para su obtencin.
c) Dependiendo del campo de conocimiento que se pretende analizar, se habla de
indicadoreseconmicos, sociales, ambientales, etctera.

6.1.5 INDICADORES SOCIALES

Una de las definiciones ms utilizadas por diferentes organismos y autores es la que Bauer dio en
1966: Los indicadores sociales (...) son estadsticas, serie estadstica o cualquier
forma de indicacin que nos facilita estudiar dnde estamos y hacia dnde nos
dirigimos con respecto a determinados objetivos y metas, as como evaluar programas
especficos y determinar su impacto.

Si bien, el fin ltimo de todos ellos es ser un insumo para evaluar la cercana o lejana
hacia las metas de bienestar econmico, social y de conservacin del medio ambiente, en lo que
varan es en las unidades de medida que utilizan: los indicadores los sociales lo hacen en
personas; y los ambientales, principalmente, en recursos naturales.

6.1.6 INTERPRETACIN DE DATOS DE INVESTIGACIN

Una vez que se haya seleccionado el asunto o problema a investigar se procede
a redactar la propuesta segn los criterios que siguen a continuacin. La misma se redactar en
forma de ensayo siguiendo el modelo American Psychological Association (APA) para la redaccin
de propuestas y trabajos escritos de investigacin.

a) Primera Parte: Introduccin
o Trasfondo
o Planteamiento del problema
o Propsito y justificacin de la investigacin
47

o Marco terico conceptual
o Preguntas/ hiptesis
o Definicin de trminos
b) Segunda Parte: Revisin de la Literatura
c) Tercera Parte: Metodologa
o Diseo:
o Poblacin y muestra:
o Instrumentos.
o Anlisis estadstico
o Procedimientos
d) Cuarta Parte: Presentacin de Hallazgos
e) Quinta Parte: Discusin y Anlisis de Resultados


7. PROBABILIDAD

7.1. DEFINICIN DE PROBABILIDAD

La probabilidad de un suceso A es el cociente entre el nmero de casos favorables al suceso y
el nmero de casos posibles. Se llama probabilidad a una ley que asocia a cada suceso A, del
espacio de sucesos, un nmero real que llamamos probabilidad de A y representamos
por p(A), que cumple los siguientes axiomas:

1. La probabilidad de un suceso cualquiera del espacio de sucesos es
positiva o nula:
2. La probabilidad del suceso cierto es igual a la unidad:
3. La probabilidad de la unin de dos sucesos incompatibles es igual a la suma de
las probabilidades de cada uno de ellos. Si A y B son incompatibles,



Probabilidad del suceso contrario:

Probabilidad del suceso imposible:
Probabilidad de la unin de sucesos incompatibles:
Ay B son incompatibles.
Probabilidad de la unin de sucesos compatibles:.

Probabilidad condicionada del suceso B respecto del suceso A, y la
denotamos por p(B/A), al cociente siguiente:



Probabilidad de la interseccin de sucesos independientes:
si A yB son independientes.
Probabilidad de sucesos dependientes:
48

si A y B son
dependientes.

Teorema de la probabilidad total: Sea A
1
, A
2
,... A
n
, un sistema completo
de sucesos tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B
en un suceso cualesquiera para el que se conocen las probabilidades de entonces la
probabilidad el suceso B viene dada por la siguiente expresin :




Teorema de Bayes: Sea A
1
, A
2
,... A
n
, un sistema completo de sucesos tales que la
probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualesquiera para el que se
conocen las probabilidades de


7.2. ESPACIOS, PUNTOS MUESTRALES Y EVENTOS

El uso de conjuntos representados por diagramas de Venn, facilita la compresin
de espacio muestral y evento, ya que el espacio muestral S, se puede equiparar con el conjunto
universo, debido a que S contiene la totalidad de los resultados posibles de un experimento,
mientras que los eventos E contienen solo un conjunto de resultados posibles del
experimento, mientras que los puntos muestrales se equiparan con los elementos.

Espacio Muestral.- Se llama espacio muestral (E) asociado a un experimento aleatorio, el conjunto
de todos los resultados posibles de dicho experimento.

Evento o Suceso.- Se llama evento o suceso a todo subconjunto de un espacio muestral.

Espacio muestral discreto.- Un espacio muestral es discreto si contiene un
nmero finito o numerablemente infinito de elementos. Numerablemente infinito de elementos:
sus elementos pueden ser escritos como una sucesin.

Los eventos se clasifican en:
Evento simple. Evento con un nico elemento.
Evento compuesto. Evento con ms de un elemento.

En el ejemplo anterior, A es simple, B y C son compuestos. Un evento A ocurre o se realiza cuando
se ejecuta el experimento y su resultado pertenece a A.


7.3. EVENTOS COMPUESTOS Y SUS PROBABILIDADES

Los eventos A, B, C, etc., son eventos compuestos si se componen de dos o ms eventos simples.
Ejemplos de eventos simples y compuestos
49

Evento simple: Lanzamiento de un dado
A = {evento que salga un # impar} A={1, 3, 5} B = {el nmero sea 4} = {1, 2, 3, 4}

Evento Compuesto: Lanzamiento de dos monedas
A = el evento de observar una cara
A = {HH, HT, TH, TT}

Existen varias maneras de representar un espacio muestral particular. Consideremos dos de ellas;
a) mediante una tabla de contingencia
b) mediante un diagrama de Venn

7.4. INDEPENDENCIA, EXCLUSIVIDAD MUTUA Y EXHAUSTIVIDAD

Eventos independientes. Dos eventos A y B son independientes si
P(A | B) = P(A) o bien
P (B | A) = P(B).

Regla multiplicativa para la interseccin de dos eventos.

Si P(A) > 0 y P (B) > 0,
P(A B) = P(A) P(B | A) = P(B) P(A | B) A y B son independientes si y slo si
P(A B) = P(A) P(B).

La ltima igualdad se puede generalizar para ms de 2 eventos. Por ejemplo, si A, B, C son eventos
mutuamente independientes,
P (A B C) = P(A) P(B) P(C).


7.5. PROBABILIDAD CONDICIONAL

La nocin de probabilidad condicional tiene que ver con que en algunas situaciones se quiere saber
cul es la chance de que una cosa suceda sabiendo que alguna otra cosa ha sucedido. Formalmente,
se habla de la probabilidad condicional de que el evento A ocurra dado o sabiendo que el evento B ha
sucedido. Por ejemplo, el juego consiste en tirar dados. Queremos apostar al 2 sabiendo que sali un
nmero par. Cmo influye este dato en la probabilidad de que salga 2

Probabilidad condicional. La probabilidad condicional de A dado B, P(A | B), se define como
P(A | B) = P(A B) / P(B) si P(B) > 0.

Si P (B) = 0, entonces P(A | B) no est definido.

La idea intuitiva de la probabilidad condicional es que es ms confiable o ms
ajustada a la informacin disponible. Sin embargo a veces la ocurrencia del
evento B no ofrece nueva informacin respecto de la ocurrencia del evento A. Es decir, hay
50

pares de eventos para los cuales el hecho de conocer que uno de ellos ha ocurrido no modifica el
valor de la probabilidad del otro.


8. MODELOS DE PREDICCIN


8.1 INTRODUCCIN

Los modelos de prediccin actuales incorporan lo que se denomina la estabilidad de las series,
es decir una variable cualquiera puede tener un comportamiento que involucra una parte errtica y
una parte estable. Una serie estable significa que cualquier efecto o impacto sobre ella, se diluye
en un perodo determinado de tiempo, una serie inestable incorpora los efectos y no muestra
reduccin de estos, lo que se denomina no convergencia.

Si al modelar encontramos relacin entre las partes estables de la variable, entonces podemos decir
que esa variable es explicada por la otra y adems predecible. Si el modelo de consumo
relacionado con el ingreso permanente es explicativo, entonces hemos encontrado la variable
de prediccin y es posible estimar su impacto con modelos de regresin medianamente
complejos, que se denomina Vectores auto regresivos VAR.


8.2 MTODOS ECOMOMTRICOS DE PREDICCIN

Existen tres objetivos principales para construir un modelo economtrico, cada uno de los
cuales tiene un uso dentro del contexto de evaluacin, los dos que mencionar a continuacin los
considero los ms notables.

Entendimiento: Un modelo puede ayudar a dar luz sobre las relaciones entre variables, porque en
economa o ms generalmente en las ciencias sociales, los hechos no hablan
por ellos. Ms formalmente, el modelo es una manera de probar si existen pruebas para una
hiptesis especfica, por ejemplo, la variable Y tiene influencia significativa sobre variable X.

Pronstico: El pronstico puede ser bastante distinto del entendimiento. Es posible pronosticar si en
realidad entender los procesos complicados, esto es pronosticando por asociacin, por lo cual en el
modelo, los datos son asociados sin necesidad entender las relaciones causales complicadas.


8.3 EL MODELO SENOIDAL DE MINIMOS CUADRADOS

De acuerdo al Teorema del Lmite Central, una medida puede considerarse como
un variable aleatoria, distribuida gausianamente entorno a su valor verdadero , siempre que el
error total sea la suma de un nmero grande de contribuciones pequeas.

Considerar un conjunto y1, y2,...yN de variables aleatorias independientes relacionadas
51

con otra variable xi que se asume conocida sin error.Cada yi tiene un valor medio i (desconocido) y
una varianza i (conocida)

Las N medidas de yi pueden considerarse como la medida de un vector aleatorio N-dimensional con




Suponer adems que el valor verdadero de las yi es una funcin de la variable x que depende de un
vector de parmetros desconocido en principio.



El objetivo del mtodo de mnimos cuadrados es estimar el vector de parmetros . Adems, el
mtodo permite evaluar la bondad con la que la funcin (x,) ajusta los
datos experimentales.

Para establecer el mtodo tomamos logaritmos en la pdf que describe los datos:








El principio de mxima verosimilitud establece que la pdf conjunta de las medidas (y por lo tanto la
verosimilitud L) es mxima para los parmetros autnticos. Por lo tanto, para
encontrar los parmetros maximizamos log L () o bien minimizamos la cantidad:




Si las medidas no son independientes, pero pueden describirse por una pdf conjunta gausiana, con
matriz de covarianza conocida, la definicin anterior se generaliza a:




Que reduce a la expresin anterior si la matriz de covarianza es diagonal (medidas independientes)


8.4 EL MODELO AUTORREGRESIVO DE PREDICCIN

A los modelos que consideran la correlacin entre observaciones consecutivas se les llaman
52

modelos autorregresivos. Entonces si Y
t
y Y
t-1
son las observaciones en los tiempos t y t-1
respectivamente, podra escribirse:

Esto es, se usa el conocimiento de la observacin al tiempo t -1 para
predecir la observacin en el tiempo t.

Al modelo se denomina modelo autoregresivo de primer orden.

En general la ecuacin del modelo autoregresivo de p-esimo orden es:

La nica manera de determinar si el modelo autoregresivo, o cualquier otro modelo de prediccin, es
un buen modelo de prediccin es calculando su SCE y tomar aquel modelo que tenga ese valor mas
pequeo (recordemos que el

Los intervalos de tiempo en los cuales existen correlacin significativa se determinan por medio de
un correlograma, una grfica en que se muestra las correlaciones que existen entre
observaciones separadas por un intervalo de tiempo constante. Estas correlaciones a
intervalos de tiempo son llamadas autocorrelaciones y se calculan de la siguiente manera:






Siendo y
t
los valores consecutivos de la serie de tiempo y y
t
los valores en el
tiempo t de la ecuacin de la tendencia lineal ajustado al mtodo de regresin lineal.

Se grafican los valores de los r
k
. Se toman las correlaciones con mayor valor absoluto. Por ejemplo
si el grafico del correlograma fuese el siguiente:







Las correlaciones de mayor valor absoluto son la r
1
y r
4
por lo que una funcin autorregresiva
de prediccin pudiera ser


53

Los valores de se obtienen usando los mnimos cuadrados de la regresin multivariables es
decir:






De donde los estimadores mnimos cuadrticos se obtienen a partir de la ecuacin:




8.5 EL MODELO DE PREDICCIN DE SUAVIZAMIENTO EXPONENCIAL

A diferencia de los promedios mviles, este mtodo pronostica otorgando una
ponderacin a los datos dependiendo del peso que tengan dentro del clculo del pronstico. Esta
ponderacin se lleva a cabo a travs de otorgarle un valor a la constante de suavizaci n, 1, que
puede ser mayor que cero y menor que uno. Para nuestro ejemplo, utilizamos un valor de 1 = 0.8,
por ser ste el que mejor ajusta al pronstico a los datos reales. De manera particular, esta
tcnica considera que las observaciones recientes tienen ms valor, por lo que le
otorga mayor peso dentro del promedio.


8.6 EL MODELO DE PREDICCIN DE PROMEDIOS MVILES EXPONENCIALMENTE
PONDERADOS

La utilizacin de esta tcnica supone que la serie de tiempo es estable, esto es, que los datos que
la componen se generan sin variaciones importantes entre un dato y otro (error aleatorio=0), esto
es, que el comportamiento de los datos aunque muestren un crecimiento o un decrecimiento lo
hagan con una tendencia constante.

El mtodo de promedios mviles es muy til cuando se tiene informacin no desagregada y cuando
no se conoce otro mtodo ms sofisticado y que permita predecir con mayor confianza. Este mtodo
permite suavizar la serie de tiempo aunque existen otros mtodos que son ms
eficientes en la prediccin.


8.7 OTROS MODELOS Y MTODOS DE PRONSTICO

8.7.1. EL MODELO DE RIELLY

El modelo de gravitacin comercial de Converse, derivado del modelo de Reilly, que se basa a su
vez, en la ley de gravitacin comercial de Newton. Donde:
54


Dab = Lmite del rea o sub-rea comercial de la localidad o municipio "a" (cabecera de rea o sub-
rea), medido en kilmetros a lo largo de la carretera o va de comunicacin que
conduce a la localidad "b" (cabecera de otra rea o sub-rea). Dicha distancia
es, por tanto, el "punto de indiferencia" entre dos municipios (a y b) en el cual los
consumidores seran indiferentes a comprar o gravitar comercialmente en cualquiera de dichos dos
municipios.

8.7.2. EL MODELO DE HUFF

El modelo de Huff, principalmente en aquellos casos en que existe duda sobre la gravitacin de un
municipio sobre ms de dos cabeceras (de rea o sub-rea).
El modelo de Huff se puede expresar de la forma siguiente: Donde:

Pij = Probabilidad de que un consumidor de un municipio i (punto de origen) se
desplace a un municipio j determinado (punto de destino).
Sj = Metros cuadrados de superficie de venta de las grandes superficies (centros
comerciales, grandes almacenes, hipermercados, grandes superficies especializadas) y
cadenas de tiendas especializadas ubicadas en el municipio j.
Sk = Metros cuadrados de superficie de venta de las grandes superficies y cadenas ubicadas en el
municipio k.
Tij = Tiempo empleado en el desplazamiento para llegar de la base i del consumidor al municipio j.
Tik = Tiempo empleado en el desplazamiento para llegar de la base i del consumidor al municipio k.
= Parmetro que refleja la sensibilidad del cliente al equipamiento comercial existente
(metros cuadrados de grandes superficies y cadenas).
= Parmetro que refleja la sensibilidad del cliente al tiempo de desplazamiento.
n = Nmero de municipios considerados por el consumidor como otros posibles
centros de atraccin, adems del municipio j.
Los parmetros y se calculan en base a datos empricos. Estos parmetros suelen coincidir con
los de la Ley de Reilly: = 1 y = 2.



CONCLUSIONES

La importancia que circunscribe este documento, tiende a complementar el trabajo del estudiante a
travs de los mtodos cuantitativos y la estadstica dentro de ellos como herramienta indispensable y
metodolgica en los diversos trabajos de investigacin.

El documento recaba una serie de textos e investigaciones relacionadas a la estadstica y a la
razn de ser de la ciencia, del objeto de estudio y de las variables de anlisis. Se entiende que el
trabajo implica una contribucin metodolgica del tipo cuali-cuantitativo en el desarrollo de
investigaciones.


55

BIBLIOGRAFA

ALCALDE INCHAUSTI, NGEL; LVAREZ VZQUEZ, NELSON (1992), Econometra, modelos
deterministas y estocsticos, teora. Ed. Centro de estudios Ramn Areces; Madrid, Espaa.

BOURDIEU, P.; CHAMBOREDON, J.C., PASSERON, J.C.(1996). La construccin del objeto. El oficio de
socilogo. Madrid: Siglo XXI.

BOX, GEORGE; HUNTER, WILLIAM; HUNTER, STUART (1999), Estadstica para
investigadores, introduccin al diseo de experimentos, anlisis y construccin de modelos; Ed.
Revert; Mxico.

DES RAJ (1980), Teora del Muestreo, Fondo de Cultura Econmica, Mxico, 105 p.

DAZ B., A. (1997). La explicacin cientfica. Una polmica desde la teora del conocimiento.
Hoyos M., C.A. (coord.) Epistemologa y objeto pedaggico Es la pedagoga una
ciencia? Mxico: Plaza y Valds.

FOSTER, EDWARD, ET AL. (1980), Anlisis Coste-Beneficio; Instituto de Estudios Fiscales,
Ministerio de Hacienda, Espaa.

FUENTES N., R. (2005). Construccin del objeto de investigacin (entrevista), Noviembre.

HERNNDEZ SAMPIERI, ROBERTO, FERNNDEZ-COLLADO, CARLOS & BAPTISTA LUCIO,
PILAR (2005). Metodologa de la investigacin. 4. Ed. Mxico: Mc Graw-Hill. ISBN 970-10-5753-8.

HIDALGO G., J. L. (1992). Construccin del objeto de investigacin. Investigacin Educativa. Una estrategia
constructivista. Mxico.

HORN, ROBERT V. (1993), Statistical indicators for the economic and social sciences. Cambridge, University
Press, Hong Kong, p. 147.

MOOD, A.M. & GRAYBILL, F.A. (1964), Introduccin a la Teora de la Estadstica, 2. Edicin. Mxico, Mc
Graw-Hill.

MNCH, LOURDES (2007). Mtodos y Tcnicas de Investigacin. 3. Edicin. Mxico: Ed.
Trillas. ISBN 978-968-24-7691-4

OBREGN BIOSCA SAL ANTONIO (2008), Impactos sociales y econmicos de
las infraestructuras de transporte viario: estudio comparativo de dos ejes, el Eix Transversal
de Catalunya y la carretera MEX120 en Mxico, Tesis de Doctorado, Escuela Tcnica Superior de
Ingenieros de Caminos Canales y Puertos de Barcelona, Barcelona.

ORGANIZACIN DE LAS NACIONES UNIDAS (1999). Integrated and coordinated
implementation and follow-up of major. United Nations conferences and summits. Nueva York,
Estados Unidos de Amrica, 10 y 11 de Mayo, p. 18.

REVISTA DE EDUCACIN Y DESARROLLO (2007) El objeto de estudio en la investigacin. Diversas
aproximaciones, Octubre-diciembre.

SIERRA BRAVO R. (1981), Anlisis Estadstico y Modelos Matemticos, Paraninfo, Madrid.

You might also like