You are on page 1of 312

UNIVERSIDAD

~~ NACIONAL
DE COLOMBIA

"~~=~ S E D E

P A L M 1R A

FACULTAD DE INGENIERA
Y ADMINISTRACIN

ESTADSTICA DESCRIPTIVA PARA


INGENIERA AMBIENTAL CON SPSS

VIVIANA VARGAS FRANCO

ESTADSTICA DESCRIPTIVA PARA


INGENIERA AMBIENTAL CON

CALI, JULIO DE

2007

SPSS

Vargas Franco, Viviana


Estadstica descriptiva para ingeniera ambiental con
SPSS / Viviana Vargas Franco. -- Editora Viviana Vargas
Franco. -- Cali : Impresora Feriva, 2007.
312 p.: ii. ; 24 cm .
ISBN 978-958-33-9319-3
1. Estadstica descriptiva. 2. Anlisis de datos. 3. Estadstica
con ayuda de computador. 4. SPSS para Windows (Programa para computador) Mtodos estadsticos. 5. Medio ambiente - Mtodos estadsticos 1. T!.
519.53 cd 21 ed.
A1131724
CEP-Banco de la Repblica-Biblioteca Luis ngel Arango

Viviana Vargas Franco


vvargasf@palmira.unal.edu .co
Julio de 2007
ISBN 978-958-33-9319-3
Universidad Nacional de Colombia - Sede Palmira
Facultad de Ingeniera y Administracin
Foto cartula: Carlos Carrillo
Impreso en los talleres grficos
de Impresora Feriva S.A.
Calle 18 No. 3-33
PBX: 5249009
www.feriva.com
Cali, Colombia

A
Diana y David, mis hijos

A
Diana y David, mis hijos

Agradecimientos
La autora expresa sus ms sinceros agradecimientos a las diversas personas e
instituciones que han colaborado en la elaboracin de este libro, entre las que se
destacan las siguientes:

Adela Parra Romero. Estadstica - Universidad del Valle.


Juan Jos Castillo. Ingeniero Ambiental- Universidad Nacional de Colombia, Sede
Palmira.
Mauricio Rojas Delgado. Estudiante Ingeniera Agrcola - Universidad Nacional de
Colombia, Sede Palmira.
Natalia Tamayo Gonzlez. IngenieraAmbiental- Universidad Nacional de Colombia,
Sede Palmira.
Rafael Domnguez Lasso. Ingeniero Agroindustrial - Universidad Nacional de
Colombia, Sede Palmira.
Ricardo Alberto Londoo Saldaa. Ingeniero Agroindustrial - Universidad Nacional
de Colombia, Sede Palmira.

Instituciones
Instituto Cinara de la Universidad del Valle. Santiago de Cali
Departamento Administrativo de Gestin del Medio Ambiente de Cali-DAGMA.
Corporacin Autnoma Regional del Valle del Cauca-CVC.
Universidad Nacional de Colombia - Sede Palmira

Agradecimientos
La autora expresa sus ms sinceros agradecimientos a las diversas personas e
instituciones que han colaborado en la elaboracin de este libro, entre las que se
destacan las siguientes:

Adela Parra Romero. Estadstica - Universidad del Valle.


Juan Jos Castillo. Ingeniero Ambiental- Universidad Nacional de Colombia, Sede
Palmira.
Mauricio Rojas Delgado. Estudiante Ingeniera Agrcola - Universidad Nacional de
Colombia, Sede Palmira.
Natalia Tamayo Gonzlez. IngenieraAmbiental- Universidad Nacional de Colombia,
Sede Palmira.
Rafael Domnguez Lasso. Ingeniero Agroindustrial - Universidad Nacional de
Colombia, Sede Palmira.
Ricardo Alberto Londoo Saldaa. Ingeniero Agroindustrial - Universidad Nacional
de Colombia, Sede Palmira.

Instituciones
Instituto Cinara de la Universidad del Valle. Santiago de Cali
Departamento Administrativo de Gestin del Medio Ambiente de Cali-DAGMA.
Corporacin Autnoma Regional del Valle del Cauca-CVC.
Universidad Nacional de Colombia - Sede Palmira

Contenido

Pg.

Introduccin ....................................................................................................
Captulo 1
Fundamentos de los mtodos estadsticos
1.1
1.2
1.3
1.4
1.5
1.6
1. 7

Modelos estadsticos............................................... .............. ....... ..... ....


Aspectos generales del mtodo cientfico.............................................
Los datos como materia prima de los mtodos estadsticos .... ... ....... ...
Aspectos relacionados con la calidad del dato.....................................
Conceptos en la aplicacin de los mtodos estadsticos.. .....................
Estadstica descriptiva vs estadstica inferencial..................................
Definicin de variables ............... ....................... ..... ..............................
1. 7.1 Variables cualitativas o categricas.......... ....... ....... ....... ....... ......
1.7.2 Variables cuantitativas................................................................
1.7.3 Otras clasificaciones...................................................................
1.8 Mtodos paramtricos y no paramtricos .............................................
1.9 Mtodos estadsticos por tipo de variable.............................................
1.10 Etapas generales en la construccin de un modelo estadstico .............

4
5
8
9
11
13
14
14
15
17
17
18
20

Captulo 2
Medidas descriptivas
2.1

2.2

Medidas de tendencia central............ ............ ................ .............. .........


2.1.1 Media..........................................................................................
2.1.2 Mediana......................................................................................
2.1.3 Moda...........................................................................................
Medidas de dispersin .......... .................. ...... ................ ................ .......
2.2.1 Rango....................................................... .................. ................
2.2.2 Desviacin media .......................................................................
2.2.3 Varianza......................................................................................
2.2.4 Desviacin estndar.... ............................... ............ ......... ............
2.2.5 Coeficiente de variacin ...... .......................................................

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

23
24
36
38
41
41
42
44
46
48
IX

Captulo 3
Distribucin de frecuencias
3.1

3.2.

Distribucin de frecuencias univariadas...............................................


3.1.1 Distribucin de frecuencias univariadas para una
variable discreta.................. ........................................................
3.1.2 Distribucin de frecuencias univariadas para una
variable continua .................................. ......................................
Distribuciones bidimensionales de frecuencia ................................ .....
3.2.1 Distribucin bidimensional en variables discretas ......................
3.2.2 Distribucin bidimensional para variables continuas..................

53
54
61
89
89
93

Captulo 4
Medidas y grficas de posicin
4.1
4.2
4.3
4.4
4.5

Cuartiles................................................................................................
Deciles ..................................................................................................
Percentiles.............................................................................................
Medidas de dispersin para indicadores de posicin............................
Representacin grfica de las medidas de posicin ..............................
4.5.1 Diagramas de cajas y alambres ..................................................
4.5.2 Diagrama de tallos y hojas .........................................................

98
103
106
11 O
11 O
110
120

Captulo 5
Modelos de regresin
5.1
5.2
5.3
5.4
5.5
5.6

Modelo de regresin lineal simple........................................................


Supuestos del modelo de regresin lineal simple .................................
Diagrama de dispersin ........................................................................
Otros modelos de regresin ..................................................................
Coeficiente de correlacin....................................................................
Coeficiente de determinacin ...............................................................

127
131
132
136
147
155

Captulo 6
Planeacin estadstica en un proyecto de investigacin
6.1
6.2
6.3
6.4
6.5

Objetivos del proyecto ..........................................................................


Descripcin del sistema ........................................................................
Codificacin del sistema........................ ...............................................
Definicin de variables, sitios y frecuencia de muestreo .....................
Formatos de muestreo...........................................................................
ESTADisTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

159
159
161
162
164
SPss

6.6
6.7

Flujo de informacin ... ........................................ .................................


Sistema de informacin .. ....... ...................... ........ ........................ .........

165
167

Captulo 7
Evaluacin de sistemas para tratamiento de agua potable
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8

Estadsticas descriptivas ..... ..................... .................... ..... ....................


Grficos de medias, mnimos y mximos.............................................
Histogramas ............................................................................. ... ......... .
Tablas cruzadas.....................................................................................
Grficos de frecuencias acumuladas .....................................................
Grficos de tallos y hojas .... ... ............................ .. ............... ............. ... ..
Percentiles .... ... .... ........ ....... ........... ..... ..... .. ... ... ................ .. ..... ............. ..
Diagrama de cajas y alambres ..............................................................

171
173
180
182
185
186
190
193

Captulo 8
Calidad de aire
8.l
8.2
8.3
8.4
8.5
8.6

Grficos de estadsticas descripti vas.. .... ..... .. .............. ............. .............


Histogramas ........ .... .. .. ........ ... ....... ... .... ....... .. ........ ...... ... .. ..... ..... .. ........ .
Tablas cruzadas.....................................................................................
Grficas de frecuencias acumuladas .. ................ ...................................
Percentiles... ........... ............................ .............. .............................. .......
Contaminacin del aire en Ciudad de Mxico ....................... ...............

204
211
214
217
220
224

Captulo 9
Calidad de agua en una fuente superficial
9.l
9.2
9.3
9.4
9.5
9.6

Estadsticas descriptivas .......................................................................


Presentacin grfica..............................................................................
Histogramas .......... ......... ......... .... ..........................................................
Tablas cruzadas.....................................................................................
Frecuencias acumuladas .......................................................................
Percentiles....... .... ................................................. ... .... ....... .......... .........

237
239
245
248
251
252

Captulo 10
Instrucciones en SPSS
10.1 Ingresando los datos a SPSS ..................................................................
10.2 Importando archivos de Excel ....................... ................................. ....... .
10.3 Estadsticas descriptivas................................................... ... ..... ...............

ESTADIsTICA DESCRIPT IVA PARA INGENIERIA AMBIENTAL CON SPSS

257
259
263

XI

10.4 Histograma .... ... ..... ............ .............. ....... ..... ........ ... .......... .. ..... .. .... ..........
10.5 Grfico de frecuencias acumuladas.........................................................
10.6 Grficos en tres dimensiones ...... ....... ............................................ .. .......
10.7 Grficos de barras en tres dimensiones ...................................................
10.8 Grfico de tallos y hojas. ............................ .... ................................. ..... ...
10.9 Grfico de cajas y alambres .......................................................... ..........
10.10 Percentiles....................................... ......................... ............ .... .............
10.11 Tablas cruzadas o distribucin de frecuencias con dos variables..........

268
270
271
273
274
276
277
280

Captulo 11
Grficas en Excel
11.1 Grfico para la media, desviacin estndar y el mximo.... ........ ......... ...
11.2 Grfico para media, mximo y mnimo .... .... ....... .... ... .......... .. ......... ...... .
11.3 Grfico de series de tiempo ............................................................... ......

283
288
291

Bibliografa .................................................................................................................... 295

XII

ESTADfsTICA DESCRIPTIVA PARA INGENIER fA AMBIENTAL CON

SPSS

Introduccin

Este libro tiene como objetivo proporcionar aspectos conceptuales de la estadstica


descriptiva con aplicaciones en estudios de la Ingeniera Sanitaria y Ambiental.
Est diseado como texto de consulta en cursos de estadstica o para el uso de
estudiantes o profesionales que desarrollen un estudio o una investigacin donde
se requiera aplicar tcnicas de estadstica descriptiva para el anlisis de datos y la
toma de decisiones.
En l se exponen aspectos conceptuales de los principales mtodos de la estadstica
descriptiva en lo relacionado con la organizacin, presentacin, estimacin y anlisis
de indicadores estadsticos aplicados en estudios o investigaciones en la Ingeniera
Sanitaria y Ambiental. Este trabajo se constituye en un aporte al uso de los mtodos
estadsticos descriptivos, considerando que se han escrito muchos textos sobre
mtodos estadsticos pero pocos en el mbito nacional y regional con aplicaciones
a la Ingeniera Sanitaria y Ambiental.
Si bien es cierto que el espectro de desarrollo de la Ingeniera Sanitaria y Ambiental
es amplio, se han seleccionado casos sobre evaluacin de la calidad de agua en una
fuente superficial, comparacin de sistemas de tratamiento para agua potable y
evaluacin de la contaminacin del aire en una regin especfica. Otras aplicaciones
pueden seguir la metodologa estadstica utilizada en los casos estudiados en el
presente libro.
Debido al avance de los recursos informticos, en cuanto a hardware y software,
los cuales han permitido una utilizacin intensiva de los mtodos estadsticos, en
este libro se presentan los procesos o rutinas para la estimacin de los indicadores
estadsticos en la hoja electrnica Excel (Microsoft Office) y el programa estadstico
SPSS (Statistical Package for the Social Sciences) versin 11.5.
La forma como se expone el libro se presenta a continuacin: Los primeros cinco
captulos contienen los aspectos conceptuales de la estadstica descriptiva. El captulo
1 presenta los fundamentos de los mtodos estadsticos; el captulo 2, medidas de
tendencia central y medidas de dispersin; el captulo 3, distribuciones univariadas

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS

y bivariadas; el captulo 4, medidas y grficas de posicin, y el captulo 5, modelos


de regresin lineal. En cada uno de estos captulos se desarrollan ejemplos que
ilustran los procesos estadsticos relacionados con estudios sobre ingeniera sanitaria
y ambiental.
Del captulo 6 al captulo 9 se presenta la aplicacin de los mtodos estadsticos
descriptivos a casos documentados de la Ingeniera Sanitaria y Ambiental. El captulo
6 desarrolla la planeacin estadstica de un proyecto de investigacin; el captulo
7 analiza la evaluacin de plantas de tratamiento de agua; el captulo 8 presenta un
estudio de calidad de aire, y el captulo 9, un estudio sobre la calidad de agua en
una fuente superficial.
Los captulos 10 Y 11 presentan las instrucciones para utilizar el software SPSS y
Excel, respectivamente.
Las bases de datos de los casos de apl icacin fueron recolectadas en diversas
investigaciones y estudios desarrollados por varias instituciones, entre las que se
destacan: Instituto Cinara de la Universidad del Valle, Corporacin Autnoma
Regional del Valle del Cauca (CVC), Universidad Nacional de Colombia, sede
Palmira y Departamento Administrativo de Gestin del Medio Ambiente de la ciudad
Santiago de Cali (DAGMA).

ESTADSTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPss

CAPTULO

1
Fundamentos
de los mtodos estadsticos

Los procesos de recoleccin, organizacin, presentacin, procesamiento, anlisis e


interpretacin de datos numricos son aspectos fundamentales en el desarrollo de un
estudio o una investigacin en general, y en particular en los estudios relacionados con
la Ingeniera Sanitaria y Ambiental, considerando que generalmente en estos ltimos
los datos son la herramienta bsica para la consolidacin de las investigaciones y
la toma de decisiones.
Los datos generan informacin para la toma de decisiones en condiciones de certeza
o de incertidumbre. Para la toma de decisiones en condiciones de certeza se utilizan
modelos matemticos determinsticos y la toma de decisiones en condiciones de
incertidumbre, medida por la teora de la probabilidad, se realiza a travs de los
modelos estadsticos estudiados en la ciencia Estadstica.
La estadstica es la ciencia que se encarga de la recopilacin, organizacin,
presentacin, anlisis e interpretacin de datos numricos, con el fin de tomar
decisiones con criterios de incertidumbre y confiabilidad. Los mtodos estadsticos
tratan de la presentacin grfica y resumen de datos a travs de indicadores,
estimacin de parmetros poblacionales, pruebas de hiptesis en relacin con
parmetros poblacionales, determinacin de la exactitud de las estimaciones,
estudio de la variacin, estudio de correlacin y el diseo de experimentos, de forma
univariada y multivariada, entre otros.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

VIVIANA VARGAS FRANCO

1.1 Modelos estadsticos


Un modelo estadstico es una representacin simplificada, formal y abstracta de
un fenmeno de la naturaleza o de un sistema, ste puede representar la estructura,
el comportamiento o el funcionamiento de una parte de inters o el conjunto del
fenmeno o del sistema. La representacin se hace a travs de smbolos matemticos
que corresponden a relaciones entre parmetros y variables.
Un modelo se considera adecuado si efectiva y objetivamente representa la realidad
que pretende estudiar y conocer. El elemento bsico para juzgar un modelo es su
confrontacin con la realidad, esto implica que para juzgar el modelo debe hacerse
una observacin emprica del objeto de estudio y con base en ella juzgar la bondad
del modelo (Quiroga).
La construccin y aplicacin de un modelo estadstico se define a travs de los
elementos bsicos de la teora estadstica: datos, aleatoriedad, variabilidad, teora de
probabilidad, seleccin muestral, estimacin de parmetros y docimasia de hiptesis,
entre otros.
No existe un modelo perfecto, pero se debe preferir un modelo simple, donde no
se pierda informacin, considerando los componentes sistmicos y aleatorios del
fenmeno.
Los mtodos estadsticos proporcionan criterios y modelos matemticos para
realizar los procesos de recoleccin, procesamiento y anlisis de datos requeridos
en estudios donde una componente fundamental son los datos, con caractersticas
de variabilidad y aleatoriedad. La aplicacin de los mtodos estadsticos permite
generar conclusiones objetivas con criterios de confiabilidad y riesgo en la toma de
decisiones. Los mtodos estadsticos son un medio y no un fin y como tal deben
ser utilizados; los resultados estadsticos deben ser contrastados con anlisis de las
teoras y modelos conceptuales o modelos matemticos que permitan suministrar
avances significativos en las diferentes reas de su aplicacin.
La estadstica como ciencia independiente es un desarrollo del siglo XX. Sir Ronald
Aymer Fischer (1890-1962) fue el principal representante, el transformador de ideas
que cohesion y estableci los fundamentos tericos de la inferencia estadstica
como mtodo de razonamiento inductivo que da un nuevo sentido al procesamiento
de datos e intenta medir su grado de incertidumbre. Sus resultados le dieron a la
estadstica estatus de disciplina cientfica, reafirmado por los innumerables campos
de aplicacin de sus metodologas (Y ez, 200 1).
El avance del anlisis estadstico en los ltimos aos ha sido rpido y su uso se
constituye en una valiosa herramienta para la toma de decisiones. La actualizacin

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPTULO

1-

FUNDAMENTOS DE LOS MTODOS ESTADSTICOS

permanente de los recursos informticos en cuanto a hardware y software ha


permitido una utilizacin intensiva de los mtodos estadsticos.
Existen dos fases en el procesamiento estadstico de un conjunto de datos: una parte
relacionada con la estadstica descriptiva o estadstica deductiva y otra relacionada con
la estadstica inferencial o estadstica inductiva. La estadstica descriptiva consiste
en resumir el conjunto de datos de una investigacin en indicadores estadsticos
que permiten estimar el grado de centralidad, dispersin, posicin y distribucin de
frecuencias. El anlisis descriptivo es una etapa importante en la comprensin de un
fenmeno, pues permite estudiar las tendencias generales del conjunto de datos.
Generalmente despus del proceso descriptivo se hace la estimacin de la
inferencia estadstica o estadstica inferencia\. Esta consiste, a partir de los
resultados estadsticos de una muestra representativa de una poblacin, en realizar
generalizaciones o inducciones a parmetros de la poblacin, considerando criterios
de riesgo y confiabilidad, estimados a partir de la teora de la probabilidad, tal como
se observa en la Figura 1.1.
Poblacin

Muestreo probabilstico

MlIestra representativa

X" Xl' XJ'


X 4 , X 5 , ........ X .. ,
X ..+/, X m +l
........ X p

XIV'

X/ .

Xl'"

X4

X k +/

XJ

Xk+1" ....... X n

Teora de probabilidad

Proceso de inferencia estadstica

Figura 1.1 Esquema del proceso de inferencia estadstica


Los mtodos estadsticos estn relacionados con el mtodo cientfico en las etapas
de recoleccin, organizacin, presentacin y anlisis de datos, para la deduccin
de conclusiones y la toma de decisiones razonables de acuerdo con los anlisis
estadsticos.

1.2 Aspectos generales del mtodo cientfico


El conocimiento cientfico es aquel que se realiza mediante la aplicacin del mtodo
cientfico; permite el uso de la razn, la lgica, la objetividad y tiende a evitar que

ESTADSTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPSS

VIVIANA VARGAS FRANCO

el conocimiento surja de la pasin o la emocin. Por medio de la investigacin


cientfica el hombre ha alcanzado una reconstruccin conceptual del mundo que es
cada vez ms amplia, profunda y exacta (Bunge). El conocimiento cientfico puede
caracterizarse como conocimiento racional, sistemtico, exacto, verificable y por
consiguiente falible .
El mtodo cientfico es una gua para desarrollar una investigacin o estudio con
resultados de carcter cientfico. La palabra mtodo viene del griego: "meta", que
significa "con" y "odos" que significa "camino", es decir, es la forma de proceder
encaminada hacia un objetivo donde lo que se va desarrollando guarda orden y
coherencia. El mtodo cientfico puede concebirse como un modelo general de
acercamiento a la realidad; es una pauta o matriz abstracta y amplia, dentro de
la cual estn los procedimientos y tcnicas especficas que se emplean en una
investigacin.
Una investigacin puede definirse como el estudio sistemtico de un sujeto u objeto
con el fin de descubrir nuevos hechos o principios. La aplicacin de la lgica y
la objetividad son la base del uso del mtodo cientfico. En el mtodo cientfico
es esencial el estudio de lo que ya se conoce, pues a partir de ese conocimiento
se formulan hiptesis, que se ponen a prueba generalmente con procesos de
experimentacin.
Las etapas del mtodo cientfico no deben considerarse lineales, son procesos
cclicos, donde el avance de una etapa permite revisar las anteriores; stas deben
considerarse como una gua para abordar en forma metdica el proceso de realizar
una investigacin. Si bien existen diferentes esquemas del mtodo cientfico, el
que se presenta en la Figura 1.2 destaca los aspectos relacionados con el uso de los
mtodos estadsticos.
Entre las caractersticas bsicas del proceso de investigacin se destacan los siguientes
aspectos:
Un producto de la investigacin: nuevo conocimiento
Es un proceso sistemticamente organizado
Es un proceso en espiral del conocimiento
Genera saltos cualitativos del conocimiento por acumulacin de pequeos cambios
cuantitativos
Permite replicabilidad de los resultados
Operan la lgica y la objetividad

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPTULO

PREGUNTAS DE
INVESTIGACIN
Definir:
Antecedentes
Justificacin
Preguntas a
resolver

1-

OBJETIVOS
Definir:
Objetivo general
Objetivos
especficos

FUNDAMENTOS DE LOS MTODOS ESTADSTICOS

HIPTESIS
Definir los posibles resultados de las preguntas de investigacin.

t
NUEVAS
PREGUNTAS DE
INVESTIGACIN

t
CONCLUSIONES y
RECOMENDACIONES
Generar en relacin con las
preguntas de investigacin
y anlisis de datos.

MARCO TERICO
Describir teoras y conceptos aplicados en la investigacin .
PROCESAMIENTO Y
ANLISIS DE DATOS
Aplicar:
Instrumentos de
recoleccin de datos.
Sistemas de informacin.
Teora de muestreo.
Estadstica descriptiva.
Inferencia estadstica.
Modelos matemticos.

.......

t
~

METODOLOGA
Describir el diseo experimental, materiales y
mtodos para desarrollar
los objetivos de la investigacin.

Figura 1.2 Esquema de las etapas del mtodo cientfico.

Se relacionan los siguientes conceptos:


o Teora vs prctica
o Abstraccin vs concrecin
o Conocimiento particular vs general
o Induccin vs deduccin
o Anlisis vs sntesis
o Conocimiento heurstico vs cientfico
La estadstica es un conjunto de herramientas tiles en la investigacin en las fases
de planeacin, anlisis e interpretacin de los resultados de una investigacin,
apoyando el desarrollo del mtodo cientfico en la descripcin y la prediccin. Por
la naturaleza de los mtodos estadsticos los resultados son parciales y fragmentados
ms que completos y definitivos.
En una investigacin debe haber concordancia lgica entre los objetivos, el diseo
de la investigacin, el anlisis de los resultados y las conclusiones; generalmente
los conceptos y mtodos estadsticos juegan un papel importante nicamente en el
anlisis e interpretacin de datos, lo cual conduce con frecuencia a investigaciones
en las que no hay una buena concordancia entre los objetivos, el diseo de la
investigacin y las conclusiones.

ESTADISTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPss

VIVIANA VARGAS FRANCO

Los procesos estadsticos proporcionan informacin y conclusiones a partir de un


conjunto de datos. Inferencias de lo particular a lo general podrn obtenerse con
un cierto grado de incertidumbre y los investigadores en los diferentes campos de
la ciencia debern reconocer el papel de la estadstica como un aspecto relevante
de una investigacin.
El papel de la estadstica en la investigacin es, entonces, funcionar como una
herramienta en el diseo de sta, en el anlisis de datos y en la extraccin de
conclusiones a partir de ellos. Los mtodos estadsticos no deberan ser ignorados
por ningn investigador, aun cuando no tengan ocasin de emplearlos en todos sus
detalles y ramificaciones.

1.3 Los datos como materia prima de los mtodos estadsticos


Los datos provienen de un proceso de medicin u observacin que debe realizarse
de manera regular, organizada y sistemtica, de tal forma que permita obtener un
sistema confiable de observaciones con el fin de acercarse a la respuesta de los
interrogantes especficos de una investigacin.
Los datos son la materia prima de la mayora de los estudios o investigaciones, de
ellos depende en buena medida el aprovechamiento de los mtodos estadsticos para
su posterior anlisis. De nada vale acumular datos sobre una investigacin si no
existen criterios para su organizacin y procesamiento estadstico.
En un estudio donde los resultados generan un conjunto de datos, es casi indispensable
resumirlos en indicadores de carcter estadstico que faciliten su presentacin,
interpretacin y anlisis. Un conjunto de datos no genera informacin por s mismo,
es a travs del procesamiento matemtico o estadstico significativo donde se pueden
encontrar indicadores y medidas de tendencia que generen informacin:

Datos =/:. Informacin


No se puede caer en la frase "ricos en datos, pobres en iriformacin ". En general los
textos de mtodos estadsticos no mencionan o suponen que el proceso de recoleccin
y calidad del dato es un aspecto conocido por los investigadores o profesionales
que realizan estudios, sin embargo es una de las fases de la experimentacin que
generalmente no se planea con el cuidado que se requiere.
La recoleccin de datos y su posterior anlisis no son la finalidad principal de
una investigacin o un estudio, es necesario realizar procesos de modelacin
matemtica y estadstica que permitan generar informacin sobre las preguntas
de la investigacin. La informacin que se genere del proceso de anlisis debe

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

1-

FUNDAMENTOS DE LOS MTODOS ESTADSTICOS

incorporarse a teoras y marcos conceptuales, de tal forma que se consigan


conclusiones vlidas y objetivas. Un proceso que permite transformar datos en
informacin se presenta en la Figura 1.3.

Definicin de
tcnicas de
recoleccin de
datos

Procesamiento y
anlisis de datos con
mtodos estadsticos
y matemticos

Aplicacin de
tcnicas de
recoleccin de
datos

+
DATOS

Organizacin y
digitalizacin en
bases de datos
y sistemas de
infonnacin

INFORMACIN

Teoras y conceptos
del fenmeno de
estudio

Figura 1.3 Un esquema metodolgico para convertir datos en informacin.

1.4 Aspectos relacionados con la calidad del dato


La calidad de los datos es uno de los aspectos importantes que se deben planear
antes de las etapas de recoleccin y aplicacin de los mtodos estadsticos, pues los
procesos estadsticos generalmente no verifican ni corrigen deficiencias en la calidad
de los datos. Varios componentes se deben estudiar sobre la calidad de un conjunto
de datos: confiabilidad, validez y representatividad, entre otros.

Representatividad. Est relacionada con el tamao de la muestra y la forma como se


seleccionan los individuos u observaciones a ser analizados y responde a la pregunta:
Los resultados de la muestra pueden aplicarse o generalizarse a la poblacin objeto
de estudio?
El tamao de la muestra depende del grado de variabilidad del fenmeno a estudiar,
el nivel de precisin deseado y el nivel de confiabilidad requerido, as como de los
costos de personal, reactivos y equipos, entre otros.
La forma de seleccin del nmero de muestras, es decir, el tipo de muestreo a
utilizar, puede ser probabilstico (cada elemento tiene una probabilidad conocida de
ser seleccionado en la muestra), o no probabilstico (no todos los elementos tienen

ESTADSTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPss

VIVIANA VARGAS FRANCO

probabilidad de ser incluidos en la muestra). Se deben seleccionar los individuos sin


sesgo y que haya participacin de los diversos elementos del fenmeno a estudiar.
La representatividad est ligada a la definicin de la poblacin objetivo y a la
muestra seleccionada y estas a su vez a los objetivos del estudio, los cuales deben
estar claramente definidos
Confiabilidad. Se relaciona con los instrumentos o formas de medicin de las
variables a medir y responde a la pregunta: Qu tanto se puede repetir la medicin
de tal forma que produzca resultados similares en condiciones similares?

La corrfiabilidad est asociada a la consistencia de los datos con los instrumentos de


medicin. La corrfiabilidad de un instrumento de medicin se refiere al grado en que
su aplicacin, repetida al mismo sujeto u objeto, produce resultados iguales.
Validez . Se refiere al grado en que un instrumento, concepto o indicador mide
realmente la variable que se pretende medir, sta debe alcanzarse en todo instrumento
de medicin que se aplica. Una pregunta que responde al concepto de validez es:
Se est midiendo lo que realmente se cree medir?

Si es as, la medida es vlida, de lo contrario no lo es. No hay medicin perfecta, pero


es necesario que haya una representacin fiel de las variables a observar, mediante
el instrumento de medicin.
Un instrumento de medicin puede ser confiable, pero no necesariamente vlido.
Por eso es conveniente que los resultados de una investigacin demuestren ser
confiables y vlidos,
Factores que afectan la confiabilidad y la validez. Algunos factores que afectan la
confiabilidad y la validez de un conjunto de datos:

Improvisacin
Instrumentos de medicin utilizados en diferentes contextos y sin adaptacin
Falta de validacin de los instrumentos de medicin
Instrumentos inadecuados para las variables seleccionadas
Condiciones inadecuadas en las que se aplica el instrumento
Capacitacin deficiente al personal de apoyo
Instrucciones deficientes

Fuentes de error. Algunas fuentes de error en las mediciones son: error aleatorio,
error sistemtico, normalidad y anormalidad.
Error aleatorio. Es el producido por el sistema de mediciones, es un error constante
que est presente en cada una de las mediciones que se efectan. Su valor no afecta

10

ESTADiSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPTULO

1-

FUNDAMENTOS DE lOS MTODOS ESTADSTI COS

al valor real ni al valor promedio del conjunto de datos. En trminos estadsticos es


igual a la diferencia entre una medicin y la media de todas las mediciones.

Error sistemtico. Es el producido por la medicin de cada una de las componentes


del sistema, no es constante, es el error de redondeo que se lleva a cabo en cada una
de las mediciones. En trminos estadsticos es igual a la diferencia de la media de
todas las mediciones con el valor real de la variable (que normalmente es desconocido
en el estudio).
El error sistemtico normalmente permanecer cuando se repita la medicin. De
ah que sea dificil detectarlo en un estudio. ste tambin indica que el instrumento
de medida no es completamente vlido. Algunas veces es posible detectar un error
sistemtico si el mismo objeto se mide con dos mtodos distintos. Si se descubre,
se elimina por correccin de mediciones (por ejemplo, por normalizacin de las
mismas) o por calibracin de la escala del instrumento de medida.
En un estudio el error aleatorio y el error sistemtico pueden darse conjuntamente
y es importante detectarlos. A mayor nmero de observaciones se controla el error
aleatorio, pero no el error sistemtico. Entre las estrategias para reducir el error
sistemtico se encuentran: calibracin de los instrumentos y realizacin de medidas
ocultas. En general, los fabricantes de instrumentos de medicin suelen garantizar
que el error total (aleatorio + sistemtico) de su equipo es inferior a cierto lmite,
siempre y cuando el instrumento sea usado con las especificaciones definidas.

Normalidad y anormalidad. Se dice que los datos son normales si el patrn sigue
la forma de una curva normal o en forma de campana, en caso contrario se habla de
datos con anormalidad. En el caso de datos normales, se pueden estimar intervalos
de confianza alrededor de indicadores estadsticos de inters; en caso de anormalidad
se pueden estimar niveles percentiles, que pueden estar alrededor del 95% y 97,5%,
que depende del estudio que se est realizando.

1.5 Conceptos en la aplicacin de los mtodos estadsticos


A continuacin se describen algunos conceptos fundamentales para la aplicacin de
los mtodos estadsticos.

Poblacin. Se define de acuerdo con los objetivos del estudio, y est determinada
por condiciones ambientales, de tiempo y espacio, entre otras. La poblacin se define
como la totalidad de los elementos o individuos que tienen caractersticas similares y
sobre los cuales se desean realizar inferencias o generalizaciones. Se deben definir
claramente quines y qu caractersticas deben tener los objetos o sujetos del estudio,
es decir, la poblacin.

ESTADSTICA D ESC RIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

11

VIVIANA VARGAS FRANCO

Muestra. Es una parte seleccionada de la poblacin objeto de estudio y sobre la


cual se van a realizar las mediciones. La muestra debe ser representativa con el fin
de dar confiabilidad a las inferencias o generalizaciones a la poblacin. La muestra
puede ser seleccionada con criterios probabilsticos o criterios no probabilsticos. En
general, para el uso de la inferencia estadstica se requiere una muestra probabilstica.
Para la seleccin de una muestra probabilstica se deben considerar los siguientes
aspectos:
Definir en forma precisa la poblacin
Considerar el marco muestral (fuente de extraccin de unidades)
Seleccionar el tipo de muestreo (depende de la poblacin, puede ser aleatorio,
estratificado, por conglomerados, sistemtico, entre otros)
Estimar el tamao de muestra (con criterios estadsticos, definir: nivel de
confiabilidad deseado, nivel de precisin en la estimacin y nivel de variabilidad
de las variables de inters)
Definir un procedimiento de muestreo (cmo seleccionar los elementos de la
poblacin)
Seleccionar la muestra
Una poblacin puede ser finita o infinita, pero la muestra siempre ser finita. La
muestra puede ser de inters inmediato, pero importa principalmente describir la
poblacin de la cual se tom. La escogencia de la muestra debe reflejar estrechamente
las posibles caractersticas de la poblacin.

Parmetro. Se refiere a un indicador estadstico que es calculado a travs de


las observaciones o datos de la poblacin. El valor del parmetro es constante y
generalmente desconocido, el cual se estima a travs de los datos de la muestra.
Estadstico o estadgrafo. Se refiere a un indicador estadstico que es calculado de
las observaciones o datos de la muestra. El valor del estadstico es conocido y vara
con la muestra. En general estos indicadores son los que se pretenden generalizar a
la poblacin a travs del proceso de inferencia estadstica. Los ms utilizados son:
media aritmtica, desviacin estndar, momentos, coeficientes de correlacin, entre
otros. La media muestral es un estadstico que permite estimar la media poblacional,
que es un parmetro.
Estimacin. Es el proceso estadstico mediante el cual se infieren o generalizan los
datos de un estadstico a un parmetro, utilizando la teora de la probabilidad. Es decir,
se generalizan los valores de los resultados muestrales a valores poblacionales.
Distribucin de probabilidades. Es la forma de agrupacin de los datos. Existe un
gran nmero de distribuciones asociadas a la forma de agrupacin y al tipo de variable
de los datos. Algunos ejemplos de distribuciones son: normal, Poisson, geomtrica,

12

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPITULO 1 - FUNDAMENTOS DE LOS MTODOS ESTADlsTICOS

hipergeomtrica, entre otras. Si los datos se aproximan a una de estas distribuciones,


su modelo terico se puede utilizar para propsitos de toma de decisiones.

1.6 Estadstica descriptiva vs estadstica inferencial


Los mtodos estadsticos se pueden clasificar en dos fases: estadstica descriptiva y
estadstica inferencia\. No es que existan dos estadsticas, las primeras son tcnicas
descriptivas y las segundas inferenciales, estas ltimas se apoyan en los resultados
de las tcnicas descriptivas y permiten generalizar de una muestra a una poblacin,
utilizando la teora de la probabilidad, tal como se observa en la Figura 1.4.

Estadistica descriptiva o
estadlstica deductiva

Inferencia estadlstica o
estadlstica Inductiva

Univariada o
multivariada

Unlvariada o
multivariada

1
(

TEoRA DE LA PROBABILIDAD

Presentacin grfica de datos.


Medidas de tendencia central.
Medidas de dispersin.
Medidas de posicin.
Distribucin de frecuencias.

Intervalos de confianza.
Pruebas de hiptesis.
Modelos de regresin.
Modelos de diseo de experimentos.
Modelos de series de tiempo.
Anlisis multivariado.
Geoestadstica.
Meta-anlisis.

Figura 1.4 Esquema de la relacin entre estadstica descriptiva e inferencial y sus


principales procesos.

La estadstica descriptiva, como su nombre lo indica, permite describir


significativamente un conjunto de datos mediante la presentacin, organizacin y
resumen en indicadores estadsticos. Las tcnicas con las cuales se resume el conjunto
de datos son: las medidas de tendencia central, de dispersin, de posicin y el anlisis
de distribucin de frecuencias; estos mtodos pueden ser de carcter univariado o
multivariado, de acuerdo con los requerimientos del estudio. Generalmente despus
del anlisis descriptivo se desarrolla el anlisis inferencia\.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

13

VIVIANA VARGAS FRANCO

El anlisis estadstico inferencial permite hacer un proceso inductivo para inferir


sobre una medida estadstica, generalmente la media aritmtica, a la poblacin
con base en observaciones de una muestra seleccionada en el estudio. Este tipo de
anlisis utiliza la teora de la probabilidad para cuantificar el nivel de confianza de
las conclusiones obtenidas (Behar, 1996). Algunos mtodos para realizar el proceso
de inferencia estn conformados por modelos de diseo de experimentos, modelos
de regresin, intervalos de confianza y pruebas de hiptesis.

1.7 Definicin de variables


Una variable es una caracterstica observable o medible en un objeto o sujeto de
estudio, que puede adoptar diferentes valores o expresarse en varias categoras. Los
valores que asumen las variables en cada uno de los sujetos son los datos. Tambin
se entiende por variable una caracterstica observable relacionada con otros aspectos
observables, estas relaciones pueden ser de causalidad, covariacin, dependencia y
asociacin o influencia.
En investigacin, las variables son los aspectos a medir y representan los conceptos
estudiados, estas constituyen un elemento bsico de las hiptesis puesto que se
construyen sobre la base de relaciones entre variables referentes a determinadas
unidades de medicin. Es importante resaltar la importancia de las variables como
elementos bsicos del mtodo cientfico, ya que la investigacin es, en ciertos aspectos
fundamentales, una tarea de medir, analizar y concluir sobre variables de inters en
un problema especfico.
Una variable es medida utilizando una escala de medicin, la eleccin de la escala
de medicin depende del tipo de variable y del manejo estadstico que se aplicar al
conjunto de datos. Existe una correspondencia directa entre el concepto de variable
y escala de medicin. Las variables pueden ser clasificadas como cuantitativas
(intervalares) o cualitativas (categricas), dependiendo si los valores presentados
tienen o no un orden de magnitud natural (cuantitativas), o simplemente un atributo
no sometido a cuantificacin (cualitativa). Un diagrama donde se presentan la
clasificacin de los principales tipos de variables y la relacin con la escala de
medicin se presenta en la Figura 1.5.

1.7.1

Variables cualitativas o categricas

Son aquellas cuyos valores tienen un carcter de cualidad no susceptible, naturalmente


de variacin numrica. Se clasifican en ordinales y nominales.

Nominal, se denomina a la variable cualitativa que genera valores de cualidad, sin


tener ellos ningn orden o jerarqua. Los nmeros asignados a las diversas categoras

14

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPITULO

1-

FUNOAMENTOS DE LOS MTODOS ESTADlsTICOS

( CLASlFICACIN DE VARIABLES)

CUALITATIVAS

CUANTITATIVAS

Escala de medicin

INTERVALO

RAZN

Figura 1.5 Diagrama general de clasificacin de variables.


del valor de las variables se consideran como etiquetas, pero no poseen el significado
numrico usual, los valores tienen una naturaleza no-mtrica, no se puede decir
que una categora es mejor que otra y la asignacin numrica es arbitraria. Algunos
ejemplos de variables cualitativas nominales son : gnero, raza, profesin, credo
religioso, color de ojos, partidos polticos y estado civil.

Ordinal, se denomina a una variable que genera datos de cualidad y no de cantidad,


los nmeros asignados a las diversas categoras se consideran etiquetas, pero se
genera una relacin de orden que se preserva en el sistema numrico. Los nmeros
que se asignan a los atributos deben respetar o conservar el orden de las caractersticas
que se miden. El tipo de datos que resulta tiene naturaleza no-mtrica. A pesar
del orden jerrquico no es posible obtener valoracin numrica lgica entre dos
valores. Algunos ejemplos de variables cualitativas ordinales son: estrato socioeconmico, nivel de satisfaccin (acuerdo-total, acuerdo-parcial, desacuerdo-parcial
y desacuerdo-total) y calificacin (E-excelente, S-satisfactorio, A-aceptable, Ddeficiente, I-insuficiente).
Las funciones de distribucin asociadas a una variable discreta son: uniforme discreta,
Bemoulli, binomial , hypergeomtrica, Poisson, geomtrica, binomial negativa,
Beta-binomial y logartmica.

1.7.2

Variables cuantitativas

Son aquellas donde las caractersticas o propiedades pueden presentarse en diversos


grados o intensidad y poseen un carcter numrico. Las escalas cuantitativas son

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

15

VIVIANA VARGAS FRANCO

reconocidas tambin como escalas intervalares o numricas. Estas se clasifican en


continuas y discretas.

Variables discretas, los valores de estas variables son enumerables y toman slo
valores enteros. Ejemplos: nmero de hijos, nmero de carros, nmero de personas,
nmero de productos y nmero de pacientes atendidos, entre otras. La escala de
medicin es de intervalo.
Variables continuas, son aquellas que pueden tomar infinitos valores dentro
de un intervalo dado. Los valores de estas variables estn relacionados con los
nmeros reales. Ejemplos: peso, estatura, salario y temperatura, entre otros.
Las variables continuas presentan dos escalas de medicin: de intervalo y de
razn.

Escala de intervalo, se caracteriza por generar datos numricos, la diferencia entre


dos medidas es significativa. En esta escala tienen sentido la suma y la resta de
valores, pero no existe un cero absoluto ni las distancias entre los valores generan
nocin de equivalencia. En esta escala no tiene sentido el concepto de divisin.
Algunos ejemplos: puntuaciones en una prueba de razonamiento (IQ) y temperatura
del agua.
Por ejemplo, en esta escala es posible decir el mejor desempeo (IQ) que tuvo
un estudiante en una prueba frente a otro; un nio con un IQ de 150 es mejor
que un nio que obtuvo 75, pero no se puede decir que el primero tiene el doble
de inteligencia que el segundo. En esta escala no hay un cero verdadero. El cero
en temperatura Fahrenheit es una temperatura seleccionada al azar. El cero en
centgrados corresponde a otra temperatura muy diferente. El resultado es que, a
pesar de que 100C es el doble de 50C, en una temperatura de 100C no hace el
doble de calor que en una de 50C.

Escala de razn, es el nivel ms complejo en las escalas, tiene un origen natural, el


cero absoluto, y al igual que en la escala de intervalo se generan medidas numricas
y las diferencias son valores significativos. La resta y la divisin entre dos valores
de esta escala tienen significado. Ejemplos: peso, estatura y edad, entre otros. Aqu
tiene sentido hablar de que una persona pesa el doble de otra, o que alguien tiene el
doble de aos que otra persona.
En general las medidas dan origen a datos continuos, mientras que las enumeraciones
o conteos originan datos discretos. Es siempre posible pasar de una escala a otra
menos exigente. Ejemplo: los estudiantes pueden medirse en metros (variable
continua-razn), pero pueden tambin ordenarse de mayor a menor, convirtindose
en una variable ordinal.

16

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS

CAPfTUlO

1 - FUNDAMENTOS DE lOS MTODOS ESTADfsTICOS

En nivel de complejidad se puede clasificar como el ms simple, la escala nominal,


seguido de la escala ordinal, posteriormente aparecen las escalas de intervalo y la escala
de ms alto nivel de complejidad es la de razn. La importancia de esta clasificacin
por niveles reside en el hecho de que mientras ms complejo o alto es el nivel de
medicin, ms elaborados son los mtodos estadsticos que se pueden utilizar.
Las funciones de distribucin asociadas a una variable continua son: uniforme,
normal, exponencial, gamma, beta, Cauchy, Log normal, doble exponencial o
Laplace, Weibull, Logstica, Gumbel y sistema Personiano.

1.7.3

Otras clasificaciones

Existe otro tipo de clasificaciones de las variables, las cuales se presentan a


continuacin:

Variables dependientes (1'): Reciben este nombre las variables a explicar, o sea, el
objeto de una investigacin que se trata de explicar en funcin de otros elementos.
Variables independientes (X): Son las variables explicativas, es decir, los factores o
elementos susceptibles de explicar las variables dependientes (Y); en una investigacin
de tipo experimental son las variables que se manipulan.
Variables intermedias o intervinientes: En algunos casos de anlisis de relacin
causa-efecto, se introducen una o ms variables de enlace interpretativo entre las
variables dependientes e independientes.
Variables explicatorias: Son las propiedades que interesan directamente al
investigador en trminos de su modelo.
Variables externas: Son las que estn fuera del inters terico inmediato y pueden
afectar los resultados de la investigacin emprica.
La clasificacin de las variables depende de cada investigacin en particular.

1.8 Mtodos paramtricos y no paramtricos


Dentro de los mtodos estadsticos se pueden distinguir los mtodos paramtricos
y no paramtricos. La estadstica paramtrica se aplica principalmente a datos de
tipo cuantitativo y cada tcnica tiene supuestos estadsticos que se deben cumplir
para poder aplicar el mtodo; uno de los principales supuestos se refiere a la
normalidad de la poblacin de la cual fue extrada la muestra, si no se cumple
este supuesto, sobre todo en los casos en que la muestra es de tamao menor de
30 unidades, las conclusiones a las que se llegue podran ser errneas. Cuando
las variables que se manejan no son de tipo cuantitativo o cuando no se cumplen

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

17

VIVIANA VARGAS FRANCO

los supuestos estadsticos requeridos para las diferentes pruebas, se utilizan los
mtodos no paramtricos.
Los mtodos utilizados para las variables de tipo cuantitativo (intervalo o razn)
son los mtodos paramtricos, los cuales presentan buenos niveles de confiabilidad
en la prediccin. En las escalas cualitativas (nominales u ordinales) se utilizan los
mtodos estadsticos no paramtricos, que no son tan precisos en su prediccin. En
la Tabla 1.1 se presentan las principales caractersticas de los mtodos paramtricos
y no paramtricos.

Tabla 1.1

Principales caractersticas de los mtodos paramtricos y no


paramtricos.

Mtodos paramtricos

Mtodos no paramtricos
Se requieren conocimientos de teora de Se requieren conocimientos elementales
la probabilidad, pruebas de hiptesis y
a nivel matemtico. Son fciles de usar y
funciones de distribucin, entre otros.
entender.
Se deben cumplir varios supuestos sobre los Se tienen pocos supuestos, los datos puedatos de la poblacin: distribucin normal,
den o no tener distribucin, es decir, libre
varianzas iguales, entre otros.
distribucin.
Las variables deben ser cuantitativas, Se pueden utilizar con variables de tipo
con escala de medicin de intervalo o de
cualitativo con escalas de medicin ordinal
razn.
o nominal. Tambin se pueden utilizar en
variables cuantitativas.
Se pueden realizar anlisis multivariados.

Presenta limitaciones en el anlisis multivariado.

Generalmente se requieren tamaos de Se pueden trabajar con muestras pequeas


muestra grandes (n > 30).
(n < 30).
Se utiliza el total del conjunto de datos.

Solo se utiliza parte del conjunto de da


tos.

Son mtodos eficientes y confiables esta- No son tan eficientes estadsticamente,


dsticamente.
presentan una mayor probabilidad de
rechazar una hiptesis nula falsa (error
Tipo 11).

1.9 Mtodos estadsticos por tipo de variable


Un aspecto a considerar en una investigacin es definir el tipo de anlisis estadstico
que se debe realizar dependiendo de las variables y su escala de medicin. Como
una gua se presentan en la Tabla 1.2 los diversos mtodos estadsticos que se pueden
aplicar segn el tipo de variable y su escala de medicin.

18

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPrTULO 1 - FUNDAMENTOS DE LOS MTODOS ESTADrSTICDS

Tabla 1.2

Clasificacin de mtodos estadsticos dependiente del tipo de variable


y su escala de medicin.

Tipo de variable

nominal

Cualitativa

ordinal

discreta

Cuantitativa

continua

Estadistica
descriptiva

M6todo a utilizar
Estadistica inferencial
paramtrica

Estadistica infarancial
no param6trica

Anlisis de
Tabulacin cruzacorrespondencias.
da: Chi-cuadrado,
Anlisis de correlacin
Mcnemar, Cochran,
cannica no lineal.
moda
Coeficiente
de continfrecuencias
Anlisis de
gencia, Phi, Cramer's
homogeneidad.
V, Lambda
Modelos de regresin de
Rachas.
eleccin discreta.
Anlisis de
correspondencias.
Tabulacin cruzada:
Anlisis de correlacin Chi-cuadrado,
Gamma,
cannica no lineal.
Somer's
d,
Kendall's,
Anlisis de
Taub, Kendall's tauc.
moda
homogeneidad.
Kruskal-Wallis.
frecuencias Anlisis de componentes Prueba
de la mediana.
mediana
principales
Friedman.
categrico.
Mann-Whitney.
Regresin categrica.
Wilcoxon.
Modelos de regresin de
Rachas.
eleccin discretaordenados.
Anlisis de
correspondencias.
Tabulacin cruzada:
Anlisis de correlacin Chi-cuadrado,
Gamma,
cannica no lineal.
Somer's
d,
Kendall's,
Anlisis de
Tau-b, Kendall's tau-c.
homogeneidad.
moda
Kruskal-Wallis.
frecuencias Anlisis de componentes Prueba
de la mediana.
mediana
principales
Friedman.
categrico.
Mann-Whitney.
Regresin categrica.
Wilcoxon.
Modelos de regresin de
Rachas.
eleccin discretaordenados.

Todas

Estimacin puntual y por


intervalo.
Pruebas de hiptesis.
ANOVA.
MANOVA.
Anlisis de componentes
principales.
Modelo de regresin
lineal simple y mltiple.

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS

Kruskal-Wallis.
Prueba de la mediana.
Mann-Whitney.
Wilcoxon.
Signo.
Rachas.
Chi-cuadrado.

19

VIVIANA VARGAS FRANCO

1.10 Etapas generales en la construccin de un modelo estadstico


Como una gua y no como una norma inflexible, se pueden delinear las siguientes
etapas en la construccin de un modelo o procesamiento estadstico (Quiroga).

Caracterizacin del problema


En esta etapa se deben definir los diferentes aspectos del problema, con el fin de lograr
una idea global del mismo, considerando en lo posible ir de lo simple a lo complejo,
de las partes al todo. En este aspecto se pueden seguir los siguientes pasos:

El sistema. Definicin del sistema y los diversos componentes del sistema, de acuerdo
con el problema, su delimitacin, los diversos componentes y sus relaciones.
Justificacin. Se debe definir el porqu y el para qu de la investigacin y del
estudio del sistema, aclarando los elementos tericos sobre el problema y sus
fuentes, realizando una revisin del estado del arte. Se deben definir el tipo
de parmetros, variables y supuestos sobre sus relaciones; de causalidad o de
correlacin. As mismo, se deben definir variables de respuesta, variables de estado,
variables endgenas y/o exgenas y la caracterizacin de informacin disponible,
en inventario y tamao.
Definicin de objetivos e hiptesis
Se deben plantear los objetivos e hiptesis generales en relacin con el problema
objeto de la investigacin. Las hiptesis deben basarse principalmente en la
naturaleza misma del fenmeno o sistema, apoyadas en teoras, experiencias y
criterios de personas que conozcan la problemtica estudiada. Se deben definir
alternativas de modelos y su aplicacin.

Marco terico
De acuerdo con las hiptesis, se deben exponer los elementos tericos fundamentales
de la investigacin y de carcter estadstico que permitirn la construccin, el
desarrollo y aplicacin de los modelos estadsticos.

Diseo de metodologas estadsticas


Se debe caracterizar el proceso de muestreo o el diseo experimental utilizado para
la obtencin de las observaciones, definiendo limitaciones y cobertura (poblacin y
muestra). As mismo, definir los parmetros y las variables, su caracterizacin y su
nivel de importancia: cules variables se observan?, cmo se observan?, cules
se generan? y cmo se generan? Las variables deben clasificarse segn diferentes
criterios (aleatoria, determinstica, de respuesta, independiente, dependiente,
observable, no observable, generada, endgena, exgena, de estado, controlada, no

20

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIEN TAL CON SPSS

CAPrTULO

1-

FUNDAMENTOS DE LOS MTODOS ESTADrSTICOS

controlada y covariable, entre otras). Debe juzgarse su grado de variabilidad, los


posibles factores que la determinan y definir sus categoras.
En la caracterizacin de parmetros deben explicarse su interpretacin y su papel
en el sistema o fenmeno. Del mismo modo, describir los mtodos de estimacin
de parmetros, propiedades, errores estndar y criterios para evaluarlos. Se deben
describir y explicar la docimasia de hiptesis estadsticas. Qu supuestos se deben
validar? Cul es su importancia? Cmo validarlos? Se deben describir y explicar
los mtodos y formas de aplicacin del modelo construido y validado, sus alcances,
limitaciones y ventajas.

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

21

CAPrTULO

1-

FUNDAMENTOS DE LOS MTODOS ESTADrSTICOS

controlada y covariable, entre otras). Debe juzgarse su grado de variabilidad, los


posibles factores que la determinan y definir sus categoras.
En la caracterizacin de parmetros deben explicarse su interpretacin y su papel
en el sistema o fenmeno. Del mismo modo, describir los mtodos de estimacin
de parmetros, propiedades, errores estndar y criterios para evaluarlos. Se deben
describir y explicar la docimasia de hiptesis estadsticas. Qu supuestos se deben
validar? Cul es su importancia? Cmo validarlos? Se deben describir y explicar
los mtodos y formas de aplicacin del modelo construido y validado, sus alcances,
limitaciones y ventajas.

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

21

CAPTULO

2
Medidas descriptivas

Este captulo presenta las principales medidas descriptivas de tendencia central y


dispersin utilizadas para el resumen de un conjunto de datos. Una medida descriptiva
es un valor que caracteriza las observaciones resumindolas en medidas de tendencia
central, dispersin o variabilidad y forma o asociacin.
Las medidas de tendencia central describen valores tpicos que se encuentran entre el
valor mnimo y el valor mximo observado en el conjunto de datos. Las medidas de
dispersin o variabilidad describen en qu medida los valores de un conjunto de datos
son distintos entre s o con respecto a una medida de centralidad. Las medidas de
forma describen las caractersticas de una distribucin de frecuencias de un conjunto
de datos. Las medidas de asociacin, para el caso de dos o ms variables, muestran
el grado de asociacin entre estas variables y cmo estn relacionadas.

2.1 Medidas de tendencia central


Estas medidas permiten describir el grado de centralidad de un conjunto de datos. Son
valores que representan un valor central hacia el cual tiene tendencia a concentrarse
el conjunto de datos. Entre las medidas de tendencia central se destacan:
Media:
aritmtica
geomtrica

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

23

VIVIANA VARGAS FRANCO

armnica
cuadrtica
rango medio
ponderada
Mediana
Moda

Las medidas de centralidad ms utilizadas son la media aritmtica, mediana y moda.


En algunos textos al clculo de estas tres medidas se le denomina promedio.

2.1.1

Media

2.1.1.1

Meda aritmtica

Es la medida ms utilizada en el anlisis de un conjunto de datos, es un valor central que


toma en cuenta todos los valores que aparecen en el conjunto de datos y las distancias
relativas a estos valores. Los valores tienen la misma importancia en el grupo de datos.
Su analoga fisica se puede comparar con el centro de masa de una coleccin de
masas de una dimensin, tal como se presenta en la Figura 2.1

O O O!

Figura 2.1 Representacin grfica del concepto de media.


La media aritmtica es la suma de los valores de la variable sobre el nmero de datos
en anlisis, la notacin en la muestra es diferente que en la poblacin.
Si XI' X]' X j , , X n _ l' X n representan los valores de una variable en una
muestra, entonces la media aritmtica se calcula por medio de la ecuacin 2.1.
11

X=XI+XZ+Xj + ... +Xn

n
X

. (se lee

: nmero de datos de una muestra

_~Xi LX

---=--

. (2.1)

"X barra" o "X trazo ''): media de un conjunto de datos provenientes de una muestra

I :(es la letra griega mayscula sigma): signo de suma/aria (se lee "suma de'')
Cuando los datos representan el total de la poblacin, la notacin de la media es
diferente de la media de los datos muestrales.

24

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

2-

MEDIDAS DESCRIPTIVAS

Si XI' X]' X J,............, X N _ l ' X N representan los valores de una variable en una
poblacin, entonces la media aritmtica se calcula por medio de la ecuacin 2.2.
N

p=

XI+X]+XJ+'" +XN
N

,..LIx

~X
~

=--=-N
N

(2.2)

f.l

: (es la letra griega minscula mu): media de un conj unto de datos p rovenientes de una poblacin
N : nmero de datos de una poblacin

La media aritmtica poblacional se estima a partir de la media aritmtica muestral


utilizando la teora de la probabilidad.
En estudios ambientales o de ingeniera sanitaria en muy pocas oportunidades se
cuenta con los datos poblacionales, muy frecuentemente se tienen conjuntos de
datos provenientes de una muestra, considerando que generalmente los fenmenos
naturales tienen poblacin infinita, lo cual impide obtener los datos de la poblacin.
Por ejemplo, para estimar la calidad de agua de una fuente de agua o la calidad del
aire en una determinada zona, tener la poblacin es equivalente a analizar "toda"
el agua del ro o "todo" el aire de la zona de estudio, lo cual no es posible. Esto
refuerza la importancia de la estimacin de la media poblacional a partir de la media
muestral.
La media aritmtica no siempre tiene sentido conceptual o validez real. Por ejemplo,
si en un muestreo de calidad de agua se tiene un valor de pH de 4 unidades, es decir
cido, y un valor de pH de 8 unidades, es decir bsico, el promedio del agua dara
un pH de 6 unidades, es decir neutro, lo cual no tendra sentido desde el punto de
vista real, por 10 anterior es necesario analizar la validez lgica y real de esta medida
antes de ser utilizada.
La media aritmtica slo tiene sentido para datos cuantitativos, ya sean estos de
carcter discreto o continuo, pues no se puede promediar el sexo, que toma categoras
de femenino y masculino, as estas estn categorizadas como y 1, debido a que la
media dara 0,5, que no tiene sentido ni representacin real. En el presente texto la
media aritmtica se denominar media o promedio. En la Tabla 2.1 se presentan
algunas ventajas y limitaciones de la media aritmtica.

ESTADIs TICA DESCRIPTIVA PARA ING ENIERfA AMBIENTAL CON

SPSS

25

V IVIANA VARGAS FRANCO

Tabla 2.1

Ventajas y limitaciones de la media aritmtica.


-,

Ventajas

Limitaciones

Es la medida estadstica ms comnmente


empleada.
Es fcil de calcular y entender.
Se pueden realizar clculos algebraicos.
En su clculo se incluye cada uno de los
datos de la muestra o la poblacin.
Es un valor nico para cada conjunto de
datos.
Las unidades son las mismas de la variable
analizada.
La distribucin de las medias que se obtienen
de muestreos repetidos de una poblacin se
conoce y es de gran utilidad en el proceso de
inferencia. Generalmente es la distribucin
normal.

Es fuertemente afectada por los valores ex


tremos, ya sean valores mximos o mnimos
Ypor consiguiente puede estar lejos de ser
una representacin de la muestra.
No es conveniente utilizarla en: conjunto
de datos demasiado heterogneos, cuando
los datos sean proporcionales o estn en
progresin geomtrica.
Se debe analizar junto con medidas de
dispersin.
Se debe acompaar por otras medidas de
tendencia central, tales como la mediana y
la moda.
Slo tiene sentido en variables cuantitati
vas.

Ejemplo 2.1 Un monitoreo de la calidad de agua en una fuente superficial, en


la variable turbiedad, presenta los siguientes resultados:
7

X;
Datos primer muestreo: 5; 4; 5; 4; 8; 10,' 9 (UNT) -+ X = ~ = 6,4 (UNT)
7
8

X;
Con una muestra adicional: 12 (UNT)

-+

X=~= 7,1 (UNT)

8
9

X;
Con otra muestra adicional: 150 (UNT)

-+

X=~= 23(UNT)
9
10

x;
Con otra muestra adicional: 320 (UNT)

-+

X=~= 52,7 (UNT)


10

(UNT Unidades Nefelomtricas de Turbiedad)

26

ESTADSTICA D ESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPss

CAPfTULO

2-

MEDIDAS DESCRIPTIVAS

Considerando el primer muestreo, la media de turbiedad para la fuente


superficial es 6,4 UNT, valor que indica el centro del conjunto de datos. A
medida que se adicionan valores extremos de turbiedad, la media incrementa
su valor significativamente. Un solo dato extremo altera el valor de la media
de manera significativa.
El valor de la media para datos homogneos es un buen indicador del grado de
centralidad de un conjunto de datos; sin embargo, es una medida fuertemente
afectada por valores extremos, y esto es una gran limitacin para el uso de este
indicador estadstico sin el anlisis conjunto de otras medidas de centralidad
o dispersin.
2.1.1.2

Propiedades del operador sumatoria

A continuacin se presentan las principales propiedades del operador sumatoria, las


cuales permiten comprobar algunas propiedades de la media.
n

e = ne

donde e es constante y n el nmero de datos

;=/
n

eX;=eX;
;=/

;=/

11

X=nX
;=/
n

(aX;bYj=aX;bY;
;=/

;= /

;=/

"x.

"
11

- . /
X=~X.=nX
n

2.1.1.3

;=/

Propiedades de la media

La suma de las desviaciones de los datos con respecto a la media es cero.


Esta propiedad surge del hecho de que la media es el punto de equilibrio de
la distribucin, tal como se presenta en la ecuacin 2.3. La media es la nica
medida de tendencia central que cumple esta propiedad.
n

(X-X)= 0

(2.3)

;=/

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

27

VIVIANA VARGAS FRANCO

Demostracin: Aplicando propiedades del operador sumatoria se tiene el


siguiente proceso:
n

I(X-X)= Ix;- IX= IX-nX=nX-nX=O


= 1

= 1

= 1

=1

Las sumas de los cuadrados de las desviaciones a partir de la media aritmtica


es menor que la suma de cuadrados de las desviaciones a partir de cualquier
otro valor. En forma algebraica:

(X-xy

es mnima.

Si cada uno de los datos de una variable toma valores constantes (k) , la media
ser igual al valor de la constante. En trminos algebraicos:

Si X= k , para todo i = 1,2, ..... n, entonces X= k .


Si cada uno de los datos de una variable es afectado aditivamente (negativamente)
por una constante (k) , la media de la nueva variable es equivalente a sumar
(restar) la constante a la media de la variable original. Enforma algebraica:
Si Y = k X,para todo i = 1,2, ..... n , entonces Y= k X.
Si cada uno de los datos de una variable es afectado multiplicativamente por
una constante (k) , la media de la nueva variable es equivalente a multiplicar la
constante por la media de la variable original. Enforma algebraica:
Si Y = kX , para todo i = 1, 2, ..... n , entonces Y = kX.
Si cada uno de los datos de una variable es dividido por una constante (k) ,
entonces la media de la nueva variable es la media de la variable original,
dividida por la constante. Algebraicamente:

Si Y. = -'- , para todo i = 1, 2, ..... n , entonces Y = X


,

Si se genera una variable como la combinacin lineal de dos variables, la media


de la nueva variable ser la combinacin lineal de las medias de las variables
originales. Algebraicamente:
Si Z = aX + bY , para todo i = 1,2, ..... n, entonces Z = aX + bY.
En general, de todas las medidas utilizadas para calcular la tendencia central
de una poblacin, la media es la menos sujeta a variacin debida a cambios en
la muestra.

28

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

2 - MEDIDAS

DESCRIPTIVAS

La media es la medida de tendencia central ms utilizada en estadstica, pues emplea


los datos disponibles de una variable y tiene una fuerte aplicabilidad en el proceso
de inferir de una muestra a una poblacin, debido a que las distribuciones de medias
que se obtienen de muestreos repetidos de una poblacin se conocen y son de gran
utilidad en el proceso de inferencia.
2.1.1.4

Media geomtrica

Esta es una medida de centralidad que se utiliza generalmente cuando los valores
dependen del tiempo; varan de manera no lineal o cuando existe un alto grado de
heterogeneidad en el conjunto de datos.

La media geomtrica de un conjunto de datos XI' Xl' X] ,......, X II _I , XII


de una muestra se define como la raz n-sima de la multiplicacin del conjunto
de datos y se calcula como se presenta en la ecuacin 2.4.
(2.4)

Para facilitar el clculo se aplica la funcin log a ambos lados de la


ecuacin:

_1
- -log ( XI' Xl' XII)
n

_1

- - ( log XI + log Xl + ...

+ log XII)

generando la ecuacin 2.5.


11

Llog(X/)
/
.
:
l og X g= . .---=1'---_ _

(2.5)

n
Entonces para hallar la media geomtrica se aplica la foncin exponencial en
base 10, a ambos lados de la igualdad, generando:

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

29

VIVIANA VARGAS FRANCO

Cuando los datos representan el total de la poblacin la notacin de la media


geomtrica se presenta a continuacin.

La media geomtrica de un conjunto de datos Xl' X]' X 3 , , XN _1' X N de


una poblacin, se define como la raz N-sima de la multiplicacin del conjunto
de datos y se calcula como se presenta en la ecuacin 2.6.

Il g

= ~ XJ' X]' X 3 ' oo. X N_J' X N

(2.6)

El empleo de la media geomtrica es equivalente a realizar una transformacin de la


variable original X , en log(X) y el posterior clculo de la media aritmtica a la nueva
variable, para obtener ellogaritrno de la media geomtrica. Por ejemplo, si la variable
abarca un campo de variacin muy grande, tal como el porcentaje de impureza de
un producto qumico (por lo general alrededor del 0.1%, pero en ocasiones llega
incluso al 1% o ms); en este caso es conveniente el empleo de log X en lugar de
X para obtener una distribucin ms simtrica y una aproximacin ms cercana a
la curva nOffilal. En la Tabla 2.2 se presentan algunas ventajas y limitaciones de la
media geomtrica.

Tabla 2.2

Ventajas y limitaciones de la media geomtrica

Ventajas

Limitaciones

Es una medida resistente a datos extremos, pero


mite detectar en un conjunto muy heterogneo,
una medida de tendencia central confiable.
Las unidades de la media geomtrica son las
mismas de la variable.
Se pueden realizar clculos algebraicos.
En su clculo se incluye cada uno de los datos de
la muestra.
Es un valor nico para un conjunto de datos.
Es muy til cuando el conjunto de datos represen
ta aumentos o disminuciones porcentuales.
Se utiliza para promediar valores cuyo crecimiento
sea en progresin geomtrica.

No es fcil de calcular y para un nmero considera


ble de datos (n > 150), se presentan limitaciones
en el programa Excel. En el programa SPSS
no est considerada dentro de las rutinas ms
comunes.
Puede presentar limitaciones en su interpreta
cin.
Cuando existe uno o varios valores de la variable
iguales a cero, el valor de la media geomtrica
toma automticamente el valor de cero.
Slo se puede calcular cuando la raz nsima
exista.
Programas como Excel no validan el signo del
producto y siempre que hay valores negativos no
la calcula.
Slo tiene sentido en variables de carcter cuan
titativo.
El desarrollo algebraico de esta medida puede
tener un grado de complejidad mayor que el
desarrollo de la media aritmtica.

30

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPTULO

2-

MEDIDAS DESCRIPTIVAS

Ejemplo 2.2 Considerando la situacin del ejemplo 2.1 se calcula la media


geomtrica:
Datos del primer muestreo:

x =~x.x"x

5; 4; 5; 4; 8; 10; 9 (UNT)

= 6 (UNT'/

Considerando una muestra adicional:


12 (UNT)

Xg = ~ XI

-+

Xl Xa

6,6 (UNT)

Considerando otra muestra adicional:


150 (UNT)

~ = ~ Xl Xl X 9 = 9,3 (UNT)

-+

Considerando otra muestra adicional:


320 (UNT)

-+

Xg

~ol

= 'IJ Xl Xl XJO = 13,2 (UNT)

La media geomtrica para los datos del primer muestreo es 6 UNTya medida que
se incorporan datos extremos la media geomtrica se incrementa levemente en
comparacin con la alteracin que presentan las medias aritmticas calculadas
en el ejemplo 2.1 .
El valor de la media geomtrica es considerablemente menos afectado por valores
extremos en comparacin con los valores de la media aritmtica, generando una
medida ms cercana a la centralidad del conjunto de datos cuando el conjunto
de datos es heterogneo.

2.1.1.5

Media armnica

Equivale a la transformacin del conjunto de datos originales en el recproco de cada


dato, l/X, y luego se calcula la media de los datos transformados, es el recproco de
X. Su campo de aplicacin es bastante restringido. Es til al promediar velocidades,
volmenes de ventas y cuando la variable crece en progresin armnica.
La media armnica de un conjunto de datos XI' X 2 , Xl' ............, XII _I' XII
provenientes de una muestra se define como la media de los recprocos del
conjunto de datos, tal como se presenta en la ecuacin 2.7.

n
1

IX
11

=I

(2.7)

Siempre que X :; O

ESTADSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

31

VIVIANA VARGAS FRANCO

Para un conjunto de datos provenientes de una poblacin se calcula como se presenta


a continuacin.
La media armnica de un conjunto de datos XI' X]' X 3 , , X N _I' X N
provenientes de una poblacin se define como la media de los recprocos del
conjunto de datos, tal como se presenta en la ecuacin 2.8.

N
1

#"=7f~)
L...x.
;=1
t

Siempre que X

Ix.

;-1

(2.8)

'* O

La relacin entre las medias aritmtica, geomtrica y armnica se presenta en la


desigualdad 2.9.
(2.9)

X" :5 X g :5 X

La media armnica es la ms resistente a valores extremos, seguida por la media


geomtrica y luego la media aritmtica. Las fortalezas de la media aritmtica son sus
propiedades, las cuales permiten desarrollos algebraicos y propiedades importantes
para la inferencia estadstica y la distribucin normal que presenta la familia de
medias de un estudio.
Ejemplo 2.3 Considerando la situacin del ejemplo 2.1 se calcula la media
armnica:
Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT)

-+

x=

"

7
1

I-

5,7 (UNT)

/_/ X

Con una muestra adicional:


12 (UNT)

-+

X=

"

8
1

I-

6,1 (UNT)

~/ X

Con otra muestra adicional:


150 (UNT)

-+

X=
h

9
9

I-

6,8 (UNT)

_/ Xi

Con otra muestra adicional:

32

ESTAOfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTULO

2-

MEDIDAS DESCRIPTIVAS

7,5 (UNT)

320 (UNT)

El valor de la media armnica para turbiedad en el primer muestreo es 5, 7 UNT,


ya medida que se adicionan valores extremos a la muestra el valor de la media
armnica no se incrementa significativamente.
Como se puede observar, a travs de los ejemplos 2.1, 2.2 Y 2.3, se cumple la
relacin de desigualdadpresentada en la ecuacin 2.9 entre las medias armnica,
geomtrica y aritmtica. La media armnica genera los menores valores de
centralidad del conjunto de datos y es la que menor impacto presenta por
valores extremos. Sin embargo, esta medida presenta limitaciones en su manejo
algebraico y no existe cuando algn dato toma el valor de cero. As mismo no
posee ventajas en su distribucin.
2.1.1.6

Media cuadrtica

Es otra medida de tendencia central, que consiste en elevar al cuadrado los valores y
generar la raz cuadrada de la media aritmtica de estos nuevos valores, es poco afectada
por valores extremos, pero presenta pocas ventajas algebraicas y de distribucin.

La media cuadrtica de un conjunto de datos Xl' X 2 , X 3 , ............ , Xn_l' X n


provenientes de una muestra se define como se presenta en la ecuacin 2.10.

-2

X=

r;Zx/
n

(2.10)

Xl es la notacin para la media cuadrtica muestral

Cuando los datos representan la totalidad de una poblacin la definicin de la media


cuadrtica se presenta a continuacin.

La media cuadrtica de un conjunto de datos XI' X 2 , X 3 , ............ , X N _I' X N


provenientes de una poblacin se define como se presenta en la ecuacin 2.11.

p.

~~X/
N

(2.11)

p.2 es la notacin para la media cuadrtica poblacional

ESTADfsTICA D ESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

33

VIVIANA VARGAS FRANCO

Ejemplo 2.4 Considerando la situacin del ejemplo 2.1 se calcula la media


cuadrtica:
Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT)

-+

Con un dato adicional:

12 (UNT)

-+

~
X/
[f;
X/

X2 =

;=17

= 6,8 (UNT)

;=18

7,7 (UNT)

Con otro dato adicional:

150 (UNT)

-+

~
X/
~
X/

X =
2

Con otro dato adicional:

;=19

= 50,5 (UNT)

320 (UNT)

-+

= 112 (UNT)
10
El valor de la media cuadrtica para turbiedad en el primer muestreo es 6,8
UNT, pero a medida que se adicionan valores extremos el valor de la media
cuadrtica aumenta significativamente.
X2

;=1

La media cuadrtica presenta ms variabilidad que la media aritmtica. Esta


medida es fuertemente afectada por valores extremos.
2.1.1.7

Rango meda o semrrango

Otro valor representativo de importancia, sobre todo cuando se necesita rpidamente


una medida de centralidad es el rango medio o semirrango.

El rango medio se define como la media aritmtica del valor mximo y el valor
mnimo de un conjunto de datos y se calcula como se presenta en la ecuacin
2.12.
X mn +Xmx
(2.12)
RM = ~~--.:.=2
Donde X mn es el valor mnimo y X mx es el valor mximo del conjunto de
datos.

34

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

2-

MEDIDAS DESCRIPTIVAS

Aunque el rango medio se calcula fcil y rpidamente, a menudo es ineficiente porque


ignora la informacin contenida en los trminos intermedios. As mismo puede que
no sea representativo, en el caso de que alguno de los valores mximo o mnimo,
sean valores especiales o atpicos dentro del conjunto de datos.
Ejemplo 2.5 Considerando la situacin del ejemplo 2.1 se calcula el rango
medio:
Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT)

RM=

X min +Xm6x

= 7 (UNT)

Con un dato adicional:


12 (UNT)

RM=

RM=

RM=

X min + X m6x

=8 (UNT)

Con otro dato adicional:


150 (UNT)

X mn +Xm6x

= 77 (UNT)

Con otro dato adicional:


320 (UNT)

X min +Xm6x

=162 (UNT)

El rango medio para turbiedad en el primer muestreo es 7 UNT; sin embargo,


cuando se adicionan datos extremos esta media aumenta significativamente.
El valor del rango medio presenta una variacin similar al valor de la media
aritmtica, por su definicin es afectada por los valores extremos.
2.1.1.8

Media ponderada

Cuando se conoce la media de varios grupos de datos y el nmero de datos en cada


grupo, se puede calcular la media global que se conoce como la media ponderada,
mediante la ecuacin 2.13.

(2.13)

En el siguiente ejemplo se ilustra su uso.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

35

VIVIANA VARGAS FRANCO

Ejemplo 2.6 Se ha realizado un monitoreo de 4 meses sobre la calidad de agua


en slidos suspendidos (mg/l), en el afluente de una planta de tratamiento de
agua potable. Las medias mensuales se presentan a continuacin:

S61idos suspendidos (mall)

Mes 1

Mes 2

Mes 3

Mes 4

9,8
13

11,4
18

7,5

10,5
15

20

Para el clculo de la media se utiliza la media ponderada, descrita en la


ecuacin 2.13

Xp

(13 9,8) + (18 11,4) + (20 7,5) + (1510,5)

13 + 18 + 20 + 15
X p = 9,7 mg/l

Es decir, la media de slidos suspendidos en el afluente de la planta durante los


4 meses fue de 9, 7 mg/l

2.1.2 A4ediana
Es la segunda medida ms utilizada despus de la media aritmtica para estimar
el centro de un conjunto de datos. Para hallar la mediana de un conjunto de datos
estos deben ser inicialmente puestos en orden de magnitud, de manera creciente o
decreciente. La mediana es el elemento central del conjunto de datos, es una medida
de posicin; hay el mismo nmero de observaciones a la derecha y a la izquierda
del valor de la mediana.
La mediana divide la distribucin de los datos en el punto medio; el 50% de los datos
est por encima de la mediana y el otro 50% est por debajo de la mediana, es decir,
es el valor que divide el conjunto de datos en dos grupos iguales.

Si Xl' X 2 , X j , , X n -1' X n representan los valores ordenados de forma


ascendente o descendente de una variable seleccionada de una muestra, entonces
la mediana se calcula mediante la ecuacin 2.14.

X n+l

si n es impar

Me =ixn+xn
2

- +1
2

36

(2.14)

si n es par

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

2-

MEDIDAS DESCRIPTIVAS

Cuando los datos representan la totalidad de una poblacin la frmula de la mediana


se presenta a continuacin:

Si XI' X]' X 3 , , X N- 1' X N representan los valores ordenados de forma


ascendente o descendente de una variable seleccionada de una poblacin,
entonces la mediana se calcula mediante la ecuacin 2.15.
X N+ I
-

si N es impar

(2.15)

M=
e
XN+XN
-+1
2

si N espar

Si el nmero de datos es impar, la mediana es el dato del centro del conjunto de


datos. Una vez los datos se ordenen en forma ascendente o descendente. Los datos
que se repiten deben ser ordenados, tambin, en su secuencia lgica. Si el nmero
de datos es par, la mediana es la media de los dos datos del centro. En la Tabla 2.3
se presentan algunas ventajas y limitaciones de la mediana.

Tabla 2.3 Ventajas y limitaciones de la mediana.

Ventajas

Limitaciones

Su valor no se ve afectado por datos extre Es afectada por el nmero de observaciones,


pero no por su magnitud.
mos y por lo tanto es una medida de impor
tancia cuando se presenta esta situacin en
En general la mediana es menos estable que
un conjunto de datos.
la media de una muestra a otra, por lo tanto
no es tan til en la estadstica inferencial.
Es fcil de calcular y entender.
las unidades de la mediana son las mismas los datos deben ser ordenados antes de
de la variable.
calcular la mediana.
Se puede hallar en variables cualitativas y Su definicin no permite realizar procesos
cuantitativas.
algebraicos.
Es un valor nico para un conjunto de da
tos.
Cuando los datos tienen una marcada asi
metra, es mejor representar la tendencia
central con la mediana que con la media.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

37

VIVIANA VARGAS FRANCO

Ejemplo 2. 7 Considerando la situacin del ejemplo 2.1 se calcula la mediana:


Datos del primer muestreo (n=7):

5; 4; 5; 4; 8; 10; 9 (UNT)

-+

Me =X7 +/ =X4 = 5 (UNT)


2

Con un dato adicional (n=8):


12 (UNT)

-+

M=
e

Xi +
'"

X~

+ /=

X 4 : X s = 6,5 (UNT)

Con otro dato adicional (n=9):


150 (UNT)

-+

Me

= X 9 +/

=Xs = 8 (UNT)

Con otro dato adicional (n=10):


320 (UNT)

-+

X IO + X/o
Me

-+/
2

X s + X6

= 8,5 (UNT)

La mediana para la turbiedad en el primer muestreo es 5 UNT, es decir, el 50%


de los datos son menores a 5 UNTy el 50% son mayores a 5 UNT A medida que
se adicionan datos extremos esta medida vara levemente.
El valor de la mediana es el valor central de la distribucin de datos, es una
medida bastante resistente a valores extremos, por lo tanto es una buena medida
de centralidad del conjunto de datos.

2.1.3

Moda

Como su nombre lo indica, representa el valor o valores que tienen la mayor


frecuencia en el conjunto de datos; son los valores que ms se repiten, ya sean estos
muestrales o poblacionales. En un conjunto de datos puede no existir un valor modal
o existir una o ms modas. Cuando hay una moda, el conjunto de datos se denomina
unimodal, en el caso de dos modas se denomina bimodal, en el caso de tres modas se
denomina tri modal y en el caso de ms modas se denomina multimodal. La moda
se representa como M o para datos muestrales o poblacionales. En la Tabla 2.4 se
muestran algunas ventajas y limitaciones de la moda.

38

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPrTULO

Tabla 2.4

2-

MEDIDAS DESCRIPTIVAS

Ventajas y limitaciones de la moda.


Ventajas

Limitaciones

Es fcil de calcular y entender.

La moda no necesariamente ocurrir como


un valor central.
Las unidades de la moda son las mismas de La moda no siempre existe.
No se pueden realizar procesos algebraila variable.
cos.
No presenta mucha utilidad con pocos datos
No requiere clculo.
en el conjunto de anlisis.
En general cuando el conjunto de datos no
resulta unimodal se debe a posibles fallas
Puede utilizarse para datos cualitativos y
en
el muestreo o falta de homogeneidad de
datos cuantitativos.
los mismos.
A pesar de describirse como una medida
No es afectada por datos extremos aislade centralidad, cuando los datos no son
simtricos, no la representa.
dos.

Ejemplo 2.8 Considerando la situacin del ejemplo 2.1, se estima la moda:


Primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT)

-+

Mol

= 4 (UNT) Y

Mol

= 5 (UNT)

-+

Mol

= 4 (UNT) y

Mol

= 5 (UNT)

-+

MOl

= 4 (UNT) y

Mol

= 5 (UNT)

-+

Mol

= 4 (UNT) y

Mol

= 5 (UNT)

Con un dato adicional:


12 (UNT)
Con otro dato adicional:
150 (UNT)
Con otro dato adicional:
320 (UNT)

Los datos del primer muestreo presentan dos modas, es decir, es un conjunto de
datos bimodal; los valores que mayor frecuencia presentan en turbiedad son 4
UNT y 5 UNT A medida que se incorporan datos extremos al conjunto de datos
las modas se mantienen constantes, en este caso especfico.
Si se obtienen diferentes muestras de una poblacin en forma aleatoria, la media
varia en cada una de ellas, lo mismo sucede con la mediana y la moda. Sin embargo,
la media vara menos que la mediana y la moda, lo cual es muy importante en la
estadstica inferencial y es una de las principales razones del uso de la media en

ESTADrSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

39

VIVIANA VARGAS FRANCO

esta rama de la estadstica. Una media muestral con seguridad est ms cerca de la
media poblacional que la mediana o la moda de la muestra.
La media, la mediana y la moda proporcionan una parte de la descripcin del conjunto
de datos. Sin embargo, es necesario definir indicadores que permitan estimar el grado
de variacin o dispersin de los datos con relacin a las medidas de tendencia central
y del conjunto de datos en general. Estas medidas por s solas no son suficientes
para analizar y tomar decisiones en relacin con un fenmeno en estudio, como se
ilustra en el siguiente ejemplo.
Ejemplo 2.9 Se evala el efluente de dos reactores en paralelo para tratamiento
de agua potable, en la variable color real medida en Unidades de Platino Cobalto
(UPC), generando las siguientes medias:
Reactor 1:

Xl =10 UPC

Reactor 2:

Xl =10UPC

En el anlisis y comparacin de estos dos reactores se estara muy tentado a


concluir la igualdad en el efluente para color real. Sin embargo, los datos con
los cuales se calcularon las medias se presentan a continuacin:
Reactor 1:
Reactor 2:

10; 12; 10; 12; 8; 10; 8 UPC


58; 2; 2; 2; 2; 2; 2 UPC

Como se puede apreciar, los datos arrojados por los dos reactores en color real
difieren significativamente, factor que no se puede evidenciar slo a travs del
valor de la media. Por lo tanto, a pesar de ser la media una de las medidas ms
utilizadas para resumir y analizar un conjunto de datos, es necesario acompaar
esta medida con otras medidas de centralidad y dispersin, las cuales permitan
estimar el grado de variacin del conjunto de datos.

En la Tabla 2.5 se presentan otras medidas de centralidad que permiten analizar de


forma ms integral la calidad de agua en color real de los dos reactores. Se puede
apreciar, a travs de estas medidas, que el reactor 1 tiene ms homogeneidad en el
conjunto de datos, en comparacin con el reactor 2, debido a que en el primero las
medidas de tendencia central son muy similares, mientras que en el segundo difieren
significativamente.

40

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPiTULO

Tabla 2.5

2-

MEDIDAS DESCRIPTIVAS

Medidas de tendencia central de dos reactores para potabilizacin de


agua en color real.

Medidas de tendencia central

Color Real (UPC)


Reactor 1

Reactor 2

Media

10

10

Mediana

10

Media geomtrica

9,9

2
3,2

Moda

10

Se puede generalizar que un conjunto de datos es homogneo cuando la media, la


mediana y la media geomtrica presentan valores similares, en caso contrario se
presenta heterogeneidad en el conjunto de datos_ Sin embargo, existen medidas
descriptivas que miden en forma adecuada el grado de dispersin o variabilidad del
conjunto de datos, denominadas medidas de dispersin.

2.2 Medidas de dispersin


Las medidas de dispersin o variabilidad permiten generar criterios sobre el grado
de homogeneidad o heterogeneidad del conjunto de datos que se est analizando, en
relacin con una medida de centralidad, o con respecto a los datos en s. Las medidas
estadsticas ms utilizadas para medir el grado de variabilidad o dispersin son:
rango, desviacin media, varianza, desviaciv estndar y coeficiente de variacin.

2.2.1 Rango
Es la diferencia entre el valor mximo y el valor mnimo del conjunto de datos.
Mide la longitud en la cual se encuentran los datos, en general a mayor longitud
mayor dispersin de los datos; sin embargo, es necesario analizar la variable y las
unidades en las cuales se est midiendo, con el fin de hacer un anlisis adecuado de
esta medida de dispersin.

El rango de una muestra aleatoria o de una poblacin se define por la


ecuacin 2.16.
(2.16)

En la Tabla 2.6 se presentan algunas ventajas y limitaciones de esta medida de


dispersin.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

41

VIVIANA VARGAS FRANCO

Tabla 2.6

Ventajas y limitaciones del rango.

Ventajas

Limitaciones

Es la medida de variacin ms fcil No se pueden realizar clculos algebraicos.


Slo incluye dos datos para su clculo: el valor
de calcular y entender.
mximo y el valor mnimo, ignorando los valores
intermedios.
las unidades coinciden con las de Es fuertemente afectada por los valores extremos.
Se debe acompaar de otras medidas de dispersin
la variable de anlisis.
para su anlisis.

Ejemplo 2.10 Considerando la situacin del ejemplo 2.1 se calcula el rango:


Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT)
Con un dato adicional:

12 (UNT)

Con otro dato adicional: 150 (UNT)


Con otro dato adicional: 320 (UNT)

-+ R = X mx - X min = 6 (UNT)
-+ R =Xmx-Xmn = 8 (UNT)
-+ R =Xmx-Xmln = 146 (UNT)
-+ R =Xmx-Xmn = 316 (UNT)

Para el primer muestreo el rango es 6 UNT, es decir, la diferencia entre el valor


mnimo y el valor mximo es 6 UNT A medida que se incorporan datos extremos
el rango aumenta considerablemente, evidenciando el grado de dispersin de
los datos.
Como se puede apreciar, a medida que el conjunto de datos presenta
ms variacin o heterogeneidad, el rango incrementa su valor de forma
significativa. El rango es una buena medida del grado de dispersin de un
conjunto de datos.

2.2.2

Desviacin media

Se define como la media aritmtica de los valores absolutos de las desviaciones


de los datos, con respecto a la media; tambin se puede calcular en relacin
con la mediana, en este ltimo caso la desviacin media representa un valor
menor. Una limitacin de esta medida es su poca facilidad para el desarrollo
algebraico.
En la obtencin de esta medida intervienen todos los valores del anlisis; por lo
tanto, permite una informacin relativa de todos ellos, y da mejor conocimiento del
grado de variabilidad de la distribucin de los datos que el rango.

42

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPfTULO

2-

MEDIDAS DESCRIPTIVAS

Si Xl' Xl' X 3 , ............ , X,, _I' X" representan los valores de una variable en
una muestra, entonces la desviacin media se calcula por medio de la ecuacin
2.17.

dm

"
Ix;-xl

(2.17)

=.:..;=.-:1'----_ _

n
Si los datos son el total de la poblacin, la notacin de la desviacin media se presenta
a continuacin:

Si XI' Xl' X 3 , , X N _ I' X N representan los valores de una variable en una


poblacin, entonces la desviacin media se calcula por medio de la ecuacin
2.18.
N

IX;-pl

(2.18)

DM = .:. ;=.-:1'-----N

Ejemplo 2.11 Considerando la situacin del ejemplo 2. 1 se calcula la desviacin


media:
Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT)

-+

lx;-xl
dm=

Con un dato adicional:

;= I

=2,2 (UNT)

12 (UNT)-+

lx;-xl
;=/

dm=

Con otro dato adicional:


150 (UNT)

=2,6 (UNT)

-+

1x;-xl
dm=

Con otro dato adicional:


320 (UNT)-+

;= /

=28,2 (UNT)

10

Ix;-xl
dm=

;=1

10

= 72,9 (UNT)

La desviacin media para el primer conjunto de datos toma el valor de 2,2 UNT,
que indica el nivel de dispersin de los datos con relacin al valor medio, que es
6,4 UNT Cuando se introducen datos extremos al muestreo, la desviacin media
aumenta evidenciando el grado de dispersin del conjunto de datos.

ESTADfsTICA DESCRIPTIVA PARA INGENIER fA AMBIENTAL CON

SPSS

43

VIVIANA VARGAS FRANCO

A medida que el conjunto de datos presenta mayor variabilidad la desviacin


media aumenta su valor y permite medir el grado de variabilidad del conjunto
de datos.

2.2.3

Varianza

Debido a las limitaciones algebraicas que evidencian el rango y la desviacin media,


se origina el concepto de varianza, que mide las variaciones del conjunto de datos con
respecto a su media aritmtica y se define como la media aritmtica de los cuadrados
de las desviaciones de cada dato a la media aritmtica. En general, cuanto menor sea
el valor de la varianza, menor es el grado de variacin o heterogeneidad del conjunto
de datos con respecto a su media aritmtica. Sin embargo, es necesario contextualizar
el anlisis de esta medida a la variable y las unidades en que est medida.

Si Xl' X 2 , X 3 , , X,,_I' X" representan los valores de una variable


seleccionada de una muestra, entonces se define la varianza muestral como la
ecuacin 2.19.
n

~ (x-X/ = (X-X/+(X -X/+(X -X/+ + (Xn-X/


2

S2

n-l

n-l
(2.19)

El cociente (n -1) se utiliza en reemplazo de n, debido a que con esta definicin se


obtiene una mejor estimacin de la variable poblacional, es decir, el valor esperado
de S es igual a ,;2, en trminos matemticos:
E (S) =,;2

Adems, S cumple con la propiedad de ser un estimador insesgado, una caracterstica


deseable para un estimador.
En el caso de que los datos sean el total de la poblacin, la notacin se presenta a
continuacin:

Si Xl' X 2 , X 3 , , XN_1' X N representan los valores de una variable


seleccionada de una poblacin, entonces se define la varianza poblacional como
la ecuacin 2.20.
N

(J
0":

44

~ (x- f.l/
N

(X- f.l/+ (X2 - f.l/+ (X3 - f.l/+ ....

es la letra griega "sigma"

+ (XN- f.l/

N
(2.20)

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

2-

MEDIDAS DESCRIPTIVAS

En la Tabla 2.7 se muestran algunas ventajas y limitaciones de la varianza.


Tabla 2.7

Ventajas y limitaciones de la varianza.

limitaciones

Ventajas

Es de las medidas de variacin, la ms utili Las unidades de esta medida son las uni
dades de la variable al cuadrado.
zada.
No es fcil su interpretacin debido a sus
unidades.
Se pueden realizar clculos algebraicos.
Se debe acompaar de otras medidas de
Se incluyen todos los datos en su clculo.
dispersin para su anlisis.
Ejemplo 2.12 Considerando la situacin del ejemplo 2.1 se puede calcular el
valor de la varianza:
Datos del primer muestreo:
7

5; 4; 5; 4; 8; 10; 9 (UNT)

(Xi-Xl

S=

;gl

7-1

Con un dato adicional:

= 6,3 (UNTl

12 (UNT)

(X/-Xl
= 9,3 (UNTl

S=

;~1

s=

(X-Xl

Con otro dato adicional:

8-1

150 (UNT)

1_ _ __
c...;--0

9-1

Con otro dato adicional:

2276,3 (UNTl

10

320 (UNT)

(X;-Xl
S =

;-1

10-1

= 10844,3 (UNTl

Como se puede apreciar la varianza genera una idea significativa del grado
de variabilidad de un conjunto de datos, pues a medida que aumenta el grado
de heterogeneidad esta medida aumenta sustancialmente, aunque sus unidades
elevadas al cuadrado limitan fuertemente su interpretacin.

2.2.3.1 Propiedades de la varianza


El valor de la varianza es siempre positivo o igual a cero, esto es:
cualquier conjunto de datos.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

~ O,para

45

VIVIANA VARGAS FRANCO

Si todos los valores de un conjunto de datos son constantes, el valor de la varianza es


igual a cero. Algebraicamente:
Si Xi = k , para todo i = 1, 2, ..... n, entonces S2

= O.

La varianza no se altera cuando a cada uno de los datos se le suma o se le resta


una constante. En trminos algebraicos:

Si 1'; = Xi k, para todo i = 1, 2, ..... n, entonces

S: S: .
=

Si cada uno de los datos en anlisis se multiplica por una constante, la varianza
resultar multiplicada por la constante al cuadrado. Algebraicamente:
Si 1'; = kXi , para todo i = 1, 2, ..... n, entonces

S:= S:.
k

Si se divide por un mismo nmero a cada uno de los datos en anlisis, la varianza
quedar multiplicada por el cuadrado de dicho divisor. En este caso la constante
debe ser diferente de cero. Algebraicamente:
Si Y i = : Xi ' para todo i = 1,2, ..... n, entonces S: =

/2 S: ;

k,* O

Una ecuacin alternativa para el clculo aproximado de la varianza se presenta


a continuacin:
n

IX;
S2=~-X2

2.2.4 Desviacin estndar


La forma de superar una de las limitaciones de la varianza, sus unidades al cuadrado,
es a travs del uso de la raz cuadrada, dando origen al concepto de desviacin
estndar.

La desviacin estndar muestral se define como la raz cuadrada positiva de la


varianza muestral, tal como se presenta en la ecuacin 2.21.

I"

S=-Vs2=

(Xi-Xl

/-1

(2.21)

n-1

La desviacin estndar poblacional se define como la raz cuadrada positiva de


la varianza poblacional, tal como se presenta en la ecuacin 2.22.
N

I
u={Gi=

, 46

(Xi-P.)]

(2.22)

i-l

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

2-

MEDIDAS DESCRIPTIVAS

En la Tabla 2.8 se presentan algunas ventajas y limitaciones de la desviacin


estndar.
Tabla 2.8

Ventajas y limitaciones de la desviacin estndar.

Ventajas
Limitaciones
Es, junto con la varianza, una de las medidas Se debe acompaar de otras medidas de
de variacin ms utilizadas.
dispersin para su anlisis.
Tiene las mismas unidades de la variable
analizada.
Para su clculo primero debe calcularse la
Se pueden realizar clculos algebraicos.
varianza.
Se incluyen todos los datos en su clculo.

Ejemplo 2.13 Considerando la situacin del ejemplo 2.1 se calcula el valor de


la desviacin estndar:
Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT) ~ S

= ...JS2 =

_i-_'____ = 2,5 (UNT)


7-1

Con un dato adicional:

...JS2 =

~ S =

...JS2 =

;- 1

~ S = ...JS2 =

i='

12 (UNT) ~ S

_ia_,_ _ _

=3 (UNT)

8-1

Con otro dato adicional:

150 (UNT)

9-1

=47,7 (UNT)

Con otro dato adicional:

320 (UNT)

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

10-1

=104,1 (UNT)

47

VIVIANA VARGAS FRANCO

Para los datos del primer muestreo la desviacin estndar es 2,5 UNT, que
indica poca variacin entre los datos, es decir, los datos se alejan de la media
(6,4 UNT) en una desviacin estndar en 2,5 UNT hacia adelante yen 2,5 UNT
hacia atrs de la media. A medida que el conjunto de datos se vuelve heterogneo,
la desviacin estndar toma valores bastante grandes. Por ejemplo, con todo
el conjunto de datos analizados, el valor de la desviacin estndar es 104,1
UNT, lo que significa que los datos se alejan en promedio 104,1 UNT del valor
medio (6,4 UNT).
sta es una buena medida del grado de dispersin del conjunto de datos; a
medida que aumenta el grado de variacin de los datos esta medida aumenta,
en las mismas unidades de la variable de origen.

2.2.5

Coeficiente de variacin

El coeficiente de variacin permite estimar la relacin porcentual entre el valor de


la media y la desviacin estndar. A medida que se presenta mayor heterogeneidad
en el conjunto de datos, el valor del coeficiente de variacin es mayor. Esta medida
puede tomar valores negativos slo cuando la media tiene un valor negativo, por
ejemplo, en el caso de la variable temperatura o nivel de prdidas. En este caso se
sugiere tomar el valor absoluto para una mejor interpretacin del coeficiente de
variacin.

El coeficiente de variacin muestral consiste en expresar la desviacin estndar


muestral como un porcentaje de la media muestral, tal como se presenta en la
ecuacin 2.23

CV= X x 100%
Siempre que

(2.23)

X"# O

El coeficiente de variacin poblacional consiste en expresar la desviacin


estndar poblacional como un porcentaje de la media poblacional, tal como se
presenta en la ecuacin 2.24.
(1

CV=-x 100%
Siempre que JI.

(2.24)

"# O

Esta medida es adimensional, sus unidades estn dadas en porcentaje, por lo tanto
es un buen indicador de comparacin entre dos o ms diferentes variables o dos o
ms diferentes poblaciones.

48

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

2 - MEDIDAS

DESCRIPTIVAS

Como una gua para su interpretacin se puede tomar el siguiente esquema:

0%

70%

30%
Datos poco variables
u homogneos

Datos variables
o heterogneos

100%
Datos muy variables ---.
o muy heterogneos

De otra forma:
Si

S~

entonces el conjunto de datos es poco variable u homogneo


con relacin a la media.

O.3X

Si O.3X < S
Si S>0.7X

O. 7X

entonces el conjunto de datos es variable o heterogneo con


relacin a la media.
entonces el conjunto de datos es muy variable o muy
heterogneo con relacin a la media.

Ejemplo 2.14 Considerando la situacin del ejemplo 2.1, se calcula el coeficiente


de variacin:
Datos del primer muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT) -+ CV = 2,5 x100%


6,4

= 39,1 % (UNT) o S = 0,39 X

Con un dato adicional:

12 (UNT) -+ CV=.-L x100%


7,1

= 42,3% (UNT) o S = 0,42 X

Con otro dato adicional:

150 (UNT) -+

CV = 47, 7xl 00% = 207,4% (UNT) o S


23

= 2,07 X

Con otro dato adicional:


320 (UNT)

-+ CV= 104,1 x100% = 197,6% (UNT) o S = 1,97 X


52,7

Para el primer conjunto de datos el CV = 39%, indica que los datos presentan
variacin con relacin a la media. A medida que se consideran datos extremos en
el muestreo, el CV toma valores de 207% y 197%, que indica una gran variacin
de los mismos con relacin a la media.
El coeficiente de variacin aumenta considerablemente a medida que la distancia
entre la media y la desviacin estndar crecen.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

49

VIVIANA VARGAS FRANCO

Ejemplo 2.15 Considerando los datos presentados en el ejemplo 2.8: Se evalan


dos reactores en paralelo para tratamiento de agua potable, en la variable color
real en Unidades de Platino Cobalto (UPC), generando las siguientes series
de datos:
Reactor 1: 10; 12; 10; 12; 8; JO; 8 UPC
Reactor 2: 58; 2; 2; 2; 2; 2; 2 UPC
En la Tabla 2.9 se presentan las principales medidas de tendencia central y
dispersin para este conjunto de datos.
Tabla 2.9

Medidas descriptivas para la comparacin de dos reactores para


potabilizacin de agua, en color real.

Medidas
descriptivas
Media
Mediana
Media geomtrica
Moda
Rango
Varianza
Desviacin estndar
Coeficiente de variacin

Smbolo
matemtico
X

Me
Xg

Mo
R

SZ
S

e.v.

Reactor 1

Reactor 2

10 UPC
10 UPC
9,9 UPC
10 UPC
4 UPC
2,7 UPC 2
1,6 UPC
16,3 %

10 UPC
2 UPC
3,2 UPC
2 UPC
56 UPC
448 UPC 2
21,2 UPC
211,7 %

A pesar de tener los mismos promedios en color real, los dos reactores presentan
eficiencias bastante diferentes, tal como se puede evidenciar en las medidas de
dispersin. El rango para el primer reactor es 4 UPC Y para el segundo es 56 UPC,
10 cual evidencia que en los datos del segundo reactor la distancia entre el valor
mnimo y el valor mximo es mucho mayor que la del reactor 1.
La desviacin estndar, esto es, el promedio de la distancia de los datos con respecto
a la media, es 1,6 UPC para el primer reactor y 21,2 UPC para el segundo reactor. Es
decir, los datos se alejan de la media en 1,6 UPC para el primer reactor y se alejan
21,2 UPC para el segundo reactor, lo cual permite concluir que existe una mayor
variacin en el reactor 2.
El coeficiente de variacin es tambin un buen indicador del grado de variacin de
los datos en relacin con la media; para el reactor 1 es 16,3% y para el reactor 2 es
211,7%. Un CV=16,3% significa que el conjunto de datos es homogneo para el caso

50

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

2-

MEDIDAS DESCRIPTIVAS

del reactor 1; sin embargo, un CV= 211,7% significa gran variacin o heterogeneidad
en el conjunto de datos, para el caso del reactor 2.
Tambin, las medidas de centralidad, como la mediana, la media geomtrica y la
moda, indican el grado de variacin de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor 2.
En general las medidas descriptivas permiten resumir adecuadamente un conjunto de
datos en medidas de centralidad y medidas de dispersin que permiten caracterizar
el fenmeno en estudio. Adicionalmente es necesario estudiar la distribucin del
conjunto de datos, tal como se desarrolla en el prximo captulo.

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

51

CAPITULO

2-

MEDIDAS DESCRIPTIVAS

del reactor 1; sin embargo, un CV= 211,7% significa gran variacin o heterogeneidad
en el conjunto de datos, para el caso del reactor 2.
Tambin, las medidas de centralidad, como la mediana, la media geomtrica y la
moda, indican el grado de variacin de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor 2.
En general las medidas descriptivas permiten resumir adecuadamente un conjunto de
datos en medidas de centralidad y medidas de dispersin que permiten caracterizar
el fenmeno en estudio. Adicionalmente es necesario estudiar la distribucin del
conjunto de datos, tal como se desarrolla en el prximo captulo.

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

51

CAPTULO

3
Distribucin de frecuencias

Las medidas de tendencia central y dispersin resumen el conjunto de datos en


uno o varios indicadores estadsticos, perdindose la tendencia y las frecuencias
de agrupacin de los datos. Esta limitacin se soluciona con el estudio de la
distribucin de frecuencias, que consiste en describir numrica y grficamente la
forma y composicin del agrupamiento del conjunto de datos. La distribucin de
frecuencias puede realizarse para una, dos o ms variables. En el caso de una variable
se denomina distribucin univariada, en el anlisis de dos variables se denomina
distribucin bivariada y para ms de dos se denomina distribucin multivariada.
La manera de construir la distribucin de frecuencias puede resultar tediosa, si se
realiza manualmente y si el nmero de datos es considerablemente grande; para
ello se recomienda el uso de software estadstico. Sin embargo, en este captulo
se desarrollarn ejemplos que ilustran la forma de construir la distribucin de
frecuencias de forma manual y en el captulo lOse presenta el proceso con el
software SPSS.

3.1 Distribucin de frecuencias univariadas


Corresponde a la agrupacin de una sola variable a travs de categoras o intervalos,
de tal forma que se presentan las frecuencias o repeticiones en cada una de ellas.
En el caso de una variable discreta, los datos se agrupan en categoras, mientras que
para una variable continua se agrupan en intervalos.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

53

VIVIANA VARGAS FRANCO

3.1.1

Distribucin de frecuencias univariadas


para una variable discreta

Para generar la distribucin de frecuencias en una variable discreta se deben seguir los
pasos que se describen a continuacin, los cuales permiten organizar la distribucin
de los datos en una tabla de cinco columnas:
Paso 1: Identificar los valores diferentes que toma la variable y escribirlos en la
primera columna de la tabla, en orden ascendente. Se denotar por k el nmero
de valores diferentes que se encuentran en el conjunto de datos y se denotarn por
Xl' X]' X 3 , .... , X k_ 1' X k. En esta columna no deben haber valores repetidos.
Paso 2: La segunda columna consiste en calcular la frecuencia absoluta, ni' que es
el nmero de veces que se repite el valor Xi en el conjunto de datos. La suma de
los ni es igual al nmero total de datos en anlisis. Por ejemplo, el valor de n 3 es el
nmero de veces que se repite la observacin X 3 en el conjunto de datos.
Paso 3: El clculo de la frecuencia absoluta acumulada, Ni' consiste en diligenciar
la tercera columna y es equivalente a sumar los valores menores o iguales de las
frecuencias absolutas, ni' de cada valor Xi' como se presenta a continuacin.
N =n
N]

= NI + n} = nI + n]

N3

= N 2 + n 3 = nI + n 2 + n 3

:
:

N k_ =Nk _] + n k _

= n + n] + n 3 + ..... + n k _] + n k _1

N k =Nk _ + n k = nI + n] + n 3 + ..... + n k _ 1 + n k = n

Por ejemplo, el valor N 4 es el nmero de datos que tienen valores menores o iguales

aX4
En este caso se debe cumplir la desigualdad de la ecuacin 3.1.
nI =N ~N2 ~N3""'" ~Nk_ ~Nk= n

(3.1)

Paso 4: La cuarta columna consiste en calcular la frecuencia relativa, hi , la cual es


el valor relativo o porcentual, que representa el valor de cada Xi . Generalmente este
valor se multiplica por 100%, tal como se ilustra a continuacin:

54

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTULO

3-

DISTRIBUCiN DE FRECUENCIAS

n,

h,=-lOO%
n

:
n

hk _ ]=~lOO%
n

Por ejemplo el valor de h3 es el porcentaje de veces que aparece la observacin


X 3 en el conjunto de datos.
La suma de todos los valores h debe ser 100%. En el caso que cada h no sea haya
multiplicado por 100%, la suma debe ser 1.
Paso 5: La quinta columna consiste en calcular la frecuencia relativa acumulada,
H, que es equivalente a sumar los valores menores o iguales de las frecuencias
relativas de cada valor X , como se presenta a continuacin.
H] =h
H 2 = H + h 2 = h + h 2
H3

= Hz + h3 = h + h 2 + h3

H k_ =Hk_2 + h k_ = h + h 2 + h3+ .... + h k_2 + h k_


Hk =Hk_+hk=h+hz+h; + .... +hk _+hk=l lOO%

Por ejemplo, el valor de H 4 es el porcentaje de datos que tienen valores menores o


iguales a X 4
En este caso se debe cumplir la desigualdad de la ecuacin 3.2.
(3.2)

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

55

VIVIANA VARGAS FRANCO

Siguiendo los pasos del 1 al5 se construye la Tabla 3.1, que representa la distribucin
de frecuencias para una variable cuantitativa discreta, presentando un buen resumen
del conjunto de datos de la muestra o poblacin estudiada.
Tabla 3.1

Distribucin de frecuencias para una variable discreta.

Valores
de la
variable
X;

Frecuencia
absoluta
n;

Xl

Frecuencia
absoluta
acumulada
;

Frecuencia
relativa

Frecuencia
relativa
acumulada 1%1
;

N;=n
;= I

n;
h;=-100%
n

H;=h;

nI

NI

hl

Hl

Xz

nz

Nz

hz

Hz

Xl

n]

N]

h]

H]

X k_l

nk_l

N k_l

h k_l

H k_1

Xk

nk
k
n;=n

Nk=n

hk
k
h;=100%

H k= 100%

Totales

;~1

--

;=1

;-1

--

Cuando se tiene un nmero considerable de categoras en una variable discreta se


procede a generar intervalos para construir la tabla de distribucin de frecuencias,
debido a que al utilizar la metodologa descrita anteriormente se genera una
distribucin poco significativa, pues es posible que cada dato presente una o
dos repeticiones, 10 que generara una tabla casi igual al conjunto de datos
analizados.
3.1.1.1

Medidas de tendencia central y dispersin


para datos agrupados en una variable discreta

Cuando se tiene una tabla de frecuencias para una variable discreta, es posible estimar
a partir de la informacin de la distribucin, algunas medidas descriptivas tales como:
media, varianza, desviacin estndar y coeficiente de variacin.
La media se puede calcular utilizando la distribucin de frecuencias de la Tabla 3.1,
a travs de la ecuacin 3.3.

56

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

XII'

3-

DISTRIBUCiN DE FRECUENCIAS

(3.3)

X'" : media calculada con datos agrupados


La varianza para datos agrupados se puede calcular a travs de la frmula de la
ecuacin 3.4.

n-l

;-/

El valor de h; debe utilizarse sin porcentaje (%), tanto para el clculo de la media
como de la varianza.
A partir de estas dos medidas se pueden estimar la desviacin estndar y el coeficiente
de variacin; su conceptualizacin, interpretacin y unidades son similares a las
presentadas en el Captulo 2.
3.1.1.2

Representacin grfica de la distribucin para una variable discreta

Grfica de frecuencias absolutas


Esta grfica se construye ubicando los diversos valores de la variable en el eje X, en
el eje y] la frecuencia absoluta y en el eje Y2 la frecuencia relativa, o viceversa, tal
como se observa en la Figura 3.1. Esta grfica muestra la tendencia de la distribucin
de los datos.

Grfica de frecuencias acumuladas


Esta grfica coincide con la funcin discontinua escalonada. En el eje X se ubican
los valores que toma la variable X, en el eje Y la frecuencia relativa acumulada y
en el eje Y2 la frecuencia absoluta acumulada, o viceversa. Tal como se presenta en
la Figura 3.2.
Segn esta grfica el valor de H" es el porcentaje de datos que tienen valores menores
o iguales a X".

(Ver Figura 3.1 y Figura 3.2 en la pgina siguiente)

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

57

VIVIANA VARGAS FRANCO

Y
hJ%)

Y
ni

nj

h3

n3

h2

n2

hk

hk _ 1

X X

X2

XI

k_1

nk

t nk _ 1

Xk

Variable X

Figura 3.1 Grfica de frecuencias absoluta y relativa para una variable discreta.

hK =100%
Y,
H K_ I

o---e
o---e
o---e

H K _]

H4

H3
H]

o---e
o---e
o---e
o---e
XI

X]

X3

X4

Nk=n
Nk_1
Nk _]

N4

N3
N]
N
X k _] X k _ 1

Xk

Variable X

Figura 3.2 Grfica de frecuencias acumuladas para una variable discreta.

58

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

3 - DISTRIBUCiN

DE FRECUENCIAS

Ejemplo 3.1 Se tomaron muestras de coliformes totales, mediante el mtodo


de filtracin por membrana, para la estimacin de la calidad del aire en los
predios de la Universidad Nacional de Colombia-Sede Palmira y se encontr
la siguiente serie de datos: 23; 10; 47; 47; 232; 156,' 99; 47; 156; 23; 47 Y
99 UFC/m 3 .
Considerando que la variable coliformes totales es una variable cuantitativa
discreta, se utilizan los pasos descritos anteriormente para construir la tabla y
grficas de distribucin de frecuencias. La Tabla 3.2 presenta la distribucin
de frecuencias, donde se puede analizar que el 75% de los datos toman valores
menores o iguales a 99 UFC/m 3, el valor de 232 UFC/m 3 tiene una frecuencia
de un dato en la muestra y corresponde a un porcentaje del 8,3%, y el valor de
47 UFC/m 3 tiene una frecuencia de cuatro muestras equivalentes a un porcentaje
del 33,3%.

Tabla 3.2

Coliformes
totales
XI

Distribucin de frecuencias para coliformes totales en el anlisis


de la calidad de aire en la Universidad Nacional de Colombia-Sede
Palmira.
Nmero de
datos de
coliformes
totales
ni

Datos
acumulados de colifor
mes totales
;

N I = ni
1- 1

%de datos de
coliformes
totales
ni
hl =-100%
n

%de datos acumulados de coliformes


totales
I

HI=h (%)
1- 1

10

8,3

8,3

23

16,7

25,0

47

33,3

58,3

99

16,7

75,0

156

11

16,7

91,7

232

12

8,3

100%

Totales

n=12

--

100%

--

La Figura 3.3 muestra la grfica de frecuencias absoluta y relativa, no acumuladas,


donde se puede analizar que la mayor frecuencia la presenta el valor de 47
UFC/m 3, con una frecuencia absoluta de cuatro datos y una frecuencia relativa
de 33,3%, y con menores frecuencias los valores de 10 UFC/m3 y 232 UFC/m 3
con frecuencias absolutas de un dato y frecuencias relativas de 8,3 %.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

59

VIVIANA VARGAS FRANCO

h(%)

ni

33,3

16,7

2
~

8,3

10

23

47

99

Coliformes IOlales (UFC/m

156

232

J
)

Figura 3.3. Frecuencias absoluta y relativa para el estudio de calidad de aire


en coliformes totales en la Universidad Nacional de Colombia-Sede
Palmira.
La Figura 3.4 presenta la grfica de frecuencias acumuladas, donde se analiza que
el 58,3% de los datos son menores o iguales a 47 UFC/m 3 y el 91,7% de los datos
son menores o iguales a 150 UFC/m 3
HJ%)

Ni

100
91,7
75,0

58,3

0----0

25,0

o
o

o
o

9
7

0-----0

8,3~
10

12
11

23

47

99

150

232

Coliformes IOlales (UFC/m J)

Figura 3.4. Frecuencias absoluta y relativa acumuladas para el estudio de calidad


de aire en coliformes totales en la Universidad Nacional de ColombiaSede Palmira.

60

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

3-

DISTRIBUCiN DE FRECUENCIAS

Utilizando las ecuaciones 3.3 y 3.4 para el clculo de la media y la varianza


considerando datos agrupados, se presentan a continuacin estas medidas para
coliformes totales en el anlisis de calidad de aire:
6
n X
s I

= 82,2 (UFC 1m3 )

n ( ) ( -

82,2/

a l

=> S ag = 68,1 (UFC 1m3)

= ----11----

S ag

Con la frmula alterna:

Sa~

= h ()(- 82,2/ = 4649,8 (UFC I m 3/

=> S ag = 65,2 (UFC 1m3)

= I

El coeficiente de variacin se puede estimar a partir de los anteriores valores:

CV=82,8%
La media de coliformes totales es 82,2% (UFC/m 3) , con desviacin estndar
de 68 ,1 (UFC/m 3) y coeficiente de variacin de 82,8%, lo que indica gran
dispersin del conjunto de datos con relacin a la media. Aunque generalmente
debido a la gran variacin de la variable coliformes se sugiere el uso de la media
geomtrica.

3.1.2

Distribucin de frecuencias univariadas


para una variable continua

En el caso de una variable continua, los datos se agrupan en intervalos o clases


para definir la distribucin de frecuencias. Los criterios de frecuencias: absolutas
y relativas, acumuladas y no acumuladas, son los mismos que para el caso de una
variable discreta, analizada anteriormente. La diferencia consiste en la definicin
de intervalos y el concepto de marca de clase, as mismo la representacin grfica
tiene algunas particularidades. La definicin de los intervalos la puede hacer el
investigador, de acuerdo con su conocimiento sobre la variable o el inters por
rangos especficos. Tambin se pueden utilizar algunas reglas que permiten estimar

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

61

VIVIANA VARGAS FRANCO

el nmero de intervalos. A continuacin se presentan los pasos para la definicin


de los intervalos, la marca de clase y la forma de construccin de la tabla de
frecuencias.

Paso 1: Estimar el nmero de intervalos a considerar; esto se puede hacer de dos


maneras: que el investigador defina el nmero de intervalos que requiere, o utilizar
como gua la ecuacin 3.5, donde k es el nmero aproximado de intervalos y n es
el nmero de datos de la variable analizada.

= 1 + 3,3 Ig( n )

(3.5)

El valor de k generalmente toma valores decimales, por lo tanto es necesario


aproximarlo a un valor entero ; el nmero de intervalos es un valor entero, se
deben hacer 4 5 intervalos y no 4,5. Otra opcin para hallar el nmero de
Se recomienda aproximar este valor
intervalos es utilizando la frmula: k =
al mayor entero. En general la literatura recomienda usar entre cinco y veinte
intervalos

rn.

Paso 2: Una vez definido el nmero de intervalos, se requiere estimar la longitud de


cada intervalo. Se recomienda que la longitud sea igual en cada uno de los intervalos,
pues esto facilita la interpretacin de la distribucin de frecuencias. La longitud de
cada intervalo se calcula mediante la ecuacin 3.6.

L=JL

Donde R es el rango; R

= X mx -

(3.6)

X min Y k el nmero de intervalos a elaborar.

A continuacin se presentan los pasos para la definicin de los intervalos, la marca


de clase y la construccin de la tabla de frecuencias.

Paso 3: Definir los lmites de cada intervalo, se inicia con el valor inicial X o, que
puede ser definido como el valor mnimo del conjunto de datos, o como el menor
valor entero al valor mnimo, con el fin de que los lmites de los intervalos tengan
valores enteros y esto facilite la interpretacin de la distribucin de frecuencias.
Los intervalos deben definirse con la notacin matemtica de conjuntos, pues esto
evitar ambigedades en la ubicacin de cada dato en particular, tal como se presenta
a continuacin:

62

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPiTULO

primer intervalo

[Xo, XI]

segundo intervalo

(XI, Xzl

tercer intervalo

(X2 , Xl]

(k -1) simo intervalo (Xk -

2,

3 - DISTRIBUCiN

DE FRECUENCIAS

X k -)

k-simo intervalo
Cada lmite se calcula sumndole la longitud del intervalo al lmite anterior:
XI

= X o + L;

X 2 = Xl

+ L; :::::; X k- I = X k- 2 + L; X k = X k- I + L

Paso 4: Calcular la marca de clase, que se define como el punto medio de cada
intervalo, y se calcula mediante la ecuacin 3.7.

X'I

(3.7)

Paso 5: Construir la distribucin de frecuencias como se presenta en la


Tabla 3.3:
La primera columna consiste en enumerar los intervalos definidos con la
ecuacin 3.5.
La segunda columna es la definicin de los intervalos construidos sobre la base
de los pasos 2 y 3, descritos anteriormente.
La tercera columna es la marca de clase definida en el paso 4.
La cuarta columna es la frecuencia absoluta, ni' que consiste en contar el nmero
de datos de la muestra o poblacin que se encuentran en cada intervalo.
La quinta columna es la frecuencia absoluta acumulada, N, definida como el
valor acumulado del nmero de datos en cada intervalo.
La sexta columna es la frecuencia relativa, h, definida como la representacin
porcentual de cada intervalo.
La sptima columna es la frecuencia relativa acumulada, H i , que consiste en el
valor acumulado de las representaciones porcentuales, h, en cada intervalo.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

63

VIVIANA VARGAS FRANCO

Tabla 3.3. Distribucin de frecuencias univariadas para una variable continua.

Nmero
del
intervalo

Intervalo
(X;-J,XJ

Marca
de
clase

Frecuencia
absoluta

Frecuencia
relativa

X' I.

Frecuencia
absoluta acu
mulada

N=n

Frecuencia
relativa
acumulada

h=nln (%) H=h


; =1

= /

{Xo,Xti

x',

n,

N,

h,

H,

:z

(X"Xz]

X'z

nz

Nz

hz

Hz

(Xz' X,]

X'J

nj

Nj

hj

Hj

k-l

(X. _l , X. _ti

X'. _,

nk _ 1

N. _,

h. _,

H. _,

(X. _"X.]

x'.

n.

N.=n

h.

H.=IOO%

--

Totales

--

--

100%

--

3.1.2.1 Medidas de centralidad y dispersin para datos agrupados


en una variable continua
Media, para datos agrupados de una variable continua se calcula utilizando la
ecuacin 3.8.
k

X ag =

n;X/

n;X/

;=1

;-1

ni

=h;X/

; =1

(3.8)

;=1

El clculo de la media a travs de la tabla de frecuencias genera un error en relacin con


la media de los datos originales, pues como se puede analizar de las frmulas, se supone
que la marca de clase es un representante de cada intervalo. Este error se denomina
error de agrupacin, que es equivalente al error relativo de un nmero aproximado y
se calcula con la frmula de la ecuacin 3.9. Para calcular el error de agrupacin de la
media se debe calcular la media del conjunto de datos sin agrupar.

IEagl = X-X
X ag I100%

(3.9)

Siempre que X:f:: O

64

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

3-

DISTRIBU CiN DE FRECUENCIAS

Varianza, para datos agrupados de una variable continua se calcula utilizando la


frmula de la ecuacin 3.10.
k

nJX/-X"gl nJX:"'X"gl
Sl=
"11

.....:/:.....-...:..'-----

(fn,)-l

/- 1

n-l

-::::.'Lh/(x/-x.l

/-/

(3.10)

/- /

El error de agrupamiento para la varianza se presenta en la ecuacin 3.11. Para


calcularlo se debe hallar la varianza de los datos sin agrupar.

(3.11)

Siempre que S #: O
Desviacin estndar, para datos agrupados de una variable continua se calcula
utilizando la frmula de la ecuacin 3.12.

(3.12)

El error de agrupamiento para la desviacin estndar se presenta en la ecuacin 3.13.


Para calcularlo se debe hallar la desviacin estndar de los datos sin agrupar.

(3.13)

Siempre que S #: O
En general, se puede decir que los datos estn bien agrupados si el error de agrupacin
presenta valores menores al 30%, medianamente bien agrupados si ste se encuentra
entre 30% y 70% Yun deficiente agrupamiento para errores mayores a 70%, tal como
se ilustra a continuacin:

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

65

VIVIANA VARGAS FRANCO

70%

30%

0%

Datos bien
agrupados

Datos medianamente
bien agrupados

100%

Agrupacin
deficiente

Mediana, cuando los datos se agrupan en intervalos de clase, la mediana no puede


calcularse en forma exacta; sin embargo, si se supone que las observaciones en cada
intervalo estn distribuidas uniformemente, puede obtenerse una aproximacin de
la mediana.
El primer paso consiste en localizar el intervalo que contiene el valor de la mediana,
es decir, saber dnde se halla el 50% de los datos, o dnde se encuentra la mitad de
ellos. La mediana se calcula a travs de la ecuacin 3.14 utilizando las frecuencias
absolutas, o la ecuacin 3.15 empleando las frecuencias relativas.

-2- N1-1

1(L)

(3.14)

+O'5 - H 1-1 1/L I

(3.15)

Me:: X I _ 1 +

M :::: X
,-

I-J

n ni

h1

.' '/

Donde:
X;-J

Lmite inferior del intervalo que contiene el valor de la mediana

Nmero de observaciones en el conjunto de datos

X; -1

Frecuencia absoluta acumulada hasta el intervalo anterior a la clase que


contiene la mediana

ni

Frecuencia absoluta del intervalo donde se encuentra la mediana

H-l

Frecuencia relativa acumulada hasta el intervalo anterior a la clase que


contiene la mediana (sin porcentaje)

Frecuencia relativa del intervalo donde se encuentra la mediana (sin


porcentaje)

Longitud del intervalo donde se encuentra la mediana

66

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

.!J

CAPfTULO

3.

DISTRIBUCiN DE FRECUENCIAS

Moda, similarmente como se calcul la mediana, la moda se puede estimar a partir


de la tabla de distribucin de frecuencias. El primer paso consiste en identificar
el intervalo donde se encuentra la moda, es decir, el intervalo que tenga la mayor
frecuencia absoluta o relativa. Una vez determinado el intervalo modal, la moda se
puede estimar a partir de la ecuacin 3.16.

(3.16)

Donde:
X; -

lmite inferior del intervalo que contiene el valor de la moda

dI =Ini - ni-! I

diferencia entre la frecuencia absoluta del intervalo modal y la


frecuencia absoluta del intervalo precedente.

d] = Ini - nj+ 1I

diferencia entre la frecuencia absoluta del intervalo modal y la


frecuencia del intervalo siguiente.

longitud del intervalo donde se encuentra la moda

Si la longitud de los intervalos es igual, se pueden considerar las frecuencias relativas


(sin porcentaje), tal como se presenta a continuacin:

3.1.2.2

Representacin grfica de las frecuencias para una variable continua

En el caso de una variable continua las grficas de la distribucin de frecuencias


tienen nombre especfico y juegan un papel protagnico para estimar la tendencia
de la distribucin poblacional y tienen una fuerte incidencia en los procesos de:
inferencia, clculo de probabilidades, estimacin de intervalos de confianza y pruebas
de hiptesis, entre otros.
Histograma, es la representacin grfica de los intervalos en el eje X y las frecuencias
relativa y absoluta en los ejes YI y y], como se presenta en la Figura 3.5. Con el
histograma se puede analizar la tendencia de los datos y es la primera aproximacin
a la forma de distribucin poblacional del conjunto de datos.
Polgono de frecuencias, es la representacin grfica de la marca de clase de cada
intervalo en el eje X y las frecuencias relativa y absoluta en los ejes YI y y], como
se presenta en la Figura 3.6. Se puede dibujar sobrepuesta al histograma o en forma
separada. El polgono de frecuencias permite estudiar la forma de la distribucin

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

67

VIVIANA VARGAS FRANCO

de frecuencias, y a partir de la forma se pueden inferir algunas caractersticas


importantes, tales como la simetra con relacin al centro del conjunto de datos.

h,f")

",

hJ

"J

h,

"1

h,

"1

hk

nk

Xo

X,

XJ

Xl

Xk _ 1 X k

Variable X

Figura 3.5. Histograma, grfica de los intervalos de clase vs. las frecuencias
absoluta y relativa.

n/

h,(%)

hJ
h1

h'l

"

hk _ 1

X'3

ni
nk _ 1

..

hk t

X/ x/

n
n1

X/_
I

t nk

x'
k

Variable X

Figura 3.6. Polgono de frecuencias , grfica de las marcas de clase vs. las
frecuencias relativas y absolutas.

68

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

3 - DISTRIBUCiN

DE FRECUENCIAS

Ojiva es la representacin grfica de cada lmite de clase en el eje X y la frecuencia


relativa y absoluta acumulada en los ejes Y Y Yz, como se observa en la Figura 3.7.
La ojiva se puede presentar para valores mayores o iguales (a) o para valores menores
o iguales al lmite superior de cada intervalo (b).

H(%)

Variable X

(a) Ojiva, para valores menores o iguales

H(%)

Ni

NJ=n

H J=100%
H1

N1

HJ

NJ

H4

N4

------e

Xk _ J
Variable X

(b) Ojiva, para valores mayores o iguales

Figura 3.7 Ojiva, grfica de los intervalos y las frecuencias relativa y absoluta
acumuladas.

ESTADIsTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

69

VIVIANA VARGAS FRANCO

A partir de la grfica de la ojiva es posible obtener en forma aproximada el


valor de la mediana. sta es el valor que divide la distribucin en dos partes
iguales, es decir, el 50% de los datos estn por encima de la mediana y el 50%
de los datos estn por debajo de la mediana. Ubicando el valor del 50% en el
eje Y, se estima en el eje X el valor de la mediana en forma aproximada, como
se presenta en la Figura 3.8.

HJ%)

NI

Nk=n
Nk _ J

100%
HK_J

HJ
50%

NJ

H2

N2

HJ

NJ

Xo

XJ

X2

Xk _ J

XJ

Me =

Xk

valor de la mediana

Variable X

Figura 3.8 Estimacin de la mediana a partir de la ojiva.


Ejemplo 3.2 Los datos de la Tabla 3.4 corresponden a un muestreo de
ruido ambiental del nivel de presin sonora (LP) medida en decibeles
(dE) en diferentes estaciones de la ciudad de Cali durante el da (LPD) y
la noche (LPN).
Como el nivel de presin sonora es una variable cuantitativa continua, se procede
a realizar los pasos para construir la tabla de frecuencias, el histograma y la ojiva,
tanto para el nivel de ruido en el da y en la noche.
Anlisis para el nivel de presin sonora de la ciudad de Cali durante el da (lPO)

El nmero de intervalos se estima utilizando la ecuacin 3.5:


k

70

= 1 + 3,3 19(50) = 6,6:::::

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

Tabla 3.4

DISTRIBUCiN DE FRECUENCIAS

Muestras del nivel de presin sonora de ruido medida en decibles (dB)


en diferentes estaciones de la ciudad de Cali. (LPD, en el da; LPN,
en la noche).

N' dI estlci6n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

3 -

LPD(dB)

LPN(dB)

63,7
66,9
66,8
75,3
70,8
75,0
76,3
75,0
71,4
77,4
71,6
70,5
73,7
71,0
56,1
69,0
72,1
74,1
76,5
57,3
71,6
67,2
62,3
69,4
60,5

56,6
60,2

26
27

56,0
72,3
67,2
68,3
67,3
69,4
72,3
70,7
65,7
65,1
65,9
64,7
54,1
63,1
68,5
71,0
71,0

28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

N dllStlci6n

55,4
67,4
63,5
55,5
64,5
60,7

LPD(dB)

LPN(dB)

65,1
55,3
71,3
72,3
64,6

57,6
47,1
61,7
72,8
54,6
55,8
70,7
60,0
68,3
69,9
59,8
44,2
52,7
56,6
70,0
49,6
57,7
63,0
42,0
44,6
52,7
54,4
50,6
62,7
49,1

59,6
70,6
65,3
74,0
74,9
64,1
53,3
62,5
62,3
75,4
61,1
65,9
62,6
50,2
50,9
62,0
64,0
58,7
68,2
61,6

Es decir, se construirn siete intervalos en la tabla de frecuencias. La longitud de


cada intervalo se estima a partir de la ecuacin 3.6:
L

= X mx -Xmn = 27,2 = 39::::: 4dB


k

7'

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

71

VIVIANA VARGAS FRANCO

Esto es, la longitud de cada intervalo ser de 4 dB. Considerando que el valor mnimo
es de 50,2 dB, se selecciona el menor entero al valor mnimo como el valor de X o,
es decir:

X o=50dB
A partir del valor mnimo se generan los lmites superiores de los intervalos:
Xl = X o + L = 50 + 4 = 54 dB

X 2 = X + L = 54 + 4 = 58 dB
X 3 = X 2 + L = 58 + 4 = 62 dB
X 4 = X3 + L = 62 + 4 = 66 dB

X s = X 4 + L = 66 + 4 = 70 dB
X = X s + L = 70 + 4 = 74 dB

X 7 =X +L= 74+4= 78dB


Las marcas de clase se construyen como el valor medio de los intervalos de clase:

X;

50+54
Xo+X
=52dB
=
2
2

X'=
2

X+X2
2

54+58
2

=56dB

y as sucesivamente hasta llegar a la ltima marca de clase:

X;

X +X7
2

74 + 78 = 76dB
2

A partir de los anteriores valores se genera la Tabla 3.5 de distribucin de


frecuencias. La columna de frecuencias absolutas consiste en contar el nmero de
datos que se encuentra en cada intervalo dentro del conjunto de datos analizado,
por ejemplo n = 3, es el nmero de datos de la muestra que se encuentran en
el intervalo [ 50,54 J dB, que en porcentaje, frecuencia relativa, corresponde a
h = %0 100% = 6%, es decir, el 6% de los datos se hallan en este intervalo.
El valor de N s = 29 significa que 29 datos son menores o iguales a 70 dB Yen trminos
porcentuales representan el 58% de los datos y el valor de H 4 = 46% significa que
el 46% de los datos son menores o iguales a 66 dB.

72

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPfTULO

Tabla 3.5.

3 - DISTRIBUCiN

DE FRECUENCIAS

Distribucin de frecuencias para el nivel de presin sonora en el da


en la ciudad de Cali.

Nmero
del
intarvalo

Intervalos de
ruido

Marca

(X_oX)

clasa

(dB)

x.',

de

Nmero de
datos por
intervalo
da ruido

Nmero de
datos
acumulados
por intervalo de
ruido

ni

N=n;

Porcentaje de
datos por
intervalo de ruido

h=nln(%)

Porcentaje
acumulado de
datos por
intervalo
de ruido
;

H=h l (%)
;=1

1-1

[50,54]

52

(54,58]

56

12

(58,62]

60

12

12

24

(62,66]

64

11

23

22

46

(66,70]

68

29

12

58

(70,74]

72

12

41

24

82

(74, 78]

76

50

18

100

--

Totales

---

50

---

100%

---

La Figura 3.9 presenta el histograma para el nivel de presin sonora en el da en


la ciudad de Cali, donde se puede apreciar que las mayores frecuencias se dan en
los intervalos de ruido entre (62, 66JdB y (70, 74JdB, con frecuencias relativas del
22% y el 24%, respectivamente. Las menores frecuencias se dan en los intervalos
[50,54JdB y (54,58JdB con frecuencias relativas del 6%.
La Figura 3.10 presenta la ojiva, que consiste en graficar los lmites superiores de
cada intervalo versus los valores de frecuencia relativa acumulada. Aqu se puede
analizar que el 46% de los datos tienen niveles de ruido menores o iguales a 66dB
y el 82% niveles de ruido menores o iguales a 74dB.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

73

VIVIANA VARGAS FRANCO

25
~
20
~

.~
ji 15
~
.~

"';:s"
'"
"~
lt.,

r----1

10
5
O

50-54

54-58

58-62

62-66

66-70

70-74

74-78

Niveles de ruido LPD (dB)

Figura 3.9 Histograma de niveles de ruido en el da para la ciudad de Cali.

~ 100

i5

90
80

70
60

..s;:s

.~ 50

Ji

40

30
20

<\)

.~
<ll

~
~

la
O~I~~-:~~~--~--~~--~-54
58
62
66
70
78
74

Niveles de ruido LPD (dB)

Figura 3.10 Ojiva para los niveles de ruido en el da para la ciudad de Cali.

A continuacin se presentan algunas medidas de centralidad y dispersin para la


medicin de ruido en el da.
Como el nivel de presion sonora se mide en dB (decibelios), paraca\cular las medidas
de centralidad y dispersin se debe tener en cuenta que para promediar el nivel de
presin sonora es necesario utilizar la ecuacin 3.17:

LP=101og

74

[1n

~
O,I.LP]
~10

(3.17)

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTULO

3 - DISTRIBUCiN

DE FRECUENCIAS

Donde:

LP

Nivel de presin sonora equivalente.

Nmero de mediciones.

LP

Nivel de presin.

Es decir, el nivel de presin sonora (LP) no se puede promediar directamente ya que


esta medida se encuentra en escala logartmica. Es necesario entonces utilizar como
parmetro la ecuacin 3.17. Redefiniendo las ecuaciones 3.8 a la 3.16 con base en
la ecuacin 3.17 y la informacin de la Tabla 3.5, se calculan la media, varianza,
desviacin estndar, mediana y moda.
X ag = 10 /og (-~

L ni. 1(yO,J)(XiV = 70,9dB

-IEagl%

7
':;,;,9

= 0,3%

El valor medio de ruido en el da en la ciudad de Cali es 70,9 dB, el error de


agrupamiento es 0,3% para este estadstico, que significa que la tabla de distribucin
de frecuencias resume muy bien el conjunto de datos.

1159,9159,9
-162,11 %= 1,3%
-1 Eag 1%=112,71~,1/,61 %=0,7%

S;g = 162,ldB2 -IEagl% =

Sag

=12,6dB

La desviacin estndar del nivel de ruido durante el da en la ciudad de Cali es 12,6


dB. La distribucin de frecuencias representa muy bien la variacin del conjunto de
datos, con un error de agrupamiento del 0,7%.

La moda estimada a partir de la distribucin de frecuencias representa adecuadamente


la moda del conjunto de datos, dado que el error de agrupamiento es slo del
3,1% .

Me""'67.3dB
,

-lEag

1%=167,05-67,31
%=04%
,
67,05

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

75

VIVIANA VARGAS FRANCO

El valor de la mediana estimado con la distribucin de frecuencias es un buen


indicador de la mediana del conjunto de datos, pues el error de agrupamiento es tan
solo del 0,4%.
Anlisis para el nivel de presin sonora en la noche (LPNJ

Siguiendo la misma metodologa para el anlisis de ruido en el da, se realiza la


distribucin de frecuencias para el nivel de presin sonora en la noche. La distribucin
de frecuencias se presenta en la Tabla 3.6.
Tabla 3.6 Distribucin de frecuencias para el nivel de presin sonora en la noche
para la ciudad de Cali.
Nmero
del
intervalo

Intervalos
de
ruido

(X_/J X}
(dB)

Marca
de
clase

Datos por
intervalo
de ruido

x.'

Datos
acumulados por
intervalo de ruido
/

N=n

Porcentaje de
datos por interva
lo de ruido

h=nln (%)

Porcentaje acumulado
de datos por intervalo
de ruido
/

H=h/(%)
/- 1

/- 1

[42,47}

44,5

(47, 52}

49,5

14

(52, 57}

54,5

11

18

22

36

(57,62)

59,5

25

14

50

(62,67)

64,5

34

18

68

(67,72)

69,5

13

47

26

94

(72, n)

74,5

50

100

--

Totales

--

50

--

100%

--

La Figura 3.11 presenta el histograma para el nivel de presin sonora en


la noche en la ciudad de Cali, donde se puede apreciar que las mayores
frecuencias suceden en los intervalos de ruido entre (52,57]dB y (67, 72]dB,
con frecuencias relativas del 22% y el 26%, respectivamente. Las menores
frecuencias se dan en los intervalos (42,47]dB y (72, 77]dB con porcentajes
del 6%, respectivamente.

76

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

3 - DISTRIBUCiN

DE FRECUENCIAS

30

~
~

25

.~ 20
.
~
.~

"s:::
<Il

;os

"~
~

15

10
5

O
42-4 7

4 7-52

52-5 7

57-62

62-67

67- 72

72- 77

Niveles de ruido LPD (dB)

Figura 3.11 Histograma del nivel de presin sonora, ruido, medido en la noche en
la ciudad de Cali.
En la Figura 3.12 se presenta la ojiva, que representa la grfica de los lmites
superiores de clase versus los valores de frecuencia relativa acumulada. Donde se
puede analizar que el 50% de los datos tienen niveles de ruido menores o iguales a
62dB y el 94% niveles menores o iguales a 72dB.

.----.

100

~
~

90

~
-S!;:s

80

;;

70

"<:s

60

;:s

.~

50

40

-S!
.~

t.J

30

;:s

20

s:::
<\)
t.J

c..:;

la
O

.----/
54

58

62

66

70

74

78

Niveles de ruido LPD (dB)

Figura 3.12 Ojiva para los niveles de ruido en la noche para la ciudad de Cali.

ESTADISTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

77

VIVIANA VARGAS FRANCO

A continuacin se calculan algunas medidas de centralidad y dispersin para la


medicin de ruido en la noche; como el nivel de presin sonora se mide en dB
(decibelios), para calcular las medidas de centralidad y dispersin se debe tener en
cuenta que para promediar el nivel de presin sonora es necesario utilizar la expresin
de la ecuacin 3.17, y redefinir las ecuaciones 3.8 a la 3.16.
X

ag = 10 log (~ ni. 1ffO,J)(XV = 66,7dB

_1 Eag 1% = 166,166,1
- 66, 7

I = 0,9%

El valor medio de ruido en la noche en la ciudad de Cali es de 66,7 dB Y el error


de agrupamiento es de 0,9% para este estadstico, que significa que la tabla de
distribucin de frecuencias resume muy bien el conjunto de datos.

S;g= 153,8dBl -lEa 1%= 1153,3 -153,81 %= 0,3%

Sag= 12,4dB

153,3

-1 Eag 1%= 112,31~,~2,41 %= 0,8%

La desviacin estndar del nivel de ruido durante la noche en la ciudad de Cali es 12,4
dB. La distribucin de frecuencias representa muy bien la variacin del conjunto de
datos, con un error de agrupamiento del 0,8 %, para este estadstico.

Mo~

68,4dB

Me~62dB

_1 Eag 1%=156,;;;8,4

1%= 20%

-IEagl %= 162,2 - 62

62,2

% =0,3%

Los valores de la moda y la mediana son menores en las horas de la noche que en las
horas del da. El error de agrupamiento de la moda, en este caso, es mucho mayor
que el presentado para el nivel de ruido en las horas del da.
Ejemplo 3.3 La produccin de basura diaria por vivienda y por habitante en el
municipio de Talaigua, departamento de Bolvar, se presenta en la Tabla 3.7.

78

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

Tabla 3.7

Vivienda
No.

3 - DISTRIBUCiN

DE FRECUENCIAS

Datos de produccin de basura diaria en el municipio de Talaigua


(Bolvar) .
No. de
habitantas

Basura
por vivien
da

(kg/dial

Basura por
habitante
(kg/dial

Vivienda
No.

No. de
habitantas

Basura
por vivien
da

(kg/dial

Basura por
habitante
(kg/dial

1.70

0,57

20

3,93

0,65

4,51

0,90

21

4,06

0,51

5,14

1,03

22

4,29

0,86

0,95

0,24

23

10

4.71

0,47

1.73

0,29

24

2,59

0,43

1,08

0,22

25

3,87

1,29

10

8,55

0,86

26

6.75

1,35

3.73

0,47

27

5,83

0.73

8,87

1,11

28

11

10,65

0,97

10

2,72

1,36

29

3,72

0,62

11

1,01

0,14

30

2,18

0,54

12

1,80

0,36

31

1,97

0,49

13

2,26

1,13

32

2,09

1,04

14

6,39

1,28

33

10

5,00

0,50

15

5,43

0.78

34

6,44

1,29

16

3.71

0,53

35

1,14

0,57

17

7,86

1.12

36

3,39

0,38

18

6,67

1,11

37

4,12

0,69

19

4,44

0.74

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

79

VIVIANA VARGAS FRANCO

Anlisis para produccin de basura diaria por vivienda

Siguiendo los pasos para construir la tabla de distribucin de frecuencias, se presenta


en la Tabla 3.8, la distribucin para la produccin de basura producida por vivienda
(kglda).
Tabla 3.8

Nmero
del
intervalo
k

Distribucin de frecuencias para la produccin de basura por vivienda


(kg/da)

Intervalos de
basura por
vivienda

Marca
de
clase

(X./1Xj
(kg/da)

X.',
(kg/da)

Datos por
intervalo
de basura

ni

Datos
acumulados
por intervalo de
basura
;

N;=Ln;
;=1

Porcentaje de
datos por
intervalo de
basura

h;=n;ln(%)

Porcentaje
acumulado de
datos por intervalo de
basura
;

H;=Lh(%)
= I

rO,2]

21,6

21.6

(2,4]

11

19

29,7

51,3

(4,6]

10

29

27,0

78,3

(6,8]

34

13,5

91.8

(8,IO]

36

5A

97,2

(lO,12]

11

37

2,7

99,9

--

Totales

--

37

--

100%

--

El histograma para la produccin de basura por vivienda se muestra en la Figura


3.13, donde se puede analizar que las mayores frecuencias se tienen en los intervalos
(0,2), (2A) Y (4,6) (kg/da), con frecuencias relativas de 21,6%, 29,7% Y 27,0%,
respectivamente. La menor frecuencia se encuentra en el intervalo (10,12) (kg/da),
con un porcentaje del 2,7%.

80

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

3-

CAPfTULO

DISTRIBUCiN DE FRECUENCIAS

35
30

25
.~
.....!:! 20
~

.S! 15
u
~

;:

u
~

10

t:.;

I
I

0-2

2-4

4-6

6-8

8 -10

I
10 - 12

Basura por vivienda (kg/da)

Figura 3.13. Histograma de produccin de basura por vivienda en el municipio de


Talaigua (Bolvar).

La ojiva se muestra en la Figura 3.14, donde se puede analizar que el 51,3% de los
datos son menores o iguales a 4 kg/da por vivienda y el 91,8% de los datos son
menores o iguales a 8 kg/da por vivienda.

100
90
~
~
80
~
-Sl;:
70
t:
;:
<.>
~

60

50

40
30

.9
<.>

s.::

1\)

;:
<.>

J:

20

10

la

12

Basura por vivienda (kg/da)

Figura 3.14. Ojiva de la produccin de basura por vivienda en el municipio de


Ta/aigua (Bolvar) .

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

81

VIVIANA VARGAS FRANCO

A continuacin se presentan medidas de centralidad y dispersin para la medicin


de produccin diaria de basura por vivienda en kg/da, estimados a partir de la
distribucin de frecuencias.

X Qg = 4,2 (kg/da)

-IEQgl % = 0%

S:g = 6,4 (kg/da)

-IEQgl % = 12,3%
EQg % = 4,2%

SQg = 2,5 (kg/da)

-1 1

Me ~ 3,9 (kg/da)

-1 EQg 1% =

Mo ~ 3,5 (kg/da)

-IEQgl % =No existe

0%

El valor medio de produccin de basura por vivienda es 4,2 kg/da, con una
desviacin de 2,5 kglda. La mediana y la moda toman valores de 3,9 kglda y 3,5
kglda, respectivamente. En general, las distribuciones de frecuencias presentan una
buena agrupacin del conjunto de datos, pues se obtuvieron errores de agrupamiento
relativamente pequeos. El error de agrupamiento de la moda no existe, debido a que
en el conjunto de datos no existe moda, a pesar de que este valor se puede estimar
con la tabla de frecuencias.
Anlisis para produccin de basura diaria por habitante

La distribucin de frecuencias para la produccin de basura diaria por habitante para


el municipio de Talaigua (Bolvar), se presenta en Tabla 3.9.
El histograma para la produccin diaria de basura por habitante del municipio de
Talaigua se presenta en la Figura 3.15, donde se puede analizar que la produccin
de basura con mayor frecuencia sucede en el intervalo (O,4-0,6]kg/da, con una
frecuencia relativa del 27%. La produccin con menor frecuencia se da en el intervalo
(O-O,2]kg/da con una frecuencia relativa del 2,7%.
La ojiva para la produccin de basura diaria por habitante se presenta en la Figura
3.16, donde se puede analizar que el 43,2% de los habitantes tienen una disposicin
de basuras menor o igual de 0,6 kglda, el 70,2% tienen una disposicin de basura
menor o igual a 1,0 kg/da y el 86,4% tienen una disposicin menor o igual a 1,2
kglda.

82

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

Tabla 3.9

intervalo

DISTRIBUCiN DE FRECUENCIAS

Distribucin defrecuencias para la produccin de basura por habitante


(kg/da).

Intervalos de Marca
de
basur por
clase
habitente
(X./JX,j
X'1
(kg/dl)
(kg/dI)

Nmero
del

3-

Datos por
intervalo
de basura

ni

Datos
acunwlados
por intervalo
de basura
1

Porcentaje de
datos por
intervalo de
basura

Porcentaje
acumulado
de datos por inter
valo de
basura

N=Ln hl=nln(%)
H1=Lh l (%)
1- /
i- l

[0-0,2}

0,1

2,7

2,7

(0,2-0,4)

0,3

13,5

16,2

(O, 4-0, 6}

0,5

10

16

27,0

43,2

(O, 6-0, 8}

0,7

22

16,2

59,4

(O,8-l)

0,9

26

10,8

70,2

(J-l,2)

1,1

32

16,2

86,4

(J ,2-l,4)

1,3

37

13,5

99,9

--

Totales

--

37

--

100%

--

30
~
~

25

~ 20

15

10

O +------+------r-----~----~r_----~----~----~
1-1,2

1,2 -1,4

Basura por vivienda (kg/da)

Figura 3.15 Histograma de produccin de basura diaria por habitante para el

municipio de Talaigua (Bolvar).

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

83

VIVIANA VARGAS FRANCO

100
~
~

.g
-Sl;:s
E::

;:s

<.;
(]

(]

90
80
70
60

.;:

50

~
~

40

.S!<.;

30

;:s

20

s::
~

"~
~

10
O

0,2

0,4

0,6

0,8

1,2

1,4

Basura por vivienda (Kg/da)

Figura 3.16 Ojiva de produccin de basura diaria por habitante para el municipio
de Talaigua (Bolvar) .

A continuacin se presentan medidas de centralidad y dispersin para la medicin


de basura por habitante en kg/da, estimados a partir de la distribucin de
frecuencias.
X ag = 0,7 (kg/da)

-IEagl%=O%

S:g = 0,1 (kg/da)

-IEagl%=O%

Sag = 0,3 (kg/da)

-IEagl%=O%

Me;:;; 0,7 (kg/da)

-IEagl%=O%
0
-lEag 1%=1
,6-0,51=167%
Q
0,6
'

Mo ;:;; 0,5 (kg/da)

El valor medio de la produccin de basura por habitante es 0,7 kg/da, con una
desviacin de 0,3 kg/da. La mediana y la moda toman valores de 0,7 kg/da y 0,5
kg/da, respectivamente. En general, la distribucin de frecuencias presenta una
buena agrupacin del conjunto de datos, pues se obtuvieron errores de agrupamiento
iguales a cero, excepto para el valor de la moda.

84

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPTULO

3.1.2.3

3 - DISTRIBUCiN

DE FRECUENCIAS

Asimetra y nivel de apuntamiento de las grficas de frecuencias

La suavizacin de los polgonos de frecuencias muestrales son una aproximacin


a la curva de frecuencias poblacional; esta aproximacin es ms precisa a medida
que aumenta el tamafio de la muestra. La Figura 3.17 muestra diversas formas
de tendencia de los datos, generadas a travs de las curvas del polgono de
frecuencias.

a) Simtrica o normal

b) Sesgada a la derecha
(sesgo positivo)

c) Sesgada a la izquierda
(sesgo Negativo)

v
d) En forma de J

e) En forma de J
invertida

j) En forma de U

g) Bimodal

h) M ultimodal

i) Rectangular o uniforme

Figura 3.1 7 Diagramas de distribucin para una variable continua (Spiegel,


1970).
(a) Curva de frecuencias simtricas. Se caracterizan porque las
observaciones que equidistan el mximo central tienen la misma
frecuencia. Curva normal.
(b) Curva sesgada a la derecha (sesgo positivo). La cola de la curva a
un lado del mximo central es mayor que al otro lado. Si la cola

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

85

VIVIANA VARGAS FRANCO

mayor se presenta a la derecha de la curva se dice que est sesgada


a la derecha o sesgo positivo.
(e) Curva sesgada a la izquierda (sesgo negativo). Si ocurre lo contrario
se dice que la curva est sesgada a la izquierda o sesgo negativo.
(d) Curva en forma de J. El mximo se presenta en un extremo.
(e) Curva en forma de J invertida. El mnimo se presenta en un
extremo.
(f) Curva en forma de U. Tienen el mximo en ambos extremos.
(g) Curva bimodal. Tiene dos mximos.
(h) Curva multimodal. Tiene ms de dos mximos.
(i) Rectangular o uniforme.

Dos medidas ayudan a caracterizar una curva de frecuencias : el grado de asimetra,


medido por el indicador de sesgo, y el grado de apuntamiento de la curva, medido
por el coeficiente de curtosis.
Sesgo, es el grado de asimetra o falta de simetra de una distribucin. Una curva es
simtrica si las observaciones son equidistantes con el valor mximo central de la
curva. Si el polgono de frecuencias de una distribucin tiene una cola ms larga a
la derecha del mximo central que a la izquierda, la distribucin se llama asimtrica
positiva o sesgada a la derecha o que tiene sesgo positivo. En el caso de que la
distribucin tenga una cola ms larga a la izquierda, la distribucin se llama asimtrica
negativa o sesgada a la izquierda o que tiene sesgo negativo. El sesgo o nivel de
asimetra de una distribucin se puede estimar a partir de la ecuacin 3.18.

asimetra = A = meda - moda


s

(3.18)

Aqu, s es la desviacin estndar de la muestra.

El nivel de sesgo o asimetra presenta las siguientes interpretaciones:


Cuando es igual a cero, la simetra es perfecta; la curva presenta forma de campana
o distribucin normal.
Cuando el valor es cercano a 0,1, indica una distribucin de frecuencias
ligeramente asimtrica.
Si el valor es mayor que 0,1, indica una distribucin de frecuencias con asimetra
notoria.

86

El signo positivo indica una asimetra con cola hacia la derecha.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

3 - DISTRIBUCiN

DE FRECUENCIAS

El signo negativo indica una asimetra con cola hacia la izquierda.

Un valor aproximado de la moda ser el valor ms alto de la curva del polgono de


frecuencia. Una curva de frecuencia puede tener ms de una moda, sin embargo, en
la mayora de las aplicaciones relacionadas con las investigaciones experimentales
son raras las distribuciones que tienen ms de una moda. La presencia de dos o
ms modas significa generalmente que los datos no son homogneos o que se han
combinado dos o ms distribuciones distintas.
Si la distribucin es unimodal y simtrica, entonces la media, mediana y moda sern
iguales entre s. Un ejemplo de esto es la curva con forma de campana o normal.
Cuando la distribucin es asimtrica, la media y la mediana no sern iguales. As, en
el caso de una distribucin asimtrica en forma negativa o sesgada negativamente,
la media ser menor que la mediana. Con una curva asimtrica en forma positiva
o sesgada positivamente, la media ser mayor que la mediana, tal como se observa
en la Figura 3.18.

M o =M =X
As=O
(a)

M o <M <X
As>O
(b)

X<M<M

o
As <O
(e)

Figura 3.18. Opciones de asimetra presentadas en una distribucin de


frecuencias.
(a) Asimetra perfecta; distribucin normal
(b) Asimetra positiva, cola hacia la derecha, sesgo positivo
(e) Asimetra negativa, cola hacia la izquierda, sesgo negativo
Coeficiente de curtosis, es el grado de apuntamiento de una distribucin, este se toma
generalmente con relacin a la distribucin simtrica o curva normal; una distribucin
que presenta un apuntamiento relativamente alto se llama leptocrtica;una
distribucin achatada se llamaplaticrtica y la distribucin normal o acampana con
relacin al centro se llama mesocrtica. Una medida del coeficiente de curtosis se
emplea utilizando la ecuacin 3.19.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

87

VIVIANA VARGAS FRANCO

"
(X-Xl
curtosis =k

1-/

(3.19)

ns4

Donde s es la desviacin estndar y n el nmero de datos en la muestra.


Este ndice presenta la siguiente interpretacin:
Cuando es igual a 0,263, se dice que es una distribucin mesocrtica o distribucin
normal.
Cuando es mayor que 0,263 se dice que es una distribucin leptocrtica.
Cuando es menor que 0,263 se dice que es una distribucin platicrtica.
Para las distribuciones no normales que tienen un gran apuntamiento, la mediana
puede ser una medida de centralidad ms fiable que la media, y entonces resulta
preferible. En la Figura 3.19 se presentan las diversas opciones del coeficiente de
curtosis.

~
k=0,263
(a) Mesoertiea:
distribucin normal

Figura 3.19

k < 0,263
(b) Platiertiea:
distribucin achatada

k> 0,263
(e) Leptoertiea:
distribucin apuntada

Clasificacin del nivel de apuntamiento de una curva a travs del


coeficiente de curtosis.

Intervalos para la media. Para una distribucin aproximadamente normal se pueden


estimar intervalos con relacin a la media y la desviacin estndar, como se ilustra
a continuacin:
f.I. a

: contiene aproximadamente el 68% de los datos.

f.I. 2a: contiene aproximadamente el 95% de los datos.


f.I. 3a: contiene aproximadamente el 99 % de los datos.

88

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPrTULO

3 - OISTRIBUCIN

OE FRECUENCIAS

Con datos muestrales los intervalos son:


XS

Contiene aprox. el 68% de los datos.

X 2S ~ Contiene aprox. el 95% de los datos.

X 3S ~ Contiene aprox. el 99% de los datos.


Grficamente se ilustran estos intervalos en la Figura 3.20.

I
I
I
I
I
I
I
I

._0-;

.L-3O

.L-20

.L-o

\.

.L

.L

.L+20

.L+3O

Y
68%

\.

Y
95%

\.

Y
99%

Figura 3.20 Intervalos para la media en una distribucin normal.

3.2 Distribuciones bidimensionales de frecuencia


En este caso se analiza la distribucin de frecuencias de dos variables simultneamente.
Se estudia el caso donde las dos variables son discretas o continuas, pero no la
combinacin de ellas.

3.2.1

Distribucin bidimensional en variables discretas

En este caso se considera que las dos variables en anlisis son de carcter discreto.
La distribucin de frecuencias consiste en elaborar una tabla de dos entradas, donde se

ESTAOrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

89

VIVIANA VARGAS FRANCO

colocan en la primera fila los valores diferentes de la primera variable y en la primera


columna los valores diferentes de la segunda variable; en ambos casos los valores
de cada variable deben ser diferentes y estar ordenados en forma ascendente. En la
Tabla 3.10 se presenta la distribucin bidimensional para dos variables discretas.
Tabla 3.10 Frecuencia bidimensional para variables discretas.

~
VIfiBbII x

X,
X2
X3

Xp"
Xp
Frecuencias
margina/es de Y

Y,

y]

Y3

..

Yk-/

Y,

nll
hll
n21
hZI

n,z
h/2
n2Z
hzz

n'3
h'3

..

n/,k _1
hlk _ 1

nZ3
hZ3

..

nZ,k- 1
hU _1

n"k
h"k
nz,'
hu

n31
h31

n3Z
h3Z

n33
h33

..

n3,k_1
hU _1

nu
hu

np_u
h._u
npl
hnl
n,
h,

np _I,z
h. _1.2
npz
hoz
nz
h.z

np_I,3
h. _I,3
np3
h3
n3
h3

..

np _/,k - I
h. _lk _1
np,k_1
h.,k_1
n,k_1
h,k_1

np _I,k
h. _u
npk
h.k
n.k
hk

..
..

Frecuencias
margina/es de X
n,.
h,.
nz.
hz.
n3.
h3.

np_l"
h. _l .
np.
h.
n-n
h . 100"

En este caso cada frecuencia absoluta, nij' es el nmero de datos que presentan los
valores Xi y lj, simultneamente.
Por ejemplo, n]3 es el nmero de datos que toman los valores X] y Y3' simultneamente.
n 34 es el nmero de datos que tienen los valores de X3 y Y4, simultneamente.
As mismo se pueden hallar las frecuencias absolutas marginales, que son equivalentes
al anlisis de las variables unidimensionales o de una variable independiente de la
otra y se denota por ni. para la variable X y nj . para la variable Y.
Por ejemplo, n 3. es el nmero de datos que toman el valor de X3 para cualquier valor
de la variable Y y es equivalente a la expresin:
k

n 3.=n3 /+n 31 + ...... +n3k =

Ln

3j

j =/

n.4 es el nmero de datos que toma el valor de Y4 para cualquier valor de la variable
X y es equivalente a la expresin:

90

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPfTULO

n. 4+ n 14 + nu+ ...... + n p4 =

3 - DISTRIBUCiN

DE FRECUENCIAS

nu

;=1

En la tabla de frecuencias se deben verificar las siguientes expresiones:


k

. =n
n./+n.l +n.3+ ...... +n.k = ~n
~ .J
j =/
p

~n
. =n
~ l.
i= /

De forma similar:

Donde n es el nmero total de datos considerados en el estudio.


De modo similar se procede para el clculo de las frecuencias relativas, recordando
que estas son el cociente entre la frecuencia absoluta sobre el total de datos. Tambin
se pueden calcular las frecuencias relativas con relacin al nmero de datos de las
filas o al nmero de datos de las columnas.
Cada frecuencia relativa, hij' es el porcentaje de datos que presentan los valores Xi
lj, simultneamente.

Por ejemplo, h23 es el porcentaje de datos que toman valores de Xl y Y3 ,


simultneamente. h34 es el porcentaje de datos que tienen valores de X 3 y Y4,
simultneamente.
As mismo se pueden hallar las frecuencias relativas marginales, que son equivalentes
al anlisis de las variables unidimensionales o de una variable independiente de la
otra y se denotan por h. para la variable X y h.j para la variable Y.
Por ejemplo, h3. es el porcentaje de datos que toman el valor de X 3 para cualquier
valor de la variable Y y es equivalente a la expresin:
k

h 3.=h3/+h 3Z + ...... +h 3k = h3j


j =/

h.4 es el porcentaje de datos que toman el valor de Y4 para cualquier valor de la


variable X y es equivalente a la expresin:
h.4= h/ 4+ hu+ ...... + h p4 =

hu

i= /

/
ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

91

VIVIANA VARGAS FRANCO

Para las frecuencias relativas se deben verificar las expresiones:


k

h. l + h.Z + h.3+ ....

+ h.k = hj= 1 100%


j =1

h l. + h z. + h3. + ......

+ hp. =

h L = 1 100%

;=1

De forma similar:
h ll + h 12 + h13+ ...

+ h pl + h pz + + hpk=f "ihij= 1 100%


;= 1 j = 1

Tambin es posible calcular las frecuencias acumuladas absolutas y relativas, Nij y


Hij' considerando los criterios anteriores y la definicin de cada una de ellas.
En la Figura 3.21 se muestra la representacin grfica de una distribucin
bidimensional para variables discretas. En este caso se deben graficar en el espacio
tridimensional; dos dimensiones para las variables X y Y, Y otra para las frecuencias
relativas o absolutas. La grfica se realiza levantando sobre cada punto del plano
XY, es decir (Xi' Y j ), un segmento vertical de longitud igual a nij para la frecuencias
absolutas o hij para las frecuencias relativas.
n , (h,J

II

1( I A,A

1/
/
/

X,/

/
/

11

'.

y,
y, /

y,

x ..

x, Ix:

Y,

/
/

Figura 3.21 Grfica de distribucin defrecuencia bidimensional para dos variables


discretas,

92

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

3 - DISTRIBUCiN

DE FRECUENCIAS

Distribucin bidimensional para variables continuas

3.2.2

Para el caso de dos variables continuas se deben realizar intervalos tanto para la
variable X como para la variable Y. En este sentido los intervalos se pueden definir
por experiencia de los investigadores o se pueden construir siguiendo los pasos
recomendados para la definicin de intervalos de una variable continua del caso
unidimensional.
En la Tabla 3.11 se presenta la distribucin de frecuencias bivariadas para dos
variables continuas ( X Y Y). En la primera columna se colocan los intervalos
de la variable X y en la primera fila se colocan los intervalos de la variable Y,
o viceversa.
Tabla 3.11 Frecuencia bidimensional para dos variables continuas.

[Yo. V,I

IY,.Y 21

IY 2.Y31

..

(YK.,.YKI

Frecuencias
marginales de X

n11
h11
n21
h21
n31
h31

n12
h12
n22
h22

..

..

n32
h32

n13
h13
n23
h23
n33
h33

n1K
h1K
n2K
h2k
n3K
h3K

n1.
h1.
n2.
h2.
n3.
h3.

IXp.1 Xpl

np1
hp1

np2
hp2

np3
hp3

..

npK
hpK

Frecuencias
marginales de V

n' l
h' l

n'2
h'2

n'3
h'3

..

n'K
h'K

np.
hp.
n.. -n
h.. -100%

Variable X

[X Xd
IX 1 X21
IX 2 X31

..

Las frecuencias absolutas nij consisten en el nmero de datos que se encuentran en


los intervalos ( X i _l , XJ y ( lj-l' lj], simultneamente.
Por ejemplo, n l3 es el nmero de datos que se dan en los intervalos (Xl' Xl] Y
( YH Y3 ] simultneamente. n 34 es el nmero de datos que tienen los intervalos
(Xl' X 3] y (Y3, Y4] simultneamente.
As mismo , se pueden hallar las frecuencias absolutas marginales, que son
equivalentes al anlisis de cada una de las variables unidimensionales o de una
variable independiente de la otra y se denota por ni. para la variable X y n.j para la
variable Y.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

93

VIVIANA VARGAS FRANCO

Por ejemplo, n 3. es el nmero de datos que hay en el intervalo ( X] ,X3 J,


independientemente de los intervalos de la variable Y. Es equivalente a la siguiente
expresin:
k

n 3 = n 31 + nn+ ...... + n 3k =

3j

j=/

n." es el nmero de datos que hay en el intervalo (Y3, YJ, independientemente de


los intervalos de la variable X. Es equivalente a la expresin:
p

n.4=n 14 +n u + ...... +np"= ni"


i= I

En la tabla de frecuencias se deben verificar las expresiones:


k

. =n
n.l = n.] + n. 3 + ...... + n.k = ~n
~ ./
j=1
p

nI. + n].
+.
n 3 + ...... + np. = ~
~ n = n
L

i=1

De forma similar:

f f nij = n

n 11 + n J] + n /3 + ...... + n p / + n p ] + .... + n pk =

i=1 j = 1

Donde n es el nmero total de datos considerados en el estudio.


De forma similar, se procede para el clculo de las frecuencias relativas, recordando
que son el cociente entre la frecuencia absoluta sobre el total de datos. Tambin se
pueden calcular las frecuencias relativas en cuanto al nmero de datos de las filas o
al nmero de datos de las columnas.
Cada frecuencia relativa hij consiste en el nmero de datos que se encuentran en los
intervalos ( X i _l , XJ Y ( lJ-l' lJJ, simultneamente.
Por ejemplo, h]3 es el porcentaje de datos que toman valores entre (XI' Xzl Y
( y] , Y3 J simultneamente. h]3 es el porcentaje de datos que tienen valores entre
( X]' X 3 J y ( Y3 , Y"J, simultneamente.
As mismo, se pueden hallar las frecuencias relativas marginales, que son equivalentes
al anlisis de las variables unidimensionales o de una variable independiente de la
otra y se denota por h i. para la variable X, y hj para la variable Y.

94

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

3-

DISTRIBUCiN DE FRECUENCIAS

Por ejemplo, h3' es el porcentaje de datos que toman valores entre ( X 2, X 3] para
cualquier valor de la variable Y. Es equivalente a la siguiente expresin:
k

h 3.=h3/+h 32+ +h 3k= h3j


j =/

h.4 es el porcentaje de datos que toman valores entre (Y3' y J para cualquier valor de
la variable X. Es equivalente a la expresin:

h.4 = hl4+ hu+ ...... + h p4 =

hu

;=/

En la tabla de frecuencias se deben verificar las expresiones:


k

h./ + h.2+ h.3 + ...... + h. k =

h.j = 1 100%
j =/

h/. +h 2. +h 3. + ...... +hp . = fh

= 1 100%

;=/

De forma similar:
P

hlJ +hll + h/3 + ...... + h p1 +hp 2 + .... +hpk

= hij = 1 100%
i=l j =l

Tambin es posible calcular las frecuencias acumuladas absolutas y relativas Nij y


Hij, considerando los criterios anteriores y la definicin de cada una de ellas.
La Figura 3.22 muestra la representacin grfica de una distribucin bidimensional
para variables continuas. En este caso se deben graficar en el espacio tridimensional;
dos dimensiones para las variables X y Y Y otra para las frecuencias relativas o
absolutas. En el caso unidimensional las frecuencias se representan por reas de
rectngulos en el histograma, ahora en el caso bidimensional, las frecuencias se
representan por volmenes de paraleleppedos en el denominado estereograma.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

95

VIVIANA VARGAS FRANCO

n(h)

:. f-

/
/

/
1/

/
/

.~

1/

Xl ....

1/ ,.

1/

/
/

1/

YJ

1/

/
,/

XJ

Xl

"XI
/

YI

/ V

/
/

Figura 3.22 Estereograma, grfica de distribucin bidimensional de frecuencia


para dos variables continuas.

96

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPTULO

4
Medidas y grficas
de posicion

Las medidas de tendencia central y dispersin presentan limitaciones cuando se desea


realizar anlisis con respecto a la posicin que ocupan los datos; por tal razn surgen
las medidas de posicin que se usan para describir la posicin que tienen un valor
especfico en relacin con el resto de datos. Estas medidas sintetizan las distribuciones
de frecuencias e indican qu porcentaje de datos, dentro de una distribucin, hay
antes o despus de un valor determinado.
Las medidas de posicin ms utilizadas en estadstica son los cuartiles, deciles y
percentiles:
Cuartiles :

Dividen la distribucin en 4 partes iguales; existen 3 cuartiles: primero,


segundo y tercer cuartil.

Deciles:

Dividen la distribucin en 10 partes iguales; existen 9 deciles: primero


al noveno decil, son tambin llamados cuantiles.

Percentiles: Existen 99 percentiles que dividen una distribucin en 100 partes iguales:
primero al noventa y nueve percentil, tambin se llaman centiles.

A continuacin se describe la forma de estimar cada una de estas medidas, las cuales
se pueden calcular para datos agrupados y datos sin agrupar. Tambin es posible
estimarlos a partir de la ojiva

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

97

VIVIANA VARGAS FRANCO

4.1 Cuartiles
Los cuartiles son los valores que dividen un conjunto de datos que previamente han
sido ordenados en forma creciente, en cuatro partes iguales. Existen tres cuartiles
que se denominan Q/ , Q2 y Q3 y presentan las siguientes caractersticas:

Q/ : Es el valor de la variable donde el 25% de los datos es menor que este valor
y el 75% de los datos es mayor que l.
Q2: Es el valor de la variable donde el 50% de los datos es menor y el 50% de
los datos es mayor que este valor. Coincide con el valor de la mediana.
Q3: Es el valor de la variable donde el 75% de los datos es menor que l y el 25%
de los datos es mayor que este valor.
Entre los valores Q/ y Q3 se encuentra el 50% de los datos.
Entre dos cuartiles consecutivos se encuentra un 25% de los datos, tal como se
observa en la Figura 4.1.

25%

mn.

25%

Q2

Ql

25%

25%

Q3

mx.

Datos ordenados en forma creciente


Figura 4.1 Esquema grfico de la ubicacin de los cuartiles en una distribucin.
Cuartiles para datos sin agrupar, en este caso se deben ordenar los datos de forma
creciente. El clculo de los cuartiles se debe realizar considerando diferentes opciones
de acuerdo con el nmero de datos. Generalmente los textos presentan que el cuartil

..
Xn+Xn
uno, Q, se puede calcular como X n + / SI n es Impar o 4 4+ / SI n es par y que

.
.
X 3n +X3n
.
el cuartll tres, Q3' se puede calcular como X 3 (n +/) SI n es par o 7
7+ / SI n
4

es impar, pero estas frmulas no funcionan en todos los casos. (El lector puede
verificarlo con los ejemplos que se muestran en este captulo).

98

ESTAOlsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

4-

MEDIDAS Y GRFICAS DE POSICiN

Despus de un detallado anlisis de las posibilidades para el clculo de los cuartiles


se llega, en este libro, a las frmulas generales que permiten estimar estos valores
en forma precisa. El cuartil dos, Q;z, slo depende del valor de paridad que toma n ,
mientras que para el clculo del cuartil uno, Qb y el cuartil tres, Q3' deben considerarse
adicionalmente otros argumentos, como la paridad de ; o de n

~1

Para el clculo de los cuartiles los datos deben estar ordenados en forma ascendente,
los valores repetidos deben considerarse en el conjunto de datos. Las diferentes
opciones para el clculo de cuartiles se presentan en las siguientes ecuaciones:

Si n es impar:

(4.1)

Q;Z=X"+I
;z

. n+l
S1 --2- es par:

(4.2)

(4.3)

Si n + 1 es impar: QI =X"+3

(4.4)

Q3 = X3" +J

(4.5)

Si n es par:

Q1=

Si !!. es par:
2

X"+X,,
-+1
1

(4.6)

2
3X"
-+1 +X"
-

QI=

O, 75X" + 0,25X"
-
-+I

(4.7)

(4.8)

Si n es impar:

O, 75X" + 1 + 0,25X" + 6
4

2
3XJ"

+1

(4.9)

+ X3"-1
4

Q3 =---=--4-~- = 0,75XJ"+1 + 0,25X311 _1 (4.10)


4

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

99

VIVIANA VARGAS FRANCO

Ejemplo 4.1 Se tienen los datos de Demanda Qumica de Oxgeno (DQO) en


mg/l, en el efluente de una planta de tratamiento anaerbico para agua residual
tipo UASB (Upflow Anaerobic Sludge Blanket), la serie de datos ordenados en
forma creciente se presenta a continuacin:
110; 126; 135; 145; 152; 155; 160; 181; 191; 191; 200; 208; 216; 257; 260;
312; 315,: 320 y 320 (mg/l) .
1
Considerando que el nmero de datos es impar, n=19, y que n ~
10
es un nmero par, se utilizan las ecuaciones 4.1,4.2 Y 4.3 para el primero, segundo
y tercer cuartil, respectivamente, tal como se presenta a continuacin:

Q/ =

X S +X6
2

0,5Xj + 0,5X6 = 0,5( 152) + 0,5( 155) = 153,5 mg / I

Es decir, el 25% de los datos son menores que 153,5 mg/l y el 75% de los datos
superan este valor en el efluente de DQO en la planta UASB.
Q2=X/ o =191 mg/I
Donde el 50% de los datos son menores que 191 mg/I y el 50% de los datos
supera este valor. Es el valor de la mediana.

Q3 =

X U +X/5
2
= 0,5Xu + 0,5X/5 = 0,5( 257) + 0,5( 260) = 258,5 mg / I

Significa que el 75% de los datos es menor que 258,5 mg/l y e125% de los datos
supera este valor en el efluente de DQO en la planta UASB.
Cuartiles para datos agrupados: En este caso se considera que los datos estn
agrupados en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre
cada uno de los cuartiles. Los cuartiles se pueden calcular a travs de la ecuacin
4.11 si se utilizan las frecuencias relativas, o con la ecuacin 4.12 si se utilizan las
frecuencias absolutas.

Q. =x1-/ + (0,25k-H
2 1- / ) (L)

(4.11)

1
Q. =X-/ + (knl4 -N
n _/) (L)

(4.12)

100

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPiTULO

4 -

MEDIDAS Y GRFICAS DE POSICiN

Donde:
k

: Valor del k-simo cuartil a ser calculado (k

= 1, 2 3)_

X _/: Lmite inferior del intervalo que contiene el valor cuartiL

: Nmero de observaciones.

H - 1: Frecuencia relativa acumulada del intervalo anterior al que contiene el cuartil

(sin porcentaje).
h

: Frecuencia relativa del intervalo donde se encuentra el cuartil (sin

porcentaje).
N - 1: Frecuencia absoluta acumulada del intervalo anterior al que contiene el

cuartiL
n

: Frecuencia absoluta del intervalo donde se encuentra el cuartiL

: Longitud del intervalo donde se encuentra el cuartiL

Ejemplo 4.2 Considerando la Tabla 4.1, donde se presenta la distribucin de


frecuencias para la variable nivel de presin sonora en el da, ruido, tomada en
diferentes estaciones de la ciudad de Santiago de Cali, se procede a estimar los
cuartiles para datos agrupados. (Esta tabla es equivalente a la Tabla 3.5).
Tabla 4.1

Nmero
del
intervalo

Distribucin de frecuencias para la presin sonora en el da (LD).

Intervalos de
ruido
(X,-" X,}
(dB)

Marca
de
clase

X'
(dB)

Datos acumulados por


Datos por
intervalo de
intervalo de de
ruido
ruido

ni

N/=n
/- 1

1
2
3
4
5
6
7

[50,54J
(54,58J

52
56

(58,62J

60

(62,66J

11

(74,78J

64
68
72
76

....

Tota/es

.....

50

(66,70J
(70,74J

3
3
6
6
12
9

3
6
12
23
29
41
50
.....

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

Porcentaje de
datos
por
intervalo de ruido

h=n;ln (%)

6
6
12
22
12
24
18
100%

Porcentaje
acumulado
de datos
por
intervalo
de ruido
/

H=h(%)
- I

6
12
24
46
58
82
100
.....

101

VIVIANA VARGAS FRANCO

A partir de la tabla de distribucin de frecuencias se utiliza la frmula de la ecuacin


4.11, para el clculo de los cuartiles:

Primer cuartil
Se encuentra en el cuarto intervalo, considerando que los datos hasta all son menores
o iguales que 46% y el tercer intervalo contiene el 24% de los datos, segn la columna
de frecuencia relativa acumulada. El primer cuartil es el valor que genera el 25% de
los datos menores que l. Por lo tanto, se generan los siguientes valores:
n

= 50; k = 1; X3 = 62 dB; H3 = 24% = 0,24; h4 = 22% = 0,22; L = 4

Entonces:

Q = 62 +

( 0,25 - 0,24) (4) = 62,2 dB


0,22

Significa que e125% de los datos es menor que 62.2 dB Yel 75% de los datos supera
este valor.

Segundo cuartil
Se encuentra en el quinto intervalo, considerando que los datos hasta all son menores
o iguales que 58% y en el cuarto intervalo los datos son menores o iguales al 46%,
segn la columna de frecuencia relativa acumulada, presentndose los siguientes
valores:

n = 50; k = 2; X 4 = 66 dB; H 4 = 46% = 0,46; hs = 12% = 0,12; L = 4


Entonces:
Ql

= 66 +

( 0,50 - 0,46) (4) = 67,3 dB


0,12

Es decir, el 50% de los datos es menor que 67,3 dB Y el 50% de los datos supera
este valor. Coincide con el valor de la mediana.

Tercer cuartil
Se encuentra en el sexto intervalo, pues los datos hasta all son menores o iguales al
82%, segn la columna de frecuencia relativa acumulada. Por lo tanto, se generan
los siguientes valores:

n = 50; k = 3; X s = 70 dB; H s = 58% = 0,58; h = 24% = 0,24; L = 4


Entonces:
Q3

102

= 70 +

(0,75 - 0,58) (4) = 72,8 dB


0,24

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

4 -

MEDIDAS Y GRFICAS DE POSICiN

Significa que el 75% de los datos es menor que 72,8 dB Y e125% de los datos supera
este valor.

4.2 Deciles
Los deciles son los valores que dividen el conjunto de datos, ordenados en forma
creciente, en diez partes iguales. Existen nueve deciles que se denominan DI' D2J ,
D9' Cada decil representa el! 0% del total de los datos y entre dos deciles consecutivos
se encuentra un 10% de los datos, tal como se presenta en la Figura 4.2. El clculo
de los deciles se puede realizar para variables no agrupadas y variables agrupadas.

Datos ordenados en forma creciente

Figura 4.2 Esquema grfico de los valores deciles de una distribucin.


Deciles para datos sin agrupar, en este caso se deben ordenar los datos en orden
creciente. Si se considera el conjunto de datos ordenados XI' X]' X]' X" _1 , X"
los deciles se pueden estimar a partir de la ecuacin 4.13.
X ...

D=
k

si n es par

10

(4.13)

Xk(It+I)

10

si n es impar

Donde k es el nmero del decil a calcular.


Ejemplo 4.3 Para los datos del ejemplo 4.1, sobre la Demanda Qumica de
Oxgeno (DQO) en el efluente de una planta de tratamiento anaerbico para
agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
110; 126; 135; 145; 152; 155; 160; 181; 191; 191; 200; 208; 216; 257; 260;
312; 315; 320 Y 320 (mg/l).
Se calculan a continuacin los deciles del conjunto de datos (n=19):
DI

= X I (II +I) = X] = 126 mg /

10

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

103

VIVIANA VARGAS FRANCO

D 2 =X2 (fI+l) =X4

= 145 mg / I

lO

DJ =XJ(fI+l) =X6 = 155 mg / I


10

D 4 =X4 (n+I)=Xa =181 mg/I


lO

D s = X s (fI + 1) = X IO = 191 mg / I
10

D 6 = X 6 (fI + 1)

= X 12 = 208 mg / I

10

D 7=X7(fI+l) =X14 = 257 mg / I


10

Da =Xa(fI+l) =X16 = 312 mg / I


lO

D9 =X9(fI+l) =Xla =320 mg/I


10

El decil 3, D J , significa que el 30% de los valores es menor que 155 mg/l y el
70% de los datos supera este valor.
El decil5, D s , significa que el 50% de los datos es menor que 191 mg/l y el 50%
de los datos supera este valor.
El decil 9, D 9 , significa que el 90% de los datos es menor que 320 mg/l y el1 0%
de los datos supera este valor.
Deciles para datos agrupados: En este caso se considera que los datos estn agrupados
en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre cada
uno de los deciles a estimar. Los deciles se pueden calcular a travs de la ecuacin
4.14, si se utilizan las frecuencias relativas, o con la ecuacin 4.15, si se utilizan las
frecuencias absolutas.

=x.

D
k

104

1- /

(4.14)

+ (knll0-N _/ ) (L)

D =X
k

+ (O,lk-HI _ I ) (L)

,-1

(4.15)

ni

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

4 -

MEDIDAS Y GRFICAS DE POSICiN

Donde:
: Valor del k-simo decil a ser calculado. (k

= 1,2, 3, 4, .... , 9)

X _I : Lmite inferior del intervalo que contiene el valor decil.


: Nmero de observaciones en el conjunto de datos.

H _I : Frecuencia relativa acumulada del intervalo anterior al que contiene el decil


(sin porcentaje).
h

: Frecuencia relativa del intervalo donde se encuentra el decil (sin

porcentaje).
N_ I : Frecuencia absoluta acumulada del intervalo anterior al que contiene el decil.
n

: Frecuencia absoluta del intervalo donde se encuentra el decil.

: Longitud del intervalo donde se encuentra el decil.

Ejemplo 4.4 Considerando los datos del ejemplo 3.2 y la tabla de distribucin
de frecuencias 4.1, donde se presentan las frecuencias de la variable nivel de
presin sonora de ruido medido en decibeles (dB), para diferentes estaciones
de la ciudad Santiago de Cali, en el da. Se calculan a continuacin los deciles
D, DsY D", utilizando la ecuacin 4.14.

Primer decil
Se encuentra en el segundo intervalo, debido a que los datos hasta all son menores o
iguales al 12%, segn la columna de frecuencia relativa acumulada y el primer decil
es el valor que genera el 10% de los datos menores que l. Por lo tanto, se generan
los siguientes valores:
n

= 50; k = 1; XI = 54 dB ; HI = 6% = 0,06 ; h } = 12% = 0,12; L = 4

Entonces:
D =X + [0,1(l)-HJ (L)
I
I
h
1

= 54 + [ 0,1 -

D
1

0,06 J
0,12

= 553 dB
'

Es decir, el 10% de los datos es menor que 55,3 dB Y el 90% de los datos supera
este valor.

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

105

VIVIANA VARGAS FRANCO

Quinto decil
Se encuentra en el quinto intervalo, debido a que los datos hasta all son menores
o iguales al 58%, segn la columna de frecuencia relativa acumulada y el quinto
decil es el valor que genera el 50% de los datos menores que l. De esta manera se
generan los siguientes valores:
n

= 50; k = 5; X 4 = 66 dB; H 4 = 46% = 0,46; h5 = 12% = 0,12; L = 4

Entonces:
D =66+ (0,50-0,46) (4)=6~3dB

0,12

'

Es decir, el 50% de los datos es menor que 67,3 dB Y el 50% de los datos supera
este valor. Coincide con el valor de la mediana.

Noveno decil
Se encuentra en el sptimo intervalo, pues los datos hasta all son menores o iguales
al 100%, segn la columna de frecuencia relativa acumulada, y el noveno decil es
el valor que genera el 90% de los datos menores que l. Por lo tanto, se generan los
siguientes valores:
n

= 50; k = 9; X = 74 dB; H = 82% = 0,82; h7 = 18% = 0,18; L = 4

Entonces:

= 74 + (0,9 - 0,82) (4) = 758 dB

D
9

0,18

'

Significa que el 90% de los datos es menor que 75,8 dB Yel 10% de los datos supera
este valor.

4.3 Percentiles
Los percentiles son aquellos valores que dividen los datos ordenados de forma
creciente, en cien partes iguales. Existen noventa y nueve percentiles que se denotan
por P, P 2 , . . . . . . . oo. , P 99 , donde cada percentil representa el 1% del total de los
datos.
El percentil 1, PI> supera el uno por ciento de los valores y es superado por el 99%
de los datos restantes. El percentil 95, P 95 , supera el 95% de los datos y es superado
por el 5% de los datos. P k : Percentil k-simo, es aquel valor de la variable que deja
a su izquierda el k% de la distribucin.

106

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO 4 - MEDIDAS Y GRFICAS DE POSICiN

Percentiles para datos sin agrupar, en este caso se deben ordenar los
datos en forma creciente. Si se considera el conjunto de datos ordenados
XI' X 2 , X 3 , X n _ l' X n , los percentiles se pueden calcular a travs de la
ecuacin 4.16.

x ...

P=
Ir

si n espar

lOO

(4.16)

XIr(If+J)
110

si n es impar

Donde k es el nmero del percentil a calcular.


Ejemplo 4.5 Para los datos del ejemplo 4.1, sobre la Demanda Qumica de
Oxgeno (DQO) en el efluente de una planta de tratamiento anaerbico para
agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
Se calculan a continuacin los percentiles 35, 80 Y 95.
P 35 =X35 (n+J) =X7

= 160 mg /1

100

P ao =Xao(n + l) =X16 = 312 mg /1


100

P 95 =X95 (n+l) =X19 = 320 mg /1


10

El percentil 35, P35 , significa que el 35% de los valores es menor que 160 mg/l
y el 65% de los datos es mayor que este valor.
El percentil 80, Pao, significa que el 80% de los datos es menor que 312 mg/l y
el 20% es mayor que este valor.
El percentil95, P 95 , significa que el 95% de los datos es menor que 320 mg/l y
el 5% es mayor que este valor.
Percentiles para datos agrupados. En este caso, se considera que los datos estn
agrupados en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre
cada uno de los percentiles a estimar. Los percentiles se pueden calcular a travs de
la ecuacin 4.17, si se utilizan las frecuencias relativas, o con la ecuacin 4.18, si
se utilizan las frecuencias absolutas.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

107

VIVIANA VARGAS FRANCO

=x. +

P
k

,-1

(0,01k-Hi _ l ) (L)
h ,.

P =X _ + (kn/100-N 1) (L)
k

ni

(4.17)

(4.18)

Donde:

: Valor del k-simo percentil a ser calculado. (k = 1,2,3,4,5, 6, 7, .... , 98,99)

Xi -

J :

Lmite inferior del intervalo que contiene el valor percentil.

: Nmero de observaciones.

N i _ 1 : Frecuencia absoluta acumulada del intervalo anterior al que contiene el


percentil.
nk

Frecuencia absoluta del intervalo donde se encuentra el percentil.

Hi _ J : Frecuencia relativa acumulada del intervalo anterior al que contiene el percentil


(sin porcentaje).
hk

: Longitud del intervalo donde se encuentra el percentil.

Frecuencia relativa del intervalo donde se encuentra el percentil (sin


porcentaje).

Ejemplo 4.6 Considerando los datos del ejemplo 3.2 y la tabla de distribucin
de frecuencias 4.1, donde se presentan las frecuencias de la variable nivel de
presin sonora de ruido medido en decibeles (dE), para diferentes estaciones
de la ciudad de Santiago de Cali, en el da. Se calculan a continuacin los
percentiles 25, 80 Y 95, utilizando la ecuacin 4.17.

Percentil 25

Se encuentra en el cuarto intervalo, debido a que los datos hasta all son menores
o iguales al 46%, segn la columna de frecuencia relativa acumulada y el percentil
25 es el valor que genera el 25% de los datos menores que l, lo cual genera los
siguientes valores:
n

= 50; k = 25; X 3= 62 dB; H3 = 24% = 0,24; h4 = 22% = 0,22; L = 4

108

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPrTULO

4-

MEDIDAS Y GRFICAS DE POSICiN

Entonces:

P 15 = 62 +

( 0,25 - 0,24 )
0,22
( 4 ) = 62,2 dB

Es decir, el 25% de los datos es menor que 62,2 dB Y el 75% de los datos supera
este valor.

Percentil 80
Se encuentra en el sexto intervalo, debido a que los datos hasta all son menores o
iguales al 82%, segn la columna de frecuencia relativa acumulada. De esta manera
se generan los siguientes valores:

n = 50; k = 80; X 5 = 70 dB; H5 = 58% = 0,58; h5 = 24% = 0,24; L = 4


Entonces:

Pao = 70 +

( 0,80 - 0,58 )
0,24
( 4) = 73,7 dB

Es decir, el 80% de los datos es menor que 73,7 dB Y el 20% supera este valor.

Percentil 95
Se encuentra en el sptimo intervalo, pues los datos hasta all son menores o iguales
al 100%, segn la columna de frecuencia relativa acumulada. De esta manera se
generan los siguientes valores:
n

= 50; k = 90; X = 74 dB ;

= 82% = 0,82; h 7 = 18% = 0,18; L = 4

Entonces:

P 95 =74+

( 0,95 - 0,82 )
0,18
(4)= 76,9dB

Significa que el 95% de los datos es menor que 76,9 dB Y el 5% supera este valor.
Tambin existen los quintiles que dividen el conjunto de datos en cinco partes iguales;
existen cuatro quintiles que se pueden denominar k l , k], k j Y k".
En teora, los percentiles 25%, 50% Y 75% son el primero, segundo y tercer cuartil,
respectivamente. As mismo, los percentiles P/O ' p]O ' PjO, P"o , P so , Po, P 70, Pao Y
P 90 corresponden a cada uno de los deciles DI ' D] , D j , Do Ds, D, D 7 , DaY D 9,
respectivamente. Tal como se presenta a continuacin:

PJO = DI ; P10 = Dl ; P30 = Dj Y as sucesivamente hasta P 90 = D9 Y

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

109

VI VI ANA VARGAS FRANCO

P2S= Q ; P SO=Q2= DS y P 7S= QJ

4.4 Medidas de dispersin para indicadores de posicin


Algunas medidas de dispersin para las medidas de posicin se relacionan a
continuacin. stas permiten representar, en forma grfica, las medidas de posicin
y comprender la dispersin del conjunto de datos a travs de los intervalos intercuartil, inter-decil, inter-percentil y semirrecorrido inter-cuartil, tal como se presenta
en las ecuaciones 4.19, 4.20, 4.21 Y 4.22, respectivamente.

Intervalo o recorrido ;nter-cuartil


Ra=R1C=QJ-Q

(4.19)

Este intervalo contiene el 50% de los datos analizados

Intervalo o recorrido ;nter-decil


R D =D 9 -D

(4.20)

Este intervalo contiene el 80% de los datos analizados

Intervalo o recorrido ;nter-percentiJ


RC=P99- P

(4.21)

Este intervalo contiene el 99% de los datos analizados

Sem;rrecorr;do ;nter-cuartil
SRa = QJ- Q

(4.22)

4.5 Representacin grfica de las medidas de posicin

4.5.1

Diagramas de cajas y alambres

Este diagrama constituye una buena sntesis de la distribucin de frecuencias y su


sencillez lo hace muy til, sobre todo en aquellas situaciones donde es necesario
comparar dos o ms distribuciones (poblaciones o tratamientos). Los diagramas
de cajas y alambres (boxplots o box and whiskers), muestran cmo se distribuyen
los datos, de tal forma que proporcionan informacin acerca de la localizacin, la
dispersin, el sesgo y las colas del conjunto de datos, que se pueden apreciar en un
solo grfico.

110

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

4-

MEDIDAS Y GRFICAS DE POSICiN

Este diagrama ha sido un aporte fundamental realizado por Tukey (1977). Es un


grfico simple debido a que se realiza con cinco nmeros y se observan en forma
clara la distribucin de los datos y sus principales caractersticas.
Los diagramas de cajas y alambres son tiles para diversos fines, entre los objetivos
de estos se destacan :
Identificar los datos alrededor de la mediana
Tener idea de la dispersin de los datos, basndose en la longitud de la caja (rango
intercuartlico), pues la caja corresponde al 50% de los datos que estn en la parte
central. Adems, se aprecia el rango de los datos que corresponde a la distancia
entre las observaciones ms extremas.
Permitir conocer el grado de asimetra de una distribucin, al comparar la
proporcin de la caja que queda a la izquierda de la mediana con la que queda a
la derecha, igualmente la longitud de los alambres respectivos.
El diagrama es til para identificar posibles outliers (datos fuera de lo comn) a
travs de los cercos internos pero dentro de los externos y outliers fuera de los
cercos externos.
Permitir comparar varias poblaciones a travs de sus distribuciones. En este
caso se construye un diagrama para cada distribucin y se dibujan en una
misma escala (sobre un mismo plano), lo cual permite fcilmente hacerse una
idea de las semejanzas y las diferencias de los rasgos ms importantes de las
distribuciones.
Similarmente se pueden comparar diversas variables para una misma
poblacin.
Existen dos opciones para graficar el diagrama de cajas y alambres : uno general y
otro identificando valores extremos y outliers.

Diagrama general. Se basa en el valor mnimo, los cuartiles (Q/> Q2 y Q3) y el valor
mximo. Los pasos para construirlo se presentan a continuacin:
Dibujar y marcar un eje de medida horizontal o vertical.
Construir una caja (rectngulo), con ancho arbitrario (el ancho no tiene
representacin estadstica alguna), cuyo borde izquierdo (inferior) sea el valor del
primer cuartil y el borde derecho (superior) sea el valor del segundo cuartil.
Construir una segunda caja a partir del lmite derecho (superior) de la primera
caja, hasta el valor del tercer cuartil.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

111

VIVIANA VARGAS FRANCO

Dibujar un primer segmento de recta (bigote) desde el valor mnimo hasta el


borde izquierdo (inferior) del primer rectngulo.

Dibujar un segundo segmento de recta (bigote) desde el borde derecho (superior)


del segundo rectngulo hasta el valor mximo del conjunto de datos.

Siguiendo los pasos anteriores se construye el diagrama general de cajas y alambres


para un conjunto de datos, el cual se puede presentar de forma horizontal o vertical,
tal como se observa en la Figura 4.3. El bigote de la izquierda (inferior) representa
el 25% de los valores entre el valor mnimo y el primer cuartil, Q; la primera caja
corresponde al 25% de los datos, los cuales se encuentran entre Q y Q2; la segunda
caja corresponde al 25% de los datos, los cuales se encuentran entre Q2 y Q3' El
bigote de la derecha (superior) viene dado por los datos que se encuentran entre Q3
y el valor mximo del conjunto de datos.

",4x.

-Q3

M. =Qz

-Q

mn.

= M.

Qz

Q]

mx.

I
I

-mn.

(a)

(b)

Figura 4.3 Diagrama general de cajas y alambres en un eje vertical (a) y un eje
horizontal (b).
La interpretacin del diagrama de cajas se presenta a continuacin:

La longitud de la caja refleja el grado de dispersin de los datos. A mayor longitud,


mayor dispersin. Ah se encuentra el 50% de los datos.

La lnea que divide la caja principal es el valor de la mediana. Si sta se encuentra


en el punto medio de la caja o cercano a ste, indica simetra de los datos con
relacin a la mediana. Tambin indica homogeneidad en la distribucin de los
datos.

112

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPrTULO

4-

MEDIDAS Y GRFICAS DE POSICiN

La dispersin est dada tanto por la longitud de la caja, como por la distancia
entre los extremos de los bigotes.
El sesgo se observa en la desviacin que exista entre la lnea de la mediana en
relacin con el centro de la caja, y tambin la relacin entre las longitudes de los
bigotes.
Las colas de la distribucin se pueden apreciar por la longitud de los bigotes
en cuanto a la altura de la caja, y tambin por las observaciones que se marcan
explcitamente.
Ejemplo 4. 7 Considerando el ejemplo 4.1 sobre los datos de Demanda Qumica
de Oxgeno (DQO) en mg/l, en el efluente de una planta de tratamiento anaerbico
para agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
110; 126; 135; 145; 152; 155; 160; 181; 191; 191; 200; 208; 216; 257; 260;
312; 315; 320 y 320 (mg/l).
Se desarrolla el diagrama de cajas y alambres con base en los valores de los
cuartiles:

QJ=153,5 mg/l, Ql=191 mg/l, Q3=258,5 mg/I


Considerando el valor mnimo 110 mg/l y el valor mximo 320 mg/l, se construye
en la Figura 4.4 el diagrama de cajas y alambres.

_
!(

110
Xmn

'::lf::I~,.

:l
I

153,5

191

258,5

Qz

QJ

320
Xmx

Niveles de DQO (mg/I)

Figura 4.4 Diagrama de cajas y alambres para los datos de DQO en una planta
de tratamiento UASB.

Considerando que en cada cuartil se encuentra e125% de los datos, se puede analizar
que la distribucin es asimtrica en relacin con la mediana, as mismo, que existe
menor dispersin en el intervalo (153,5; 191) mgll que en el intervalo (191; 258,5)
mgll. El bigote de la izquierda presenta menor longitud que el bigote de la derecha,
evidenciando que por debajo del valor de la mediana; 191 mgll, el conjunto de datos
presenta menor nivel de variacin que por encima de este valor.

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

113

VIVIANA VARGAS FRANCO

Diagrama con puntos extremos. En este caso se realizan las cajas como en el caso del
diagrama general, adicionando los lmites generados por cercos internos y externos,
utilizando las siguifntes expresiones:
cerco interno inferior
cerco interno superior
cerco externo inferior
cerco externo superior

~
~
~

QJ-1.5*RlC
Q3+ 1.5*RlC
QJ-3*RlC
Q3 +3*RlC

Donde RlC = QJ- Q2 es el rango intercuartlico que corresponde a la longitud de la


caja, es decir, donde se encuentra el 50% de las observaciones analizadas.
Se deben prolongar lneas rectas desde los bordes de las cajas, QJ y Q3' identificando
los lmites a una distancia de 1,5*RlC (cerco interno) y a una distancia de 3*RlC
(cerco externo).
Los puntos que se encuentren entre las distancias 1, 5 *RlC y 3*RlC se deben marcar
con crculos abiertos, "o", y significan puntos inusuales suaves o puntos extremos. Los
puntos que se encuentren por encima de una distancia de 3*RIC son puntos atpicos
o que se salen de la tendencia general de los datos, a estos puntos generalmente se les
llama "outliers" o puntos raros y se marcan con "*". Si no hay datos en esta regin
se considera que no hay puntos outliers en el conjunto de datos. La representacin
de este diagrama de cajas y alambres se ilustra en la Figura 4.5.

*
* --

o
o
o _

Puntos raros u "outliers"

3RlC
Puntos extremos

1,5RlC

-QJ}

Ql

50 % de datos

-Q/

o
O
O

*
*
*

1,5RlC
Puntos extremos

3RIC
Puntos raros u "outliers"

Figura 4.5 Representacin del diagrama de cajas y alambres con datos


extremos.

114

ESTAOfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPiTULO

4 - MEDIDAS Y GRFICAS DE POSICiN

La interpretacin en este caso es similar al diagrama general de cajas y alambres,


pero se deben tener las siguientes consideraciones:
Si hay valores extremos por debajo o por encima de la caja, se presenta una mayor
dispersin en el conjunto de datos.
Cuando hay valores extremos, la media aritmtica no es representativa.
Los puntos outliers deben analizarse cuidadosamente, con el fin de tomar
decisiones en relacin con ellos.
Ejemplo 4.8 Se tienen los datos de precipitacin anual (mm) registrada desde
1994 hasta el 2002, en el municipio de Morales-Cauca, tal como se presenta
en la Tabla 4.2. Se desea comparar, mediante un diagrama de cajas y alambres
con valores extremos, la precipitacin de los meses de julio y octubre a travs
de los aos analizados.
Tabla 4.2

Precipitacin (mm) anual registrada en el municipio de Morales,


departamento del Cauca, desde 1994 al 2002.

En.

Feb

Mlr

Abr

Jun

Jul

Al'

5.,

Oct

1994

63,5

70,4

160,5

101

89,5

92,5

100,5

115,3

158,9 99,4

97,8

1995

58,4

78,3

168,9

110

95,6

80.7

115,2

120,3

166,2

103

89.7

1996

60,2

80,1

152,3

108

102

89,6

97,3

109,4

171,3

96,5

80,4

1997

70,2

70,4

156,3

112

98,4

86,9

103,3

110,3

169,2 97,5

86,3

1998

98,2

78,2

159.7

106

90,1

90,6

105,8

114,5

160,5 89,3

94,2

1999

57,3

69,8

148,9 98.7

85,6

79,4

95,4

100,2

149.7 90,1

85,2

2000

68,2

75,6

158,9

112

98,9

88,1

108,4

109,8

168,4 86,3

79,8

2001

59,8

71.2

160,2

105

88,5

83.7

104,2

118,2

170,2 90,4

86,3

2002

68,1

73,2

156.7

110

96,8

91.7

107,9

111,8

165,9 94.7

95,8

Nov

Die

Precipitacin en el mes de julio


Con base en las ecuaciones 4.1 a 4.5 se calculan los cuartiles, el RlC y los
cercos internos y externos:
Q=X3 = 83,7 mm, Q2=XS

= 88,1 mm y

Q3=X7 = 90,6 mm

RlC= Q3 - Q = 6,9 mm

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

115

VIVIANA VARGAS FRANCO

Cerco interno inferior: QJ -1,5* RlC= 83,7 -10,4 = 73,3 mm


Cerco interno superior: QJ + 1,5* RlC= 90,6 + 10,4 = 101 mm
Cerco exterior inferior: QJ - 3* RlC= 83,7- 20,7 = 63 mm
Cerco exterior superior: QJ + 3* RlC= 90,6 + 20,7= 111,3 mm

Precipitacin en el mes de octubre


QJ= 160,5 mm , Q2 = 166,2 mm y Q3 = 169,2 mm
RlC= Q3 - QJ

= 8,7 mm

= 147,4 mm
Q, + 1,5* RlC= 169,2 + 13,1 = 182,3 mm
Q, - 3* RlC= 160,5 - 26,1 = 134,4 mm

Cerco interno inferior: QJ -1,5* RlC= 160,5 -13,1


Cerco interno superior:
Cerco exterior inferior:
Cerco exterior superior:

Q, - 3* RlC= 169,2 - 26,1

=195,3 mm

Como se puede apreciar en la Figura 4.6, no existen valores extremos ni puntos


outliers en la precipitacin de los meses de julio y octubre. Se puede analizar
que existe mayor precipitacin en el mes de octubre que en el mes de julio.
Las dos distribuciones presentan ligera asimetra en relacin con la mediana,
considerando que la longitud de las cajas no es similar. La precipitacin enjulio
es mucho menor que en octubre.

116

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPfTULO

4 -

MEDIDAS Y GRFICAS DE POSICiN

200
195.3

182,3

169.2
166,2
160.5

150

147,4

134.4

,......,

'"

111 .3

'-'
Q

'O
' (3

.....

100

:&

101
90,6

88.1
83,7

e
p.,

73.3

63

50

Julio

Octubre

Meses
Figura 4.6 Diagramas de cajas y alambres para la precipitacin mensual del
municipio de Morales- Cauca, en los meses de julio y octubre, durante
los aos 1994 a 2002.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

117

VIVIANA VARGAS FRANCO

Ejemplo 4.9 Considerando los datos de precipitacin anual (mm) registrada


en los aos de 1994 hasta el 2002, en el municipio de Morales-Cauca, se desea
comparar, mediante un diagrama de cajas y alambres con valores extremos, la
precipitacin de los aos 1994 y 2002.
Precipitacin en el ao 1994:
63,5 70,4 89,5 92,5 97,8 99,4 100,5 101 115,3 158,9
. Como n

= 11 Y

n;

1 = 6,

par, entonces se utilizan las frmulas 4,1,4,2 Y 4,3 para

el clculo de los cuartiles.

= 0,5X3 + 0,5X4= 0,5( 89,5) + 0,5( 92,5) = 91 mm


Q2 =X6 = 99,4 mm

Q3

= 0,5Xa + 0,5X9 =0,5( 101) + 0,5( 115,3) = 108,2 mm


RlC= Q3 - Q

Cerco interno inferior:


Cerco interno superior:

= 17,2 mm

Q -1,5* Rle= 91- 25,8 = 65,2 mm


Q + 1,5* Rle= 108,2 + 25,8 = 134 mm

Cerco exterior inferior: Q, - 3* Rle= 91- 51,6 = 39,4 mm


Cerco exterior superior: Q, + 3* Rle= 108,2 + 51,6 = 159,8 mm
Precipitacin en el ao de 2002:

68,1 73,2 91,7 94,7 95,8 96,8 110 107,9111,8 156,7 165,9
Como n

= 11 Y n + 1 = 6, par, se utilizan las frmulas 4.1, 4.2 Y 4.3.


2
Q = 0,5X3 + 0,5X4 = 0,5( 91,7) + 0,5( 94,7) = 93,2 mm
Q2=X6 = 96,8 mm

Q3 = 0,5Xa + 0,5X9 =0,5( 107,9) + 0,5( 111,8) = 109,9 mm


Rle= Q3 - Q

= 16,7 mm

Cerco interno inferior: Q -1,5* Rle= 93,2 - 25,1

= 68,1 mm

Cerco interno superior: Q3 + 1,5* Rle= 109,9 + 25,1

118

= 135 mm

ESTAD ISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

4 -

MEOIDAS y GRFICAS DE POSICiN

= 43,1 mm
50,1 = 158,3 mm

Cerco exterior inferior: Q- 3* RlC= 93,2 - 50,1


Cerco exterior superior: Q3 + 3* RlC= 108,2 -

Como se puede apreciar en la Figura 4.7, no existen diferencias marcadas en


la precipitacin de los aos 1994 y 2002, pero en el ao 2002 se present un
punto atpico o "outlier ", con valor de 165,9 mm.

Precipitacin
(mm)

o
\ 59,8

\ 65 ,9
\ 58,3

\35
\34

\ 09,9

08,2
99,4

96,8

9\

93,2

65,2
68, \

43 ,\
39,4

1994

2002

Aos

Figura 4.7 Diagramas de cajas y alambres para la precipitacin mensual del


municipio de Morales- Cauca, para los aos de 1994 y 2002.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

119

VIVIANA VARGAS FRANCO

4.5.2 Diagrama de tallos y hojas


Tambin denominado diagrama de Tukey, es un procedimiento semi grfico para
presentar informacin en variables cuantitativas; es una forma rpida de obtener una
representacin visual del conjunto de datos a travs de su recuento y ordenacin.
En trminos generales, se puede decir que los diagramas de tallos y hojas, adems
de ser fciles de elaborar, presentan ms informacin que los histogramas, teniendo
solo como limitacin que no muestran las frecuencias, aunque se pueden desarrollar
en columnas anexas al diagrama.
Los pasos para construirlo son los siguientes:

Se deben seleccionar uno o dos dgitos iniciales de la variable de anlisis, para


los valores de tallo y el dgito o dgitos finales se convierten en hojas.

Luego se hace una lista de los valores de tallo en una columna vertical (entre 5
y 20 tallos).
Se procede a registrar la hoja por cada observacin junto al valor correspondiente
al tallo.
Finalmente se indican las unidades de tallos y hojas en algn lugar del
diagrama.
El diagrama de tallos y hojas permite visualizar:
El centro de la distribucin.
La forma general de la distribucin: simtrica si las porciones a cada lado del
centro son imgenes espejos de las otras; sesgada a la izquierda si la cola izquierda
(los valores menores) es mucho ms larga que los de la derecha (los valores
mayores) y sesgada a la derecha opuesto a la sesgada a la izquierda.
Desviaciones marcadas de la forma global de la distribucin.
La forma de comparar dos distribuciones en forma simultnea.
Ejemplo 4.10 Considerando los datos de precipitacin anual (mm) registrada en
los aos 1994 a 2002 en el municipio de Morales-Cauca, presentados en la tabla
4.2, se realiza a continuacin el diagrama de tallos y hojas para la precipitacin
del mes de enero y del mes de octubre, durante los aos 1994 a 2002.
Precipitacin en el mes de enero:

63,5 58,4 60,2 70,2 98,2 57,3 68,2 59,8 68,1 (mm)

120

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

4-

MEDIDAS Y GRFICAS DE POSICiN

Estos datos transformados a nmeros enteros quedan como: 635584602702


982573682598681.
En este caso es conveniente escoger el primer nmero como el tallo y los dos
ltimos trminos como las hojas. El diagrama de tallos y hojas se presenta a
continuacin:
Enero
Tallos

Hojas (n=9)

73
02
02

5
6
7
8
9

84
35

98
81

82

82

Como se puede apreciar, las mayores frecuencias de precipitacin para el mes


de enero se presentan en los rangos de 50 mm y 60 mm, muy poca frecuencia
en los rangos de 70 mm a 90 mm.
Precipitacin en el mes de octubre:

158,9166,2171,3169,2160,5149,7168,4170,2165,9(mm)
Estos datos transformados a nmeros enteros quedan como: 1589 1662 1713
16921605 1497 1684 17021659.
En este caso es conveniente escoger los dos primeros trminos como el tallo y
los dos ltimos trminos como la hoja, tal como se presenta a continuacin:
Octubre
Tallos

14
15
16
17

Hojas (n = 9)

97
89
05
02

59
13

62

84

92

Como se puede apreciar, las mayores frecuencias para el mes de octubre


se presentan alrededor de 160 mm y muy pocas frecuencias entre 140mm y
150mm.
Otra ventaja de los diagramas de tallos y hojas consiste en la comparacin de dos
distribuciones, tal como se presenta en el siguiente ejemplo.

ESTADISTICA DESCRIPTIVA PARA ING ENIERfA AMBIENTAL CON SPSS

121

VIVIANA VARGAS FRANCO

Ejemplo 4.11 Mediante un diagrama de tallos y hojas, comparar la distribucin


de la precipitacin de los aos 1995 y 2000, indicados en la Tabla 4.2. A
continuacin se presentan los datos transformados:

Ao 1995: 584783168911009568071152120316621030897 (mm)


Ao 2000: 682 75615891120989881108410981684863798 (mm)
Generando el siguiente diagrama:
Ao 2000

Ao 1995
Hojas

Tal/os

84

5
6

83
9707
56
3000
52
03

8962

Hojas

10
11

82
5698
6381
89
8498
20

12
15
16

89
84

8
9

Como se puede apreciar, las distribuciones de precipitacin de los aos 1995 y


2000 no presentan grandes diferencias, concentrndose las mayores frecuencias
entre 70 mm y 110 mm.

122

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

Modelos de regresin

Cuando se realizan estudios que involucran varias variables, evaluadas simultneamente


para cumplir un objetivo especfico, se puede analizar la relacin inherente a ellas.
Definir relaciones que posibiliten predecir una o ms variables en trminos de otras
es uno de los objetivos fundamentales de muchas investigaciones, lo cual se puede
abordar a travs de las tcnicas estadsticas de modelos de regresin.
Los modelos de regresin se usan para estimar "la mejor" relacin funcional entre
una variable dependiente y una o varias variables independientes, mientras que los
mtodos de correlacin se utilizan para medir el grado de asociacin de las distintas
variables.
El trmino "regresin" fue definido por Francis Galton (1822-1911), en su libro
Natural inheritance (1889), refirindose a la "ley de la regresin universal". l
estudi la eugnica, trmino tambin introducido por l para definir el estudio de la
mejora de la raza humana a partir de las caractersticas hereditarias.
Galton estudi la altura de los hijos en relacin con la altura de sus padres, y prob
que la altura de los hijos, de padres altos, "regresaba" hacia la media de la altura de
la poblacin a lo largo de sucesivas generaciones. Esto es, hijos de padres demasiado
altos tendan a ser en promedio ms bajos que sus padres, e hijos de padres muy
bajos tendan a ser en promedio ms altos que sus padres.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

123

VIVIANA VARGAS FRANCO

As mismo, se realiz un estudio con ms de mil registros de grupos familiares y


se encontr la relacin que se presenta en la ecuacin 5.1, que permite estimar la
altura media del hijo a partir de la altura del padre.

Altura del hijo =85 (cm) + (0,5)* altura del padre (cm)

y=a+bx

(5.1)

Por ejemplo, si el padre mide 2,0 m = 200 cm, entonces se desea estimar la estatura
media de su hijo, es decir, cunto vale y = ?, para un valor x = 200 cm, reemplazando
en la ecuacin 5.1 se obtiene:

y = 85 + 0,5( 200 )

= 185 cm

Entonces, se espera que el hijo mida 185 cm = 1,85 m, es decir alto, pero no tanto
como el padre. El valor tiende a regresar a la media.
Si el padre mide 1,2 m
estatura de su hijo:

= 120 cm, entonces se desea estimar qu se espera de la


y

= 85 + 0,5( 120 ) = 145 cm

En este caso, se espera que el hijo mida 1,45 m, es decir bajo, pero no tanto como
el padre. El valor tiende a regresar a la media.
Actualmente el trmino regresin se utiliza para predecir una variable en funcin de
otra, y no implica que se est estudiando si se produce una regresin a la media.
El aspecto estadstico de la regresin consiste en lograr una estimacin funcional
de la relacin entre dos o ms variables. En este proceso es necesario identificar
una variable independiente o de respuesta, y, la cual no es controlada en el estudio;
los valores de esta variable dependen de una o ms variables independientes o de
regresin, que se denominan x" x], x 3 , , x n. Estas variables independientes o
de regresin no son aleatorias y no tienen propiedades poblacionales.
La variable y puede ser de carcter cuantitativo o dicotmico (aquella que
slo admite dos categoras que definen opciones o caractersticas mutuamente
excluyentes: s o no). En el primer caso se habla del modelo de regresin lineal y
en el segundo caso del modelo de regresin logstica. La diferencia fundamental
entre el modelo de regresin lineal y de regresin logstica es que el primero
predice el valor medio de la variable dependiente (y) a partir de una o ms variables
independientes; mientras que el segundo permite predecir la proporcin de una

124

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

5-

MODELOS DE REGRESiN

de las dos categoras de la variable dependiente dicotmica, en funcin de una o


ms variables independientes.
En el caso del modelo de regresin lineal, la relacin entre dos variables
cuantitativas, una dependiente y una independiente, se denomina regresin simple
y cuando se trabaja una variable dependiente en funcin de varias variables
independientes, se denomina modelo de regresin mltiple, tal como se presenta
en la Figura 5.1.
Modelo de regrala

I
I

I!I

Mldple
Varias variables independientes

Simple
Una variable independiente x

x"xz,,x"

Una variable dependiente: y

Una variable dependiente: y

Lineal

N o lineal

Lineal

No lineal

Figura 5.1. Clasificacin de modelos de regresin


La relacin fija para un conjunto de datos de un estudio, se caracteriza por una
ecuacin de prediccin que recibe el nombre de ecuacin de regresin o modelo
probabilstico, en contraposicin de un modelo determinstico. Un modelo se
denomina determinstico cuando el valor de y es nico para un nico valor de x. Es
decir, dado un valor de entrada se obtiene un nico valor de salida cada vez que se
opere el modelo, mientras que en un modelo estocstico o probabilstico que incluye
una o varias componentes probabilsticas, para un valor de entrada se obtiene una
respuesta diferente cada vez que se opere el modelo, tal como se muestra en la Figura
5.2. El modelo determinstico genera una relacin de causa-efecto, mientras que el
modelo estocstico no necesariamente.
-'"

Entrada

Modelo
determinstico

nica
salida

Entrada

Modelo
estocstico

Posibles
salidas
(n respuestas)

(a)

(b)

Figura 5.2. Esquema operativo de un modelo determinstico (a) y un modelo


estocstico (b).

ESTADfsTICA DESCRIPTIVA PARA INGENIER fA AMBIENTAL CON

SPSS

125

VIVIANA VARGAS FRANCO

Algunos ejemplos de modelos determinsticos son: la ecuacin del balance


hidrolgico, la frmula racional y el hidrograma unitario, y algunos ejemplos de
modelos estocsticos son: series de lluvias, series de caudales, niveles de embalses
y eventos extremos.
La Figura 5.3 presenta el ejemplo de una ecuacin determinstica correspondiente
al balance de agua en un embalse (a) y un ejemplo de un modelo estocstico, que
estima la remocin en un sistema de tratamiento de agua por Filtracin Lenta en
Arena (FLA) (h).
Et
Evapotranspiracin

Caudales de entrada

Qv
Excesos

EMBALSE
dS
Cambio en almacenamiento

Suministro

Precipitacin

Q
Infiltracin
F

BALANCE: 1 + P

= Et + F + Qv + Q + dS

a) Esquema de un modelo determinstico. Balance de agua en un embalse

Ag Ul1
atl lente

,-

F.L.A.

-.

....

agua

arena

Agua efluente

= J30+ J3agua

Posibles valores en el
agua etluente

afluente + Error

b) Esquema de un modelo estocstico. Estudio de la eficiencia


de unfiltro lento en arena (FLA)

Figura 5.3. Ejemplos fsicos de un modelo determinstico (a) y un modelo


probabilstico (b).

126

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

5 - MODELOS

DE REGRESiN

5.1 Modelo de regresin lineal simple


El anlisis de regresin lineal simple se realiza cuando se pretende explicar una
variable dependiente, y , cuantitativa, en funcin de una variable independiente, x,
cuantitativa. Este modelo permite estimar la funcin lineal matemtica entre x y y,
con el fin de hallar la estimacin media de y, a partir de valores de x, tal como se
presenta en la ecuacin 5.2.

(5.2)

Donde:
Y : Valores de la variable de respuesta o dependiente. Genera un vector fila

transpuesto de dimensin (n x 1): [Y'Y]'Y3' .......'Ynl

Valores de la variable independiente. Genera un vector fila transpuesto de


dimensin (n x 1) : [x, x]' x 3 , , xnl T

}Jo

Valor poblacional desconocido, el cual se estima a travs del conjunto de datos.


Es el valor de y cuando la variable x toma el valor de O. Punto de corte con el
ejey

}J,

Valor poblacional desconocido, el cual se estima a travs del conjunto de


datos. Es el valor de la pendiente de la recta.
Error aleatorio. Genera un vector de dimensin (n x 1) : [E" E], E3 , ....... , Enl T

Los errores aleatorios, E , son valores no observables, en estos se pueden recoger


los posibles errores de medida, tanto de la variable x como de la variable y, as
como los errores en la especificacin lineal del modelo y que pueden afectar a la
variable dependiente del modelo.
Los coeficientes poblacionales de correlacin}Jo y }J, se estiman con los datos
muestrales del estudio generando los valores de a y b respectivamente, como se
presenta a continuacin:

...-. y=a+bx

Modelo poblacional
Estimacin de parmetros
Modelo muestral

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

127

VIVIANA VARGAS FRANCO

La prediccin de y se realiza a travs de valores promedios o valores esperados;


a travs de la ecuacin 5.3 se puede estimar el valor promedio de y para un valor
especfico de x .
I'xIy =

E (y / x) = E ( Y) = y = a + bx

(5.3)

Donde: I'ylx = E (y / x) = E ( Y) es la esperanza de y.


A partir de la ecuacin 5.3 los errores se pueden calcular como e = !y - y!; es la
diferencia entre el valor muestral y y el valor estimado de la lnea de regresin, y.
Existen dos formas de estimar los coeficientes del modelo de regresin (a y b): el
mtodo de los mnimos cuadrados y el mtodo de mxima verosimilitud. El mtodo
de los mnimos cuadrados consiste en estimar los coeficientes de regresin, de tal
forma que se minimicen las distancias de los puntos muestrales a la recta estimada,
como se ilustra en la Figura 5.4. El mtodo de mxima verosimilitud consiste en
hallar un modelo matemtico o funcin de verosimilitud con los datos, de tal forma
que maximice la probabilidad de los parmetros del modelo.

y= a +bx

Variable y

Variable x

Figura 5.4 Esquema grfico del mtodo de mnimos cuadrados.

128

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPITULO

5-

MODELOS DE REGRESiN

En general, la tcnica ms utilizada es la de mnimos cuadrados, que consiste en un


mtodo de ajuste de curvas, sugerido originalmente a principios del siglo XIX por el
matemtico francs Adrien Legendre (1752-1833).
Tal como se present anteriormente, el mtodo de los mnimos cuadrados consiste en
hallar los valores de los parmetros del modelo de regresin, a partir de minimizar
la suma total de residuos o errores aleatorios generados por la estimacin de la lnea
de regresin, como se muestra en la ecuacin 5.4 .
n

ft

ft

eJ = (YI- yi = (YI- a - bxi


- /

1- /

(5.4)

1- /

Para obtener los mnimos de la ecuacin 5.4 se deben encontrar primero las derivadas
parciales con respecto de a y b, tal como se presenta en las ecuaciones 5.5 y 5.6,
respectivamente.

(5.5)

(5.6)

Seguidamente se igualan a cero las dos ecuaciones anteriores; generando las


expreSlOnes:

- 2

(y - a - bxi = O

-2 x(y,-a-bx,i= O

Aplicando propiedades del operador sumatoria, se obtienen las expresiones:

Y -

a- b

xY- a x-b

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

=O

SPSS

x/=O

129

VIVIANA VARGAS FRANCO

Realizando operaciones algebraicas, se genera el sistema de ecuaciones 5.7 ,


denominado sistema de ecuaciones normales de la regresin, el cual es un sistema
de dos ecuaciones con dos incgnitas: a y b.

"

"
- I

na+b x=y
- 1

(5.7)

"
" x/ = xy
"
a x;+ b

;- 1

- 1

;- 1

Utilizando alguno de los mtodos para resolver sistemas de ecuaciones lineales, se


obtiene el valor de b a travs de la ecuacin 5.8.

"

n (x;y) - (
b

=;

""
LXi)
(y;)
;

"

"

(5.8)

n (x/) - ( xli
Una vez calculado b se puede despejar de alguna de las ecuaciones del sistema 5.7
el valor de a, generando la ecuacin 5.9.

"
"
y- b
a

LXi = _YI
_

---'--1
- -=----1_....:....1-....:....1_

bx1
n =y-bx

(5.9)

Es decir, los coeficientes poblacionales'po y.PI se estiman a travs de los datos


muestrales, por el mtodo de los mnimos cuadrados, con las ecuaciones 5.8 y 5.9.
Primero se debe calcular el coeficiente b y luego el coeficiente a. a es el punto
de corte con el eje y; es el valor de la variable x, cuando y = OY b es la pendiente
de la recta; es la razn media de cambio de y por cada unidad de cambio en x.
En la actualidad el clculo de estas constantes se puede realizar de forma gil
utilizando diferente tipo de software y estimar diversos modelos para un estudio
en particular.
De manera similar, se pueden hallar los coeficientes de regresin de un modelo
de regresin, con los parmetros en forma lineal, realizando las derivadas
parciales, encontrando y solucionando el sistema de ecuaciones normales
respectivo.

130

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

5-

MOOELOS OE REGRESiN

5.2 Supuestos del modelo de regresin lineal simple


Para obtener los estimadores de los parmetros desconocidos del modelo de regresin
lineal simple se debe cumplir un conjunto de supuestos, para el uso adecuado e
interpretacin del modelo de regresin. Algunos de estos supuestos se requieren para
el anlisis de inferencia de los parmetros, el cual no se desarrolla en el presente
texto. Los supuestos se presentan a continuacin:
El modelo es lineal en las variables y en los parmetros
Las variables independiente y dependiente que se analizan en el modelo se deben
encontrar en forma lineal, en la primera descripcin del modelo o a travs de un
proceso de transformacin, y los parmetros o coeficientes de regresin asociados
a dichas variables tambin deben aparecer en forma lineal. Este supuesto es
fundamental, puesto que las tcnicas estadsticas son diferentes para modelos
lineales que para modelos no lineales. Por ejemplo, el modelo y =.Po +.PX + e es
lineal en sus variables y en sus coeficientes de regresin, mientras que el modelo
y =.P~ I + e no es lineal en la variable independiente, pero lo es en sus parmetros.
Sin embargo, este modelo se puede transformar en un modelo lineal, como se
presentara ms adelante en este captulo.
El modelo est correctamente definido
Este supuesto implica que se han incluido las variables explicativas o independientes
adecuadas dentro del modelo de regresin. Adems no se deben haber omitido
variables independientes relevantes para explicar la variable dependiente, y la
relacin matemtica debe permanecer en el perodo muestral, lo cual implica que
los coeficientes de regresin son constantes.
Variable independiente no estocstica
Los valores de la variable x son fijos para muestras repetidas, x es una variable
no estocstica, lo que equivale a realizar el anlisis estadstico condicionado
a la muestra que se ha observado. De este modo, se supone que el modelo de
regresin y sus supuestos se aplican al conjunto particular de los valores de la
variable dependiente, x.
Identijicabilidad de los parmetros
Significa que los coeficientes'po y.PI se pueden estimar de forma nica a partir de
unas observaciones dadas, lo cual sucede cuando la variable x no sea constante, es
decir, que presente variabilidad. Si la variable x es constante, el modelo presentara

ESTAOlsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

131

VIVIANA VARGAS FRANCO

dos trminos constantes: el asociado al parmetro fJo y el asociado al parmetro fJ/


y ambos coeficientes mediran el mismo efecto.

La esperanza de los errores condicionada a la informacin dada es nula


Significa que las observaciones de x no contienen informacin sobre el valor esperado
de ej. Este supuesto se utiliza en el proceso de inferencia de los parmetros estimados,
en forma algebraica:

ro

E {e}
E {el]

E { e;} = O => E { e;} = I

=
E {en]1

IO

Los errores presentan varianza constante


Esto significa que la varianza de los errores es constante, en forma algebraica:

v (e) = rl =

constante

i = 1, 2, 3, ....., n

Los errores se distribuyen de forma normal

En forma estadstica significa que la distribucin de los errores es simtrica, es decir,


presenta una distribucin normal, con media cero y varianza rl.
E ( e) - N (

o,rl )

El cumplimiento de este supuesto permite realizar inferencias sobre los parmetros


estimados del modelo de regresin.

5.3 Diagrama de dispersin


Existen diversas opciones para estudiar la forma del modelo de regresin: el primero
es a travs de la relacin conceptual de las variables analizadas, esto es, si se conoce
a priori la ecuacin matemtica de la relacin entre las dos variables.
Otra es a travs del diagrama de dispersin, que consiste en graficar en el plano
cartesiano las parejas de datos observados para realizar el anlisis de regresin.
Este permite visualizar la tendencia del conjunto de datos y da una idea del tipo de
relacin matemtica existente entre las dos variables analizadas. El diagrama de
dispersin, permite evidenciar si existen datos que se alejan de la tendencia general

132

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

5 - MODELOS

DE REGRESiN

del conjunto de datos; puntos atpicos u outliers, los cuales se pueden confirmar a
travs de las grficas de cajas y alambres.
Estos diagramas se pueden realizar con relativa facilidad en diferentes programas de
computador. En la Figura 5,5 se presenta el esquema general de un diagrama de dispersin,
el cual representa una gran ayuda en la definicin de la ecuacin matemtica que permita
estimar la tendencia de los datos. Por ejemplo, en la Figura 5,6 se evidencia una tendencia
de los datos a una lnea recta, con pendiente positiva y corte en el origen.
y

Yi

~* ~


- -+-
:

Xi

Figura 5.5 Esquema general de un diagrama de dispersin.


Ejemplo 5.1 Se tienen las medidas de slidos suspendidos y turbiedad, evaluados
en una estacin de monitoreo sobre el ro Cauca, en el departamento del Valle
del Cauca. (Fuente: Cinara,1991), como se presentan a continuacin:

Se desea calcular un modelo de regresin lineal que permita estimar valores


de slidos suspendidos a partir de valores de turbiedad, es decir, la variable
dependiente, y, es slidos suspendidos, pues esta es la que se desea estimar a
partir de la variable independiente, x; turbiedad.
Realizando el grfico de dispersin entre turbiedad y slidos suspendidos, se
observa en la Figura 5.6 que esta tendencia es una lnea recta y que la relacin
es directa, es decir, a medida que aumentan los niveles de turbiedad aumentan
los niveles de slidos suspendidos.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

133

VIVIANA VARGAS FRANCO

1200

~ 1000

!.

'"

"5

800

600

::s

'"

400

200

~'"

O
O

200

400

600

800

Turbiedad (UNT)

Figura 5.6 Diagrama de dispersin entre las variables slidos suspendidos (y) y
turbiedad (x).

Para hallar los parmetros a y b del modelo de regresin lineal se presenta en la


Tabla 5.1 el clculo de las operaciones requeridas para su estimacin.
Tabla 5.1

Nmero de
observacin

Datos de turbiedad y slidos suspendidos en una estacin del ro Cauca,


para ser analizados en un modelo de regresin lineal.

Fecha

i
1
2
3
4
5
6
7

Slidos
suspendidos
(mg/l)

Turbiedad
(UNT)
Xi

Xi

* X,

x, * y,

Yi

04Mar-91
07-Mar91
11Mar91
14-Mar91
08Abr91
11Abr91
15Abr91
14May-91

8
9
10
11
12

16May-91
20May-91
23May-91
27-May-91

13

30May-91

42
72
360

71
146
505

1764
5184
129600

35
65
120

61
136
169
190

1225
4225
14400

2135 ;
8840
20280

10000
36100
422500

19000i
51110 I
635700

52900
11025

90620
18480
9000
6831

100
190
650
230
105

269
978
394
176

75

120

5625

69

99

4761

2982
10512
181800

Contina en la pgina siguiente

134

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPTULO

5-

MODELOS DE REGRESiN

Viene de la pgina anterior

Nmero de
observacin

Fecha

Slidos
Suspendidos
(mgfl)
y

Turbiedad
(UNT)
x

x*x

X*Yi

14

04Jun91

125

133

15625

16625

15

06Jun91

85

140

7225

11900

16

11Jun91

32

53

1024

1696

17

13Jun91

34

54

1156

1836

18

17Jun-91

85

123

7225

10455

19

24-Jun91

450

568

202500

255600

20

02Jul91

51

84

2601

4284

21

04-Jul91

37

73

1369

2701

22

11Jul-91

62

84

3844

5208

3074

4626

941878

1367595

139,727273

210,272727

21

=suma
;=/

Media

Utilizando los resultados de la Tabla 5.1 y las ecuaciones 5.8 y 5.9 se tienen los
siguientes resultados para los coeficientes de regresin a y b.

b = 22 (1367595) - ( 3074 )(4626) = 1 40765


'
22 (941878) - (3074/
a = (210,272727 -1,40765) (139,727273)

= 13,5856

Entonces, el modelo de regresin lineal que relaciona turbiedad y slidos


suspendidos en la estacin de monitoreo en el ro Cauca queda definido por la
ecuacin 5.10.
E (y)

=y = SS = 13,5856 + 1,40765 * TU

(5.10)

El valor del intercepto en algunas ocasiones no tiene significado prctico, como


en este caso; significa que para un valor de turbiedad de O unidades, los slidos
suspendidos son de 13,58 mg/l. El valor de la pendiente significa que por cada
unidad de cambio en los niveles de turbiedad, los slidos suspendidos aumentan en
promedio en 1,4 unidades.

ESTADSTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPss

135

VIVIANA VARGAS FRANCO

Con el modelo de regresin hallado se pueden realizar estimaciones del valor


promedio de slidos suspendidos a partir de un valor fijo de turbiedad. En general, se
recomienda realizar estimaciones en el rango de valores de la variable independiente
turbiedad, es decir [ 32; 650 J UNT, esto con el fin de evitar posibles inconsistencias,
debido a que no se conoce la forma de la relacin por fuera de este rango.
Por ejemplo, para un valor de turbiedad de 50 UNT se espera que el valor medio de
slidos suspendidos en el ro Cauca, sea:

ss = 13,5856 + 1,40765 ( 50 UNT) = 83,9681 mgll


Para un valor de turbiedad de 450 UNT se espera que el valor medio de slidos
suspendidos en el ro Cauca sea:

ss = 13,5856 + 1,40765 ( 450 UNT) = 647,03 mgll


Valores por fuera del rango de turbiedad no se recomiendan estimar, pues la fuerza
del modelo de regresin es la estimacin y no el pronstico, para esto ltimo se
utilizan con mucha confiabilidad los modelos de series de tiempo.

5.4 Otros modelos de regresin


Aunque la ecuacin de la lnea recta es una de las ms utilizadas, en general un
conjunto de datos puede ajustarse a otra funcin matemtica para describir en
mejor forma la asociacin entre las variables. Se considera un modelo lineal si los
parmetros a estimar aparecen de manera lineal en la ecuacin. En la Tabla 5.2 se
presentan diversos modelos lineales, en los parmetros de regresin.
Tabla 5.2

Modelos de regresin lineales en los parmetros de regresin.

Nombre de la funcin

Ecuacin

Parbola o cuadrtico

=.Po + .PI X + .P1K + 8

Polinomio de grado 3cbico

=.Po + .PI X + .P1K + .P3 r

Polinomio grado-n

+8

Semi logartmica

=.Po + .PI X + 'pzK + .P3 r + ..... + .PIIX' + 8


y =.Po + .PIsen x + .P2COS X + 8
In y =.Po + .PI In x + 8
y =.Po + .PI In x + 8

Inversa

Senoidal
logartmica

.PI
=.Po + -+8
x
Contina en la pgina siguiente

136

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

5 - MODELOS

DE REGRESiN

Viene de la pgina anterior

Nombre de le funci6n

Ecuaci6n

Raz cuadrtica 1

=flo + flx'h + 8

Raz cuadrtica 2

=flo +flx 'h + fllX + 8

Cuadrtico del logartmico

y =flo + fllnx

+ fll( Inxl + 8

=flo + fl e-x + 8
Y = flo +fl~ + fll ln x + 8
Y

Otras ecuaciones lineales

=flo + flx + fll ~ + 8

=flo + fllnx +fl2 ..x+ 8

=flo + flx5 + fl2

=flo + fllnx +fl2(ln xl + 8

In y

eX

+8

= In flo +fl Iln x + 8

Los modelos lineales son tiles en muchas situaciones, y aunque la relacin entre
la variable de respuesta y las variables regresoras no sea lineal, en muchos casos
la relacin es "linealizable" en el sentido de que haciendo transformaciones con
logaritmos o funciones inversas en la variable de respuesta y/o algunas variables
regresoras, la relacin se convierte en lineal. Sin embargo, existen situaciones
donde una relacin no lineal no es factible su linealizacin. En este ltimo caso se
denomina modelo de regresin no lineal (El estudio de un modelo de regresin no
lineal es muy extenso y complejo, pero existe una amplia literatura sobre el tema).
En la Tabla 5.3 se presentan ejemplos de modelos no lineales y su transformacin a
modelos lineales en los parmetros y variables de regresin.
Tabla 5.3

Modelos de regresin no lineales y su transformacin a modelos de


regresin lineales.

Modelo no lineal

Funci6n
Hiprbola 1

y=

Hiprbola 2

y=

Modelo transformado a lineal

+8

-=fl
y
o+fl X+8

x
+8
flox-fl

1
fl
y=flo--X+ 8

flo+ fl1x

Contma en la pgma sIguIente


ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

137

VIVIANA VARGAS FRANCO

Viene de la pgina anterior

Exponencial 1

y =fJofJ/ +&

In y

= In fJo + x In fJ + &

Exponencial 2

=fJOeP + &

Iny

= InfJo + fJx + &

Geomtrica o
potencia

y = fJOxP ' + &

In y

= In fJo + fJ In x + &

Raz

y =fJofJ~+ &

1
Iny=lnfJo+-X Infl+&

logstica 1

1
Y = fJ fJ; + &
o

In y

logstica 2

logstica 3

y =fJo (l-eP'X) + & ; fJ < O

In (1- to )=fJx+&

Gamma o
especial de Hoerl

y =fJOeP1XxP' + &

In y

Gauss

y =fJo eP{X -fJ,/ + & ; fJ < O

Iny = InfJo + fJ (x-fJ]l + &

Especial 1

y =flo eP'/. + &

Iny=lnfJo + fJ +&
x

Especial 2

'X

~+&;fJ<O

= -lnfJo -x InfJ+ &

In (fJ] -1) =fJo + flx + &

= InfJo + flx + fJ]ln x + &

1
Y =fJo+fJe- x +&

En la Tabla 5.4 se muestra el sistema de ecuaciones lineales para algunos modelos


de regresin, las cuales se pueden resolver con un conjunto especfico de datos, para
estimar los parmetros a y b.

138

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

5 - MODELOS

CAPITULO

Tabla 5.4

DE REGRESiN

Ecuaciones normales para algunos modelos de regresin.

Modelo de regresi6n lineal

Sistema de ecuaciones normales


n

y=Po+px+e poblacional

na+b xl = y
- /

- /

a xl + b

mues/ral

y=a+bx

1- /

x: = Xy

;- /

;- /

y=po+p/lnx+e poblacional

na+b Inx= y
- /

- /

y=a+blnx

mues/ral

a Inx+b (lnxl/= ylnx


;- 1

- J

- l

;- /

;- /

In x =

Y = PoxtI'+ e
} poblacional
lny = InPo +plnx +e

n In a + b

Iny=lna+blnx

mues/ral

In a In x+ b (In x;/ =

poblacional

n In a + b x =

Iny=lnPo+px+e

y=Po+ p +e
x
b
y=a+ -x

poblacional

Y =Pop/'+ e
1

} poblacional

mues/ral

Iny

i=I
n

;- /

1- /

1- /

n 1
n
na+b -=y

Xi

_ I

y.

;_1

1_ /

xi

_ I

a-+b-=~

n In a + In b

Iny = In Po +-X Inp+e


Iny=lna+ -X Inb

In a x;+ b(X)2 = xlny;

_ I

mues/ral

In x Iny

;- /

mues/ral

;=1

1- /

/- /

Iny=ln a +bx

y =Po efl,x+ e

In y

-x1 =
n

_ /

_ /

In y

n 1
n 1
n Iny .
Ina-+b2=-'
_ / x
1_ / XI
_ /
x
n

na +b xl+c x/= y
y=Po+PX+P2r +e

poblacional

;- /
n

i- J

i=I

a x+b x/+c x; = xy
y=a+bx+d

mues/ral

;- /

- I

=/
n

a x:+ b x/+ C x/ =
;- /

;- /

- I

;=/
n

X2y

; ""' 1

Contina en la pgina siguiente


ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

139

VIVIANA VARGAS FRANCO

Viene de la pgina anterior

Modelo de regresin lineal

Sistema de ecuaciones normales


na+b ix,'h+eix,=iy,
- I

flo + flx'h + fllX + e poblaeional

- 1

a ix,'h+bix,+e ix~=ix:y,
/- /

/- /

y=a+bx'h + ex

1- 1

muestral

ix,+bix~+e i x / = ix/y/
/- /

=flo + flln x + fll (In x / + e

poblacional

= a + blnx + e (In x/

muestral

;- /

/- /

/- /

/- 1

na + b t}n x/ + c
/- /

- I

f (In x/l f

y/

/- /

1- /

a f/nx,+b f(lnx)'+c f(lnx}J=


1- /

/- 1

y/In x/

1- /

f (In xl + b f (In xli + c f (In XI)' f y (In xl


=

/- /

y = floefl'xxP' + e
}
lny = Inflo + flx + fllln x + e poblacional

/- /

/- /

1- 1

n In a +b fx+c f/nx
/- 1

/- /

/- /

Iny

/- /

Ina fx+b fx:+c fx (Inxl= fXlny,


lny =ln a +bx+clnx

muestral

'-1

/-/

- I

- l

In a f/nx+b fXlnx+e f(lnxl= f/nYlnx


1- 1

In

fl2

1 +efl+fl,x

+e ;fl< O }

poblacional

(L
-1 )=flo+flx+e
y

/-

;- /

,- /

e
In ( - - 1 )
y

,.
"
,.
e
a x+b x/= xln (- -1)
- /
/- /
/- /
y

e
In(--1)=ax+b
y

muestral

y =fl o efl,(x- fl ,/ + e,fl<O

n In a + b

Iny=lnflo+fl/(x-fll/ +e

poblacional

Iny =ln a + b(x- e/

muestral

140

na + b

/- /

(x - e/ =

/- /

In y

- /

In a i(x,-e/+ b i(x-e/= i
/- /

/-

(x,-e/lny

/- /

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPrTULO

5-

MODELOS DE REGRESiN

Ejemplo 5.2 Calcular el modelo potencial y =flo X fJ1 + e para estimar niveles
de slidos suspendidos a partir de valores de turbiedad, en una estacin de
monitoreo del ro Cauca, con los datos presentados en el ejemplo 5.1. Con el
fin de seguir los procedimientos para estimar los coeficientes de regresin de
la lnea recta, se debe linealizar la ecuacin potencial aplicando logaritmo
natural, generando la ecuacin 5.11, que es lineal en los parmetros de
regresinfloY fll '

= Inflo + fllln x + e
In y = In a + b In x

In y

ecuacin poblacional

(5.11)

ecuacin muestral

En la Figura 5.7 se presenta el diagrama de dispersin para esta ecuacin.

.,

:;;

.
1::

7
6

:oc 6

''""

~
:::: 5
.~

'"
~ 5

~
....

4
4
3
3

5
5
6
LN de turbiedad

Figura 5.7 Diagrama de dispersin para el logaritmo de turbiedad y el logaritmo


de slidos suspendidos.
Para estimar a y b se define en la ecuacin 5.12 la frmula de los residuales para el
modelo transformado a logaritmos.
n

Le: = L(y-yl =L(lny-ln a-b Inx)2


/- 1

=1

(5.12)

= I

Hallando las derivadas parciales con respecto a cada uno de los parmetros a estimar,
se obtienen las ecuaciones 5.13 y 5.14.

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

141

VIVIANA VARGAS FRANCO

ooa~e: = _2a f(lny,-In a-b Inx)

(5.13)

-1

oLe:

~ =- 2

ob

In x ( In Y -In a - b In x)

(5.14)

=1

Igualando a cero simultneamente las dos ecuaciones anteriores y despejando se


genera el sistema de ecuaciones (5 .15), denominado sistemas de ecuaciones normales
de la regresin, para el modelo potencial. Este sistema coincide con el presentado
en la Tabla 5.4.

n In a + b
n

1-1

1-1

In x = In y
n

In a ~)nx+b (Inx,l=
-1

-1

(5.15)

Inx Iny,

-1

Con el fin de calcular las diversas sumas que se requieren para la estimacin de
los coeficientes, se presentan en la Tabla 5.5 los datos que permiten reemplazar las
ecuaciones normales del modelo potencial, para el ejemplo 5.2.

Tabla 5.5.

Observacin

Valores que permiten estimar el sistema de ecuaciones normales del


modelo potencial y =/Jo xP 1 + e
turbiedad
fecha

(x}
(UNT)

Slidos
suspendidos

(y}
(mgll)

04Mar91

42

71

07Mar-91
ll -Mar-91

72

360

14-Mar-91

35

5
6

08-Abr-91
ll-Abr-91

65
120

136
169

In
(turbiedad)
( lnx}

In
(slidos
suspendidos)
( lny,)

Un tur)x
(lntur)
(lnx;/

Un tur)x
Un slidos)
(lnx,lny)

4,26

13,97

15,93

146

3.74
4,28

4,98

505

5,89

6,22

18,29
34,65

21,31
36,64

61

3,56
4,17

4,11

12,64

14,62

4.79

4,91
5,13

17,43
22,92

20,51
24,56

15-Abr-91

100

190

4,61

5,25

21,21

24,16

14-May-91

190

269

5,25

5,59

27,53

29,36

Contina en la pgina siguiente

142

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

5 - MODELOS

DE REGRESiN

Viene de la pgina anterior

Observaci6n

turbiedad
fecha

(x)
(UNT)

Slidos
suspendidos

(y)
(mgll)

In

In
(turbiedad)

( Inx)

(slidos
suspendidosl

( Iny)

(In tur}x
(Inturl
(In xi

(In tur}x
(In slidosl
(lnxlny)

16May91

650

978

6,48

6,89

41,95

44,60

10

20May91

230

394

5,44

5,98

29,57

32,50

11

23May91

105

176

4,65

5,17

21,66

24,06

12

27-May91

75

120

4,32

4,79

18,64

20,67

13

30May91

69

99

4,23

4,60

17,93

19,46

14

04Jun91

125

133

4,83

4,89

23,31

23,61

15

06Jun91

85

140

4,44

4,94

19,74

21,95

16

11Jun91

32

53

3,47

3,97

12,01

13,76

17

13Jun91

34

54

3,53

3,99

12,44

14,07

18

17Jun91

85

123

4,44

4,81

19,74

21,38

19

24Jun91

450

568

6,11

6,34

37,32

38,75

20

02Jul91

51

84

3,93

4,43

15,46

17,42

21

04Jul91

37

73

3,61

4,29

13,04

15,49

22

11Jul91

62

84

4,13

4,43

17,03

18,29

3074

4626

99,88

109,98

468,47

513,09

22

L=suma
I- l

Utilizando los resultados de la tabla anterior y reemplazando en las ecuaciones 5.15 .


El sistema de ecuaciones lineales para el modelo potencial queda expresado como
se presenta a continuacin:
22 In a + 99,88 b = 109,98
99,88 In a + 468,47 b = 513,09

Resolviendo este sistema de ecuaciones con incgnitas In(a) y b, se tiene que:

b = 0,917814 Y In a = 0,8322

Se aplica antilogaritmo para obtener el valor de a:


a =2,2984

Por lo tanto el modelo de regresin queda definido por la ecuacin 5.16 5.17.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

143

VIVIANA VARGAS FRANCO

In SS

= 0,8322 + 0,9178 In TU

(5.16)

o
SS

= 2,2984 TUo. m814

(5.17)

Los coeficientes de la ecuacin 5,16 se pueden interpretar de la siguiente forma:


In a = 0,832 ~ para un valor de turbiedad de 1 UNT, el valor del logaritmo de
slidos suspendidos es de 0,8322.

b = 0,9178 ~ por cada unidad de cambio en el logaritmo de turbiedad, el logaritmo


de slidos suspendidos aumenta en 0,9178.
En la ecuacin 5,17 el coeficiente de la potencia b = 0,917814 tiene la misma
interpretacin que en la ecuacin 5,16, mientras que el valor de a = 2,2984 es el
valor de slidos suspendidos, en mg/l, para un valor de turbiedad de 1 UNT.
Como se puede apreciar, las variables slidos suspendidos y turbiedad se ajustaron
de manera adecuada al modelo de la lnea recta y al modelo potencial, tal como lo
evidenciaron los respectivos diagramas de dispersin. Surge entonces, de manera
natural, la pregunta: Cul es el mejor modelo? Para responder esta pregunta es
necesario estudiar los conceptos de correlacin, que se presentan en el siguiente
numeral.
En la Figura 5.8 se ilustran algunas grficas de modelos no lineales en los parmetros,
pero que son linealizables por medio de una transformacin matemtica, como se
present en la Tabla 5.3.

144

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

I
I
I

~
It

MODELOS DE REGRESiN

I
I

1-....

5-

t
c-;.",....
v.

-.----------------------------I

I
I

I
I

1M

Jl

tic

61.
7

6>'

116

116

/1

y=ax 6
x

--_-:y=ax

/1

b>O

b<O

y =a +blnx
y=a +blnx
X
X

Figura 5. 8 Tendencias de algunos modelos no lineales en los parmetros (Behar,


1996).

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

145

VIVIANA VARGAS FRANCO

b<'

,-u""

l:

,-_""

"1------------------------

" t------::;---------------

y
1

l/a

(a + be-X)

1- - - - 1- - - - - - - - :.::.;:..::.::- - - - -

(a> 0, b> 0, e > O)

,
,,

,,

,,

,,
,,

(a > 0, b> 0, e < O)

y=a + be-x

a--r---------------------+

= a + be-x

,
"
, , , , ,

Figura 5.8 Tendencias de algunos modelos no lineales en los parmetros


(Continuacin) (Behar, 1996).

146

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

5-

MODELOS DE REGRESiN

5.5 Coeficiente de correlacin


Una pregunta que surge despus de la estimacin del modelo de regresin, es: cul
es la intensidad de la relacin matemtica entre las dos o ms variables analizadas?
Las tcnicas estadsticas que permiten responder y determinar el grado de intensidad
de la relacin del conjunto de variables se denomina anlisis de correlacin. Un
indicador muy utilizado en el anlisis de correlacin es el denominado coeficiente
de correlacin muestral, denotado por r, el cual se estima con el conjunto de datos
analizado.
El coeficiente de correlacin muestral, r, fue definido por el investigador Kart
Pearson, aproximadamente en 1900. Este coeficiente describe la intensidad
lineal de la relacin entre dos conjuntos de variables de nivel de intervalo
o de razn, y no proporciona necesariamente una medida de la causalidad
entre ambas variables. r es una medida de la dependencia estadstica lineal,
es decir, la ecuacin de la lnea recta, de las variables x y y. Tambin se le
denomina r de Pearson o coeficiente de correlacin producto-momento de
Pearson, el cual se puede calcular con las ecuaciones 5.18, o, 5.19.
n

(x-x)(y-y)
r=

- /
n

(xi-xl
=b

-/
n

(xi-xl (y-il

(y-il

-/

-1

-/

(5.18)

Donde b, es el coeficiente de correlacin estimado en el modelo de regresin


lineal.

(5.19)

Propiedades del coeficiente de correlacin r


A continuacin se describen las principales propiedades del coeficiente de
correlacin:

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

147

VIVIANA VARGAS FRANCO

r es un valor adimensional, que no depende de la magnitud de las variables

analizadas.
El valor del coeficiente r se encuentra entre: -1 ~ r
-100% ~ r ~ 100%.

1, en trminos porcentuales

El coeficiente de correlacin tiene el mismo signo que la pendiente de la ecuacin;


(a) r> O s y slo si b > O; (b) r < O s y slo si b < O. Tal como se presenta a
continuacin:

r<'

6<'

a)

b)

Un valor de r == O significa que no hay correlacin lineal entre las variables


estudiadas; las variables no presentan ningn grado de dependencia lineal(a) o
la dependencia es curvilnea (b) como se observa a continuacin:

'Z

r -:: :, O

-=----.x

t
a)

148

b)

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

5-

MODELOS DE REGRESiN

Valores de r cercanos a O indican que hay dependencia estadstica lineal dbil,


por lo tanto las predicciones que se realicen a partir de la recta de regresin son
poco fiables . Tambin, es posible en estos casos que la relacin pueda ser no
lineal entre las variables. Si las variables son independientes r = O, la inversa no
es necesariamente cierta.

Un valor de r cercano a 1 (o 100%) indica dependencia lineal fuerte (las variables


aumentan al mismo tiempo) y por lo tanto las predicciones que se realicen a partir
de la recta de regresin sern bastante fiables. En este caso existe una correlacin
lineal positiva fuerte, como se observa en la siguiente figura:

y
r=:.1

Un valor de r cercano a -1 indica dependencia lineal fuerte (una variable


disminuye a medida que la otra crece) y por lo tanto las predicciones que se
realicen a partir de la recta de regresin sern bastante fiables, en forma grfica
se muestra a continuacin:

y
r =:. -1

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

149

VIVIANA VARGAS FRANCO

Valores de r = 1 o r = -1 (r = 100% o r = -100 %) se presentan cuando los puntos


observados se encuentran sobre la lnea de regresin; existe una dependencia
perfecta entre las dos variables analizadas, como se observa a continuacin:

y.
r=-1

a)

b)

Las variables x y y pueden estar correlacionadas linealmente, es decir, un valor


de r cercano a 1 (100%), lo cual no significa que x causa a yo y causa a x; el
modelo de regresin no evidencia una relacin de casualidad.
Las variables x y y pueden ser depen,dientes, pero su coeficiente de correlacin, r,
puede ser O, esto sucede en el caso de tendencias parablicas o exponenciales, pues
el coeficiente de correlacin mide el grado de asociacin de la lnea recta, de las
dos variables analizadas. Si dos variables aleatorias son independientes tambin
son no correlacionadas, pero si dos variables aleatorias no estn correlacionadas
no necesariamente son independientes.
Se puede definir una gua que permita analizar la intensidad y la direccin del
coeficiente de correlacin, tal como se presenta a continuacin:
Correlacin
negativa
fuerte

r=-1

Correlacin
negati va
moderada

r=- 0.7

r=-0.4

150

r=O

Correlacin
positiva
moderada

r=0.4

Correlacin
positiva
fuerte

r=0.7

r=1

j
No hay
correlacin

Correlacin
negati va
perfecta

Correlacin
positiva
dbil

Correlacin
negativa
dbil

Correlacin negativa

Correlacin
positi va
perfecta

Correlacin positiva

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

5-

MODELOS DE REGRESiN

La anterior gua debe tomarse como un apoyo en el anlisis del coeficiente de


correlacin, pero siempre el coeficiente de correlacin debe analizarse en el contexto
del fenmeno en estudio.

Qu no mide r?
El coeficiente de correlacin muestral, r, no mide la magnitud de la pendiente,
es decir, la fuerza de la asociacin lineal entre las dos variables en estudio, como
se presenta en seguida:

Igual valor de r

El coeficiente de correlacin muestral tampoco mide 10 apropiado del modelo


lineal, como se muestra a continuacin:

...

Igual valor de r

Si r = 0,3 Y r = 0,6, significa, solamente, que se tienen dos correlaciones positivas,


una algo mayor que la otra. No se puede concluir que r = 0,6 indica una relacin
lineal dos veces mejor que la indicada por el valor r = 0,3.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

151

VIVIANA VARGAS FRANCO

Ejemplo 5.3 Calcular el coeficiente de correlacin del modelo lineal estimado


para slidos suspendidos y turbiedad, presentado en la ecuacin 5.10:
E (y) = y = SS = 13,5856 + 1,40765

* TU

En la Tabla 5.6 se muestran las columnas que permiten calcular el coeficiente


de correlacin, el cual se estima a travs de la ecuacin 5.18.
n

(xi-xl
r=b

= 1,40765*

;=1
n

512356,36
1035004,36

= 0,99 o r = 99%

~:rY;-YY
;=1

El valor del coeficiente de correlacin indica que los slidos suspendidos y la


turbiedad, presentan una buena relacin lineal, es decir, los datos muestrales
se encuentran muy cercanos a la recta estimada.
Tabla 5.6

Observacin

i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Valores que permiten estimar el coeficiente de correlacin para el


modelo de regresin lineal entre slidos suspendidos y turbiedad.
Turbiedad
IUNT)

Slidos
suspendidos Irng/ll

Xi

Yi

42
72
360
35
65
120
100
190
650
230
105
75
69
125
85

71
146
505
61
136
169
190
269
978
394
176
120
99
133
140

(xi-xl
9549,20
4586,00
48523,28
10966,28
5583.08
388,88
1577,68
2528,08
260385.68
8150.48
1205.48
4188.68
5001.32
216.68
2994,28

(Y/-yi
19396,13
4130,63
86865.77
22281,53
5516,03
1703.21
410.87
3449,21
589409,35
33756.71
1174.43
8148,67
12381.01
5970.65
4937.87

Contina en la pgina siguiente

152

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

5 - MODELOS

DE REGRESiN

Viene de la p gina anterior

Turbiedad
(UNT)

Slidos
suspendidos (mg/l)

XI

YI

16
17
18
19
20
21
22

32
34
85
450
51
37
62

53
54
123
568
84
73
84

11603,60
11176,72
2994,28
96273.68
7871.24
10551,40
6040,40

24733.85
24420.31
7616.05
127970,75
15944,11
18843,05
15944.11

=suma

3074

4626

512356.36

1035004.36

Observecin

(x-xl

(Y-yl

22

- 1

139.72

Media

210.27

Ejemplo 5.4 Calcular el coeficiente de correlacin del modelo potencial


y = 'p~J para slidos suspendidos y turbiedad, considerando los datos del
ejemplo 5.2. El modelo se calcul en la ecuacin 5.17:

ss = 2,2984 *

TUO,91 7814

En la Tabla 5.7 se presentan las columnas que permiten calcular el coeficiente


de correlacin, el cual se estima a travs de la ecuacin 5.18, con las variables
transformadas a In.

"
(
In x-In xl
r=b

- I

- - - - - - - =0,917814 *
n

15,06

- - - = 0,98 o r = 98%
13,11

(lny-Inyl
- I

El valor del coeficiente de correlacin indica que el logaritmo natural de los


slidos suspendidos y el logaritmo natural de la turbiedad presentan una buena
correlacin lineal, es decir, los datos analizados se encuentran muy cercanos
a la recta estimada.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

153

VIVIANA VARGAS FRANCO

Tabla 5.7

Observacin

Valores que permiten estimar el coeficiente de correlacin para el


modelo de regresin lineal entre In de slidos suspendidos y In de
turbiedad.
Turbiedad
(UNT)

S6lidos
suspendidos

In Turbiedad

In Slidos

(rng/I)

Iny

Inx

L,(In x/- bt x)'

L,(In y/-In y)'

42

71

3,74

4,26

0,64

0,54

72

146

4,28

4,98

0,07

0,00

360

505

5,89

6,22

1,81

1,50

35

61

3,56

4,11

0,97

0,79

65

136

4,17

4,91

0,13

0,01

120

169

4,79

5,13

0,06

0,02

100

190

4,61

5,25

0,00

0,06

190

269

5,25

5,59

0,50

0,35

650

978

6.48

6,89

3,75

3,56

10

230

394

5,44

5,98

0,81

0,96

11

105

176

4,65

5,17

0,01

0,03

12

75

120

4,32

4,79

0,05

0,04

13

69

99

4,23

4,60

0,09

0,16

14

125

133

4,83

4,89

0,08

0,01

15

85

140

4,44

4,94

0,01

0,00

16

32

53

3.47

3,97

1,15

1.06

17

34

54

3,53

3,99

1,03

1,02

18

85

123

4,44

4,81

0,01

0,03

19

450

568

6,11

6,34

2.46

1,80

20

51

84

3,93

4.43

0,37

0,32

21

37

73

3,61

4,29

0,86

0,50

22

62

84

4,13

4.43

0,17

0,32

3074

4626

99,88

109,98

15,06

13,11

139,72

210,27

4,54

5,00

12

=suma
;=1

Media

154

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

5-

MODELOS DE REGRESiN

5.6 Coeficiente de determinacin


El coeficiente de determinacin muestral, R 2 , es la variacin total de la
variable dependiente y , que es explicada, o se debe a la variacin de la variable
2
independiente x. R expresa la proporcin de la variacin total de los valores de
la variable y , que puede ser explicada por una relacin lineal con los valores de
la variable aleatoria x. Este se puede calcular mediante la ecuacin 5.20.

(5.20)

Propiedades del coeficiente de determinacin

O S K S 1 en tnninos porcentuales; 0% S R S 100%

KS,,2

R 2 da una mejor interpretacin de la fuerza de relacin entre y y x , que el


coeficiente de correlacin, r.
Un valor de r = 0.9435 indica una buena relacin lineal entre x y y , lo cual implica
un valor de R 2 = 0.8902 u 89.02%, lo cual significa que aproximadamente el 89%
de la variacin de los valores de y se deben al modelo de regresin estimado.
Ejemplo 5.5 Calcular el coeficiente de determinacin en los modelos lineal y
potencial, para los slidos suspendidos y turbiedad en una estacin de monitoreo
del ro Cauca, presentados en las ecuaciones 5.10 Y 5.17.
Modelo

ss

= 13,5856 + 1,40765 * TU

SS = 2,2984 * TUO,917814

Tipo
Lineal

0,99039

0,98087

Potencial

0,98380

0,96786

En la ecuacin lineal el 98% de la variacin de los slidos suspendidos es


explicada por el modelo, que indica un buen modelo, es decir, solo el 2% de
la variacin de y no es explicado por el modelo. En la ecuacin potencial el
96,8% de la variacin de los slidos suspendidos es explicada por el modelo,
lo cual representa un buen modelo, es decir, solo el 3,2% de la variacin de y no
es explicado por el modelo, presentndose ligeramente mejor el modelo lineal.
Adems, generalmente se prefiere matemticamente el modelo de la lnea recta,
por su sencillez y facilidad de interpretacin.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

155

VIVIANA VARGAS FRANCO

Coeficiente de no determinacin
A partir del coeficiente de determinacin, se puede definir el coeficiente de no
determinacin, el cual mide la proporcin de la variacin total de y, que no es
explicada por la variacin de x y se calcula como 1 - R 2 . Por ejemplo, para un valor
de r = 0.8, el valor del coeficiente de determinacin es R 2 = 0,64 o 64%, el coeficiente
de no determinacin es 1- R 2 = 0,36 o 36%, es decir, e136% de la variacin de y no
se debe a la variacin de la variable x.

Algunos aspectos para definir el modelo de regresin


A continuacin se presentan algunos aspectos a considerar en la estimacin de un
modelo de regresin.
Analizar el grado de causa-efecto entre las variables a correlacionar. Si se sabe
el comportamiento del fenmeno en trminos de su ecuacin diferencial, como
por ejemplo, si el crecimiento de y por cada unidad de x es constante, es decir:

Z=

k. Entonces la ecuacin de regresin debe considerarse como la funcin

y = kx + e, o sea la familia de modelos rectilneos, que soluciona la ecuacin


diferencial.

Estar interesado en estimar la variable y a partir de valores de la variable x o


determinar la tendencia de esta relacin.
Desear determinar el grado de correlacin lineal entre las variables y y x.
Generar y analizar el diagrama de dispersin. Este paso es muy importante porque
permite establecer en forma grfica la tendencia de la relacin.
Seleccionar el modelo de regresin que tenga el valor ms alto del coeficiente de
determinacin y el menor nmero de variables en el modelo.

156

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPTULO

6
Planeacin estadstica
en un proyecto
de investigacin

La planeacin del proceso de recoleccin y organizacin del conjunto de observaciones


o datos en un proyecto de investigacin se constituye en etapas fundamentales en el
desarrollo de un estudio, pues estos aspectos permiten contribuir significativamente
con la coherencia entre la recoleccin, el anlisis de datos y los objetivos de la
investigacin. La planeacin de la recoleccin de los datos incluye la organizacin,
el manejo, la sistematizacin, la definicin de variables, sitios y frecuencias de
muestreo, definicin de instrumentos de recoleccin de datos, as como la definicin
de un sistema de informacin.
La planeacin estadstica debe hacerse desde la toma de las muestras hasta el anlisis
de los datos y la produccin de informes, con el fin de generar informacin confiable
y coherente con los objetivos de la investigacin. Para desarrollar el proceso de toma
de datos es necesario que el grupo de trabajo comprenda y comparta los objetivos del
proyecto, conociendo los aspectos de carcter tcnico y los conceptos a manejarse
dentro de la investigacin.
En este captulo se presenta el mtodo utilizado para el manejo de informacin en el
proyecto de investigacin sobre sistemas para potabilizacin de agua denominado
Proyecto Integrado de Investigacin y Demostracin de Mtodos de Filtracin
Gruesa para Sistemas de Abastecimiento de Agua, el cual fue desarrollado por el
Instituto Cinara de la Universidad del Valle en los aos de 1990 a 1995, realizado en

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

157

VIVIANA VARGAS FRANCO

la Estacin de Investigacin y Transferencia de Tecnologa localizada en la Planta


de Tratamiento de Agua Potable de Puerto Mallarino en predios de Emcali.
El Instituto Cinara de la Universidad del Valle realiza, entre otras actividades,
investigaciones sobre tecnologas simplificadas en el rea del abastecimiento de
agua potable con el objeto de desarrollarlas y adecuarlas a las condiciones tcnicas
y socio-econmicas de pases en va de desarrollo y como aporte a los problemas
de abastecimiento de agua del pas.
Una de las tecnologas investigadas, por el Instituto Cinara, es la tecnologa de
Filtracin en Mltiples Etapas (FiME), la cual es una alternativa tecnolgica para
la potabilizacin de agua, con mucho potencial de ser utilizada en las zonas rurales,
pequeos y medianos municipios. Esta tecnologa no requiere el uso de sustancias
qumicas ni componentes mecnicos y puede ser fcilmente operada, mantenida y
administrada por miembros de la comunidad.
Cuando la tecnologa FiME es seleccionada, diseada, construida, operada y
mantenida adecuadamente, produce efluentes con bajos niveles de turbiedad, sin la
presencia de impurezas ofensivas y libre de entero-bacterias, entero-virus y quistes
de protozoarios. (Visscher, 1996).
Una planta de tratamiento FiME generalmente consta de tres etapas de
tratamiento: un Filtro Grueso Dinmico (FGDi), un Filtro Grueso (FG) y un Filtro
Lento en Arena (FLA), tal como se presenta en la Figura 6.1. El Filtro Grueso
presenta varias opciones, dependiendo de tres aspectos: nmero de unidades,
sentido del flujo del agua y la forma de instalacin del material filtrante, que
en este caso son gravas. En esta investigacin se compararon cinco opciones
de filtracin gruesa (FG) operando en paralelo: Filtro Grueso Ascendente
en Serie(FGAS), Filtro Grueso Ascendente en Capas (FGAC), Filtro Grueso
Horizontal Modificado(FGHM), Filtro Grueso Horizontal (FGH) y Filtro Grueso
Descendente en Serie (FGDS).
El estudio de diferentes tipos de filtros gruesos se realiz para remover niveles
adecuados de turbiedad y otros parmetros, de tal forma que permitieran superar
las limitaciones de operacin que tiene la tecnologa de Filtracin Lenta en Arena
(FLA), la cual presenta dificultades en su operacin, cuando los niveles en la fuente
de abastecimiento supera en turbiedad 50 UNT en el afluente o cuando se presentan
amplias variaciones en perodos muy cortos, intensificando las labores de operacin
y mantenimiento, reduciendo significativamente la eficiencia del FLA. (CINARAIRC,1989).

158

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTUlO

6-

PlANEACIN ESTADfsTICA DE UN PROYECTO DE INVESTIGACiN

Etapas de filtracin

Desinfeccin terminal

,~--------------------------~,

Filtro grueso

Filtro lento

(FG)

en arena

,,-----------\

(FLA)

Figura 6.1 Esquema general de una planta de tratamiento con tecnologa FiME.
(Galvis, 1999).

6.1 Objetivos del proyecto


El equipo de trabajo debe entender claramente los objetivos del proyecto, pues estos
permiten guiar permanentemente las diversas actividades, en general, y en particular
el proceso de recoleccin y anlisis de datos.
Entre los objetivos del proyecto de investigacin: "Proyecto Integrado de Investigacin
y Demostracin de Mtodos de Filtracin Gruesa para Sistemas de Abastecimiento
de Agua", se destacan los siguientes:
Evaluar y comparar desde el punto de vista econmico, fsico-qumico ,
bacteriolgico e hidrulico, diferentes opciones de filtracin gruesa: FGAS ,
FGAC, FGH, FGHM Y FGDS .
Investigar diferentes alternativas de Filtracin Gruesa orientadas a producir
criterios de seleccin, diseo, operacin y mantenimiento.
Promover alternativas de Filtracin Gruesa que permitan superar las limitaciones
de la tecnologa de la Filtracin Lenta en Arena.

6.2 Descripcin del sistema


Realizar el esquema del sistema en estudio es una de las primeras actividades a
realizarse dentro del desarrollo de un proyecto de investigacin.
El sistema de evaluacin de la calidad de agua de los filtros gruesos se presenta en
la Figura 6.2. La fuente de abastecimiento utilizada fue el agua del ro Cauca en su
paso por la estacin Juanchito de la ciudad Santiago de Cali. La tecnologa FiME
evaluada consta de tres etapas: Filtro Grueso Dinmico (FGDi), Filtro Grueso (FG)
y Filtro Lento en Arena (FLA).

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

159

VIVIANA VARGAS FRANCO

Filtro Grueso Dinmico (FGDi). Consiste en una estructura que consta de una capa
de grava fina del orden de 0,2m-0,3m de profundidad. El agua que entra en la unidad
fluye sobre la capa fina de grava y parte de ella drena, a travs del lecho, hacia una
tubera perforada y continua hacia la siguiente etapa en el sistema de tratamiento. La
velocidad de operacin de estas unidades puede estar entre 1,0 m/h y 9,0 m/h.
Filtro Grueso Ascendente en Serie (FGAS). Consiste en tres estructuras, de 1,2 m a
1,5 m de altura, encontrndose en cada una determinado tamao de grava. La grava
se coloca de gruesa a fina. El agua atraviesa las tres estructuras, desde la grava gruesa
hasta la grava ms fina, con flujo ascendente. La velocidad de operacin es del orden
de 0,3 m/h a 3,0 m/h.

FLA 1

-t.4 ~

FLA2

-2.2 ~

~uenteO.1
deagua

~~[B~:]uP~~~~~

FLA3
3.4 ~

FLA4

-4.4 ~

FLA 5

-5.4 ~

Filtracin Gruesa Descendente en serie 3 Etapas (FGDS3)

Figura 6.2 Sistema del estudio de comparacin de Filtros Gruesos (Galvis,


1999)

Filtro Grueso Ascendente en Capas (FGAC). Consiste en una sola estructura, de 1,2 m
a 1,5 m de altura, en la cual la grava se encuentra instalada por capas, quedando en
el fondo el material grueso y en la superficie el material fino. La grava se coloca de
gruesa a fina. El agua atraviesa la estructura desde la grava gruesa hasta la grava
ms fina, con flujo ascendente. La velocidad de operacin es del orden de 0,3 m/h
a 3,0 m/h.
Filtro Grueso Horizontal (FGH). Consiste en una estructura rectangular, compuesta
de tres capas de grava las cuales van de gruesa a fina. El flujo del agua va en sentido
horizontal. La velocidad de operacin es del orden de 0,3 m/h a 3,0 m/h.

160

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPfTULO

6 - PLANEACIN

ESTADfsTICA DE UN PROYECTO DE INVESTIGACiN

Filtro Grueso Horizontal Modificado (FGHM). Consiste en una estructura


rectangular, compuesta de tres capas de grava las cuales van de gruesa a fina. En este
estudio ste es una modificacin del FGH. El flujo del agua va en sentido horizontal.
La velocidad de operacin es del orden de 0,3 m/h a 3,0 m/h.

Filtro Grueso Descendente en Serie (FGDS) . Consiste en tres estructuras de 1,2 m


a 1,5 m de altura, encontrndose en cada una determinado tamao de grava. La
grava se coloca de gruesa a fina. El agua atraviesa las tres estructuras, desde la grava
gruesa hasta la grava ms fina, con flujo descendente. La velocidad de operacin es
del orden de 0,3 m/h a 3,0 mIh.

Filtro Lento en Arena (FLA)~ Es una estructura que consiste en un lecho de arena
fina, de dimetro efectivo entre 0,2 mm y 0,3 mm, con una profundidad de 0,5 m
a 0,8 m, colocada sobre una camada de grava de medio de soporte y una tubera
como sistema de drenaje en el fondo. La altura total del filtro, desde el fondo hasta
la corona de los muros, puede variar de 1,90 m a 2,50 m y se puede construir en
hormign reforzado, ferrocemento, piedra o mampostera.

6.3 Codificacin del sistema


La codificacin del sistema de evaluacin permite una fcil ubicacin, agiliza el
manejo y desarrollo del muestreo, as como el diligenciamiento de los formatos
de campo y de laboratorio y la retroalimentacin al sistema de informacin. El
sistema de experimentacin, en la presente investigacin, se codific considerando
las diversas etapas de evaluacin de la calidad de agua que operan en el sistema, tal
como se presenta en la Tabla 6.1.

Tabla 6.1

Codificacin del sistema de evaluacin del proyecto de investigacin.


Codificaci6n

Etapas de mulltreo
0.1

Cruda

Acondicionadores

0.2 FGDiA:

Filtro Grueso Dinmico - A

0.3 FGDiB:

Filtro Grueso Dinmico - B

0.4 FGDiC:

Filtro Grueso Dinmico - C

FGAS1:

Filtro Grueso Ascendente en Serie etapa 1

1.2 FGAS2:

Filtro Grueso Ascendente en Serie etapa 2

1.3 FGAS3:

Filtro Grueso Ascendente en Serie etapa 3

1.4 HA1:

Filtro lento en Arena 1

2.1

Filtro Grueso Ascendente en Capas

1.1
Lnea 1

Lnea 2
I

Cruda

FGAC:

2.2 FlA2:

Filtro lento en Arena 2


Contina en la pgina siguiente

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

161

VIVIANA VARGAS FRANCO

Viene de la pgina anterior

Etapas de muestreo

Codificaci6n
3.1

FGHM 1: Filtro Grueso Horizontal Modificado 1

3.2 FGHM2: Filtro Grueso Horizontal Modificado 2

lnea 3

3.3 FGHM3: Filtro Grueso Horizontal Modificado 3

lnea 4

lnea 5

3.4 FLA3:

Filtro Lento en Arena 3

4.1

FGH1:

Filtro Grueso Horizontal 1

4.2 FGH2:

Filtro Grueso Horizontal 2

4.3

Filtro Grueso Horizontal 3

FGH3:

4.4 FLA4:

Filtro Lento en Arena 4

5.1

FGDS1:

Filtro Grueso Descendente en Serie 1

5.2 FGDS2:

Filtro Grueso Descendente en Serie 2

5.3 FGDS3:

Filtro Grueso Descendente en Serie 3

5.4 FlA5:

Filtro Lento en Arena 5

6.4 Definicin de variables, sitios y frecuencia de muestreo


En un estudio se presentan diversos tipos de variables, pero las que ms se
encuentran en los fenmenos ambientales y de ingeniera sanitaria son las
variables de tipo continuo. En la Tabla 6.2 se presentan las variables estudiadas
en el proyecto de acuerdo con su clasificacin entre qumicas, fsicas, biolgicas
e hidrulicas. Los coliformes fecales y los estreptococos fecales son variables de
tipo discreto, las otras variables estudiadas son de carcter continuo con nivel de
medicin de razn.
Tabla 6.2

Clasificacin de variables que se analizaron en el estudio.

Variables

Fsicas

Qumicas

Tipo

Nombre de las variables

Cuantitativas
continuas

Turbiedad (UNT)
Color real (UPC)
Slidos sedimentables (mg/llh)
Slidos suspendidos (mg/l)
Slidos voltiles (mg/l)
Slidos totales (mg/l)
Temperatura (OC)

Cuantitativas
continuas

pH (unidades)
Alcalinidad total (mgJl Ca C0 3)
Dureza total (mg/l Ca C0 3)
Oxgeno disuelto (mg/l)
Hierro total (mg/l)
Manganeso total (mgtl)

- - - --- ------ -- --- -- -- -- -

--- - - - - -- -

Contina en la pgina siguiente

162

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPfTULO

6-

PLANEACIN ESTADfsTICA DE UN PROYECTO DE INVESTIGACiN

Viene de la pgina anterior

Variables

Tipo

Nombre de las variables

Biolgicas

Cuantitativas
discretas

Coliformes fecales (UFC/100ml)


Estreptococos fecales (UFC/100ml)

Hidrulicas

Cuantitativas
continuas

Prdida de carga hidrulica(cm)


Prdida de carga parcial (cm)
Caudal (l/s)

Los sitios de muestreo estn relacionados con los objetivos de la investigacin as


como de las necesidades de evaluar y comparar el sistema integralmente. En la Tabla
6.3 se presenta la frecuencia de muestreo para cada una de las variables a analizar en
esta investigacin. Las frecuencias y puntos de muestreo se definieron de acuerdo
con la experiencia de los investigadores, los cuales consideraron la importancia de
las variables, los objetivos y el presupuesto disponible del proyecto de investigacin.
En otros casos, se utiliza la teora estadstica del muestreo para estimar el nmero de
muestras requerido en cada variable, considerando niveles de error, confiabilidad,
variabilidad y recursos.

Tabla 6.3

Frecuencia y puntos de muestreo para anlisis de calidad de agua en


el proyecto de investigacin.
Punto de muestreo
5.1

1.2
5.2

1.3
2.1
3.3
4.3
5.3

1.4
2.2
3.4
4.4
5.4

Total de
muestra por
variable

2s

2s

2s

2s

2s

4d/44s

3d

3d

3d

3d

3d

90d

Slidos suspendidos (mg/l)

2s

2s

2s

2s

2s

2s

1d/44s

Slidos voltiles (mg/l)

23m

Slidos totales (mg/l)

23m

Temperatura (OC)

4d

01

03
04
05

06

Color real (UPC)

4d

Turbiedad (UNT)

24d

Slidos sedimenta bies (ml/I/h)

1.1

Variable

Prdida de carga hidrulica (cm)

4d
3s

Prdida de carga parcial (cm)


Caudal (l/s)

10q

3s

3s

3s

3s

57s

19s

lOd

Contina en la pgina siguiente


ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

163

VIVIANA VARGAS FRANCO

Viene de la pgina anterior

Punto de muestreo
03
01

04

06

05

1.1
5.1

1.2
5.2

Variable

1.3
2.1
3.3
4.3
5.3

1.4
2.2
3.4
4.4
5.4

Total de
muestra por
variable

pH lunidadesl

12q

Alcalinidad totallmg/I CaC0 31

12m

Dureza totallmg/l CaC0 31

12m

Oxgeno disuelto Img/ll

12q

Hierro y manganeso totallmg/ll

23m

Coliformes fecales IUfC/lOOmll

2s

2s

2s

2s

2s

2s

2s

46s

Estreptococos fecales IUfC/l00mll

23q

d - diaria

s - semanal

q - quincenal

m - mensual

6.5 Formatos de muestreo


Es necesario registrar el conjunto de datos recolectados en instrumentos adecuados
como paso previo al resumen y anlisis de estos. En general en proyectos de
seguimiento de sistemas de monitoreo, el instrumento que se utiliza es el formato.
La definicin de los formatos debe planearse de tal forma que permita la obtencin
de los datos de una manera completa y eficiente, que facilite la uniformidad en las
diferentes observaciones y evite la recoleccin de datos no relevantes, redundantes
y desorganizados
El formato debe responder a los objetivos y propsitos de la investigacin y antes
de su puesta en operacin se debe probar su funcionalidad. Este aspecto se cumple
mediante una aplicacin piloto que detecte las fallas del instrumento de medicin.
La distribucin para diligenciar el formato debe ser lgica y ordenada. El orden de
los aspectos a evaluar debe responder a su importancia en el estudio, los datos deben
tener referencia de espacio y tiempo especficos.
El diligenciamiento de los formatos debe hacerse con criterios de calidad,
considerando que es la primera base de datos, no digital, que se tiene del estudio o
de la investigacin, y los datos son la materia prima para el procesamiento y anlisis
de los resultados. Uno de los formatos de la presente investigacin se presenta en
la Tabla 6.4, donde se incluyen las variables analizadas y los puntos de muestreo
definidos.

164

ESTADISTI CA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

6-

PLANEACIN ESTADIsTICA DE UN PROYECTO DE INVESTIGACiN

6.6 Flujo de informacin


A los datos recolectados es necesario hacerles un proceso de revisin y correccin en
cada etapa del flujo de informacin, considerando que las conclusiones del estudio
no pueden ser ms precisas que los datos sobre los cuales se basan, es decir, las
conclusiones que se derivan del estudio son de tal calidad y precisin como se lo
permitan los datos y su anlisis. Un conjunto de datos errados necesariamente va a
llevar a conclusiones erradas.
El flujo de la informacin del proyecto de investigacin se desarroll con base
en el esquema que se presenta en la Figura 6.3; este flujo permiti identificar el
seguimiento de los datos desde la toma de la muestra hasta el reporte y publicacin
de los resultados, adems permiti generar responsabilidades definidas en cada rea
de trabajo de la investigacin.
Las muestras fueron tomadas por los muestreadores de acuerdo con los sitios y horas
de muestreo especficos, las cuales eran llevadas a los laboratorios fisico-qumico
o bacteriolgico de acuerdo con el tipo de anlisis a realizar, estos laboratorios
analizaron y reportaron los datos al rea de ingeniera, que revis y realiz las
observaciones pertinentes, para posteriormente trasladar los formatos al rea de
informacin y sistemas donde se digitalizaron los datos en bases de datos y se realiz
el procesamiento estadstico, incluyendo resumen de los datos a travs de tablas y
grficos, los cuales fueron analizados en el rea de ingeniera, para posteriormente ser
presentados y analizados con la direccin del proyecto. El procesamiento estadstico
se realiz utilizando los programas SPSS y Excel.
Direccin
del
proyecto

Laboratorio
flsico-gulmico

Toma de
muestras

Anlisis de
muestras y
reporte de
datos

1-----

Comit de
seguimiento y
control de
proyectos Cinara

rea de in:enierla
Responsable del
proyecto

Laboratorio
microbiol:ico
Anlisis de
muestras y
reporte de datos

rea de
informacin
sistemas

Informacin
tcnica y socio
econmica
~

Base de datos
Anlisis estadstico

Figura 6.3 Esquema del flujo de informacin del proyecto de investigacin.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

165

O>
O>

Tabla 6.4

<

Formato para la recoleccin de datos del proyecto de investigacin.

<:
'i>

Instituto Cinara - Universidad del Valle e IRC-Holanda


Proyecto Integrado de Investigacin y Demostracin de Mtodos de Pretratamiento para Sistemas de Abastecimiento de Agua.

<
~
:Il
G)

Fecha:

m
(j)

-i

(j)

()
:Il

~
~

:Il
~

Z
G)

m
Z
;Ti

:Il

Variable
Hora
Turbiedad (UNTl
Color real (UPC)
pH (Unidades)
Alcalinidad
(l11li/1 CaCo3)
Dureza total (mgJI CaCo3)
Oxgeno disuelto (l11li/11
Slidos suspendidos (l11li/11
Estabilidad en suspensin
(an/h)
Slidos sedimentables
(mI/h)
000 (l11li/11

!!1

Prdida de carga (an)

m
Z

Caudal II/s)

Filtrabilidad (mI/3nin)
r....,(dias)

()

O
Z

- - - - - ----

Ul
"tl

Ul
Ul

LINEA 4

LINEA 3

Observaciones:

(j)

LINEAS

FGASl

FGAS2

FGAS3

FLAl

FGAC

FLA2

FGHMl

FGHM2

FGHM3

FLA3

FGHl

FGH2

FGH3

FLA4

FGDSl

FGDS2

FGDS3

FLAS

1.1

1.2

1.3

1.4

2.1

2.2

3.1

3.2

3.3

3.4

4.1

4.2

4.3

4.4

5.1

5.2

5.3

5.4

Estreptococos fecales
(UFC/lOOmI)
CoIiformes fecales
(UFC/1OOmI)

;::

LINEA 2

~atura(OC)

i>

LINEA 1

--

- ---

---

"TI
:Il
~

()

CAPrTULO

6 - PLANEACIN

ESTADrSTICA DE UN PROYECTO DE INVESTIGACiN

6.7 Sistema de informacin


Un sistema de informacin es un mecanismo o estructura administrativa que
tiene como funciones la captacin, almacenamiento, recuperacin y anlisis de
datos; permite recopilar, organizar, sistematizar y procesar los datos de manera
gil y confiable. El sistema de informacin consta de bases de datos que son una
combinacin de programas y archivos que se utilizan conjuntamente de manera
integrada y coordinada, las cuales permiten recolectar un conjunto de datos
mutuamente relacionados. La construccin de las bases de datos incluye la obtencin
de los datos, su codificacin, captacin y sistematizacin.
Para disear el sistema de informacin se dividi el sistema de estudio en cinco
ambientes: cruda, acondicionada, integrada, filtros gruesos y filtros lentos en arena.
Estos temes forman el esquema principal de la entrada a la base de datos. La base
de datos tuvo 21 archivos correspondientes a los diferentes sitios de muestreo en
la investigacin, tal como se presenta en la Figura 6.4 (ver Figura 6.4 en la pgina
siguiente). En las bases de datos los registros se organizan y se mantienen en una
tabla compuesta por filas y columnas, de tal forma que los datos sean fciles de
encontrar y procesar. Las filas en la base de datos se llaman registros y las columnas
campos. Entre las ventajas de las bases de datos se destacan las siguientes: evitan
la redundancia, reducen las inconsistencias y los errores de captura, y apoyan la
integridad y la independencia de los datos.
E! sistema de informacin planteado permiti desarrollar las comparaciones y
evaluaciones de inters en la investigacin, agiliz la adicin, modificacin y
consulta de registros. El anlisis estadstico descriptivo de los datos generados en
esta investigacin se presenta en el prximo captulo.

ESTADrSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

167

CAPiTULO

l. CRUDA
2. ACONDICIONADA

6-

PLANEACIN ESTADIsTICA DE UN PROYECTO DE INVESTIGACiN

L-J:I
l

FGD-A
FGD-B

FGD -C
---J

[ FGAS 1

3. INTEGRADA
FGAS2
FGAS3
FGHM 1

~(

FGHM

4. FILTROS GRUESOS

FGHM2

FGHM3

FGHI

~~

=-ti
[

5. FILTROS LENTOS
EN ARENA

Figura 6.4

168

H-.[

FLA I

FLA2

FLA3

FLA4

FLA5

FGH2
FGH3

FGDSI
F0002

FGDS 3

l
l
l
l

Esquema de la base de datos del proyecto de investigacin.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPTULO

7
Evaluacin de sistemas para
tratamiento de agua potable

Este captulo presenta el procesamiento descriptivo y grfico de un conjunto de datos


relacionado con la evaluacin de sistemas para tratamiento de agua potable. Los datos
fueron procesados y presentados en el programa estadstico SPSS y corresponden a
la evaluacin de cinco Filtros Gruesos (FG), evaluados en el marco de la tecnologa
de filtracin en mltiples etapas, FiME.
El estudio de evaluacin y seguimiento de los filtros gruesos lo realiz el instituto
Cinara de la Universidad del Valle, en la Estacin de Investigacin y Transferencia
de Tecnologa localizada en predios de la Planta de Tratamiento de Agua Potable de
Puerto Mallarino en Emcali, cuya fuente de agua cruda es el ro Cauca. Los aspectos
conceptuales de esta investigacin se presentaron en el captulo 6.
Un sistema de abastecimiento de agua para beber, asearse y para fines domsticos
es un elemento esencial para la salud, el bienestar y la productividad de las
comunidades, y es determinante en la calidad de vida de las personas. El agua
contaminada contiene una gran cantidad de bacterias y virus que exponen a la
comunidad a enfermedades de origen hdrico, entre las que se destacan el clera
y la enfermedad diarreica aguda (EDA). En pases en va de desarrollo, la EDA
es la segunda causa de muerte en los nios de 1 a 4 aos (OPS). El suministro

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

169

VIVIANA VARGAS FRANCO

continuo de agua en suficiente cantidad y de buena calidad es factor bsico en la


reduccin de enfermedades de origen hdrico.
En Amrica Latina las coberturas en abastecimiento de agua son del orden del 92%
para la zona urbana y 52% para la zona rural. En Colombia las coberturas son del
orden del 86% para la zona urbana y del 44% para la zona rural; sin embargo, se
estima que solo el 62% de los habitantes de las zonas urbanas reciben agua potable
y en la zona rural lo hace solamente el 10% (Mondragn, 1996). En la actualidad
estas cifras presentan la misma tendencia.
Las cifras presentadas sobre coberturas sugieren que el aprovisionamiento de agua
que cumpla con los tres elementos bsicos: continuidad, cantidad y calidad, es
especialmente crtico en la zona rural, los pequeos y medianos municipios y los
asentamientos marginales de las grandes ciudades, donde se presentan limitaciones
de recursos humanos, fisicos, econmicos, infraestructura administrativa y vas de
comunicacin, entre otros.
Una alternativa tecnolgica con mucho potencial para ser utilizada en los pequeos y
medianos municipios, las zonas rurales y urbano-marginales de las grandes ciudades
es la filtracin en mltiples etapas (FiME). Esta tecnologa ha sido desarrollada
sobre la base de la experiencia de la Filtracin Lenta en Arena (FLA) por el Instituto
Cinara, de la Universidad del Valle.
Una planta de tratamiento FiME generalmente consta de tres etapas: filtro grueso
dinmico (FGDi), filtro grueso (FG) y filtro lento en arena (FLA). El filtro grueso
presenta varias alternativas que dependen del sentido del flujo del agua y del
nmero de unidades: de flujo ascendente: en capas (FGAC) y en serie de tres
etapas (FGAS3), de flujo horizontal: (FGH3) y modificado (FGHM3) y de flujo
descendente en serie de tres etapas (FGDS3). Un esquema de la tecnologa FiME
se present en la Figura 6.1.
El Instituto Cinara evalu los cinco filtros gruesos (FG) en parmetros fisicoqumicos, bacteriolgicos e hidrulicos, con el fin de definir los mejores en
eficiencia. En este captulo se analiza la eficiencia de los FG en las variables
turbiedad y coliformes fecales, utilizando tcnicas estadsticas descriptivas y
grficos; la metodologa presentada se puede generalizar para las otras variables
analizadas en la investigacin. A continuacin se describen conceptualmente estas
variables.
Turbiedad. Es una medida de partculas orgnicas e inorgnicas en el agua, tales como
arcillas, sedimentos, partculas orgnicas coloidales, plancton y otros organismos

170

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

microscpicos, y estas partculas tienen un efecto en la salud pblica porque pueden


incluir microorganismos patgenos o sustancias txicas, p.e. asbesto (Craun, 1993).
Niveles altos de turbiedad pueden proteger los microorganismos de los efectos de la
desinfeccin y adems estimular el crecimiento de bacterias (WHO, 1993).
Coliformes fecales. Son organismos indicadores de contaminacin fecal,
particularmente Escherichia coli (E. coli), una bacteria que vive en los intestinos del
hombre y otros mamferos, los cuales son excretados en grandes cantidades en las
heces fecales. Este es un parmetro universal para indicar el grado de contaminacin
fecal en una fuente, debido a que el mayor riesgo microbiolgico en el agua est
asociado con la ingestin de agua contaminada con excretas de origen humano y
animal, y porque se ha establecido que la ingestin de patgenos causan enfermedades
de origen hdrido. (Craun, 1993)

7.1 Estadsticas descriptivas


Considerando que el afluente de los FG es el agua integrada, se calculan las
estadsticas descriptivas incluyendo esta etapa. Los filtros gruesos que presenten
menores valores efluentes en promedio y los de mayor remocin promedio sern
considerados los mejores.
La remocin de una variable se calcula con la frmula:

Rem

afluente - efluente
afluente

xl 00%

Turbiedad

La siguiente tabla presenta los resultados del programa estadstico SPSS en el clculo
de algunas estadsticas descriptivas.
Estadsticas descriptivas para turbiedad (UNT)

Integrad

FGAS3

FGAC

FGHM3

FGH3

FGDS

Media

73,6

12,4

21.7

21,2

13,3

16,5

Mediana

48,0

8,0

18,0

17,0

9,5

14,0

Moda

26,0

14,0

17,0

17,0

18,0

18,0

5790,1

139,7

342,2

256,6

100,0

228,3

Varianza
Desviacin tpica
Rango ordinal
N total

76,1

11,8

18,5

16,0

10,0

15,1

563,0

113,0

166,2

126,1

78,2

137,4

294

294

294

294

294

294

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

171

VIVIANA VARGAS FRANCO

Los filtros con menores efluentes promedios son el FGAS3 y el FGH3, estos
presentan un menor valor en la desviacin estndar y el rango, que significa una
mayor concentracin de los datos alrededor del valor medio, seguidos del FGDS.
Por el contrario, los filtros que presentan mayores valores en los efluentes son el
FGHM3 y el FGAC, con valores de dispersin y rango ms elevados, mostrando
una mayor dispersin en relacin con el valor medio efluente.
Las estadsticas descriptivas para la remocin de turbiedad se observan en la siguiente
tabla:
Estadsticas descriptivas para remocin de turbiedad (%)
REMFAGS3

REMFGAC

REMFGHM3

REMFGH3

REMFGDS

Media

80,3

66,2

65,1

77,5

73,6

Mediana

80,8

66,6

65,3

78,6

74,3

Moda

80,0

70,0

50,0

80,0

60,0

Varianza

82,5

127,0

194,6

103,0

124,9

9,1

11,3

13,9

10,1

11,2

Rango ordinal

45.4

59.4

82,1

50,8

71,5

N total

294

294

294

294

294

Desviacin tpica

Se puede analizar que los filtros con mayor eficiencia en la remocin de turbiedad son
el FGAS3 y el FGH3, los de menor eficiencia son el FGAC y el FGHM3, generando
los dos primeros menor variacin en cuanto al valor medio que los dos ltimos. En
la remocin de turbiedad la distribucin del FGAS es muy simtrica, considerando
que los valores de la media, la mediana y la moda son muy similares. El filtro que
presenta menor simetra es el FGHM3.
Coliformes fecales

Las estadsticas descriptivas para coliformes fecales se presentan en la siguiente


tabla:
Estadsticas descriptivas para coliformes fecales (UFC/100 mI)
INTEGRAD

FGAS3

FGAC

FGHM3

FGH3

FGDS

Media

24758

65

369

929

182

147

Mediana

13200

35

260

867

141

80

Moda

12900

12

10

1600

110

50

992226516

8287

150381

525016

18199

26053

31500

91

388

725

135

161

155000

389

1790

3807

618

760

31

31

31

31

31

31

Varianza
Desviacin tpica
Rango ordinal
N total

172

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO 7 - EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

Al igual que en turbiedad, los filtros con menores efluentes son el FGAS3, el FGDS
y el FGH3, similarmente con los menores valores de dispersin. Los filtros con
mayores efluentes en coliformes fecales son el FGAC y el FGHM3, as mismo, con
los mayores valores de dispersin.
A continuacin se presentan las estadsticas descriptivas para la remocin de
coliformes fecales.
Estadsticas descriptivas para remocin de coliformes fecales(%)
Media
Mediana
Moda
Varianza
Desviacin tpica
Rango ordinal
N total

REMFGAS3

REMFGAC

REMFGHM3

REMFGH3

REMFGDS

99
100
100
1
1
6
31

98
98
99
3

93
96
76
39
6

99
99
99
3

99
99
91

24

9
31

9
31

8
31

31

Considerando la remocin en coliformes fecales se tiene que los mayores promedios


los presentan el FGAS3, FGH3 y el FGDS3 y los menores el FGAC y el FGHM3.
Las desviaciones en cada una de las remociones son muy similares. Debido a la
magnitud de las unidades en coliformes fecales, los valores de remocin deben
analizarse ms detalladamente, considerando preferiblemente el nmero de unidades
logartmicas reducidas.

7.2 Grficos de medias, mnimos y mximos


La presentacin grfica de los datos es una de las etapas fundamentales en el anlisis
descriptivo del fenmeno estudiado; en este tem se presentan diversos tipos de
grficos que permiten analizar la eficiencia de los filtros gruesos. Estas grficas
se desarrollaron en la hoja electrnica Excel (Las instrucciones para realizarlas se
presentan en el captulo 11).

Turbiedad
La siguiente grfica muestra los valores medios de los efluentes de los filtros gruesos,
la desviacin estndar y el valor mximo.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

173

VIVIANA VARGAS FRANCO

so

.ID

.-._--........ '.
'10

'00

60

i:1; ,o

i
.1

80

20

40

,o
,GAS,

'GAC

fGHM3

Medi.

FGH3

FGDS3

_ _ _ Mlimo

'.

1111

1'. :

'00

ID

:i l60
~
~

40

.'"
1

20

>201

ro
!

60

I
~

1l
~

40

20

):

'GAS,

'GAC

'OHM'

'OH'

FGOS3

Media _ _ _ Mximo

Grfica de media, desviacin estndar y mximos en turbiedad (UNT)


y remocin de turbiedad (%)

Se puede evidenciar, considerando el valor medio, la desviacin estndar y el valor


mximo, que los mejores efluentes los tienen el FGAS3 y el FGH3, seguidos del
FGDS3. Los valores ms altos en el efluente suceden en el FGAC y el FGHM3.
En el FGAC se observa el mayor valor mximo, as como la mayor dispersin del
conjunto de datos analizados.
En la remocin de turbiedad, el FGAS3 es el que mayor media presenta, seguido del
FGH3, los filtros de menor remocin son el FGHM3 y el FGAC.
El grfico de series de tiempo permite visualizar la tendencia de una variable con
relacin al tiempo de muestreo de los datos, tal como se ilustra en las siguientes
grficas, donde se compara el comportamiento de los filtros FGAC y FGAS3 .

174

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

1+-----~--~~--~----~----_r----~----~~
70
1 lO
130
150
170
190
50
90

Da de operacin
- - - FGAC

---FGAS3

30 +-----~----r_----r_----r_--~~--~----~~

50

70

90

110

130

150

170

190

Da de operacin
---FGAS3

- - - FGAC

Grficas de series de tiempo en turbiedad (UNT) y remocin de


turbiedad (%)
En el efluente de turbiedad se puede analizar que la tendencia de los filtros es similar;
sin embargo, los efluentes del FGAS3 siempre son menores que los del FGAC, y
esta caracterstica es la deseable. En la remocin de turbiedad no se evidencia la
misma tendencia, presentando el FGAS3 siempre valores mayores de remocin que
los valores del FGAC.
Otro grfico muy til es el que presenta los valores mnimo, medio y mximo, donde
se puede observar y comparar la eficiencia de los filtros gruesos, de manera gil y
clara.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

175

VIVIANA VARGAS FRANCO

110

roo

150

lZ0

J-e
~

-i""

90

r-'

60
30
~

O
FGAS3

FGAC

FGHM3

FGH3

FGDS3

FGH3

FGDS3

+ M edia

,to

~100

1""

J 80

60

~
,~

40

20

.~

=c:

'-

o
FGAS3

FGAC

FGHM3

+ Media
Grfica de mnimos, media y mximos en turbiedad (UNT) y remocin
de turbiedad (%)

El filtro donde sucede el valor mximo ms elevado, en turbiedad, es el FGAC y


el filtro que tiene el menor valor mximo es el FGH3. Considerando la definicin
de rango como la diferencia entre el valor mximo y el valor mnimo, se tiene que
el filtro con menor rango es el FGH3 seguido del FGAS3 . Los filtros con mayor
rango son el FGAC y el FGDS3 , evidenciando una mayor dispersin de los datos
en estos filtros. En remocin, el filtro con los niveles ms bajos es el FGH3 y los
filtros que tienen los mejores niveles de remocin son el FGAS3 y el FGH3 . El
filtro con mayor rango es el FGHM3 y el de menor rango es el FGAS3 , seguido
del FGH3 .

176

ESTAD IsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPiTULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

Co/iformes fecales

El siguiente grfico muestra los valores: medio, desviacin estndar y valor mximo
del efluente de los filtros gruesos en coliformes fecales.

_.... --_.....__

10000

,
I

.~-_._--._--

.......

_------~._---~_._-

...-----1

1~

1000

100

...

lO

FGAS3

FGHM3

FGAC

FGH3

FGDS3

c:==::J Media ------ Mximo

120

--1f-

f--

--

-=-

--

r-

f- - -

1------

i-

f--

~.

r--

1-

r--

t-

---......

_. ~

100
80

f--

f-- 40

t-

1- 20

60

1
..

.i
~

o
FGAS3

FGAC

FGHM3

c:=::::J Media

FGH3

FGDS3

____ Mximo

Grfica de media, desviacin estndar y mximos en coliformes fecales


(UFC/ JOOml) y remocin de coliformesfecales (%)

El FGAS3 tiene el menor valor medio y valor mximo, seguidos del FGH3 y el
FGDS3. El filtro grueso con el mayor valor medio y el mayor valor mximo es
el FGHM3, seguido del FGAC. En la remocin, los menores valores se dan en el
FGHM3 y el FGAC. Las mayores remociones suceden en los filtros FGAS3, FGH3
y FGDS3, pero en ninguno de los filtros se evidencian grandes diferencias en sus
valores medios y mximos.

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

177

VIVIANA VARGAS FRANCO

A continuacin se presenta la grfica de series de tiempo para el efluente y la remocin


de algunos de los filtros gruesos evaluados, en coliformes fecales.

10000

1
~

e.

1000

100

10

SO

70

90

110

130

150

170

190

Da de operacin
- - - FGAS3

---FGAC

- - - FGHM3

110~i--~~~~~~~--~------~---------------'

:;.
~1001

tI

t~
i
~

90 I

80 I

~.

'1

............... ;;j'*'f'

cc::::::::

::;::w

\}
---~,L\t------------------------~
____
\1

70+1----~----~----r_--~__--~----~----~~

SO

70

90

110

130

150

170

190

Dla de operacin
- - - FGAS3

---FGAC

- - - FGHM3

Grfica de series de tiempo en coliformes f ecales (UFC/l00ml) y


remocin de coliformes fecales (%)
En el efluente de coliformes fecales se muestra una tendencia irregular en los filtros
gruesos, generando los menores valores el FGAS3 y los mayores valores el FGHM3.
En la remocin los mayores valores se dan en el FGAS3 y los menores valores el
FGAC.

178

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

7 -

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

El siguiente grfico ilustra los valores mnimo, mximo y media de los efluentes de
los filtros gruesos en coliformes fecales.

10VV'

....
:-

000

...

;;.;.;~:-

L....

100

~
L....

10

1
FGAS3

FGAC

FGHM3

FGH3

FGDS3

+ Media

110

FGAS3

FGAC

.~

70
FGHM3

FGH3

FGDS3

+ Media
Grfica de mnimos, media y mximos en coliformes fecales (UFC/
100ml) y remocin de coliformes fecales (%)
Se puede analizar que los menores valores medios se encuentran en los filtros gruesos:
FGAS3 y FGDS3 y las mayores medias en el FGHM3 y el FGAC. Los mayores
rangos suceden en el FGAS3 y el FGAC y los menores rangos en el FGHM3 y el
FGH3. Las mayores remociones se observan en los filtros FGAS3, FGH3 Y FGDS3
y la menor remocin se da en el FGHM3.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

179

VIVIANA VARGAS FRANCO

7.3 Histogramas
Las grficas de histograma penniten visualizar la fonna de la distribucin del conjunto
de datos, la cual se puede comparar con distribuciones tericas establecidas. Para
variables discretas las distribuciones a comparar pueden ser binomial, poisson,
geomtrica e hipergeomtrica, entre otras. En una variable continua las distribuciones
a comparar pueden ser unifonne, t-student, nonnal, chi-cuadrado, entre otras.
A continuacin, se presentan, para algunos filtros gruesos, los histogramas de turbiedad y
remocin de turbiedad, comparado con la distribucin nonnal. Las grficas corresponden
al procesamiento realizado en el software estadstico SSPS (las instrucciones se presentan
en el captulo 10). En cada grfico se observa la desviacin estndar (Desv. tip.), el valor
de la media (Media) y el nmero de datos analizados (N).
Turbiedad
loor,- - - - - - - - - - - - ,

70 T'-----------------------,
60

80
50

'r

.~ 40

~
~

.::

.:: 30

40

20

20
D~sv.

tlp. - 18,50
Media - 21

10

N-2 94,OO

UlIII,~ J~~;".
47.g.~n~u~M~~a~~

38g~n~~~a~~~~~nn~~

FGBJ - TURBIEDAD (UNT)

FGAC - TURBIEDAD (UN1J

60,'---------,
50

40

'g
~

.::

30

20

10

Desv. tlp. - 16,01


Media -U
1 11 11 1 11 1 1 1 1! II I I II I II ~

4 9 1318n

28~37

N - 194,OO

424752 5761

FGHM3 - TURBIEDAD (UNT)

Grfica de frecuencias absolutas para turbiedad

180

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS

7-

CAPfTULO

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

El grfico de frecuencias del FGAC muestra valores hasta 88 UNT, con frecuencias
significativas hasta 53 UNT Yfrecuencias mximas entre 3 UNT Y28 UNT. El FGH3
tiene valores hasta 49 UNT, con frecuencias significativas hasta 28 UNT Yfrecuencias
mximas entre 4 UNT Y 19 UNT. El FGHM3 presenta valores hasta 57 UNT, con
frecuencias significativas hasta 42 UNT Y frecuencias mximas entre 9 UNT Y 18
UNT. Las distribuciones evidencian cierto grado de asimetra con relacin al valor
medio, con sesgo a la derecha, es decir, las mayores frecuencias se presentan en los
valores menores de turbiedad, disminuyendo la frecuencia a medida que aumentan
los valores de turbiedad.
Analizando la distribucin de frecuencias, el mejor filtro en turbiedad es el FGH3,
pues tiene sus mayores frecuencias entre 4 UNT y 7 UNT, superando ms de 120
datos en este rango, mientras que el FGAC tiene ms de 120 datos en el rango de
8 UNT a 18 UNT.

Remocin de turbiedad
30. - - - - - - - - - ,

40 ~-------'

30
20

10

1\
n

10

I L

~ Mtm - u

lD111

0J;!
35 :I,J
40 ..!,J"U,
50U,
,,U,
eo.J.65,J..!,,J..!
O,"""
5 eo
"""85
J,.U,.1.
90 J,J'
95 N-1U,H

ni

rlAf1

Dtn.tip.- n ,17

I~

Dtn.tp..- JI.IJ

MtdM 11

O~
46 ""
52 ..!,J
56..!,J
eoU,
64U,
eaU,
'2U,'6.J.eo,J..!84,J..!8,8u92
,u96
L,LJ N -1f4,1IJ

FGAC - remocin en turbiedad (")

FGHJ remocin en turbiedad (")

60

50

40

';
_

30

20

,\
.\

/
10

h-

.~

Desv. tlp. - IJ,95


Ittl!diQ - 65

N-194.00

U~~503540"50"9085roU908590~

FGHMJ remocin en turbiedad (%)

Grfica de frecuencias absolutas para remocin de turbiedad

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

181

VIVIANA VARGAS FRANCO

El grfico de frecuencias en remocin de turbiedad para el FGAC muestra valores de


remocin entre 35% y 95%, con una gran concentracin de datos en el rango entre
50% y 75%. El FGH3 tiene frecuencias de remocin entre e148% y el 96%, con una
gran concentracin de valores entre 64% y 88%. El FGHM3 presenta frecuencias
de remocin entre el 15% y el 95%, con una gran concentracin entre 45% y 85%.
Las distribuciones de la remocin de turbiedad son simtricas en relacin con el
valor medio, con una buena aproximacin a la curva normal, es decir, las mayores
frecuencias se encuentran alrededor del valor medio de la remocin y muy pocas
frecuencias en los valores extremos de la distribucin de frecuencias. "'-.
Que la distribucin de los datos se aproxime a una curva normal es una caracterstica
deseable para el proceso de inferencia estadstica.

7.4 Tablas cruzadas


El cruce de variables, denominado tablas cruzadas o tablas de contingencia, permite
evaluar las frecuencias de una variable, condicionada a los valores de otra variable. En
la evaluacin de los filtros gruesos es importante analizar la eficiencia de diferentes
intervalos de calidad de agua en el afluente.
Considerando rangos de turbiedad en la integrada y rangos de turbiedad en el
efluente de los filtros gruesos, se presentan a continuacin tablas de contingencia
para los filtros FGAS3, FGAC y FGH3, las cuales fueron generadas con el software
estadstico SPSS.
En cada tabla la segunda columna muestra los intervalos de calidad del agua afluente
(agua integrada) y la primera fila los intervalos efluentes de los filtros gruesos. El
trmino "Recuento", en cada casilla, corresponde al nmero de datos que cumplen
la condicin del agua integrada y del efluente del filtro grueso. El primer porcentaje
en cada casilla corresponde al nivel porcentual por fila y el segundo porcentaje al
nivel porcentual por columna.

182

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

Tabla para FGAS3


Tabla de contingencia Integrada * FGAS3
Integrada

[0-201

[20401

[40501

[501001

>100

Total

Recuento
%de Integrada
%de FGAS3
Recuento
%de Integrada
%de FGAS3
Recuento
%de Integrada
%de FGAS3
Recuento
%de Integrada
%de FGAS3
Recuento
%de Integrada
%de FGAS3
Recuento
%de Integrada
%de FGAS3

(lO-20)

(5-lOl

(O-S)

9
100,0%
12,2%
48
45.7
64,9%
6
14,6%
8,1%
7
9,2%
9,5
4
6,3%
5.4%
74
25,2%
100,0%

FGAS3
(20-301

>30

Total

,0%
,0%
54
51.4
56,8%
19
46,3%
20,0%
14
18.4%
14.7%
8
12.7%

,0%
,0%
3
2,9
3,8%
15
36,6%
19,2%
42
55,3%
53,8%
18
28,6%
23,1%
78
26,5
100,0%

,0%
,0%
O
,0%
,0%
1
2.4%
3.4%

,0%
,0%
O
,0%
,0%
O
,0%
,0%
2
2,6%
11,1%
16
25.4%
88,9
18
6,1%
100,0%

8.4
95
32,3%
100,0%

11
14,5%
37,9%
17
27,0%
58,6
29
9,9%
100,0%

9
100,0%
3,1%
105
100,0%
35.7%
41
100,0%
13,9%
76
100,0%
25,9%
63
100,0%
21.4%
294
100,0%
100,0%

De la tabla se pueden analizar diversos aspectos: El 35,7% de los valores del afluente
estuvieron entre 20 UNT Y40 UNT yen este caso los valores efluentes se presentaron
entre OUNT Y 10 UNT con un porcentaje representativo del 97 ,1 %. Se obtiene que el
25,2% de los datos del FGAS3, se encuentran entre OUNT Y 5 UNT Y el 32,3% entre
5 UNT Y 10 UNT. Tambin se puede analizar que el 84% de los datos del FGAS3
son menores que 20 UNT Y el 57,5% de los datos son menores que 10 UNT.
Tabla para FGH3
Tabla de contingencia Integrada * FGH3
Integrada

[0201

[20-401

[40501

[501001

> 100

Total

Recuento
%de Integrada
%de FGH3
Recuento
%de Integrada
%de FGH3
Recuento
%de Integrada
%de FGH3
Recuento
%de Integrada
%de FGH3
Recuento
%de Integrada
%de FGH3
Recuento
%de Integrada
%de FGH3

(05)

(s-lO)

7
77,8%
20,0%
23
21,9%
65.7%
3
7,3%
8,6%
2
2,6%
5.7%
O
,0%
,0%
35
11,9%
100,0%

2
22,2%
1.7%
74
70,5%
61.7%
18
43,9%
15,0%
17
22.4%
14,2%
9
14,3%
7,5%
120
40,8%
100,0%

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

FGH3
(10-20)
(20-30)
O
O
,0%
,0%
,0%
,0%
7
1
1,0%
6.7%
8,5%
2,3%
17
3
41,5%
7,3%
7,0%
20.7%
35
20
46,1
26,3%
46,5%
42.7%
23
19
36,5%
30,2%
28,0%
44,2%
43
82
27,9%
14,6%
100,0%
100,0%

>30

Total

O
,0%
,0%
O
,0%
,0%
O
,0%
,0%
2
2,6%
14,3%
12
19,0%
85.7%
14
4,8%
100,0%

9
100,0%
3,1%
105
100,0%
35.7%
41
100,0%
13,9%
76
100,0%
25,9%
63
100,0%
21.4%
294
100,0%
100,0%

183

VIVIANA VARGAS FRANCO

Se puede analizar que el 35,7% de los datos del agua integrada se encuentran entre
20 UNT Y 40 UNT Y para este rango los valores efluentes al FGH3 se tienen entre O
UNT Y 5 UNT Y 5 UNT Y 10 UNT en porcentajes de 21 ,9 Y 70,5 respectivamente.
Se visualiza que el 11,9% de los datos del FGH3 se dan entre O UNT Y 5 UNT Y
el 40,8% entre 5 UNT Y 10 UNT. Tambin se puede analizar que el 80,6% de los
efluentes del FGH3 son menores que 20 UNT Y el 52,7% de los datos son menores
que 10 UNT.
Tabla para FGAC
Tabla de contingencia Integrada FGAC

FGAC
(510)

(05)
Integrada

(020)

(2040)

(4050)

(50100)

> 100

Total
- -

Recuento
%de Integrada
%de fGAC
Recuento
%de Integrada
%de fGAC
Recuento
%de Integrada
%de fGAC
Recuento
%de Integrada
%de fGAC
Recuento
%de Integrada
%de fGAC
Recuento
%de Integrada
%de fGAC

7
77,8%
50,0%
7
6.7%
50,0%

O
,0%
,0%

O
,0%
,0%

,0%
,0%
14
4,8%
100,0%

(1020)

2
22,2%
3,1%
58
55,2%
89,2%
3
7,3%
4.6%
2
2,6%
3,1%

O
,0%
,0%
65
22,1%
100,0%

O
,0%
,0%
40
38,1%
44,0%
26
63.4%
28,6%
20
26,3%
22,0%
5
7,9%
5,5%
91
31,0%
100,0%

(2030)

Total

>30

O
,0%
,0%

O
,0%
,0%
12
29,3%
18,5%
41
53,9%
63,1
12
19,0%
18,5%
65
22,1%
100,0%

O
,0%
,0%

O
,0%
,0%

O
,0%
,0%
13
17,1%
22,0%
46
73,0%
78,0%
59
20,1%
100,0%

9
100,0%
3,1%
105
100,0%
35,7%
41
100,0%
13,9%
76
100,0%
25,9%
63
100.0%
21.4%
294
100,0%
100,0%

Se puede analizar que el 35,7% de los datos de la integrada se encuentran entre 20


UNT Y 40 UNT Y en este rango los valores efluentes al FGAC se dan entre OUNT Y
5 UNTy 5 UNTy 10 UNTenporcentajes de 6,7 y 55,2 respectivamente. Se visualiza
que el 4,8% de los datos del FGAC estn entre O UNT Y 5 UNT Y el 22,1% se da
entre 5 UNT Y 10 UNT. Tambin se puede analizar que slo el 57,9% de los datos
del FGAC son menores que 20 UNT, con relacin al 84% del FGAS3 y al 80,6%
del FGH3 y nicamente el 26,9% es menor que 10 UNT.

184

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

7.5 Grficos de frecuencias acumuladas


Los grficos de frecuencias acumuladas permiten analizar los niveles de turbiedad
y los porcentajes en que estos niveles se presentaron en cada filtro grueso. A
continuacin se muestran las grficas de frecuencias acumuladas para los filtros:
FGAS3, FGDS y FGHM3. Las grficas se procesaron en el programa estadstico
SPSS.

'''''
75

.~
lO:

!O\

.:

""
'"

25.0

""O
FGAS3

75,0

'"

100,0

25,0

""O

15.0

100,0

125,0

FGDS

'''''
'"
.~
lO:

!O\

.:

""
25,0

50,0

75,0

100,0

125.0

FGHM3

Grfica de frecuencias acumuladas para turbiedad

En el FGAS3 alrededor del 88% de los datos son menores que 25 UNT Y alrededor
del 98% de los datos son menores que 50 UNT. En el FGDS alrededor del 80% de
los datos son menores que 25 UNT Y alrededor del 98% de los datos son menores
que 50 UNT. En el FGHM3 alrededor del 70% de los datos son menores que 25
UNTy alrededor del 95% de los datos son menores que 50 UNT. De estos tres filtros,

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

185

VIVIANA VARGAS FRANCO

segn la grfica de frecuencias acumuladas, el ms eficiente es el FGAS3, seguido


del FGDS y por ltimo el FGHM3.

7.6 Grficos de tallos y hojas


Los grficos de tallos y hojas permiten visualizar en forma detallada la distribucin
de frecuencias del conjunto de datos. Las salidas que se observan a continuacin
corresponden al proceso en el software SPSS. En la columna "Frecuency" se presenta
la frecuencia absoluta de los datos; en la columna "Steam" se da el valor de los tallos
y en la columna "Leaf' se tiene el valor de las hojas para cada tallo.
Diagrama para el FGAS3

En este caso las mximas frecuencias se dan en los valores menores o iguales a
9 UNT Y las mnimas frecuencias se tienen en los valores mayores o iguales a 20
UNT. Se puede analizar en el diagrama de tallos y hojas que 33 datos de turbiedad
tomaron valores entre 2 UNT y 3 UNT; 63 datos tomaron valores entre 4 UNT y 5
UNT; 46 datos entre 6 UNT y 7 UNT y 27 datos entre 8 UNT y 9 UNT, siendo estas
las mayores frecuencias.
Diagrama de tallos y hojas para el FGAS3
FGAS3

Plot

Stem-and-Lea~

Frequency
,00
33,00
63,00
46,00
27,00
2,00
13,00
27,00
18,00
18,00
8,00
6,00
4,00
7,00
4,00
6,00
2,00
10,00

Stem

o
o
o
o
o
1
1
1
1
1
2
2
2
2
2
3
3
Extr~m~~

&

Leaf

2222222333333333
4444444444444444444455555555555
66666666667777777777777
8888888889999
,\;

223333
4444444555555
66666777
88889999
0111
233
5&
677
9&
011
2

(>=33)

Stem widch:
10,0
Each leaf:
2 case(s)
& denotes fractional leaves.

186

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPiTULO

7 - EVALUACiN

DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

Diagrama para el fGAC

En el FGAC las mximas frecuencias estn en los valores de 5 UNT a 9 UNT Y


entre 15 UNT Y 19 UNT. Las menores frecuencias se encuentran en los valores
mayores que 30 UNT. Del diagrama de tallos y hojas se puede evidenciar que 65
datos de turbiedad tomaron valores entre 5 UNT Y 9 UNT; 27 datos entre 12 UNT
y 14 UNT; 64 datos entre 15 UNT y 19 UNT y 39 datos entre 20 UNT y 24 UNT,
siendo estas las mayores frecuencias.
Diagrama de tallos y hojas para el FGAC

FGAC

5tem-and-Lea~

Frequency

Plot

Stem o;

14,00
o
65,00
O
27,00
1
64,00
1
3 9,00
2
26,00
2
17,00
3
12,00
3
8,00
4
6,00
4
1,00
5
15,00 Extremes

5tem tJidth:
Each lea:f:

Lea:f
334444.q
55566666677777888888888999999999
223333.q444.q40;
5555556666777777777788888889999
000111223333444444
55666678889
001134.q&
5678&
023&
6&
&

( > =51)
10,0
2 case (s)

& denotes fractional

leaves.

Diagrama para el fGH3

Aqu, las mximas frecuencias se encuentran entre los valores de 4UNT y 9 UNT
y las menores frecuencias entre los valores de 20 UNT a 32 UNT. Del diagrama de
tallos y hojas se puede evidenciar que 16 datos tomaron el valor de 3 UNT, 40 datos
se encuentran entre 4 UNT y 5 UNT; 71 datos se dan entre 6 UNT y 7 UNT y 28
datos entre 8 UNT y 9 UNT, siendo estas las mayores frecuencias.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

187

VIVIANA VARGAS FRANCO

Diagrama de tallos y hojas para el FGH3

FGH3 Stem-and-Leaf Plot


Frequency

Stem &

16,00
o
40,00
o
71,00
o
28,00
o
1,00
1
8,00
1
26,00
1
25,00
1
22,00
1
17,00
2
9,00
2
6,00
2
2
6,00
5,00
2
1,00
3
5,00
3
2,00
3
6,00 Extreme!!!

Leaf
3333333&
4444444445555555555
66666666666666666666677777777777777
88888888999999
&

2333
4444455555555
666677777777
88888888899
00000111
2233
445
77&
99&
&

22&
&
(>~38)

Stem width:
10,0
Each leaf:
2 case(s)
& denotes fractional leaves.

De los diagramas de tallos y hojas, para los tres filtros analizados, el FGAS3 tiene la
mejor distribucin, debido a que 169 datos tienen valores de turbiedad en el rango
de 2 UNT a 9 UNT, seguido del FGH3 con 155 datos en el mismo rango y luego se
encuentra el FGAC con slo 79 datos en este rango.
Comparaciones de diagramas de tallos y hojas

El diagrama de tallos y hojas compuesto permite comparar dos distribuciones


simultneamente. A continuacin se presenta la comparacin de los efluentes de
algunos filtros gruesos:
Diagrama para el FGAC y FGAS

La distribucin del filtro FGAS muestra las mayores frecuencias en los valores hasta
9 UNT, mientras que en la distribucin del FGAC, la concentracin de las frecuencias
se encuentra entre 8 UNT y 9 UNT y entre 16 UNT y 17 UNT. As mismo, el FGAS
presenta pocos datos mayores a 20 UNT, contrario al FGAC.

188

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPiTULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

Diagrama de tallos y hojas para el FGAC y el FGAS

....
fGAC

1
1
33 Ir

Ir

44444555
66666677777 I
888888888999999999

Ii

I1
223333
444444555555
66667777777777
88888889999
000111
223333
44444455
66667
8889
0011
3&
445
67

Ii

I1
11
11
11
11
11
11
I1
I1
11
11
11
8& 11

o
I
I
1

23& 11
6&
&

11

51 11

....
JGAI

'l'al.1o

o
o
o
o
1
1
1
1
1
I
2
I

2
2

J
J

1
J
J

1
1I
1I
1I
1I
li
1
1

66666666667777777777777
8888888889999

223333
4444444555555
66666777
88889999
0111

I
I
I
I
I
I

233

I
I
I
I
1I
I
I
1I
I
1I
I
1I

bt-.
(>-)

2222222333333333

1 4444444444444444444455555555555

5.
677
9&
011
2.

33
1

Diagrama para el FGAC y FGHM

El diagrama de tallos y hojas para comparar las distribuciones del FGAC y el FGHM
permite analizar que las distribuciones de frecuencias de estos dos filtros son muy
similares, con mayores frecuencias en los valores de 8 UNT Y 9 UNT de turbiedad
y entre 16 UNT y 17 UNT. Las menores frecuencias se dan a partir de 22 UNT en
las dos distribuciones (ver diagrama en la pgina siguiente).

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

189

VIVIANA VARGAS FRANCO

Diagrama de tallos y hojas para el FGAC y el FGHM

I
I
[

...

JGAC

ftllo

.....

I'GIIIII

1
1
1
1
1
1
1

o
o
o
o

11
11 H555555
11 666117777777
11 88888888888999999999

11

223333 1I
444444555555 1I
66667777777777 11
88888889999

1
1
1

11 2333
11 444445555555
11 66666677777177

11

88 888 888999

11
11
11
11
11
11

00011111
22233

I
I
I

45
666671777

33
44444555
66666671771

888888888999999999

000111
223333
44444455
66667
8889
0011

3&
445

00

88999
01
333
4H5

67 11
8& 11

o 11
23& 11
6& 11

11
11
51 11

8.
0001

3.
6&

I
I

--

3&
54

l>el

7.7 Percentiles
Los percentiles son valores que permiten analizar de forma detallada las frecuencias,
en general los percentiles ms utilizados son el percentil 95 y el percentil 99.
Tabla de valores percentiles en los filtros gruesos en turbiedad

Percentil 05

Integrad
21,0

FGAS3
3,2

FGAC
5,0

FGH3
3,8

FGHM3
5,7

FGDS
3,9

Percentil 25

30,0

3,9

9,6

9,2

7,5

Mediana

48,0

8,0

18,0

6.4
9,5

17,0

14,0

Percentil 75
Percentil 95

84,0

16,0

26,0

18,0

27,0

20,0

220,0

31,0

51,0

29,0

48,0

39,0

Percentil 99

450,0

68,0

110,0

50,0

100,0

105,0

De la tabla se puede analizar que el 50%, es decir, la mediana de los datos, toman
valores menores a 48 UNT en la integrada; 8 UNT en el FGAS3; 18 en el FGAC;
9,5 en el FGH3 ; 17 en el FGHM3 y 14 en el FGDS.

190

ESTAOfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPrTULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

El 75% de los datos tiene valores menores a 84 UNT en la integrada; 16 UNT en el


FGAS3; 26 UNT en el FGAC; 18 UNT en el FGH3; 27 UNT en el FGHM3 y 20
UNT en el FGDS.
El 95% de los datos toma valores menores a 220 UNT en la integrada; 31 UNT en
el FGAS3; 51 UNTen el FGAC; 29 UNT en el FGH3 ; 48 UNTen el FGHM3 y 39
UNT en el FGDS.
Analizando el percentil95, los mejores filtros son el FGAS3 y el FGH3, seguido del
FGDS y por ltimo los filtros FGAC y FGHM3.
A continuacin se presentan los grficos de diversos percentiles para los filtros
FGAS3 y FGAC.

Grficas de valores percentiles para el FGAS3 (1 y 2) en turbiedad

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

191

VIVIANA VARGAS FRANCO

GrfICo de percelltiks JHlrt:l FGAC (1)


1~rl------~--------tl--------~-160
140
~ 120
0::.'00
80
~ 60

Grficas de valores percentiles para el FGAC (1 y 2) en turbiedad


En trminos generales, el FGAS3 presenta valores percentiles menores a los valores
percentiles del FGAC, lo cual evidencia la fortaleza del FGAS3 en relacin con el
FGAC.

192

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPiTULO

7-

EVALUACiN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE

7.8 Diagramas de cajas y alambres


Los diagramas de cajas y alambres permiten estimar grficamente la forma de
distribucin de los filtros gruesos, ste se puede realizar considerando tambin
valores extremos y valores atpicos u "outliers".
Turbiedad

En el diagrama de cajas general (a) se puede evidenciar que los filtros ms homogneos
en su distribucin son el FGAS3 , FGH3 y el FGDS, con mayor homogeneidad en la
distribucin del FGDS, en relacin con el valor de la mediana.
Considerando el diagrama con valores extremos y "outliers" (b) se puede evidenciar
que en los efluentes de los filtros existen valores extremos, denotados por "o" y valores
atpicos u "outliers" denotados por "*" (el nmero indica la posicin de la observacin
en la base de datos). Los valores atpicos se deben analizar cuidadosamente, con el
fin de definir el grado de validez de los mismos .

~----------------------~

...

*t..

1
...

100
*to.

-,..

20

50

...
FGAS3

... ...
FGAC

FGHM3

... ...
FGH3

FGDS

....

too

110

FGAS3

....

.........

*t..
*tAO
*t..
*to,

....

.....
.....

...
FGAC

FGHM3

FGH3

FGDS

(b)

(a)

Grfico de cajas y alambres para turbiedad


Coliformes fecales

En el diagrama de cajas general (a) se puede evidenciar que los filtros ms


homogneos son el FGAS3 , FGH3 y el FGDS. El filtro con mayor dispersin lo
presenta el FGHM3 , seguido del FGAC.
Considerando el diagrama con valores extremos (b) se puede evidenciar que en el
efluente del FGHM3 no se presentan ni valores extremos ni atpicos, mientras que en
los otros filtros se presentan entre 1 o 2 valores extremos y 1 o 2 valores atpicos.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

193

VIVIANA VARGAS FRANCO

~rl-----------------------------'

*"
=-1500

f500

~
2,;

2-

u.

u.

J
8

,;

~ 1000

~1ooo

500

01
N-

"

FGAS3

"

FGAC

"

FGHM3

(a)

"

FGH3

"

FGDS

....

-w,

Q,

500

N_

"

FGAS3

"

FGAC

31

FGHM3

"

FGH3

B'
"

FGDS

(b)

Grfico de cajas y alambres para coliformes fecales

En general, se puede analizar que los mejores filtros gruesos evaluados en cuanto
a turbiedad ycoliformes fecales fueron el FGAS y el FGH, seguido del FGDS; por
ltimo se encuentran el FGAC y el FGHM. En el porcentaje de remocin los mejores
filtros fueron el FGAS, FGDS y FGH, seguidos del FGAC y el FGHM.
Sin embargo, para una adecuada seleccin de un filtro grueso es necesario
analizar otros parmetros de calidad de agua y considerar factores de operacin y
mantenimiento, as como los costos de inversin inicial, administracin, operacin
y mantenimiento de cada una de las unidades.

194

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPTULO

8
Calidad de aire

Este captulo presenta el manejo de informacin asociado a la calidad del aire


medido en diferentes estaciones de Santiago de Cali; los datos y la informacin
se tomaron del Departamento Administrativo de Gestin del Medio Ambiente de
Cali, a travs de su direccin electrnica www.dagmacali.gov.co. Tambin se
presenta el manejo de informacin de la calidad de aire de la ciudad de Mxico, de
su Sistema de Monitoreo Atmosfrico de Ciudad de Mxico - SIMAT, presentado
en su pgina electrnica (www.sma.df.gob.mx/simat/pnindicadores.htrn). Para los
datos de Santiago de Cali se analizan los parmetros dixido de azufre, material
particulado y ozono.
El aire es una mezcla gaseosa compuesta en un 78% de nitrgeno, un 21 % de oxgeno
y un 1% de gases como bixido de carbono, ozono, argn, xenn y radn, entre

otros. Se considera contaminacin del aire a la adicin de cualquier sustancia que


altere sus propiedades fisicas o qumicas.
Debido a la contaminacin atmosfrica que se prese.n ta principalmente en las
ciudades, y con el fin de proteger la salud de sus habitantes, se necesita implementar
acciones para mejorar la calidad del aire, y el primer paso es medir su calidad,
determinando sus causas, y evaluar sus efectos y los problemas fundamentales que
se presentan para disear un plan acorde con ellos.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

195

VIVIANA VARGAS FRANCO

Alrededor del mundo se ha encontrado que en los centros urbanos las fuentes mviles
son las mayores contribuyentes de emisiones contaminantes a la atmsfera, siendo
siempre ms significativas, comparadas con las emisiones de fuentes fijas. Un menor
aporte de emisiones es ocasionado por fenmenos asociados a las actividades de
urbanizacin, tales como: deforestacin, tala de rboles, apertura de vas, erosin de
cerros, disposicin de escombros, disposicin de desechos slidos y almacenamiento
de combustibles, entre otros. A continuacin se describen algunos parmetros de
calidad de aire.
Dixido de Azufre (S02)

Es un gas incoloro de olor caracterstico, constituido por un tomo de azufre y


dos tomos de oxgeno en su estructura molecular. Se origina por la combustin
o proceso de combustibles que contienen azufre (disel y combustible) y la
fundicin de minerales ricos en sulfatos. Se genera principalmente por la industria,
seguido de los vehculos automotores. Los compuestos que contienen azufre estn
presentes en la atmsfera natural no contaminada. Estas sustancias provienen de
la descomposicin bacteriana de la materia orgnica, de los gases volcnicos y
otras fuentes. Sin embargo, su contribucin en el balance total de S02 resulta muy
pequea en comparacin con las producidas en los centros urbanos e industriales
como resultado de las actividades humanas.
El S02 atmosfrico puede oxidarse a S03 por diferentes medios y reaccionar con la
humedad del entorno (H2S04), los cuales se dispersan en el ambiente en forma de
lluvia, niebla, nieve y roco, dando origen a un proceso de acidificacin de la tierra
y cuerpos de lluvia (lluvia cida).
En altas concentraciones, el dixido de azufre puede ocasionar dificultad para
respirar; humedad excesiva en las mucosas de las conjuntivas, irritacin severa en
vas respiratorias e incluso al interior de los pulmones por formacin de partculas
de cido sulfrico, ocasionando vulnerabilidad en las defensas.
El dixido de azufre es causante de enfermedades respiratorias como broncoconstriccin,
bronquitis y traquetis, agravamiento de enfermedades respiratorias y cardiovasculares
existentes y la muerte; si bien los efectos sealados dependen en gran medida de la
sensibilidad de cada individuo, los grupos de la poblacin ms sensibles al dixido de
azufre incluyen a los nios y ancianos, a los asmticos y aquellos con enfermedades
pulmonares crnicas como bronquitis y enfisema.
La OMS recomienda como lmite para preservar la salud pblica una concentracin
de 100 aSO llg/m3 promedio de 24 horas, y de 40 a 60 Ilg/m 3 en una media aritmtica
anual.

196

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

8 - CALIDAD

DE AIRE

Material particulado o partculas (PMJ

En contaminacin atmosfrica se reconoce como partcula a cualquier material


slido o lquido con un dimetro que oscila entre 0,0002 y 500 micrmetros (.tm).
En conjunto se designan como partculas suspendidas totales o PST.
Las fuentes de emisin de partculas pueden ser naturales o antropognicas. Entre
las naturales se encuentran: viento, erosin del suelo, material biolgico fraccionado,
erupciones volcnicas, incendios forestales y polinizacin de plantas, entre otros.
Entre las fuentes antropognicas se encuentran: combustin de productos derivados
del petrleo, quemas en campos agrcolas, fertilizacin y almacenamiento de granos,
la industria de la construccin y diversos procesos industriales.
Las partculas pueden tener una composicin fisicoqumica homognea o estar constituidas
por diversos compuestos orgnicos e inorgnicos. Entre los componentes orgnicos se
encuentran: fenoles, cidos, alcoholes y material biolgico (polen, protozoarios, bacterias,
virus, hongos, esporas y algas). Entre los compuestos inorgnicos se encuentran nitratos,
sulfatos, polmeros, silicatos, metales pesados (hierro, plomo, manganeso, zinc o vanadio)
y elementos derivados de pesticidas y plaguicidas. Las partculas se clasifican de acuerdo
con su efecto en la salud humana, como producto derivado de un proceso natural o
antropognico y por sus caractersticas fsicas:

Partculas sedimenta bies (> 10/-1m ). Son partculas que por su peso tienden a
precipitarse con facilidad, razn por la cual permanecen suspendidas en el aire en
perodos cortos. Por lo general no representan riesgos significativos para la salud.
Partculas menores a 10 micrmetros (~ 10/-1m ) (PMlO)' Son partculas de
dimetro aerodinmico equivalente o menor a lOllm. Se consideran perjudiciales
para la salud debido a que no son retenidas por el sistema de limpieza natural del
tracto respiratorio.
Partculas menores a 2,5 micrmetros (~ 2,5/-1m). Son partculas de dimetro
aerodinmico equivalente o menor que 2,5 .tm. Representan un mayor riesgo para
la salud humana, pueden ser un factor de muerte prematura en la poblacin.
El material particulado puede tener efectos negativos en la salud y bienestar del
hombre, ya que puede contribuir a aumentar las enfermedades respiratorias como
la bronquitis y agudizar los efectos de otras enfermedades cardiovasculares. As
mismo, afecta la visibilidad y velocidad de deterioro de muchos materiales hechos
por el hombre.
El riesgo a la salud por partculas lo constituye su concentracin y el tiempo de
exposicin en el aire, sin embargo, el tamao es la caracterstica fsica ms importante

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

197

VIVIANA VARGAS FRANCO

para determinar su toxicidad y efectos en la salud humana. Las partculas mayores


a 10 11m son retenidas bsicamente en las vas respiratorias superiores y eliminadas
en su mayor parte por el sistema de limpieza natural del tracto respiratorio, por lo
que no son consideradas significativamente dainas para la salud; sin embargo, la
exposicin continua a altas concentraciones puede causar irritacin de garganta y
mucosa.
Las PMIO (fraccin respirable) no son retenidas en las vas respiratorias superiores,
cerca de un tercio penetra hasta los pulmones. Su efecto depende de su composicin
qumica, pueden producir irritacin de las vas respiratorias, agravar el asma y
favorecer las enfermedades cardiovasculares. En el corto plazo la contaminacin por
PMo puede causar deterioro de la funcin respiratoria y en el largo plazo se asocia
con el desarrollo de enfermedades crnicas, el cncer o la muerte prematura.
Ozono (03)

El ozono es un gas altamente reactivo, de color azul plido, constituido por tres
tomos de oxgeno en su estructura molecular. Este se puede clasificar en dos grandes
grupos: ozono estratosfrico y ozono troposfrico.

Ozono estratosfrico. Se origina en forma natural en la estratosfera (entre 12 km y


50 km a partir del suelo) mediante la fotodisificacin del oxgeno producida por la
radiacin solar ultravioleta; se concentra en una capa delgada denominada ozonosfera,
la cual filtra y modera la radiacin solar ultravioleta y otras partculas energticas
que inciden sobre la superficie terrestre. Esta accin protectora de la capa de ozono
permite que se lleven a cabo diversos procesos en los ecosistemas naturales: en la
clula evita que se rompan las molculas de ADN y enlaces de carbono. En los
ltimos cincuenta aos la emisin de clorofiuorocarbono (CFC), usado en equipos
de refrigeracin, aire acondicionado, aerosoles y esponjas plsticas, ha provocado
el deterioro y debilitamiento de la ozonosfera en un orden de 3% cada diez aos.
Ozono troposfrico. En la troposfera (de O km a 12 km a partir de la superficie
terrestre) el ozono se produce por la reaccin fotoqumica de xidos de nitrgeno
(NOx) y compuestos orgnicos voltiles (COY' s) derivados del uso de combustibles
fsiles, los cuales se denominan precursores del ozono. La reaccin fotoqumica se
produce cuando los NOx y los COY's reaccionan con la luz solar, lo que produce
un tomo libre de oxgeno (O). Este tomo libre puede adicionarse a una molcula
de oxgeno (02) y formar una molcula de ozono (0 3), El proceso es reversible y
est condicionado por la intensidad de la radiacin solar.
La OMS recomienda como lmite para preservar la salud pblica una concentracin
de ozono de 0,05 a 0,10 ppm (partes por milln) por hora, cada tres aos.

198

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

8 - CALIDAD

DE AIRE

El ozono se considera uno de los contaminantes de mayor preocupacin en la


actualidad, ya que es altamente oxidante y afecta los tejidos vivos, se asocia con
diversos padecimientos en la salud humana. Los individuos que viven en zonas
donde se registran regularmente concentraciones altas de ozono presentan diversos
sntomas como: irritacin ocular, de nariz y garganta, tos, dificultad y dolor durante
la respiracin profunda, dolor subesternal, opresin en el pecho, malestar general,
debilidad, nusea y dolor de cabeza. Por otra parte, los daos por exposicin al
ozono dependen de la sensibilidad de cada individuo y del tipo de exposicin. El
ozono causa severos daos al follaje de algunas variedades de plantas y en otras
reduce significativamente su crecimiento.

Otros indicadores de calidad de aire


El monxido de carbono es un gas incoloro e inodoro, que en concentraciones altas
puede ser letal. La principal fuente antropognica de monxido de carbono es la
quema incompleta de combustibles como la gasolina. Para que se complete el proceso
de combustin es necesario que haya una cantidad adecuada de oxgeno. Cuando
ste es insuficiente, se forma el monxido de carbono y una manera de reducirlo es
exigir que los automviles sean sincronizados debidamente para asegurar la mezcla
del combustible con el oxgeno. Por esta razn, los reglamentos de inspeccin de
automviles han sido tiles para controlar el monxido de carbono.
El monxido de carbono es especialmente problemtico en zonas urbanas con gran
nmero de automviles. El volumen del trnsito y el clima local influyen sobre su
concentracin en el aire. Los efectos sobre la salud dependen de la concentracin y
duracin de la exposicin. El monxido de carbono en los seres humanos afecta el
suministro de oxgeno en el torrente sanguneo. La exposicin al monxido de carbono
puede agudizar las enfermedades del corazn y del pulmn. El peligro es ms evidente
en nonatos, neonatos, ancianos y en quienes sufren enfermedades crnicas.
Los xidos de nitrgeno son un grupo de gases conformados por nitrgeno y
oxgeno. El nitrgeno es el elemento ms comn y representa el 78% del aire que
respiramos. Los xidos de nitrgeno incluyen compuestos como xido ntrico (NO)
y dixido de nitrgeno (N02). El trmino NOx se refiere a la combinacin de estas
dos sustancias. Las fuentes ms comunes de xidos de nitrgeno en la naturaleza
son la descomposicin bacteriana de nitratos orgnicos, incendios forestales y de
pastos, y la actividad volcnica. Las fuentes principales de emisin antropognica
son los escapes de los vehculos y la quema de combustibles fsiles.
El xido ntrico es relativamente inofensivo, pero el dixido de nitrgeno puede
causar efectos en la salud. En el proceso de combustin, el nitrgeno en el combustible

ESTADISTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

199

VIVIANA VARGAS FRANCO

y aire se oxidan para fonnar xido ntrico y algo de dixido de nitrgeno. Los xidos
ntricos emitidos en el aire se convierten en dixido de nitrgeno mediante reacciones
fotoqumicas condicionadas por la luz solar. El dixido de nitrgeno daa el sistema
respiratorio porque es capaz de penetrar las regiones ms profundas de los pulmones.
As mismo, contribuye a la fonnacin de la lluvia cida.

legislacin ambiental
El gobierno nacional, a travs del Ministerio de Transporte y mediante nonnas como el
Estatuto del Transporte para el transporte masivo (No. 3109 de 1997), ha contribuido
a definir lineamientos necesarios para la correcta planificacin, ejecucin y control
de dichos proyectos, centrando su atencin en las grandes ciudades que integran
polos de desarrollo industrial y comercial. Para el anlisis del comportamiento de
la contaminacin es preciso realizar una comparacin de los valores registrados de
cada contaminante con la nonna nacional vigente para emisiones atmosfricas (D.L.
02/82). Para poder aplicar esta nonna deben calcularse los valores especficos de
acuerdo con la temperatura promedio y la presin atmosfrica de cada ciudad. Los
valores para Cali se muestran en la Tabla 8.1.

Tabla 8.1
Pmmetro

Partlculas
menores
de 10
micrmetros

Dixido
de azufre

Normativa de calidad del aire para diversos parmetros.


SirmoIo

Nonna

Nonnapare

Condicin

lIICionaI o

candici6n
local 121

la mxima concentracin de una muestra recolectada en forme continua


durante 24 horas que se pueda sobrepasar por una sola vez en un
periodo de 12 meses.

131 150 pg}m3

la concentracin promedio de una muestra recolectada en forma


continua durante 24 horas que se pueda sobrepasar por una sola vez en
un periodo de 12 meses.

13150pg/m3

El promedio aritmtico de los resultados de todas las muestras diarias


recolectadas en forma continua durante 24 horas en un intervalo de 12
meses, no debe exceder la norma.

100pg}m3

34.22 ppb

la mxima concentracin de una muestra recolectada en forma continua


durante 24 horas que se puede sobrepasar por una sola vez en un
periodo de 12 meses.

400pg}m 3

136.61 ppb

EPAnl

PMIO

80 2

la mxima concentracin de una muestra tomada en forma continua


durante 3 horas que se puede sobrepasar por slo una vez en un periodo
de 12 meses.

512.29 ppb

Contina en la pgina siguiente

200

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

8 - CALIDAD

DE AIRE

Viene de la pgina anterior

Norma

Par6metro

Monxido
de carbono

nacional O

la mxima concentracin de una rooestra recolectada en forma continua


durante 8 horas.

15000.g/mJ

EPAI11

Nonnapara
condicin
1ocaI 12l
11.72 ppm

CO

la mxima concentracin de una muestra tomada en forma continua


durante 1hora que se puede sobrepasar por slo una vez en un perodo
de 12 meses.

39.06 ppm

Dixido de
nitrgeno

N02

El promedio aritmtico de los resultados de todas las muestras diarias


recolectadas en forma continua durante 24 horas, en un intervalo de 12
meses, no debe exceder la norma.

100.g/mJ

47.61ppb

Ozono

03

la mbima concentracin de una muestra tomada en forma continua


durante 1hora que se puede sobrepasar por slo una vez en un periodo
de 12 meses.

170.g/mJ

77.57 ppb

121

2S' Cy 1 atmsfera
2S.2' Cy 0.89 atmsfera

131

Norma EPA

111

CandiI:i4n

SInmoIo

Red de monitoreo de calidad del aire de Santiago de Cali


La red de monitoreo de Santiago de Cali est constituida por ocho estaciones
automticas, la ubicacin de las estaciones fijas se ilustra en la Figura 8.1 y los
parmetros medidos en cada una se consignan en la Tabla 8.2.

- ..:-- -- J
M.CAUII. . . _ . . . . . . . .
M &un6N

IJU"'iUfAIWfQ . . . . . .TUtwo

. . . . . . . . .--:NR . ........

Figura 8.1 Ubicacin geogrfica de estaciones de monitoreo de calidad de aire


en Santiago de Cali (www.dagmacali.gov. co).

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

201

VIVIANA VARGAS FRANCO

Tabla 8.2

Ubicacin de las estaciones de monitoreo y parmetros medidos en


Santiago de Cali (www.dagmacalLgov.co).
Identificaci6n
(Abreviatural

Par"'tros medidos

Meteoro
logia

CO

NO.

PMIl

S02

t
Centro Diagnstico
Automotor del Valle
(CDAVI

,.:

,'.... 1.';-,

."

. (",' . )",'"

03

: >~ ~'i

.'

.", t'''~~

~':';'''.:

'.,

~~-,y.;

,;

:" U-."

/"

BA Marco Fidel Surez


(BA)

''l'- '~

Hospital Universitario del Valle (HUV)

::', -'

1", ,

~;

,,:'~:' ,,;

l ~~ ",L~

.:1:' ,);;"(

.,":'1.

,-~.

,;
'~',:

'..:1

",,:'.:'

Polideportivo El Diamante
(PPD)

CVC Pance

Escuela Repblica Argentina (ERA)

.....

!,-":

l,'.

~.

..' t-,-

"'-~:"

r:~>:
',,,:,

'*,;:.

,{~

Universidad del Valle


(UV)

Calle 15

'.
./

t'~

""

,,{:.'t'!:';;

l.:

'~ ~.:

,.'

,,! 1:+:..:"

..

""';'~'.

,:>,.,'~

;,

.... ...

..

""',

,:j;, ,e,""l

lo;

La Tabla 8.3 presenta diversos indicadores descriptivos, utilizados para analizar los
parmetros evaluados por el SIMAT, Sistema de Monitoreo Atmosfrico de Ciudad
de Mxico, y presentados en su pgina de intemet (www.sma.df.gob.mxIsimatl
pnindicadores.htm). Por la importancia que tienen los indicadores de calidad del
aire y meteorologa, estos se elaboraron con criterios de suficiencia de informacin,
que consideran el tipo de dato y el desempeo de las estaciones de monitoreo en
Ciudad de Mxico.

202

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPITULO

Tabla 8.3

8 - CALIDAD

DE AIRE

Indicadores descriptivos para el resumen de datos de calidad de aire.


(www.sma.dfgob.mx/simat/pnindicadores.htm)

Indicador

Mximo

Descripcin

Tipo de dato

Par6metro

Seala los eventos extremos. Es sensible a cualquier


suceso extraordinario (incendios. desfogues industriales.
eventos meteorolgicos. etc.).

Mximo diario
Colecta de 24 horas

03. N02. CO.


S02. PST.
PMlO

Mximo diario

03

TOP 30

Seala los eventos extremos recurrentes. mitiga la


influencia de sucesos extraordinarios.

Percentil

Al ordenar una poblacin de datos de menor a mayor.


un percentil seala la concentracin que acumula un
determinado porcentaje del total.

Percentil 90

Concentracin que acumula 90% de los registros. Ca


racteriza el comportamiento de los registros mximos
de un contaminante. evita la influencia de eventos
extraordinarios.

Percentil 75

Concentracin que acumula el 75% de los registros.


Caracteriza el comportamiento de registros cotidianos
de un contaminante. al evitar los valores altos.

Percentil 50 (mediana)

Concentracin que divide en dos al total de registros.


Caracteriza el comportamiento de registros cotidianos.
evidencia aumentos generales.

Promedio

Permite evaluar el cumplimiento de normas de proteccin


a la salud y el comportamiento anual de algunos parme
tras. Es sensible a valores extremos.

Promedio horario
Mximo diario
Promedio diario

03. N02. CO.


S02. PST,
PMlO

Colecta de 24 horas

Promedio diario
Colecta de 24 horas

S02. PST.
PM 1o. pH.
NOj. S04

Colecta semanal
Promedio trimestral

Permite evaluar el cumplimiento de la norma de proteccin


a la salud por concentracin de plomo.

Promedio superior a un limite

Indica indirectamente un nivel de riesgo por exposicin


a concentraciones superiores al valor de una norma de
proteccin a la salud.

Colecta de 24 horas

Pb

Promedio horario
03. PMlO
Colecta de 24 horas
Promedio horario

Intervalos

Indica la frecuencia de valores de un contaminante en


intervalos especificas. algunos se asocian a los lmites
permisibles definidos en las Normas Oficiales Mexicanas
de Salud Ambiental.

Promedio mvil
Colecta de 24 horas

03. N02. CO.


S02. PST.
PM10. pH.
N03. S04

Colecta semanal

Comportamiento tipico diario

Muestra el comportamiento de un contaminante en el


transcurso del dia. Permite asociar con la intensidad de
las actividades antropognicas

ESTADisTICA DESCRIPTIVA PARA INGENIERiA AMBIENTAL CON

SPSS

Promedio horario

03. N02. CO.


S02

203

VIVIANA VARGAS FRANCO

8.1 Grficos de estadsticas descriptivas


Material particulado, PMro
En la grfica se presenta el promedio anual de material particulado menor de 10
micrmetros, PMIO, en relacin con la norma anual de 50 Jlglm 3 . Las estaciones
Centro de Diagnstico Automotor del Valle (CDAV) y Calle 15 reportan valores
superiores a la norma anual definida, mientras que las estaciones Marco Fidel Surez
(BA), Polideportivo El Diamante (PPD) y Escuela Repblica Argentina (ERA) estn
por debajo de la norma anual.

60,00
50,00

i.
~9

40,00

g
.

....
<.>

30,00
20,00
10,00
0,00
COAV

BA

POO
Es/acin

Promedio anual

ERA

CALLE 15

Norma anual 50 "g/m3

Grfica de material particulado menor a JO micrmetros.


(www.dagmacali.gov.co)

En la Tabla 8.4 se presentan las frecuencias para diversos intervalos de material


particulado PM 1O
Tabla 8.4

Distribucin promedio de material particulado en algunas estaciones


de la ciudad de Santiago de Cali. Abril - noviembre de 2004.
(www.dagmacali.gov.co)
Distribucin de frecuencias para promedio PMlO por Estacin
(Recuento de dlas)

Intervalo

< 50 pg/m

CDAV

BA

85 (19.5%1

PDD

ERA

87 (35.7%1

85 (36.6%1

181 (43.5%1

51.100 pg/m3

132 (30.3%1

34(13.9%1

30 (12.9%1

27 (6.5%1

101 150 pg/m3

1 (0.2%1

1 (0.4%1

1 (0.4%1

0(0.0%1

Total

218 (50.0%1

122 (50.0%1

116 (50.0%1

208 (50.0%)

204

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

8 - CALIDAD

DE AIRE

Observando la tabla se concluye que valores menores de 50 ~glm3 se dan el 39% de


las veces en la estacin CDAV, el 71,3% en la estacin BA, el 73,3% en la estacin
PDD y el 87% en la estacin ERA. En el rango de 51 ~glm3 a 100 J.lglm 3 se muestran
el 60,5% de los datos en la estacin CDAV; el 27,8% en la estacin BA; el 25,8%
en la estacin PDD y el 13% en la estacin ERA.
La siguiente grfica muestra la serie de tiempo para la concentracin mxima PM 10,
en algunas estaciones monitoreadas de Santiago de Cali.
100

i
i

zso
ZOO

150

100 -

<:l 50 -

CDA V

-poo

~ ERA

~- BA

- - Nor",lIdillf';tI

Grfica de series de tiempo anual para concentracin mxima de


material particulado, PMlO (2004) .

La serie de tiempo de la concentracin mxima, PM 10, permite visualizar que


en general la estacin CDAV presenta muy frecuentemente valores por encima
de la norma de PM lO, con valores ms elevados en los meses de mayo y julio,
disminuyendo sus niveles en los meses de octubre a diciembre. La estacin PDD, en
los meses monitoreados, muestra valores mximos por debajo de la norma, excepto
en el mes de mayo; de igual forma la estacin ERA reporta valores por debajo de
la norma, excepto en octubre. La estacin BA tiene los valores ms altos de las
estaciones graficadas en junio y julio, tambin evidencia los valores ms bajos en
julio y agosto.
La siguiente grfica muestra el comportamiento semanal, diario y horario en algunas
estaciones de monitoreo de la red de Santiago de Cali.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

205

VIVIANA VARGAS FRANCO

80
60

I __

::-

f.

-3 40
';..

20

o l' , -

'i
COAV

BA
Domingo

POD

C Lunl!s

Martes

ERA

O Mircoles

CVC
Jueves

Viernes

CALLE 15
Sdbado

Grfica del comportamiento semanal de PMo. Enero de 2004


(www.dagmacali.gov.co)
Aunque no se puede observar una tendencia general para el comportamiento semanal
en las diferentes estaciones, las mayores concentraciones se muestran generalmente
los jueves para las estaciones BA, PDD, CVC y Calle 15; el martes para la estacin
CDAV y el mircoles para la estacin ERA. Las menores concentraciones se
dan el domingo para las estaciones CDAV, CVC y Calle 15; y el lunes para las
estaciones restantes (www.dagmacali.gov.co). La estacin ERA muestra las
menores concentraciones de material particulado en el mes graficado y las mayores
concentraciones se dan en las estaciones CDAV y Calle 15.
La siguiente grfica presenta el comportamiento diario de PM lOen enero, en algunas
estaciones monitoreadas en la ciudad.

1~r.1======================================~~

140

120

::- 100

-3

80
60
40

20

o I-~,~1

7 8

\.J

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Dias (t)
- - CDAV - + - BA - - PDD

---..-CVC ~ ERA

- + - CA LLE/5 - - - NormadiariaI50pg!m3

Grfica del comportamiento mensual de PMlO. Enero de 2004.


(www.dagmacali.gov.co)

206

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIEN TAL CON

SPSS

CAPfTULO

8 - CALIDAD

DE AIRE

Se pueden apreciar concentraciones bajas y poco variables durante los primeros diez
das del mes en las estaciones graficadas y un comportamiento variable que alcanza
concentraciones mayores en la estacin Calle 15 y CDAV, a partir del da 8 (www.
dagmacali.gov.co). La estacin que evidencia los menores valores de PMIO es la
estacin CVC, seguida por las estaciones PDD y ERA.
En la siguiente grfica se muestran las mximas concentraciones horarias en algunas
de las estaciones monitoreadas. Se puede ver que, a excepcin de la estacin CVC
- Pance, ubicada en la zona rural, las mximas concentraciones ocurren entre las
10 Y 12 horas, con un incremento de las concentraciones a partir de las 18: 00 horas,
excepto para la estacin PDD que mostr una disminucin progresiva a partir de las
18 horas (www.dagmacali.gov.co).
100

........

80

~.,

60

'-

....
~
~

40

20

o
o

10 11

12 13 14 15 16 17 18 19 20 2122 23

horas (1)
ERA

-+-- CALLE 1 5

Grfica del comportamiento horario promedio de P Mi O. Enero de 2004


(www.dagmacali.gov.co).
Dixido de azufre (S02)

La siguiente grfica muestra la concentracin promedio de dixido de azufre en


estaciones de Santiago de Cali.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

207

VIVIANA VARGAS FRANCO

40

130
~
120
,

1
~
l

10

+1_.1..-.........
BA

CDAV

PDD

ERA

Estacin
Concentracin promedio anual

-Norma anual 34,ZZ ppb

Grfica de concentracin promedio de dixido de azufre (SO


(www.dagmacali.gov.co)
En las estaciones CDAV, BA, PDD YERA los niveles de concentracin promedio de
S02 son menores que la norma anual establecida, que es de 34,22 ppb, mostrando
las estaciones graficadas valores medios menores o iguales a 10 ppb. El mayor
promedio de concentracin lo dan la estacin CDAV, seguido de las estaciones BA,
ERA y el menor promedio la estacin PDD.
La siguiente grfica muestra la serie de tiempo anual de la concentracin mxima
de S02 (ppb) en cuatro estaciones monitoreadas en Santiago de Cali.

~~-7--~-C~~~~--~~--~-C~--~~--~~--~~~--~~--~

1
!{

t
J

100

~~ :

10

'TT:'"

<.l

-~~---~~~~
~CDAV

~- BA

-7"

PDD

. .
.
:...... l . ., .

..

~~~~~--~~~

~ ERA

--Norma diaria 136,61 ppb

Grfica de series de tiempo anual para la concentracin mxima de


S02

208

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

8 - CALIDAD

DE AIRE

Se puede apreciar que en general las estaciones graficadas estn por debajo de la
norma diaria establecida que es de 136,61 ppb, excepto la estacin CDAV con un
valor superior a la norma en noviembre. De marzo a julio la estacin PDD evidenci
en general las menores concentraciones mximas de S02. De octubre a diciembre
la estacin que mostr los valores ms altos fue la CDAV y la estacin que dio los
valores ms bajos fue ERA.
La siguiente grfica muestra los valores promedios horarios de concentracin de
S02

t~
liS ..................
... _.*.
20

.. 10 . --: .............

/(~

:* .. \

..................... - ....... .

~ ~ :-~;- .~:~ ~

. . ..... ..... .

..

..

*
*
s ~ ~. ~. :.~ .: ...~... : .. : ~:.: Jo:.::::1"-'* ~ ..:a .. ii..:.:_-~ .. ~ ~7~ .. _. :. . :;.
:tE
~( JK - )k '.:+:
~
)I(- - ) K
~( )j( )K )K )K
::+:
o

: ...

..

* ..

..

-l!(.

JI(

JI(

)K

10 1 1 12 13 14 1 S 16 17 18 19 20 21 22 23
horas (1)

COA V

-*- BA

.. -. --_.

POI) _

ERA

Grfica de concentracin promedio horaria de S02 (www. dagmacali.


gov.co)

Se observa que en el comportamiento horario para las concentraciones de S02, en


las diferentes estaciones, los valores mximos se dan entre las 9 y las 11 horas. Las
estaciones CDAV y BA muestran un segundo valor mximo, ms bajo que el primero,
entre las 20 horas y las 21 horas, aproximadamente. Estos valores mximos coinciden
con las horas de mayor densidad de trfico. Tambin se observa que la estacin con
mayor concentracin es la CDAV, seguida de la BAy las menores concentraciones
las tienen las estaciones PDD y ERA.
La siguiente grfica muestra el comportamiento semanal, diario y horario, en algunas
estaciones de monitoreo de la red de Santiago de Cali.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

209

VIVIANA VARGAS FRANCO

20.---------------------------------------------~
15

1
10
~'
5

o
o

Do",ingo

PDD

BA

CDAV
CJ Lunes

Martes

ERA

O MUrcoles Jueves

Viernes

Sbado

Grfica de concentracin promedio semanal de S02


(www.dagmacali.gov.co)
Se observa que las menores concentraciones se dan el domingo, debido posiblemente
a la disminucin del trfico y de las actividades laborales. En general las mayores
concentraciones de S02 se muestran el martes para las estaciones CDAV, BAy PDD;
y el mircoles para la estacin ERA. Se puede analizar que la estacin CDAV da los
niveles ms altos de S02 en los diferentes das de la semana, seguida por la estacin
BA. En la estacin ERA se observan los menores niveles de concentracin de S02,
seguida de la estacin PDD.
Ozono (03)

La siguiente grfica presenta la mxima concentracin horaria de ozono en dos


estaciones monitoreadas: PDD y CVc.

aeJJO
84.00
82.00

80.00

-5
c" 78.00
76.00

74.00
72.00 +1------~----~~------~----~--------~----~

O/e

PDD

Mximo J hora

Norma horaria 77.57 ppb

Grfica de mxima concentracin horaria de ozono. Enero de 2004


(www.dagmacali.gov.co)

210

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

8 - CALIDAD

DE AIRE

Se puede apreciar que, en el mes graficado, se excedi la norma horaria tanto en la


estacin PDD como en CVC zona rural (www.dagmacali.gov.co). En la estacin
PDD el valor mximo fue superior a 84 ppb de ozono y en la estacin CVC la
concentracin mxima de ozono supera las 80 ppb.
En las siguientes grficas se presenta el comportamiento horario de ozono en las
estaciones Polideportivo El Diamante (PDD) y CVC Pance, para los diferentes das
de la semana.

Polideportivo El Diamante

CVCPance

60

60

50

50

>- .

1 2 3 4 5 8 7 8 9 101112 13 14 15 18 17 181920 21 22 23

O 1 2 3 4 5 6 7 8 9 101 1 1213 14 1516 17 181920 21 22 23

Domingo

-.- LI,II\f'~ Io4Irt..

Mi6rcoIes ........-

J\M'ItI ____

VemeS --"-- $M)ado

Grfica de comportamiento horario del ozono 03. Enero de 2004.


(www.dagmacali.gov.co)

En la grfica se observa que la tendencia del valor del ozono es similar en cada uno
de los das analizados en las estaciones PDD y CVC-Pance. El comportamiento
horario de 0 3 en enero de 2004 muestra que las mayores concentraciones promedio
de este contaminante se dan a las 13:00 horas en la estacin PDD y a las 15:00
horas en la estacin CVC- Pance (www.dagmacali.gov.co). Los menores valores de
03 se evidencian en las primeras hod s; desde las O hasta las 8 horas, a partir de lo
cual se observa un incremento signifibativo hasta alcanzar el valor mximo de 03
y disminuye nuevamente hasta alcanzar niveles bajos a partir de las 18 horas en la
estacin PDD y de las 20 horas para la estacin CVC-Pance.

8.2 Histogramas
Material particulado, PM,o
A continuacin se observan los histogramas del material particulado, PMO, en
las estaciones CDAV, PDD y ERA, los cuales se comparan con la distribucin
normal.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

211

VIVIANA VARGAS FRANCO

Estacin:

J CDAV

Estacin:

800

400

600

300

4 PDD

'~
~

400

'1200

'"
200

100

_"'J2.'1

_ . - 2lJf

Mtfif-j7

..........u,u.........1,I-I,Ju,u,J-li"'i"'i''''''

M... "

Nl121."

NUfl."

42031152 6884100116132148164111196

W~JIIQ~II~I~1151!m

PMII

PM"

Es/acin:

6 ERA

700
600
500

_.'14.14
II...

'J

N'u;~"

3 15 n ! 51

u
PM"

~ ~

mlDl! 147

Grfica de frecuencias absolutas para material particulado (P Mi oJ

En la estacin CDAV se dan frecuencias en material particulado, PM IO , hasta 196


Ilg/m3, con las mayores frecuencias en el rango de 20 Ilglm3 a 68 Ilglm3, as mismo
se evidencia un buen ajuste de la distribucin a la curva normal. El promedio en la
estacin es de 57 Ilglm3 y una desviacin estndar de 32,4 Ilglm3.
En la estacin PDD se observan frecuencias hasta 137 Ilg/m3, con las mayores
frecuencias en el rango de 141lglm3 a 591lglm3, evidencindose un buen ajuste de la
distribucin a la curva normal. El valor promedio en esta estacin es de 44 Ilglm3
con una desviacin estndar de 25 ,2 Ilg/m3.

212

ESTADIsTICA DESCRIPTIVA PARA IN GENIERIA AMBIENTAL CON

SPSS

CAPITULO

8 - CALIDAD

DE AIRE

En la estacin ERAse observan frecuencias hasta 147 ..tglm3, con su mxima concentracin
en el rango de 15 ..tglm3 a 63 ..tglm3, evidencindose un buen ajuste a la curva normal.
El valor promedio es de 43 ..tglm3 con una desviacin de 24,94 ..tglm3 .
En general, las estaciones PDD y ERA evidencian la misma tendencia sin diferencias
significativas en los valores promedios de PM 1O. Tambin se puede evidenciar que
de las estaciones graficadas solo la CDAV muestra frecuencias por encima de la
norma anual de PM JO, pero con pocas frecuencias en estos valores.
Dixido de azufre (SD2)

En la siguiente grfica se observan los histogramas de la variable dixido de azufre,


S02, en las estaciones CDAV, PDD y ERA.
Est.cin:
J CDAV
1000. - - - - - - - - ,

Est.cin:

4 PDD

500 . - - - - - - - ,

800

200

Dm. n,. ',H


Mp -',7

J,I,I,l,J,l,l,l,LM1IL,I,1,I,l.w;t_ N-'JIf,H
I~u~~~~w~m~~~

J~U~UU~u~~u.u

SO,

SO,

6 ERA

E,"cin:

7011 . - - - - - - - - - ,

6011

500

-..

200

1011

""

M" ~, I

J,U,LJ,LI,IJI,U,U,u,u.,u,u,IJ;I:I;J

J 1) 1 11 il 1)11 1111

N-11"'"

".I1lJl11~1

SO,

Grfica de frecuencias absolutas para el dixido de azufre (SO))


En la estacin CDAV se muestran frecuencias de dixido de azufre, S02, hasta valores
de 39,2 ppb; con concentracin mxima de frecuencias en el rango entre 0,8 ppb Y

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

213

VIVIANA VARGAS FRANCO

10,4 ppb; con un valor medio de 9,7 ppb Y una desviacin estndar de 9,06 ppb. La
forma de la distribucin se concentra en los valores menores a 13,6 ppb. A partir de
este valor las frecuencias disminuyen sustancialmente, la grfica de la distribucin
presenta sesgo hacia el lado izquierdo.
En la estacin PDD se observan frecuencias hasta 13,7 ppb; con una concentracin
mxima de frecuencias en el rango entre 0,3 ppb y 4,8 ppb; con un valor medio de 3,3
ppb y una desviacin estndar de 2,51 ppb. La forma de la distribucin es asimtrica,
concentrndose la mayora de valores hacia la franja izquierda de la grfica y muy
pocos valores mayores a 7,0 ppb.
En la estacin ERA se dan valores en la distribucin hasta 14,7 ppb, con concentracin
de frecuencias en el rango entre 0,3 ppb y 3,9 ppb; con un valor medio de 4,1 ppb
y una desviacin estndar de 4,58 ppb. La forma de la distribucin es asimtrica en
cuanto al valor medio, con sesgo alIado izquierdo.
De las estaciones graficadas slo la CDAV evidencia valores por encima de la norma
anual de S02, con bajas frecuencias.

8.3 Tablas cruzadas


Realizando un cruce de variables entre dixido de azufre S02 y material particulado,
PM 10, se muestran tablas de contingencia en tres estaciones monitoreadas en la ciudad
de Cali. A continuacin se dan los resultados de la estacin CDAY.
Estacin COA V

Tabla de contingencia PMIO *S02 8


S02
10201
<50

(50100J

PMlO
(100150)

>150

Total

Recuento
%de PM lO
%de 502
Recuento
%de PMlO
%de 502
Recuento
%de PMlO
%de 502
Recuento
%de PM,o
%de 502
Recuento
%de PMlO
%de 502

2266
97,0%
49,8%
1904
87.4%
41,9%
316
74.4%
6,9%
61
72,6%
1,3%
4547
90,5%
100,0%

(20-40)

[40-60)
63

2.7
15.4%
245
11,2%
60,0%
85
20,0%
20,8%
15
17,9%
3.7%
408
8,1%
100,0%

Total

>60

6
,3%
11,8%
21
1,0%
41,2%
17
4,0%
33,3%

,0%
,0%
8
.4%
50,0%
7
1.6%
43,8%

2335
100.0%
46,5%
2178
100.0%
43.4%
425
100,0%
8,5%

7
8,3%
13.7%
51
1,0%
100,0%

1
1,2%
6,3%
16
,3%
100,0%

100,0%
1.7%
5022
100,0%
100,0%

84

a. Estacin - CDAV

214

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

8-

CALIDAD DE AIRE

En esta estacin el 46,5% de los datos muestreados del material particulado PM 1O, da
concentraciones menores a 50 glm 3 y el 43,4% se encuentra entre 50 glm3 y lOO
3
glm , es decir, en estos dos intervalos se halla el 89,9% de los datos de PM\O.
Para dixido de azufre, S02, se observa que 90,5% de los datos se encuentran en el
rango de Oppb a 20 ppb Y el 8, I % en el rango de 20 ppb a 40 ppb, es decir, en estos
dos rangos se encuentra el 98,6% de los datos de S02.
Cuando el PM lOse encuentra entre O glm 3 y 50 glm 3, el 97% de los datos de S02
se da entre O ppb Y 20 ppb Y el 2,7% entre 20 ppb Y 40 ppb.
Cuando el S02 se encuentra entre Opbb Y 20 ppb, el 49,8% de los datos de PMIO se
encuentra entre O glm 3 y 50 glm 3 y eI41,9% entre 50glm 3 y lOO g/m 3 .
Del total de datos analizados, el 45,1% se encuentra entre O ppb Y 20 ppb de S02
3
y entre O glm y 50 glm 3 de PM 10, simultneamente. El 37,9% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50 glm 3 y 100 glm 3 de PM 10,
simultneamente.
Estacin POO

A continuacin se presenta la tabla de contingencia para la estacin PDD.


Tabla de contingencia PM1D * S02 8
Total

S02
(20-40)

[020)
PMlO

Total

<50

Recuento
%de PMlO
%de S02

2214
99,9%
65,6%

2
,1%
50,0%

2216
100,0%
65,6%

(50100)

Recuento
%de PMlO
%de S02

1065
99,9%
31,6%

2
,2%
50,0%

1067
100,0%
31,6%

(100150)

Recuento
%de PMlO
%de S02

86
100,0%
2,5%

O
,0%
,0%

86
100,0%
2,5%

>150

Recuento
%de PMlO
%de S02

10
100,0%
,3%

O
,0%
,0%

10
100,0%
,3%

Recuento
%de PMlO
%de S02

3375
99,9%
100,0%

4
,1%
100,0%

3379
100,0%
100,0%

a. Estacin - POO

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

215

VIVIANA VARGAS FRANCO

En esta estacin el 65,6% de los datos muestreados del material particulado PMIO
presenta concentraciones menores a 50 .tg/m3 y el 31 ,6% se encuentra entre 50
.tg/m3 y 100 .tg/m 3, es decir, en estos dos intervalos se encuentra el 97,2% de los
datos de PM 1O.
Para dixido de azufre, S02, se presenta que 99,9% de los datos se encuentran en
el rango de O ppb a 20 ppb.
Cuando el PMIO se halla entre O .tg/m3 y 50 .tg/m 3 , el 99,9% de los datos S02 se
encuentra entre O ppb Y 20 ppb.
Cuando el S02 se da entre Oppb Y20 ppb, el 65,6% de los datos de PM 10 se encuentra
entre O .tg/m3 y 50 .tg/m3 y el 31 ,6% se encuentra entre 50 .tg/m3 y 100 .tg/m3 .
Del total de datos analizados el 65,5% se encuentra entre O ppb Y 20 ppb de S02
y entre O .tg/m 3 y 50 .tg/m3 de PM 10, simultneamente. El 31 ,5% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50 .tg/m3 y 100 .tg/m3 de PM 10,
simultneamente.

Estacin ERA
A continuacin se presenta la tabla de contingencia para la estacin ERA.
Tabla de contingencia PMIO SOz'
80 2
[0201

[40601

Total

>60

<50

Recuento
%de PMIl
%de 802

2406
99,7%
65,6%

5
,2%
14.7%

1
,0%
20,0%

2
,1%
50,0%

2414
100,0%
65,1%

(50-1001

Recuento
%de PMlO
%de 502

1167
98,1%
31,8%

18
1.5%
52,9%

2
,2%
40,0%

2
,2%
50,0%

1189
100,0%
32,1%

(100-1501

Recuento
%de PMlO
%de 502

88
87,1%
2.4%

11
10,9%
32,4%

1
2,0%
40,0%

O
,0%
,0%

101
100,0%
2.7%

>150

Recuento
%de PMIl
%de 502

4
100,0%
,1%

O
,0%
,0%

O
,0%
,0%

O
,0%
,0%

4
100,0%
,1%

Recuento
%de PMIl
%de 502

3665
98,8%
100,0%

34
,9%
100,0%

5
,1%
100.0%

4
,1%
100.0%

3708
100,0%
100,0%

PMlO

Total

(20-401

a_Estacin - ERA

En esta estacin e165 ,1% de los datos muestreados del material particulado PMIO
evidencia concentraciones menores de 50 .tg/m 3 y el 32,1% entre 50 .tg/m3 y

216

ESTADfsTICA DESCRIPTIVA PARA INGENIER fA AMBIENTAL CON

SPSS

CAPITULO

8 - CALIDAD

DE AIRE

100 Ilg/m3, es decir, en estos dos intervalos se encuentra el 97,2% de los datos
de PM1o.
Para dixido de azufre, S02, se observa que 98,8% de los datos se encuentra en el
rango de Oppb a 20 ppb Y el 0,9% en el rango de 20 a 40 ppb, es decir, en estos dos
rangos se da el 99,7% de los datos de S02.
Cuando el PMIO se da entre O Ilg/m3 y 50 llg/m3, el 99,7% de los datos S02 se
encuentran entre O ppb Y 20 ppb.
Cuando el S02 se halla entre O ppb Y 20 ppb, el 65,6% de los datos de PMIO se
encuentran entre O Ilg/m3 y 50 Ilg/m3 y el 31,8% entre 50 Ilg/m3 y 100 llg/m3.
Del total de datos analizados, el 64,9% se observa entre O ppb Y 20 ppb de S02
y entre O Ilg/m3 y 50 Ilg/m3 de PM 10, simultneamente. El 31,5% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50Ilg/m3 y 100 llg/m3 de PMIO,
simultneamente.

8.4 Grficas de frecuencias acumuladas


A continuacin se presentan las frecuencias acumuladas para la variable dixido
de azufre S02 y material particulado, PM 10, en las estaciones monitoreadas CDAV,
PDD Y ERA.

Material particulado, PM,o


COA V

PDD

100'II

100'II

15%

15%

.~

"-

~
el; "'"

~
el;

"

,,%

~~
0,00

"'"
25%

50,00

100,00

150,00

200,00

0,00

PMII

50,00

100,00

150,00

200,00

PM"

Grfica de frecuencias acumuladas para material particulado, P MIO


(Contina en la pgina siguiente) .

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

217

VIVIANA VARGAS FRANCO

ERA
1(lO'"

15%'

.~

~ 50%
<>':

""

.~
0,00

50,00

100,00

150,00

200,00

PM"

Grfica de frecuencias acumuladas para material particulado, PMO


(Viene de la pgina anterior)

En la estacin CDAV alrededor del 50% de los datos toman valores menores o iguales
a 50 Ilglm 3 de material particulado, PM 10 Y aproximadamente el 88% de los datos
son menores o iguales que 100 Ilg/m 3 .
En la estacin PDD cerca del 75% de los datos toman valores menores o iguales
que 50 Ilglm 3 y aproximadamente el 98% de los datos son menores o iguales que
lOOllglm3.
En la estacin ERA alrededor del 65% de los datos son menores o iguales que 50 Ilglm3
y aproximadamente el 98% de los datos son menores o iguales que 100 Ilglm 3.
De las estaciones graficadas la nica que muestra frecuencias por encima de la norma
es la CDAV, con bajas frecuencias.
Dixido de azufre, S02

A continuacin se muestran las grficas de frecuencias acumuladas en tres estaciones


de monitoreo para dixido de azufre.

218

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

CDAV

"i~~

&:

8 - CALIDAD

DE AIRE

PDD

100%

100%

75"

75"
.~
~

"'"

&:

""

"'"

""
10,00

20,00

30,00

40,00

'"

50,00

0,00

10,00

SO,

20,00

JO,OO

SO]
ERA

75"
.~

l!
c:

&:

"'"
""
"',~~~~uw~~~~ww~
0.00

20,00

10,00

JO,OO

SO]

Grfica de frecuencias acumuladas para dixido de azufre, S02

En la estacin CDAV alrededor del 75% de los datos son menores o iguales que 10
ppb Y aproximadamente el 90% de los datos son menores o iguales que 20 ppb de
dixido de azufre.
En la estacin PDD alrededor del 97% de los datos son menores o iguales que 10
ppb Y aproximadamente el 99% de los datos son menores que 20 ppb de dixido
de azufre.
En la estacin ERA alrededor del 95% de los datos son menores o iguales que 10
ppb Y aproximadamente el 99% de los datos son menores o iguales que 20 ppb de
dixido de azufre.
De las estaciones graficadas la nica que evidencia frecuencias por encima de la
norma es la CDAV, con bajas frecuencias.

ESTADfsTICA DESCRIPTIVA PARA INGENIEAIA AMBIENTAL CON

SPSS

219

VIVIANA VARGAS FRANCO

8.5 Percentiles
Este tem ilustra el anlisis de los valores percentiles para material particulado, PM 1O
Y dixido de azufre S02

Material particulado, PM,0


La siguiente tabla expone valores percentiles en cuatro estaciones monitoreadas en
la ciudad de Cali.
Tabla de valores percentiles para material particulado. PMlO
Estacin
CDAV

PMlO

BA

PDD

ERA

Percentil 05

13.66

3,98

9,25

9.00

Percentil 25

33,96

16,80

25,88

25,00

Mediana

51,54

36.68

41,15

40.20

Percentil 75

73.93

56.49

57,13

56.80

Percentil 95

116.30

89,05

89.12

89.00

Percentil 99

158.16

122,15

127,37

119.70

En la estacin CDAV el 50% de los datos son valores menores o iguales que
51,5 Jlg/m3 ; el 75% menores o iguales que 73,9 Jlglm 3 ; el 95% menores o iguales
que 116,3 Jlglm 3 y el 99% menores o iguales que 158,1 Jlglm 3 . Evidenciando que
existen datos por encima de la norma anual de PM lO, en esta estacin.
En la estacin BA el 50% de los datos toma valores menores o iguales que
36,7 Jlg/m 3 ; el 75% menores o iguales que 56,5 Jlg/m 3 ; el 95% menores o iguales
que 89,1 Jlglm3 y el 122,2% menores o iguales que 158,1 Jlg/m 3 Es decir, en esta
estacin se cumple la norma anual de PM 10 en el periodo analizado.
En la estacin PDD el 50% de los datos toma valores menores o iguales
que 41,2 Jlg /m 3 ; el 75% valores menores o iguales que 57,1 Jlg /m 3 ; el
95% menores o iguales que 89,1 Jlg/m 3 y el 99% menores o iguales que
127,4 Jlg/m 3 . Lo cual indica que esta estacin cumple la norma anual de
PMIO en el periodo analizado.
En la estacin ERA el 50% de los datos toma valores menores o iguales que
40,2 Jlg/m 3 ; el 75% valores menores o iguales que 56,8 Jlg /m 3 ; el 95% de
los datos toma valores menores o iguales que 89,0 Jlg/m 3 y el 99% menores
o iguales que 119,7 Jlg /m 3 . As, en esta estacin se cumple la norma anual
de PMIO en el periodo analizado.

220

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPfTUlO

8 - CALIDAD

DE AIRE

En general, se puede observar un comportamiento similar en las estaciones BA,


PDD YERA, cumpliendo siempre la norma, contrario a lo que sucede en la estacin
CDAV, donde se presentan valores ms elevados y con datos que no cumplen la
norma anual de PM I Q.
En la siguiente tabla se presentan los valores percentiles mensuales de material
particulado, PMIO, en la estacin CDAY.
Tabla de valores percentiles mensuales para material
particulado. PM1D. en la estacin CDAV
PM'O
Parcentil 05

Mes

Parcantil 25

Mediana

Parcantil75

Parcentil 95

Parcantil 99

Abril

6.40

21,40

42,05

67,30

111,40

146.42

Mayo

12,32

29,32

45,50

64,66

110,46

153.70

Junio

5,02

17,55

36,90

61,52

111,82

160,00

Julio

5,87

24,90

42,91

63,55

102,13

143,29

Agosto

3,94

10,59

27,10

46,52

80,00

113,07

Septiembre

11 ,80

28,20

43,49

59,55

95,44

138,33

Octubre

8,88

26,12

42 .. 21

61 ,62

95,00

127,59

Noviembre

14,19

31 ,51

44,33

59,82

90,40

121.01

Diciembre

18,92

34,99

49,87

67,00

98,29

126,26

En mayo el 50% de los datos fueron menores o iguales que 45,5 llg/m3; 75% de
los datos son menores o iguales que 64,7 llg/m3 y 95% de los datos son menores o
iguales que 110;5 llg/m3.
En agosto se observ que el 50% de los datos son menores o iguales que 27,1 llg/m3;
el 75% son menores o iguales que 46,5 Ilg/m3 y el 95% menores o iguales que 80
Ilg/m3.
Para el mes de diciembre el 50% de los datos son menores o iguales que 49,9%
llg/m3; el 75% son menores o iguales que 67,0 Ilg/m3 y el 95% de los datos son
menores o iguales que 98,3 llg/m3.
En general, en el percentil 95 , los meses con los valores ms altos de material
particulado se encuentran entre abril a julio, 10 mismo sucede con el percentil 99.
La siguiente grfica presenta los valores percentiles de material particulado, PMIO
a travs de los meses en la estacin CDAY.

ESTADfs TICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

221

VIVIANA VARGAS FRANCO

180
160
.:;--. 140"
120
~ 10
~~ 80
Q.; 60
40
20
O

~.

.)(.

lE

-*

*. ~ .

)~(

)(

)(

.~ _~,.~=:~~=_~<;=-~_:m=:=.~.~:._~'.':_-~~
ABR.

MAY.

JUN.

JUL.

SEP.

AGO.

NOV.

OCT.

DIC.

Mes
--+-- Perc. S __ Perc. 25 --4- Perc. SO ~Perc. 75 --*- Perc. 95 - - Perc. 99

Grfica de valores percentiles mensuales para material particulado,


P Mi O en la estacin CDA V.
En la grafica de los percentiles se puede apreciar que los valores menores de PM 10
se dan en agosto y los mayores valores en junio.
Dixido de azufre, SD2

En la tabla siguiente se presentan valores percentiles para dixido de azufre, S02,


en cuatro estaciones monitoreadas en Cali.
Tabla de valores percentiles para dixido de azufre, SOz
Estacin

CDAV
S02

BA

PDD

ERA

Percentil 05

1.63

1,13

.31

Percentil 25

3.96

2,59

1.53

.53
1,64

Mediana

7.41

4,71

2.90

2,87

Percentil 75

12.48

8.06

4.36

5.16

Percentil 95

24.79

15.78

7.90

11.08

Percentil 99

42.82

26.19

11.96

21.38

En la estacin CDAV el 50% de los datos son valores menores o iguales que 7,4 ppb;
el 75% menores o iguales que 12,5 ppb; el 95% de los datos toma valores menores
o iguales que 24,8 ppb Y el 99% menores o iguales que 42,9 ppb. Por lo cual, esta
estacin cumple la norma anual de S02 en el perodo analizado.
En la estacin BA el 50% de los datos toma valores menores o iguales que 4,7 ppb;
e175% valores menores o iguales que 8,1 ppb; e195% valores menores o iguales que

222

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPiTULO

8 - CALIDAD

DE AIRE

15,8 ppb Y el 99% menores o iguales que 26,2 ppb. De este modo, en esta estacin
se cumple la norma anual de S02 en el periodo analizado.
En la estacin PDD el 50% de los datos toma valores menores o iguales que 2,9 ppb;
el 75% valores menores o iguales que 4,4 ppb; el 95% de los datos toma valores
menores o iguales que 7,9 ppb Y el 99% menores o iguales que 11 ,9 ppb. As, esta
estacin cumple la norma anual de S02 en el periodo analizado.
En la estacin ERA el 50% de los datos toma valores menores o iguales que
2,9 ppb; el 75% de los datos toma valores menores o iguales que 5,2 ppb; el 95%
de los datos toma valores menores o iguales que 11,1 ppb Y el 99% son menores o
iguales que 21,4 ppb. Es decir, en esta estacin se cumple la norma anual de S02
en el periodo analizado.
En general, se puede observar un comportamiento similar en las estaciones ERA
y PDD, con valores bajos de dixido de azufre, seguidas de la estacin BA, y por
ltimo con los valores ms elevados la estacin CDAY. Pero las estaciones cumplen
la norma anual de S02.
En la siguiente tabla se observan los valores percentiles mensuales de dixido de
azufre, S02, en la estacin CDAY.
Tabla de valores percentiles mensuales para
dixido de azufre. S02. en la estacin CDAV.
S02
Percentil 05
Mes

Percentil 25

Mediana

Percentil 75

Percentil 95

Percentil 99

Abril

,15

,93

1,67

2,75

6,05

9,44

Mayo

,47

1,94

3,34

5,65

11 ,34

18,73

Junio

1,34

2,39

3,96

7,50

15,17

27,12

Julio

1,91

3,60

5,94

8,95

17,11

24,21

,33

2,73

4,17

6,24

11,37

16,20

Septiembre

1,89

4,37

7,50

10,60

18,07

26,00

Octubre

1,36

3.44

5,62

8,89

15,80

26,46

Noviembre

,90

2,60

5,08

9,84

21,95

39,42

Diciembre

1,08

2,98

5,73

12,18

26,26

46,93

Agosto

En mayo, el 50% de los datos son menores o iguales que 3,3 ppb, el 75% son menores
o iguales que 5,7 ppb y el 95% son menores o iguales que 11 ,3 ppb de dixido de
azufre. En agosto, el 50% de los datos son menores o iguales que 4,2 ppb, el 75%
son menores o iguales que 6,2 ppb y el 95% son menores o iguales que 11 ,4 ppb de
dixido de azufre.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

223

VIVIANA VARGAS FRANCO

Para diciembre, el 50% de los datos son menores o iguales que 5,7 ppb, el 75% son
menores o iguales que 12,2 ppb Y el 95% son menores o iguales que 26,3 ppb de
dixido de azufre.
En general, en el percentil 95 se observa que los meses con los valores ms altos de
dixido de azufre se encuentran entre septiembre y diciembre.
En la siguiente grfica se muestran los valores percentiles de dixido de azufre a
travs de los meses, en la estacin CDAY.
!~ r - - :---:--::-----.--.-.--.~------:--~~--:-------'------------:--- ~.--~-------.--.---:--.-.-/~-j
40
35
30
,s; 25
~ 20

;
. >~
~ .,.~
~ -~ ... ! ~ ~~ ....
....

15]
10
5

t_----- _______
F;:~- -':- -!=- ~j-~

a....:..:_

ABR.

MAY.

JUN.

.AA.

-+- Pere. 5 .. -Pere. 25

~ Pere.

AGO.

SEP.

.. ; .". ~
~
.
--_'a_n
___

OCT.

NOV.

DIC.

Mes
50 ---Pere. 75 - - Pere. 95 --- Pere. 99

Grfica de valores percentiles mensuales para dixido de azufre, S02,


en la estacin CDAV
Analizando los valores percentiles de la grfica, abril presenta los menores valores
de S02, mientras en diciembre se observan los mayores valores.

8.6 Contaminacin del aire en Ciudad de Mxico


Este tem muestra informacin grfica de calidad de aire en Ciudad de Mxico, los
cuales fueron monitoreados por el SIMAT, Sistema de Monitoreo Atmosfrico de
Ciudad de Mxico, y presentados en su pgina de Internet (www.sma.df.gob.mxIsimat!
pnindicadores.htm), monitoreados en el perodo 1996 a 2005 (hasta julio).
Una de las labores del Sistema de Monitoreo Atmosfrico (SIMAT) es informar
oportunamente el estado de la calidad del aire para proteger la salud de los habitantes
de la zona metropolitana del valle de Mxico.
El SIMAT tiene un boletn informativo de los eventos extraordinarios del incremento
de las concentraciones de PMJO y S02, principalmente. El boletn se emite cuando en
determinada hora yen cualquier estacin de monitoreo, las concentraciones horarias
de PM JO o S02 son mayores o iguales a 300 ~g/m3 o 0,200 ppm, respectivamente.
A continuacin se observan las grficas de diferentes parmetros analizados en
Ciudad de Mxico.

224

ESTAOfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTULO

8 -

CALIDAD DE AIRE

Material particulado, PM 10

A continuacin se observa la grfica de los valores promedios diarios de partculas


menores de 10 micrmetros (PMIO), monitoreada entre 1995 a 2005 (fuente: www.
sma.df.gob.mxIsimatlpnindicadores.htm).

1995

1996

1997

1996

1999

2000

2001

2002

2003

2004

2005
Ano

c:::::::J Dlas arriba del valor limite -+-

Percentil 90

Grfica de promedios diarios de partculas menores de 10 micrmetros


(PMoJ, 1995 -julio 2005

Se puede observar que el nmero mximo de das por encima del lmite de PM 10 se
present en 1996; entre 1995 a 1998 se dieron los valores ms elevados del nmero
de das por encima de la norma. Sin embargo, a partir de 1998, estos valores bajan
considerablemente encontrndose valores bajos en los aos de 1998 y 2005.
A continuacin se muestra la grfica de los valores promedios diarios de partculas
menores a 10 micrmetros (PM 10), monitoreada de 1995 a 2005 (fuente: www.sma.
df.gob.mxIsimatlpnindicadores.htm).
En el diagrama de cajas se observan los valores mnimos y mximos, as como los
valores percentiles 25, 50, 75 Y 90.

1995

1996

1997

::K P~entil7S

1998

_ Mblmo

1999

Percentlt 90

2000

2001

t::JPercentll so

2002
~ Mlnlmo

200]

2004

2005

+ Pertentll25

Grfica de promedios diarios de partculas menores de 10 micrmetros


(PMoJ, 1995 -julio 2005

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

225

VIVIANA VARGAS FRANCO

Se puede analizar que la mayor dispersin de los valores promedios diarios de PM 1O,
se dan entre 1997 y 2003. En el percentil 90 se puede observar que entre 1995 y
1998 se evidencian las mayores concentraciones promedio de PM 10, mientras que
entre 1999 y 2005 estos valores son menores.
A continuacin se observa la grfica del comportamiento tpico diario de partculas
menores de 10 micrmetros (PMIO), monitoreada de 1995 a 2005, donde se
evidencia la tendencia anual cada 24 horas (fuente: www.sma.df.gob.mxlsimat/
pnindicadores.htm).
120

-lOO
~

80-

60

i...
~

t..l

40
20
0+1-'--r-.-'-'--r-r~~r-r-.-'--r-r~~--r-r-.-'-'--r~~

9 10 11 12 13 14 1 S 16 17 18 19 20 21 22 23 24
Hora

-+- 1995

1001

1996

-4- 1997 ~ 1998 --*-1999 -+- 1000

-+- 1001

-+--

1003 -'*- 1004

Julio 1005

Grfica del comportamiento tpico diario de partculas menores de 10


micrmetros (PMJO), 1995 -julio 2005

Se puede observar que a travs de los aos el comportamiento tpico diario de PM 1O


sigue la misma tendencia; valores relativamente bajos hasta las primeras seis horas,
valores altos entre las 8 horas y las 11 horas, nuevamente disminucin entre las 13
horas y las 16 horas y aumento entre las 19 horas y las 20 horas.
A continuacin se presenta la grfica del valor mximo maximorum de concentraciones
horarias de partculas menores de 10 micrmetros (PMIO), monitoreada de 1995 a
2005 (fuente: www.sma.df.gob.mxIsimat/pnindicadores.htrn).

226

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

1400

8 - CALIDAD

DE AIRE

1233

')' 1200
's:

~1000

"~

600

400

1:

7+4

721

800

763

......
670

.. ..

200

..

o
1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

Ao

Grfica del mximo maximorum de concentraciones horarias de


partculas menores a 10 micrmetros (PMJO), 1995, julio 2005
Entre 1997 a 2000 se evidencian valores ms altos del valor mximo de PM lO, pero
a partir de 2001 los valores mximos empiezan a disminuir y permanecer estables
a travs de los aos.
A continuacin se observa la grfica del promedio anual de concentraciones de
partculas menores de 10 micrmetros (PM 1o), monitoreada de 1995 a 2005 (fuente:
www.sma.df.gob.mxlsimatlpnindicadores.htm).

'" lO

'0

..... 0
1: 50
~ .0

SI

51

. 1$

60

57

5'

30

~ 20

a
1:

lO
O

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

Ao

Grfica del promedio anual de concentraciones horarias de partculas


menores a 10 micrmetros (PMoJ, 1986, julio 2005
En la grfica se puede analizar que el promedio anual de concentracin de PM 1O
muestra sus concentraciones mximas entre 1995 y 1999, a partir del 2000 el valor
de concentracin promedio disminuye y evidencia un incremento en el ao 2005
(valor estimado).
A continuacin se observa la grfica de los valores mximos diarios de ozono entre
1986 a 2005. Se ilustran los diagramas de cajas y alambres, evidenciando los valores
mximos y mnimos y los valores percentiles del 25, 50, 75 Y 90% (fuente: www.
sma.df.gob.mxlsimatlpnindicadores.htm).

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

227

VIVIANA VARGAS FRANCO

0,500

0,400

i'
~

0,300

:~

"~
a

0200
'

0,100

0,000

~llilIl! ~tt ~ ~ 1 1 ~ ~!~ ~


i

1~1~1~1~1~~

1~1~1~1~1~1_1~1~~~1~=~~

Ano
)K P~rcenlil

7S -

Mximo _ Perunlll 90

Percenta SO

MI"I",o

Percentlllj

Grfica de mximos diarios de ozono (03), 1986 - julio 2005


En general los valores mximos de ozono mostraron gran dispersin entre 1986 a
1992, a partir de lo cual la dispersin disminuye paulatinamente hasta el ao 2005.
Los valores ms altos de los valores mximos se dan hasta 1992, a partir de lo cual
disminuyen.
Ozono, 03

A continuacin se muestra la grfica de los valores mximos diarios de ozono, desde


el ao de 1986 a 2005 (fuente: www.sma.df.gob.mxlsimatlpnindicadores.htm).
0,350

380

0,300

i'
~
"

240

0,200

0,150

300

0,250

0,100
0,050
0,000

IL.iIII,L..II,L.., ,.....,,,i',i

1,'-

,I

1,1

1,1.....01,1

j,l

J,I

1,1

J ,L..l ,L......I,I."""",I,L '"', 2002 2003 2004 2005

180
120

~
-lI
e

80

1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
~

orllS""ib. dtl ViI/or lmite

..... ProMedio, rop JO

Puc.",iI 90

Mo

Grfica de mximos diarios de ozono (03) 1986 -julio 2005


Se puede analizar que los valores mximos diarios de ozono mantienen la misma
tendencia entre el valor promedio y el percentil 90. Los valores ms altos se dan en

228

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

8 - CALIDAD

CAPITULO

DE AIRE

1986 Yentre 1990 a 1993 . A partir de 1993 los valores inician un descenso paulatino
hasta e12005 (valor estimado).
A continuacin se expone la grfica del comportamiento tpico diario de ozono, por aos,
durante las horas del da (fuente: www.sma.df.gob.mxJsimatlpnindicadores.htm).

..

0,150

,19",
-.-""
-+-,--m,
____ '989

0,120

- -1"1
1993

0090

m,

~
~

... 40

1995

/996

_ _ _ 1997

~ 0.060

_ _ _ 1998

/999

-+-1000

0,030

lOO'
_ _ _ 1001

...... - . _ ........... .

--+- 100J
--1004

Jul. 1005
1

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

Grfica del comportamiento tpico diario del ozono (Oj), 1986 -julio 2005

Se puede observar que a travs de los aos el comportamiento tpico diario de ozono
sigue la misma tendencia, es decir, valores relativamente bajos hasta las primeras
diez horas, altos entre las 11 horas y las 16 horas y nuevamente disminucin a partir
de las 18 horas, aproximadamente.
A continuacin se muestra la grfica de los valores maXlmo maximorum de
concentraciones horarias de ozono, monitoreada de 1995 a 2005 (fuente: www.sma.
df.gob.mxJsimatlpnindicadores.htm).

0 ,000

O,soo

,j''''

0,500

i'

:~

a~.'

0,400

----

"-

D,U1

..

" 0,475

..

e," ,0

0,40<4

0,300

O,H9

~18

0,323

0 .312

jfZl

0,307

0,282

. ..

0,2804
'

0 ,226

-.---.

0,271

0 ,200

0,222

,~

,~

_ _-

,~

,~

_ _,~

_ _- _ -_ _~

,~

,-

,~

_ _~

__

= -

_ _-

o ,OOO-l-_ -_ _-

0,100

Mo

Grfica de mximo maximorum de concentraciones horarias de ozono


(03), 1986 - julio 2005

Se puede observar que los valores mximos maximorum son ms elevados en el


periodo de 1986 a 1992, a partir de este ultimo ao los niveles empiezan a disminuir,
pero lentamente, hasta el 2005.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

229

VIVIANA VARGAS FRANCO

Dixido de azufre, SD2

A continuacin se observa la grfica de los valores promedios diarios de dixido de


azufre (S02), monitoreada entre 1995 y 2005 (fuente: www.sma.df.gob.mxIsimat/
pnindicadores.htm).
30

0.200

25

i'

O.lSO

e
:~

20
0.100

15

e
~

<3

O.OSO

0,000

-,

Ir

1~

lW

"

J. I

"

~~~

r:J

1m

~~~

;:::::::::t mllS arribll dld

l~lm

Wllor lI"u'u

-e

l~

lm

.
v

~~

=~

10

~
~

.1
~

Ano

Peru ntll 90

Grijica de promedios diarios de dixido de azufre (SOj, 1986 -julio 2005


Se puede observar que el nmero mximo de das por encima del lmite de S02, se
dio en 1992; entre 1986 a 1998 se encuentran los valores ms elevados del nmero
de das por encima de la norma. Sin embargo, a partir de 1993 estos valores bajan
considerablemente con pocos datos por encima de la norma en el 2000 y 2001. El
percentil 90 permite analizar cmo los niveles de concentracin descienden a partir
del ao 1992, mostrando valores altos nuevamente en los aos 2000 y 200 l.
A continuacin se ilustra la grfica de los valores promedios diarios de dixido de
azufre (S02), monitoreado entre 1995 y 2005 (fuente: www.sma.df.gob.mxIsimat/
pnindicadores.htm).
0.3DO 1

O.2!lO

1
""

0.200 ; T

- rI II71 Y5! f l I ~ ~ =111 II

] ::: lATJI Tl AT
0,000

----,.--r-....,...--...-r---~

1966 1967 1966

1969 1900

1991

"na,,'"

1992

7J

r
---r---r--- - . , . - - , - - - r

1993 1994

MbJ_

1995

~tU H

1996 1997

hr,,1IJ

s,

.-'-

'---,.~

-r-

1996 1999 2000 2001

- Mtl_

2003 2004 2005

hrft,.tI/ U

No

Grijica de promedios diarios de dixido de azufre (SOj, 1986 -julio 2005

230

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

8 -

CALIDAD DE AIRE

Se puede analizar que la mayor dispersin de los valores promedios diarios de SOz se
dan entre 1986 y 1992. A partir del ao 1993 , los valores medio, mximo y mnimo
de los valores promedio de S02 empiezan a descender, excepto para el ao 2001 ,
cuando se observa la mayor dispersin de la base de datos analizada.
A continuacin se muestra la grfica de los valores promedios diarios de dixido de
azufre (S02), monitoreado entre 1995 y 2005 (fuente: www.sma.df.gob.mx/simat/
pnindicadores.htm).
-~ ~ ,..

,""
,...
...

~
-:r- IHI

--.. - '''1
- -,""

...

I PlJ

''''
m,
,,,,

."'-

'06',.... ,

~,,,,

~ ,

O,!XXl

+--~~~~~~~~~~_~

..

10

11

_ _

12

13

~~~

'4

15

16

__

17

18

~_~

19

20

21

_ _
22

- t " - l00J
- - J()(U

--I

23

-JllI.lfJO$

24

Hora

Grfica del comportamiento tpico diario del dix ido de azufre (SO]),
1986 - julio 2005

Se puede observar que a travs de los aos el comportamiento tpico diario del
dixido de azufre sigue la misma tendencia, es decir, valores relativamente bajos hasta
las primeras ocho horas, valores altos entre las 9 horas y las 11 horas y nuevamente
disminucin a partir de las 14 horas, aproximadamente.
A continuacin se muestra la grfica de los valores mximo maximorum de
concentracin horaria de dixido de azufre (S02), monitoreado de 1995 a 2005.
(fuente: www.sma.df.gob.mxJsimat/pnindicadores.htrn).
CI.IIIII
o,lIIO

ICI.IIIII

t
i

0,110

o,..z

0.0

0,4'1

0,412

~
o.. . . .
0,41

0,33 1

~ 0.300

..

0,340

, " '.

0.325.

-.

~ .276 '6

0,286

~ 0,200

0,283

-0,250

0,100
1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

Mo

Grfica del mximo maximorum de concentraciones horarias de dixido


de azufre (SO]) , 1986 - julio 2005

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

231

VI VI ANA VARGAS FRAN CO

Se puede observar en general que los valores mximos maximorum tienden a


disminuir a partir de 1986, con el valor ms bajo en 1997 y el valor ms alto en
1986.
A continuacin se muestra la grfica de los valores promedios anuales de la
concentracin horaria de dixido de azufre (S02), monitoreado entre 1995 y 2005 .
(fuente: www.sma.df.gob.mx/simat/pnindicadores.htrn).
0,060

o,~"

0,052

0,050

0,0..6

l'
~

0,047

0,030

0,020

13

0,056

.....
0,052

, 0,045

0,040

Q,i

.-~

,..,.-

0,020
......

---

0,017

0,010
O,CXXl

. --

0,016

0,014

..... .--- 0,018

0,Q1.

0,0'4

0,016
......

--- ....
0,012

0,0 12

0,011

0,012

-~-~--r-~-~--r--'--~--r--'--"'---r--'--"'---r-~-~--r--,-----l
1986 1967 1968 1969 1990 1991 1992 1993 1994 1995 1996 1997 1996 1999 200l 2001 2002 2003 2004 2005

+-1

Mo

Grfica del promedio anual de concentraciones horarias de dixido


de azufre (SO:), 1986 - julio 2005
En la grfica se puede analizar que el promedio anual de concentracin de S02
genera sus concentraciones mximas entre 1986 y 1992, a partir de 1993 el valor
de concentracin promedio disminuye.

232

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPTULO

9
Calidad de agua en una
fuente superficial

Este captulo muestra un manejo descriptivo de datos relacionados con el estudio


de la calidad de agua del ro Cauca en su paso por el departamento del Valle del
Cauca, en dos variables: oxgeno disuelto (OD) y demanda bioqumica de oxgeno
(DBO). Los datos fueron monitoreados por la Corporacin Autnoma Regional del
Valle del Cauca (CVC).
La cuenca hidrogrfica del ro Cauca ocupa dentro del contexto colombiano un
lugar estratgico; en ella se localiza la industria azucarera, la mayor parte de la zona
cafetera, las zonas de desarrollo minero y agropecuario, y un sector significativo de
la industria manufacturera del occidente colombiano. Aqu se encuentran ubicadas
dos de las ciudades ms pobladas del pas, tres consideradas intermedias y cinco
que superan los 100.000 habitantes. La intensa utilizacin de la cuenca, asociada
al desarrollo industrial del sector y el crecimiento poblacional, hace que se deba
considerar como factor importante el estudio permanente de la calidad del agua del
ro Cauca, para un mejor aprovechamiento y planificacin de este recurso hdrico
en la regin.
El ro Cauca es uno de los ros ms importantes del pas, tiene una longitud total de
1.350 km, una cuenca hidrogrfica de aproximadamente 63 .300 km 2 y brinda grandes
beneficios a cerca de 183 municipios, localizados en los departamentos que recorre,
permitiendo contabilizar aproximadamente diez millones de habitantes, es decir, el
25% de la poblacin colombiana (Vlez, 2003).

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

233

VIVIANA VARGAS FRANCO

El ro Cauca es aprovechado de manera relativamente intensa para numerosos


propsitos: generacin de energa, extraccin de materiales del lecho, captacin
de agua para consumo humano, riego, industria, pesca, recreacin y como fuente
receptora de vertimientos de aguas residuales industriales yaguas residuales de
algunos de los municipios que se encuentran en su cuenca. Sin embargo, el manejo
y las intervenciones sobre el ro Cauca y sus ros tributarios no han sido los ms
apropiados, originando serios problemas ambientales (Vlez, 2003).
Uno de los principales problemas de la calidad del agua del ro Cauca es el agotamiento
del oxgeno disuelto, como una consecuencia de las mltiples descargas de aguas
residuales domsticas e industriales que se vierten a su cuenca. Por esta razn, la
CVC desde su creacin ha venido realizando grandes esfuerzos en generacin de
polticas, planes y proyectos para el mejoramiento de la calidad del agua del ro y
el control de los vertimientos; es as como la CVC ha implementado un programa
de monitoreo sobre el ro Cauca y sus ros tributarios, con 19 estaciones en el
departamento del Valle del Cauca, el cual se ilustra en la Figura 9.1

ESTACICN
1. Ante. Suarez
2. Ante. Ovejas
3. Antes TITTlt>.

I
AbKlsa(Km)
1.8
3.1
24.1

... Paso de III Belsa


5. P. .o de III Bol..
6. Puente Hormiguero
7. Antes Navarro
8. Juanc:hlto
9. PISO del Comercio
10. Puerto lsaacs
11 . Paso de la Torre
12. Vljes
13. Yotoco
14. Medi8CIIl'lOll
15. Puente RIofrio

16. Pueril Guayabal

""-"'"

27."
78.9
113.5
127.7
139.3
1.....6
155.5

170.8
181 .8
211 .8
220.9
284.8

347.0

17. Puente La VIctoria

369.6

18. An.calO
19. Puente La VrginJa

418.5
.....7

Front....
d ... Cuenea

25

50

km

Figura 9.1 Estaciones de monitoreo sobre el ro Cauea (Vlez, 2003).


A continuacin se describen conceptualmente los parmetros analizados en este
captulo.

234

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

9 -

CALIDAD DE AGUA

Demanda bioqumica de oxgeno (DBD5J


Este parmetro es una medida aproximada de la cantidad de materia orgnica
degradable bioqumicamente, presente en una muestra de agua, y se define como la
cantidad de oxgeno requerida por microorganismos aerobios para oxidar la materia
orgnica hasta formas inorgnicas estables, en un perodo de cinco das a 20C. Si
la materia orgnica se encuentra en gran cantidad, los microorganismos necesitarn
tambin gran cantidad de oxgeno para estabilizar esa materia, lo cual indicara una
alta demanda bioqumica de oxgeno.

La DBO determina la cantidad de oxgeno requerida por la biota del sistema


para oxidar completamente la materia orgnica biolgicamente degradable. Esta
cantidad corresponde a la suma del oxgeno consumido por: las bacterias (en su
proceso de sntesis y respiracin a medida que utilizan el sustrato), los consumidores
(protozoarios cuando ingieren las bacterias como fuente de energa para realizar
los procesos de crecimiento y respiracin) y los procesos de autodestruccin de la
biomasa, creada en los dos procesos anteriores.
La DBO, al igual que la demanda qumica de oxgeno (DQO), es usada para medir el
grado de polucin de las aguas residuales, la cual se basa en el principio qumico que
en medio cido, agentes oxidantes fuertes, pueden oxidar con muy pocas excepciones
la materia orgnica presente, transformndola en dixido de carbono yagua. Por
lo que los valores de la DQO sern siempre mayores que los de la DBO para una
misma muestra, y esta diferencia puede hacerse ms grande, cuanto ms resistentes
a la degradacin biolgica sean los materiales orgnicos existentes .
, Oxgeno disuelto (00)
El oxgeno es esencial para las diferentes formas de vida acutica y tiene influencia
en la mayora de los procesos qumicos y biolgicos que ocurren dentro de un cuerpo
de agua. La concentracin de OD en el agua vara de acuerdo con la temperatura,
la salinidad, la turbulencia, la actividad fotosinttica de algas y plantas y la presin
atmosfrica. Vertimientos de aguas residuales ricos en materia orgnica y nutrientes
traen consigo una disminucin del OD, debido al incremento de la actividad microbial,
va respiracin, que ocurre en la degradacin de la materia orgnica.

En los desechos lquidos el oxgeno disuelto es el factor que determina si los cambios
biolgicos son efectuados por organismos aerbicos o anaerbicos. Los primeros
usan el oxgeno para la oxidacin de la materia orgnica e inorgnica y originan
productos finales inocuos, mientras que los ltimos efectan tales oxidaciones a
travs de la reduccin de ciertas sales inorgnicas y los productos finales son a
menudo perjudiciales.
La concentracin de oxgeno en el agua es vital, tanto para organismos animales como
para los vegetales. Influye particularmente en el metabolismo de los microorganismos

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

235

VIVIANA VARGAS FRANCO

(bacterias) que causan la descomposicin de los contaminantes en el agua. Dicha


descomposicin aerobia de los contaminantes en el agua consume oxgeno y
una reduccin de la concentracin normal de oxgeno es, pues, un indicador de
contaminacin o presencia de sustancias consumidoras de oxgeno.
La cantidad de oxgeno disuelto es un factor importante para determinar el tipo
de organismos que viven en el agua, puesto que algunos necesitan elevadas
concentraciones de oxgeno disuelto para sobrevivir, mientras que otros son ms
tolerantes a concentraciones fluctuantes o bajas. La reduccin en las cantidades
de oxgeno disuelto, adems de afectar directamente la respiracin de organismos
acuticos, puede incrementar la toxicidad de agentes venenosos, como sales de cobre,
zinc, plomo y fenoles, que son muy frecuentes en aguas residuales industriales.
La Tabla 9.1 muestra el rango admisible en algunos parmetros fisicoqumicos y
bacteriolgicos para calidad de agua.
Tabla 9.1

Marco legal para el anlisis de parmetros fsico-qumicos y


bacteriolgicos (Colombia).

Parmetro

Unidad

Norma

Rango Admisible

Unidades
oC

Ac. 14 de la CVC/1976

69

Ac. 14 de la CVC/1976

::s 30

Oxgeno disuelto

mg/l

Ac. 14 de la CVC/1976

>4

DBO

mgtl

RAS/199B

::s 6

000

mgtl

RASl199B

::s 6

pH
Temperatura

Color

(UPC)

RAS/199B

::s 75

Turbiedad

(UNT)

RAS/199B

::s 150

Slidos Totales

mgtl

Dec,4751199B

::s 1000

Dureza

mg/l

Dec.475/199B

::s 160

Nitratos

mg/l

Dec.4751199B

::s 10

Nitritos

mg/l

Dec,4 751199B

::sI

Sulfatos

mg/l

Dec.1594/19B4

::s 400
::s 0,01

Cadmio

mg/l

Dec.1594/19B4

Nquel

mgtl

Dec.1594119B4

::s 0,2

Plomo

mgtl

Dec.1594/19B4

::s 5,0

Zinc

mgtl

Dec.1594/19B4

::s 2,0

Cobre

mgtl

Dec.1594/19B4

::s 0,2

Cromo

mg/l

Ac. 14 de la CVC/1976

::s 0,05

Cloruros

mg/l

Dec.1594/19B4

::s 250

Hierro

mg/l

Dec.1594/1984

::s 5

Manganeso

mg/l

Dec.1594119B4

::s 0,2

Coliformes Totales

NMP/100 mi

Dec.1594119B4

::s 4000

Coliformes Fecales

NMP/100 mi

Dec.1594/19B4

::s 2000

Uso del racurso

Diversos Usos

Tratabilidad Convencional
para Agua Potable

Agrcola

Diversos Usos
Agrcola
Tratabilidad Convencional
para Agua Potable

Fuente : RAS: Reglamento del Sector de Agua Potable y Saneamiento.

236

ESTADSTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPSS

CAPiTULO

9 - CALIDAD

DE AGUA

9.1 Estadsticas descriptivas


Se muestran a continuacin las estadsticas descriptivas para los parmetros demanda
bioqumica de oxgeno y oxgeno disuelto, analizados en las diferentes estaciones
monitoreadas del ro Cauca, en el Valle del Cauca.
Demanda bioqumica de oxgeno (OBO;

En la siguiente tabla se observan estadsticas descriptivas para la variable demanda


bioqumica de oxgeno (DBO), en las estaciones monitoreadas del ro Cauca en el
Valle del Cauca.
Tabla de estadsticas descriptivas para demanda bioqumica de oxgeno (OBO)
Medidas de tendencia central

Minino
Img/I)

MIdiI

1. A. Surez

Medidas de dispersin
MIdiI
llImtricI

DmiIci6n
EstindIr

Coef. di
Vllilci6n1'lo1

Rango
Img/I)

'llrilnzl

1.38

7,70

2.28

1.51

80.5%

1.20

1.11

6.90

1.39

1.18

78.2%

0,70

1.15

1.19

4.60

0.83

0.91

62.4%

4.80

0.90

1.30

1.25

4.60

1.04

1.02

65.7%

1.94

5.30

1.90

1.90

1.49

5.20

1.54

1.24

63.8%

0.20

2.18

6.30

2.50

2.00

1,78

6.10

1.64

1.28

58,7%

7. A. Navarro

0.60

2.64

13.50

2.10

2.30

2.27

12.90

3.23

1.80

68.1%

8. Juanchito

0.30

2.48

5.70

2.20

2.25

2.20

5.40

1.32

1.15

46.2%

9. P. Comercio

0.60

4.61

18.40

4.20

3.80

3.93

17.80

8.76

2.96

64.2%

10. Pto. Isaacs

1.30

4.44

16,70

2.80

3.72

3.96

15.40

6.29

2.51

56.6%

11. P. La Torre

0.77

5.05

14.80

3.00

4.48

4.43

14.03

7.42

2.72

53.9%

12. Vijes

0.86

6.40

18.50

5.30

5.15

5.33

17.64

16.64

4.08

63,7%

13. Votoco

0.80

5.08

16.50

2.80

4.10

4.15

15,70

11.58

3.40

66.9%

14. Mediacanoa

1.20

4.77

13.20

2.00

3.95

4.04

12.00

8.23

2.87

60.1%

15. Pte. Riofro

0.68

4,79

14.60

1.90

3.80

3,75

13.92

11.42

3.38

70.5%

16. Pte. Guayabal

0.85

4.16

13.20

3.80

3,71

3.45

12.35

7.10

2.66

64.0%

17. La Victoria

0.50

3.53

11.60

2.50

3.05

2.99

11.10

4.56

2.14

60.4%

18. Anacaro

0.70

3.85

13.90

1.80

2.64

3.06

13.20

8.10

2.85

74.0%

19. Pte. Virginia

1.12

3.36

10.80

2.40

2.60

2.94

9.68

4.07

2.02

60.0%

ImII/II

Milimo
Img/I)

ImgIIl

ImII/II

0.10

1.88

7.80

0.60

1.40

2. A. Ovejas

0.10

1.51

7.00

1.20

3. A. Timba

0.10

1.46

4,70

4. P. Balsa

0.20

1.55

5. P. Bolsa

0.10

6. Hormiguero

EstICin

Madi

MedIIII

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

ImgIIl

SPSS

lmgII2

ImgII)

237

VIVIANA VARGAS FRANCO

Considerando el marco legal para el anlisis de parmetros fsico-qumicos y


bacteriolgicos, se observa que en el valor medio de DBO las estaciones monitoreadas
cumplen la norma admisible, menor que 6 mgll, excepto la estacin Vijes donde el
valor medio es de 6,4 mgll. Sin embargo, en los valores mximos todas las estaciones
superan el valor admisible de DBO, excepto las estaciones: Antes Surez, Paso de
la Balsa, Paso de la Bolsa y Juanchito. Los valores ms crticos se dan en el tramo
Paso del Comercio a la estacin Yotoco. As mismo, en este tramo se observa la
mayor variacin del conjunto de datos, evidencindose esta situacin con las medidas
de dispersin; rango y desviacin estndar.
El coeficiente de variacin es un indicador de la relacin relativa entre la desviacin
estndar y la media y permite analizar en forma porcentual la relacin entre estas
dos medidas. Analizando el coeficiente de variacin para la DBO se puede observar
que este valor es alto en cada una de las estaciones evaluadas, con un valor mnimo
de 46,2% en la estacin Juanchito y valor mximo de 80,5% en la estacin Antes
Surez. Las estaciones con mayores valores en el coeficiente de variacin son: Antes
Surez y Antes Ovejas, con valores de 80,5% y 78,2%, respectivamente.
Oxgeno disuelto (00)

En la tabla de estadsticas descriptivas para la variable oxgeno disuelto (00), en las


estaciones monitoreadas, se puede evidenciar que considerando un valor admisible
de oxgeno disuelto mayor a 4 mg/l, para diversos usos, se da que el ro Cauca en su
paso por el Valle del Cauca cumple este criterio en el valor medio hasta la estacin
Puente del Comercio.
A partir de la estacin Puente del Comercio los valores medios de oxgeno disuelto
disminuyen considerablemente, encontrndose valores de 1,51 mgll en la estacin de
Yotoco y de 1,65 mgll en la estacin Media Canoa. As mismo y de forma dramtica,
los valores mnimos en las estaciones evaluadas no superan la norma admisible
(>4 mgll), alcanzndose valores mnimos entre 0,1 mgll y 0,2 mg/l, en el tramo Paso
de la Torre a Mediacanoa.
En cuanto a variacin, en el tramo Antes Timba a Paso del Comercio, se encuentran
coeficientes menores al 30%, es decir, los datos varan relativamente poco en relacin
con el valor de la media, mientras en el tramo Paso de la Torre a Mediacanoa se dan
coeficientes de variacin en el rango de 54% a 70%, indicando una gran dispersin
del conjunto de datos, respecto al valor medio de oxgeno disuelto.

238

ESTAOrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS

CAPiTULO

9 - CALIDAD

DE AGUA

Tabla de estadsticas descriptivas para oxgeno disuelto 1001

~
Estacin

....
lq.4)

Medidas de tandencil cantral

....
....
....
...
.... .... .... .... ...
lIbiIIII

s.itricI

.....

Medida de dispersin

...

"-"

VIriIIII

..,;

...

E.-..

CIII.
VIridt

111

1. A. Surez

0.70

4.64

8.00

4.80

4,70

4.20

7.30

3.19

1,79

38%

2. A. Ovejas

0.90

5.09

8.00

6.20

5.30

4.74

7.10

2.57

1.60

32%

3. A. Timba

0,70

6.23

7.91

7.20

6.45

5.92

7.21

1.80

1.34

22%

4. P. Balsa

1.80

6.28

8.00

7.20

6.60

6. "

6.40

1.43

1.19

19%

5. P. Bolsa

0.40

5.95

7.27

6.40

6.30

5.71

6.87

1.38

1.17

20%

6. Hormiguero

1.60

5,76

7.80

6.10

5.96

5.60

6.20

1.19

1.09

19%

7. A. Navarro

0.80

5.52

7.50

5.90

5.90

5.31

6,70

1.38

1.17

21%

8. Juanchito

3.10

5.19

8.20

5.30

5.30

5.12

5.10

0,76

0.87

17%

9. P. Comercio

1.20

4.50

8.10

4.20

4.60

4.30

6.90

1.47

1.21

27%

10. Plo. Isaacs

0.50

3.55

5.80

3.00

3,70

3.26

5.30

1.55

1.24

35%

". P. La Torre

0.10

2.14

6.30

0.20

2.12

1.49

6.20

2.14

1.46

69%

12. Viies

0.20

1,71

4.60

0,70

1.60

1.29

4.40

1.44

1.20

70%

13. Voloco

0.20

1.51

4.30

1.20

1.35

1.22

4.10

0.92

0.96

64%

14. Mediacanoa

0.10

1.65

4.10

1.30

1.50

1.39

4.00

0.81

0.90

54%

15. PIe. Riofrlo

0.60

2.21

4.30

2.10

2.15

2.05

3.70

0.67

0.82

37%

16. PIe. Guayabal

0.30

2.40

4.60

2.40

2.40

2.23

4.30

0.66

0.81

34%

17. La Victoria

0,70

2.75

5.00

3.10

2.80

2.65

4.30

0.49

0.70

25%

18. Anacaro

1.20

2.92

6.40

3.20

2.85

2.84

5.20

0.51

0,71

24%

19. Pte. Virginia

2.20

3.55

6.00

3.80

3.60

3.48

3.80

0.49

0,70

20%

9.2 Presentacin grfica


En este tem se observan diversos tipos de grficas que permiten analizar la tendencia
de la demanda bioqumica de oxgeno y oxgeno disuelto. Se analizan grficas de
valores mximos, mnimos, medios y grficas de series de tiempo a travs de los
aos y meses.
Demanda bioqumica de oxgeno (DBO)

A travs de la grfica de valores mnimos, mximos y media se puede evidenciar que


las estaciones monitoreadas cumplen con el valor admisible de 6 mg/l en los valores

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

239

VIVIANA VARGAS FRANCO

mnimos y medios de DBO, excepto en la estacin Vijes. Sin embargo, los valores
mximos superan el valor admisible en los siguientes tramos: Antes Surez a Antes
Ovejas, Hormiguero a Antes Navarro, Paso del Comercio a Puente La Virginia, es
decir, cerca del 85% de las estaciones evaluadas no cumplen la norma de DBO en
los valores mximos, aunque el 95% s la cumple en el valor medio.

34.0

100

r-

18,0

eoo

r-

HIlo, AbrJsib/~

500

:!

12,0

T
~.~lII -t 4 ~.
~

-r .

6.0

0,0

l:!oc

..,~
...:

. .,

...:

;:

...:

.,~
'" '"

~;:

-i.

:::

~~ ~ ~
.., 8 ~

::
~

..

e
O

'"

D80

I~

11.

1>

::;

..

tl

lo

l:l

'"

Estacin

~
le

<:)1

~.

200

_.~ I 1'-.
~

~
~

..
..
e

...

ili
~

;:

1>

.
~

.. U.
~

~;:

~
..,

lOO

~
~

CAUDA L

Grfica de mnimos, mximos y valores medios para demanda


bioqumica de oxgeno
Los valores ms elevados de DBO se encuentran en las estaciones Paso del Comercio
y Vijes, con valores superiores a 18 mgll, los valores mximos por debajo de 6 mgll
se dan en el tramo Antes Timba a Paso de la Bolsa, y la estacin Juanchito, y en
estas estaciones es donde se cumple con el valor admisible de DBO, en los valores
mnimos, medio y los valores mximos.
La tendencia general de DBO es tener valores bajos hasta la estacin Hormiguero, y
a partir de ah se inicia un ascenso de los valores mximos hasta la estacin Yotoco,
luego bajan los niveles hasta Puente La Virginia, pero sin alcanzar los valores
admisibles.
En la grfica no se evidencia una relacin directa entre los niveles de caudal y los
valores de DBO en las estaciones evaluadas, pues los niveles de caudal medio tienden
a aumentar a travs de las estaciones, no siendo esta la tendencia del valor medio o
el valor mximo de la DBO.
A continuacin se observa la grfica de series de tiempo para la DBO, desde el ao
1984 al ao 2002, en cinco estaciones monitoreadas sobre el ro Cauca, donde se
evidencia que las estaciones Paso de la Balsa y Juanchito tienen, a travs de los aos,
valores menores al valor admisible.

240

ESTADfsTICA DESCRIPTIVA PARA INGENIER fA AMBIENTAL CON

SPSS

CAPITULO

9 - CALIDAD

DE AGUA

La estacin Puente La Virginia evidencia hasta el ao 1994 valores por debajo de la


norma y valores superiores al valor admisible en 1994, 1995, 1997 Y 2000.

11

~----------------------------------------------------------~

1 ..

. -.

12

.' . ............... ..

10

,,- .......,.Oo ..

1964

1985

1986

1987

"'lo

1988

- - P. Balsa

1989

1990

- - JMandilo

1991

1992

1993

1994

P. de La Torre

1995

1996

- - Pte. Riofrlo

1997

1998

1999

2000

2001

2002

- - Pte. Lu Virginia

Grfica de series de tiempo para DEO en estaciones sobre el ro


Cauca
La estacin Puente Riofro tiene valores menores al valor admisible hasta el ao
1994, a partir de esta fecha tienden a incrementar los valores, alcanzando mximos
superiores a 14 mg/l en 1997 y superiores a 12 mg/l en 2001 . En 1998 y 1999 bajan
los niveles.
La estacin Paso de la Torre tiene un comportamiento estable, con valores menores
al valor admisible, hasta 1995, excepto en 1985 y 1992. En el perodo 1996 a 2002
se observan valores superiores al valor admisible.
La siguiente grfica muestra la relacin espacio-temporal de la variable DBO,
donde se relacionan las estaciones (numeradas), los meses del ao (numerados) y
los valores de DBO.

Grfica espacio-temporal para demanda bioqumica de oxgeno

ESTADIs TICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

241

VIVIANA VARGAS FRANCO

Se puede evidenciar que en las primeras estaciones, desde Antes Surez hasta
Juanchito, los valores de DBO son menores al valor admisible de 6 mgll, en cada
uno de los meses del ao. Sin embargo, en las estaciones centrales se observan los
mayores niveles de DBO, es decir, entre Puente del Comercio y La Victoria, los
valores de DBO se incrementan considerablemente con valores mximos en los meses
de enero a marzo, disminuyendo entre los meses de abril a mayo e incrementndose
nuevamente hasta el mes de diciembre donde alcanza valores mximos.
La DBO vuelve a mostrar valores bajos en las ltimas estaciones monitoreadas, es
decir, en el tramo Anacaro a Puente La Virginia, donde la tendencia es a generar
niveles bajos de DBO. En general los meses de marzo, abril y mayo muestran
los niveles ms bajos, incrementndose hasta llegar a los valores mximos en
diciembre.
Oxgeno disuelto (00)

En la grfica de valores mnimos, mximos y media se puede evidenciar que en el


primer tramo de monitoreo del ro, desde Antes Surez a Paso del Comercio, el valor
medio de OD cumple con el valor admisible, pero en este tramo el valor mnimo no
cumple con el valor deseado de OD.

tU

..,

.,.. ""'" -. fIIMr


1,0

11 __

11,0

i"""Q

--

rI " 11

'1

4,0

l.

500

~II~

~- ""'

~~

11

2,0

l.

L..

0,0

:li

'..."

.,
~

...

;:

...

e~

.. ...
;:

.
e

e
::::: eus: .e

...

tl

...~ 8.. ~

~:
..

~~

1.-11--1 ~ . '"11 ::

Estacin
.

OD

~2

~
>:

U
~

:1;

111
;

::

JI

...;:
;;S

:li

::!'"

..

11

es::
:

300

200

100

..

., '~"

..::!

CAUDAL

Grfica de mnimos, mximos y valores medios para oxgeno disuelto

Entre la estacin Paso del Comercio a Puente La Virginia la situacin del ro se


vuelve crtica, pues el valor medio siempre est por debajo del valor deseable y sus
valores mnimos tambin estn en esta condicin, siendo el tramo ms crtico desde
Paso de La Torre a Puente Guayabal.

242

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

9 - CALIDAD

DE AGUA

Grficamente se evidencia una relacin inversa entre los niveles medios de OD y los
valores medios de caudal, pues en el tramo Antes Surez a Puente del Comercio los
valores medios de OD tienen tendencia hacia valores bajos y los valores medios de
caudal tienen tendencia a incrementarse, mientras que en el tramo Puerto Isaacs a
Puente La Virginias los valores medios de caudal tienden a incrementarse y los valores
medios de OD muestran fluctuacin con tendencia a tomar valores mnimos.
En la siguiente grfica se observan los valores mximos, mnimos y medios de
oxgeno disuelto por mes en cuatro estaciones.

9.00 , - - - - - - - - - - - - - - - - - - , - - - - - - - - - : - - - - - ; - - . . . . . . . . ,

8.00
7.00 1

6.001

! s.OO 1
~

4.00

3.00 ~

-~+_++=H_++--_+;;;.-.~+'_+_"".......,"..,j._=r-+.r..___iI_+_=____'lI....-++.....;+_+.=f1

+
1 -

2 .00~
1.00 !
0 .00 1-: -~--~-'--~-~--~-~-_--'--_-_-_--~-_l
ENE"O

FEIRUO

MA"ZO

AUI..

IoI"YO

JlHO

Mes
---+- A. Slldr~z ---+- Hor".g,,~ro --... -

Plo. ISQQCS --+- Pte Virginia

Grfica de valores mnimos, mximos y medios mensuales para oxgeno


disuelto

En la estacin Antes Surez los valores medios de OD cumplen la norma admisible,


pero solo hasta agosto, incluyendo diciembre, y de septiembre a noviembre el valor
medio est por debajo de 4 mgll. Sin embargo, en los valores mnimos esta estacin
tiene valores admisibles slo en enero, abril y julio.
En la estacin Hormiguero en general se cumple con la norma admisible de OD, en
los valores medios, mximos y mnimos, excepto en los valores mnimos en febrero,
marzo, septiembre y noviembre, mientras en la estacin Puerto Isaacs se observa que
slo en enero se cumplen con los valores deseados de oxgeno disuelto (> 4 mgll),
tanto en el valor medio como en los valores mximos y mnimos. En los otros meses
los valores medios en general son menores a 4 mgll con valores demasiado bajos,
menores a 1 mg/l, en marzo y agosto.
En la estacin Puente La Virginia los meses donde se observan valores medios
deseados de oxgeno disuelto son enero y abril; en el resto de meses los valores
medios y mnimos son menores a 4 mg/l. En enero, febrero, abril, mayo, noviembre
y diciembre los valores mximos son menores a 4 mgll, considerndose esto como
una situacin crtica.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

243

VIVIANA VARGAS FRANCO

La siguiente grfica muestra la serie de tiempo para oxgeno disuelto desde el ao


1984 al ao 2002 en cinco estaciones monitoreadas sobre el ro Cauca.
IJ

:.._.;.".,..

8
7

~ .

j:

"'

4
3

1. ,::A

Vv

).',
. \:.

Jl'

rl

_ )( _
\

y v
v

}oC: ". l }L"

I I

.. t

'N~ .

o I

}cf ' \ Pi "


'

F'

1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 19971998 1999 200 2001 200
- - P . Balsa

----Jllanchilo

- -P. de La Torre

- - PIe Riofrio

- - Pte La IIirginia

Grfica de series de tiempo para oxgeno disuelto en estaciones sobre


el ro Cauca

De las estaciones graficadas, las estaciones Paso de la Balsa y Juanchito tienen en


general valores admisibles de OD (> 4 mg/l), excepto en los aos 1987 y 1995 para
Paso de la Balsa y en los aos 1996 y 1998 para la estacin Juanchito.
Las estaciones Paso de la Torre, Puente Riofro y Puente La Virginia en general
muestran valores por debajo del valor admisible de OD, excepto en 1989 y 1991
para la estacin Paso de la Torre y en 1985, 1989 Y 2000 para Puente la Virginia.
La siguiente grfica muestra la relacin espacio-temporal de la variable OD, donde
se relacionan las estaciones (numeradas), los meses del ao (numerados) y los
valores de OD.
8,00

6 ,00

'6

o
;

4,00

.2'

el

2,00

0,00

~ i
Grfica espacio-temporal para oxgeno disuelto

244

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTULO

9 -

CALIDAD DE AGUA

Se puede evidenciar que en las primeras estaciones, desde Antes Surez hasta Juanchito,
los valores de OD son mayores al valor admisible de 4 mg/l, en cada uno de los meses
del ao. Sin embargo, en las estaciones centrales se observan los menores niveles
de OD; entre Puente del Comercio y La Victoria los valores de OD disminuyeron
considerablemente, con valores mnimos en los meses de enero a marzo.
La OD vuelve a generar valores altos en las ltimas estaciones monitoreadas, es
decir, en el tramo Anacaro a Puente La Virginia, donde la tendencia es a evidenciar
niveles altos de OD.

9.3 Histogramas
En este tem se muestran grficas de histogramas para algunas estaciones de muestreo
sobre el ro Cauca en la variable oxgeno disuelto. A continuacin se observan
histogramas en las estaciones Antes Ovejas, Paso de la Balsa y Hormiguero.
ESTACIN: 2,00 Antes Ovejas

Estacin: 4,00 Paso de la Balsa

16 , - - - - - - - - - - ,

JO

12

20

10

1,0 1,5 O

h-L
u O 5

u 3.0 3.5 Oj o~ ~o ~5 lO 1.5 7,0 7,5 lO

3.0 3,5 0,0 O~

~O

1\
1\

/)mI. tp.

',19

Medj. - 6J
N - 61,OO

5,5 6.D

6~

7,0

7~

lO

Oxgeno disuelto

Oxigeno disuelto

Estacin: 6,00 Hormiguero


JO, - - - - - - - - ,

20

0""/1p. /.1I8

Me. - j.7
.L.J.,__

:;...,.J.........,................,..L.,...l...J..,.J

N - 71.OII

1.52.02,53,03,5 4,0 4,55,05,56.06.51,07.58,0

Oxgeno disuelto

Grfica de histogramas en estaciones de monitoreo sobre el ro Cauca


para oxgeno disuelto.

ESTADfsTICA DESCRIPTIVA PARA INGENIER fA AMBIENTAL CON

SPSS

245

VI VI ANA VARGAS FRANCO

La distribucin de frecuencias en la estacin Antes Ovejas, para OD, se encuentra


en el rango de 1 mg/l a 8 mg/l, evidenciando sus frecuencias mximas entre 5,0 mg/l
y 6,0 mg/l y mnimas en datos menores a 3,0 mg/l. Tambin se puede analizar que
el 28,3% de los datos fueron menores a 4,0 mg/l y el 71,6% cumplieron la norma
admisible, es decir, valores > 4 mg/l. La media en esta estacin fue de 5,1 mg/l,
con una desviacin estndar de 1,6 mg/l. La forma de la distribucin se asemeja a
la curva normal.
En la estacin Paso de la Balsa se observa la distribucin de frecuencias en
el rango de 1,5 mg/l a 8,0 mg/l, con frecuencias mximas entre 6,5 mg/l y 7,5
mg/l y mnimas entre 1,5 mg/l y 5,0 mg/l, obtenindose que el 6% de los datos
toman valores menores que 4,0 mg/l y el 94% cumple el valor admisible (> 4,0
mg/l). La media en esta estacin fue de 6,3 mg/l, con una desviacin estndar
de 1,2 mg/l. La forma de la distribucin es asimtrica con sesgo hacia la margen
izquierda.
La distribucin de frecuencias en la estacin Hormiguero se encuentra en el
rango de 1,5 mg/l a 8 mg/l, con frecuencias mximas entre 6,0 mg/l y 6,5 mg/l
y frecuencias mnimas en los rangos de 1,5 mg/l a 4,5 mg/l y entre 7,0 mg/l y
8,0 mg/l. Tambin se puede analizar que el 9% de los datos fueron menores que
4,0 mg/I y el 91 ,0% cumplieron la norma admisible, es decir, valores > 4 mg/l.
La media en esta estacin fue de 5,7 mg/l, con una desviacin estndar de 1,08
mg/l. La forma de la distribucin es relativamente simtrica, asemejndose a una
distribucin normal.
A continuacin se muestran los histogramas en oxgeno disuelto para las estaciones
Puerto Isaacs, Vijes y Mediacanoa.

246

ESTAD ISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPfTULO

Estacin: 10,00 Puerto [saaes

DE AGUA

Estacin: /2,00 Vijes


30 ,---

12

9 - CALIDAD

----------,

r~ r- \ -r-

10

/,

r-

20

_1
[}/

10

--'

O"', Ip. = 1,35

Desv. tp. = / ,1/

1- Mtdi. . 3,4
N -76,OO

0.0 .5 1,01.52,02,5 3,03,54,04,55,05,56,0

Mt dill = /,6
.1-.,-..........L..,-.............................-L...,.....l-,.....l-,.-L..,~

0,0 ,5

Oxgeno disuelto

N - 71,00

1,0 1.5 2.0 2.5 3,0 3,5 4.0 4,5

Oxgeno disuelto

Estacin: 14,00 Mediaeanoa


30 , - - - - - - - - - - - - - ,

20

10

[7
O.... 1J!, - ,69

Mt dill = /,6

0,0 ,5

1,0 1,5 2.0 2,5 3,0 3,5 4,0

Oxgeno disuelto

Grfica de histogramas en estaciones de monitoreo sobre el ro Cauca


para ox geno disuelto

En la estacin Puerto Isaacs la distribucin de frecuencias se da en el rango entre


mg/l y 6,0 mg/l, con frecuencias mximas entre 3,0 mg/l y 5.0 mg/l y frecuencias
mnimas entre mg/l y 1,5 mg/l y entre 5,5 mg/l y 6,0 mg/l. Tambin se evidencia
que e145% de los datos, en esta estacin, cumple los valores admisibles para OD (>4
mg/l), mientras que el 55% de los datos toma valores menores a 4,0 mg/l. El valor
de la media en esta estacin fue de 3,4 mg/l y la desviacin estndar de 1,4 mg/l. La
forma de la distribucin puede considerarse cercana a una curva normal.

ESTADfsTICA DESCRIPTIVA PARA INGENI ERfA AMBIENTAL CON

SPSS

247

VIVIANA VARGAS FRANCO

La distribucin de frecuencias en la estacin Vijes se observa en el rango de Omg/l a


4,5 mg/l, con frecuencias mximas entre 0,5 mg/l y 3,0 mg/l y mnimas entre 3,5 mg/l
y 4,5 mg/l. En esta estacin slo el 7% de los datos cumple los valores admisibles
para OD (>4 mg/l), mientras que el 97% de los datos toma valores menores a 4,0
mg/l. El valor de la media fue de 1,6 mg/l, con una desviacin estndar de 1,21
mg/l. La forma de la distribucin es relativamente simtrica, asemejndose a una
distribucin normal.
En la estacin Mediacanoa la distribucin de frecuencias se da en el rango entre O
mg/l y 4,0 mg/l, dando sus frecuencias mximas entre 0,5 mg/l y 2,5 mg/l y mnimas
entre 3,0 mg/l y 4,0 mg/l. En esta estacin, en forma dramtica, el 97% de los datos
no cumple los valores admisibles para OD (>4 mg/l), es decir, los datos analizados
toman valores menores a 4,0 mg/l. El valor de la media en esta estacin fue de 1,6
mg/1, con una desviacin estndar de 1,21 mg/l. La forma de la distribucin es
relativamente simtrica y se asemeja a la curva normal.

9.4 Tablas cruzadas


Considerando rangos de calidad de agua para oxgeno disuelto y demanda bioqumica
de oxgeno, se muestran a continuacin tablas de contingencia para las estaciones
Antes Surez, Juanchito y Vijes.
A continuacin se observa la tabla de contingencia entre rangos de DBO y OD, en
la estacin Antes Surez.
Tabla de contingencia ORO * Oxgeno disuelto 8
Oxigeno disuelto

OBO

Total

(2.53.51

(3.5-5.51

5.58.01

11.4%

17
38,6%
70,8%

14
31,8%
66.7%

44
100,0%
69,8%

[02.51
Recuento
% de OBO
% de Oxgeno disuelto

62,5%

18,2%
80,0%

(2.03.01

Recuento
% de OBO
% de Oxgeno disuelto

1
10,0%
12,5%

2
20,0%
20,0%

2
20,0%
8,3%

5
50,0%
23.8%

10
100,0%
15,9%

(3.05.01

Recuento
% de OBO
% de Oxgeno disuelto

2
40,0%
25,0%

O
,0%
,0%

3
60,0%
12,5%

,0%
,0%

5
100,0%
7,9%

Recuento
% de OBO
% de Oxgeno disuelto

O
,0%
,0%

,0%
,0%

2
50,0%
8,3%

2
50,0%
9,5%

4
100,0%
6,3%

Recuento
% de OBO
% de Oxgeno disuelto

8
12,7%
100,0%

10
15,9%
100,0%

24
38,1%
100,0%

21
33,3%
100,0%

63
100,0%
100.0%

(02.01

>5.0

Total

a. Estacin - Antes Surez

248

ESTADSTICA DESCRIPTIVA PARA INGENIERA AMBIENTAL CON

SPSS

CAPITULO

9-

CALIDAD DE AGUA

En esta estacin se puede apreciar que el 69,8% de los datos de DBO se encuentran
en el rango O mg/l a 2,0 mg/l y el 15,9% se dan en el rango de 2,0 mg/l a 3,0 mg/l,
es decir, en estos dos rangos se halla el 85,7% de los datos de DBO.
Para el oxgeno disuelto, el 33,3% de los datos se encuentra en el rango 5,5 mg/l a
8,0 mg/l y e138,1 % en el rango 3,5 mg/l a 5,5 mg/l, es decir, en estos dos rangos se
encuentra el 71,4% de los datos de OD.
Cuando el oxgeno disuelto se encuentra entre 5,5 mg/l y 8,0 mg/l; la DBO toma
valores entre O mg/l y 2,0 mg/l; el 66,7% de las veces y entre 2,0 y 3,0 mg/l el
23,8%.
Cuando la DBO se halla en el rango Omg/l a 2,0 mg/l; el 11,4% de los datos de OD
se encuentra entre O mg/l y 2,5 mg/l y el 18,2% de los datos se da entre 2,5 mg/l y
3,5 mg/l.
Del total de datos analizados, el 22% se hallan entre 5,5 mg/l a 8,0 mg/l de OD y entre
Omg/l y 2,0 mg/l de DBO, simultneamente. El 27% de los datos se encuentra entre
3,5 mg/l y 5,5 mg/l de OD y entre Omg/l y 2,0 mg/l de DBO, simultneamente.
En esta tabla se puede evidenciar que valores menores de DBO estn asociados a valores
altos de OD, valores altos de DBO repercuten en una disminucin de la OD.
La siguiente tabla muestra el cruce entre oxgeno disuelto y DBO, en la estacin
Juanchito.
Tabla de contingencia oBO * Oxigeno disuelto 8
Oxigeno disuelto
Total
OBO

(2.53.51

(3.55.51

(5.58.01

[02.01

Recuento
%de OBO
%de Oxigeno disuelto

O
,0%
,0%

20
64,5%
39,2%

11
35,5%
44,0%

31
100,0%
39,2%

(2.03.01

Recuento
%de OBO
%de Oxgeno disuelto

1
4,2%
33,3%

17
70,8%
33,3%

6
25,0%
24,0%

24
100,0%
30.4%

(3.05.01

Recuento
%de OBO
%de Oxigeno disuelto

2
8.7%
66.7%

13
56,5%
25,5%

8
34,8%
32,0%

23
100,0%
29,1%

>5.0

Recuento
%de OBO
%de Oxigeno disuelto

O
,0%
,0%

1
100,0%
2,0%

O
,0%
,0%

1
100,0%
1,3%

Recuento
%de OBO
%de Oxgeno disuelto

3
3,8%
100,0%

51
64,6%
100,0%

Total

25
31,6%
100,0%

79
100,0%
100,0%

a. Estacin - Juanchito

ESTADisTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

249

VIVIANA VARGAS FRANCO

En esta estacin, el 39,2% de los datos de DBO se encuentra en el rango de O mg/l


a 2,0 mg/I, el 30,4% en el rango de 2,0 mg/I y 3,0 rng/I y el 29,1 % entre 3,0 rng/I y
5,0 mg/l, es decir, en estos tres intervalos se da el 98,7% de los datos de DBO.
Para el OD, el 31,6% de los datos se da en el rango 5,5 mg/l y 8,0 mg/I y el 64,6%
entre 3,5 rng/l a 5,5 rng/I, es decir, en estos dos rangos se halla el 96,2% de los datos
deOD.
Cuando el OD se encuentra entre 3,5 rng/ I y 5,5 mg/I; el 39,2% de los datos de DBO
se halla entre O mg/I a 2,0 mg/I; el 33,3% entre 2,0 mg/I a 3,0 mg/I y el 25,5% entre
3,0 mg/I a 5,0 mg/l.
Cuando la DBO se da entre 3,0 mg/I y 5,0 mg/I; el OD se halla entre 2,5 mg/l y 3,5
mg/I el 8,7% de las veces; el 56,5% se da entre 3,5 mg/l y 5,5 mg/l y el 34,8% entre
5,5 mg/l y 8,0 mg/l de OD.
Del total de datos analizados, el 25,3% de los datos est entre 3,5 mg/l y 5,5 mg/l de OD
y entre Omg/l a 2,0 mg/l de DBO, simultneamente. El 16,5% de los datos se da entre
3,5 mg/l y 5,5 mg/l de OD y entre 3,0 mg/l y 5,0 mg/l de DBO, simultneamente.
A continuacin se muestra la tabla de contingencia entre rangos de DBO y oxgeno
disuelto, en la estacin Vijes.

Tabla de contingencia DBO Oxigeno disuelto


Oxigeno disuelto

[02.51
oBo

(2.5-3.51

(3.55.51

Total

[02.01

Recuento
%de OBo
%de Oxigeno disuelto

2
66.7%
3,6%

1
33,3%
10,0%

O
,0%
,0%

3
100,0%
4,2%

(2.03.01

Recuento
%de OBO
%de Oxgeno disuelto

5
50,0%
9,1%

2
20,0%
20,0%

3
30,0%
42,9%

10
100,0%
13,9%

Recuento
%de OBO
%de Oxgeno disuelto

11
61.1%
20,0%

5
27,8%
50,0%

2
11,1%
28,6%

18
100,0%
25,0%

Recuento
%de OBO
%de Oxgeno disuelto

37
90,2%
67,3%

2
4,9%
20.0%

2
4,9%
28,6%

41
100,0%
56,9%

Recuento
%de OBo
%de Oxgeno disuelto

55
76.4%
100,0%

10
13,9%
100,0%

7
9.7%
100,0%

100,0%
100,0%

(3.05.0%1

>5.0

Total

72

a. Estacin - Vijes

En esta estacin el 4,2% de los datos de DBO se dan entre O mg/l y 2,0 mg/l, el
13,9% entre 2,0 mg/l y 3,0 mg/I y el 25,0% entre 3,0 mg/l y 5,0 mg/l, es decir, en
estos tres intervalos se halla e143,1 % de los datos de DBO.

250

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPTULO

9 - CALIDAD

DE AGUA

En OD, el 76,4% de los datos se encuentra en el rango mgll a 2,5 mg/l, el 13,9%
entre 2,5 mgll y 3,5 mgll y el 9,7% entre 3,5 mgll y 5,5 mgll.
Cuando el OD se halla entre 2,5 mgll y 3,5 mg/l; el 10% de los datos de DBO est
en el rango de mg/l a 2,0 mgll; el 20% entre 2,0 mg/l y 3,0 mg/l y el 50% entre
3,0 mg/l a 5,0 mgll.

Cuando la DBO se da entre 3,0 mg/l y 5,0 mgll; el OD se halla entre mg/l y 2,5
mgll e161, 1% de las veces; entre 2,5 mgll y 3,5 mg/l el 27,8% Y el 11,1 % entre 3,5
y 5,5 mg/l de OD.

Del total de datos analizados, el 51,4 % de los datos se da entre mg/l y 2,5
mg/l de OD y > 5,0 mg/l de DBO, simultneamente. El 15,3% de los datos
se ubica entre mg/l y 2,5 mg/l de OD y entre 3,0 mg/l y 5,0 mg/l de DBO,
simultneamente.

9.5 Frecuencias acumuladas


A continuacin se observan las grficas de frecuencias acumuladas para oxgeno
disuelto en las estaciones Antes Surez, Paso de la Balsa y Juanchito.

,.,.

,.,.

J",ndita

,.,.

7i-'

V
~

4,0

00

1/

dI
0,0

/
V
'"

1/

~
lO

'"

A
0,0

l,O

40

1,0

00

'"

0,0

l,O

..o

1,0

00

Grfica de frecuencias acumuladas en oxgeno disuelto, en las estaciones


Antes Surez, Paso de la Balsa y Juanchito

De la grfica se puede analizar que en la estacin Antes Surez alrededor del 43% de
los datos toma valores menores a 4,0 mgll, es decir, el 57% cumpli el valor admisible.
En la estacin Paso de la Balsa alrededor del 5% de los datos son menores a 4 mg/l,
y el 95% de los datos cumple el valor admisible. En la estacin Juanchito alrededor
del 12% muestra valores menores a 4 mgll y el 88% toma valores admisibles. Lo

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

251

VIVIANA VARGAS FRANCO

anterior evidencia que en estas estaciones se tienen pocas frecuencias en datos


menores o iguales a 4 mg/l, que es el estado deseable del ro.
La siguiente grfica ilustra las frecuencias acumuladas de las estaciones Vijes,
Mediacanoa y Puente Guayabal.
JlijtS

..

M t djfl(llffHI
- - - - - - -_.-

''''''

10'"'

"

,,.

t.

..

,.
,,'

".

..
!!" ".

,,.

,,.

oSE

,.
"

20

00

00

."

PUtnl, GII.)'ab.J

','

,.
"

00

"

00

"

"

00

"

Grfica de frecuencias acumuladas en oxgeno disuelto en las estaciones


Vijes, Mediacanoa y Puente Guayabal

En las estaciones Antes Surez, Paso de la Balsa y Juanchito se dan sus mayores
frecuencias en valores menores a 4,0 mg/l, pues cerca del 98% de los datos toman
valores menores a 4 mg/l, considerndose esta situacin bastante crtica en el ro.

9.6 Percentiles
Este tem muestra el anlisis de los valores percentiles para oxgeno disuelto y
demanda bioqumica de oxgeno.

Oxgeno disuelto
En la siguiente tabla se muestran los valores percentiles de OD en las diversas
estaciones monitoreadas sobre el ro Cauca en el Valle del Cauca.

252

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

9 - CALIDAD

DE AGUA

Tabla de percentiles para oxgeno disuelto en estaciones del ro Cauca


00

Estacin

Antes Suraz

Parcantil
05

ParcantM
25

1,3

3,5

Parcantil
75

Parcantil
95

P8rcantil
99

4,7

5,8

7,5

8,0

Mediana

Antes Ovejas

1.8

4,1

5,3

6,1

7,5

8,0

Antes Timba

4,3

6,0

6,5

7,1

7.4

7,9

Paso de la Balsa

4,1

5,7

6,6

7,1

7,6

8,0

Paso de la Bolsa

3,8

5,7

6,3

6,7

7,1

7,3

6,7

7,8

Hormiguero

3,3

5,5

6,0

6.4

Antes Navarro

1.7

5,2

5,9

6,2

6,5

7,5

Juanchito

3,7

4,7

5,3

5,7

6,3

8,0

Paso del Comercio

1,9

3,6

4,6

5,3

5,9

8,0

Puerto Isaacs

,8

2.7

3,7

4,6

5,3

5,8

Paso de la Torra

,1

,7

2,0

3,0

4,6

6,3

Vijes

,2

,6

1.4

2.4

4,0

4,6

Yotoco

,2

,8

1,3

1.8

3,5

4,3

Mediacanoa

,3

1,0

1.5

2,0

3,7

4,1

,9

1,6

2,2

2.7

3,6

4,3

Puente Guayabal

1,0

1.8

2.4

2,8

3,6

4,6

Puente La Victoria

1,7

2,3

2,8

3,1

3,8

5,0

Anacaro

2,1

2,5

2,8

3,2

3,9

6.4

Puente La Virginia

2.4

3,1

3,6

3,9

4,5

6,0

Puente Riofrlo

De la tabla se puede analizar que en la estacin Antes Surez el 50% de los datos son
menores o iguales que 4,7 mg/l; el 75% son menores o iguales a 5,8 mg/l; el 95%
son menores o iguales a 7,5 mg/l y el 99% son menores o iguales a 8 mg/l.
En la estacin Paso de la Bolsa el 50% de los datos son menores o iguales a 6,3 mg/l;
el 75% son menores o iguales a 6,7 mg/l; el 95% menores o iguales a 7,1 mg/l y el
99% son menores o iguales a 7,3 mg/l.
En la estacin Paso de la Torre el 50% de los datos son menores o iguales a 2,0 mg/l;
el 75% son menores o iguales a 3,0 mg/l; el 95% son menores o iguales a 4,6 mg/l
y el 99% son menores o iguales a 6,3 mg/l.
En la estacin Yotoco el 50% de los datos son menores o iguales a 1,3 mg/l; el 75%
menores o iguales a 1,8 mg/l; e195% menores o iguales a 3,5 mg/l y el 99% menores
o iguales a 4,3 mg/l.
Los percentiles en forma grfica se observan a continuacin.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

253

VIVIANA VARGAS FRANCO

, OI

.=......

.... .r ....
Valdr Gd",i;ible
~

.~

4~ jJ~~
'l- .: .. , ... ~.
. . =::.:=::::.
.
.
.. ... ,.~~. ~. I
t3
tl
.
~ ~ ~ .~ . ... :;: :: ~ ~
~ "u
u .~
::!i
:
::!i
~
~
...'" ...'" ... '" '" "~ ... ...::!i
~
~ "~
~
.I:!
'"
'"
.

t;j
oc

e
<:;

::;J

\,)

-~~

:_~:

~
...,

s::

;:s

ESTACIN
--+-- Pe re. 5

- P e T e. 25

--"--Perc. SO

- - * - Perc . 7 5

PeTe. 95

----- PeTe . 99

Grfica de valores percentiles para oxgeno disuelto en estaciones del


ro Cauca

Analizando en general los valores percentiles se tiene que las estaciones con mejor
reporte de datos en OD son Antes Timba y Paso de la Balsa, pues slo e15% (percentil
05) de sus datos son menores o iguales a 4,3 mg/l y 4,1 mg/l, respectivamente. Le
siguen las estaciones Antes Ovejas y Juanchito, pues e125% de los datos son menores
a 4.1 mg/l y 4,7 mg/l, respectivamente.
Las estaciones con valores crticos se encuentran en el tramo Vijes a Puente Guayabal,
pues el 99% de los datos (percentil 99) son menores o iguales a 4,6 mg/l. Otras
estaciones con datos crticos son Paso de la Torre, considerando que el 95% de los
datos son menores a 4,6 mg/l y la estacin Puerto Isaacs, pues el 75% de los datos
son menores a 4,6 mg/l, similarmente la estacin Paso del Comercio, con el 50%
de los datos menores de 4,6 mg/l.
A continuacin se observa la tabla de valores percentiles de DBO en las estaciones
monitoreadas sobre el ro Cauca. De la tabla se puede deducir que en la estacin
Antes Timba se observa que el 50% de los datos toman valores menores o iguales
a 1,2 mg/l; el 75% son menores o iguales a 2,0 mg/l; e195% son menores o iguales
a 2,9 mg/l y el 99% datos menores o iguales a 4,7 mg/l.

254

ESTAOfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPITULO

9 - CALIDAD

DE AGUA

Tabla de percentiles para demanda bioqumica de 00 en estaciones sobre el ro Cauca


080

Estacin

Percentil

Percentil

05
.4
,2
,3
,3
,3
,3
1,0
,8
1,5
1,9
1,9
2,5
1,6
1,5
1,3

25
,9
,8
,8
,9

Antes Surez
Antes Ovejas
Antes Timba
Paso de la Balsa
Paso de la Bolsa
Hormiguero
Antes Navarro
Juanchito
Paso del Comercio
Puerto Isaacs
Paso de la Torre
Vijes
Yotoco
Mediacanoa
Puente Riofro
Puente Guayabal
Puente La Victoria
Anacaro
Puente La Virginia

Mediana

1.1

2.7
2.7
2,0
2,3
2,2
1,8
2,2

1.1
1,3
1,5

Percentil

Percentil

75
2.4
2,1
2,0
1,9
2,5
2,8
3,1
3,2
5.4
5.4
6,6
9,0
6,8
5.7
6,3
5,2
4,6
5,5
4,2

95
5,1
3.7
2,9
3,6
4,9
4,8
6,0
4.4
9,0
10,1
10,9
15.7
10,5
10,8
11,2
9,3
9,8
10,1

99
7,8
7,0
4.7
4,8
5,3
6,3
15,1
5.7
15,9
16.7
14,8
18,5
16,5
13,2
14,6
13,2
11,6
13,9
10,8

1.4
1,2
1,2
1.3
1,9
2,0
2,3
2,3
3,8
3,9
4,6
5,2
4,1
4,1
3,8

1,3
1,8
1.6
2,8
3,0
3,2
3.4

1.2

Percentil

3.7
3,1

2.7
2,6

B.4

En la estacin Hormiguero el 50% de los datos son menores o iguales a 2,0 mgll;
el 75% son menores o iguales a 2,8 mg/l; el 95% menores o iguales a 4,8 mg/l y el
99% son menores o iguales a 6,3 mg/1. En la estacin Vijes el 50% de los datos
son menores o iguales a 5,2 mgll; el 75% son menores o iguales a 9 mgll; el 95%
son menores o iguales a 15,7 mgll y el 99% son menores o iguales a 18,5 mg/1. Los
percentiles en forma grfica se muestran a continuacin.

4
2

....

!:!
;:'"

'"

..;

;:

"..;
Q

~Perc.

..;

~
;:

'"

.~
Q

'"

!:l'"

"

-----Perc. 25

:::
:lO

~
..;

~...

tJ

::l

~
<.;;

'"

:!

':::"

::

::

s: ~ ~iJ'"
~
'1

'"

ESTACIN

--+-Perc. 50

. ...

- - Pe re. 75

....

::::
Q

:::

"

;:
;:

-+-Perc. 95

'1

;;:

::

'"
iJ
~

"

'1

l!!

"~

- - - Pe re. 99

Grfica de valores percentiles para DBO en estaciones del ro Cauca

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

255

VIVIANA VARGAS FRANCO

Analizando en general los valores percentiles para DBO, se da que las estaciones con
mejor desempeo son: Antes Timba, Paso de la Balsa, Paso de la Bolsa, Hormiguero
y Juanchito, pues el 99% de los datos son menores o iguales a 4,7, 4,8, 5,3 , 6,3 Y
5,7 mg/l, respectivamente.
Le siguen las estaciones Antes Surez, Antes Ovejas y Antes Navarro, debido a que
el 95% de los datos son menores o iguales a 5,1, 3,7 Y 6,0 mg/l, respectivamente.
Las estaciones con valores crticos en DBO son Paso de la Torre, Vijes y Yotoco, debido
a que el 50% de los datos son menores a 4,6, 5,2 Y 4,1 mg/l, respectivamente.
De los resultados descriptivos desarrollados en este captulo, la presentacin grfica
de los datos y consideraciones de carcter tcnico se pueden generar los siguientes
anlisis generales:
En el tramo Antes Surez a ro Ovejas se dan aumentos leves en la concentracin
de oxgeno disuelto y una disminucin leve de la demanda bioqumica de oxgeno;
el ro en este tramo inicia un proceso de recuperacin, recibiendo una reaireacin
que es utilizada para la degradacin de la materia orgnica.
En el tramo Antes ro Ovejas a Hormiguero el ro recibe aguas de tres ros afluentes :
ro Ovejas, ro Timba y ro Palo, aumentando considerablemente los niveles de
caudal del ro Cauca, lo cual permite una estabilizacin de la demanda bioqumica
de oxgeno y el incremento en la concentracin de oxgeno disuelto, considerando
que los ros Timba y Ovejas aportan un caudal importante con altas concentraciones
de oxgeno disuelto y valores bajos de demanda bioqumica de oxgeno.
En el tramo Hormiguero a Vijes se observa la mayor contaminacin del ro por
materia orgnica, debido a que en este tramo recibe las descargas de la ciudad de
Cali, Palmira y el corredor industrial Cali-Yumbo, donde se encuentra gran parte
de los ingenios azucareros, la mayora de las industrias de produccin de pulpa de
papel, industrias productoras de qumicos y la principal destilera del departamento
del Valle del Cauca. En este tramo se dan constantemente valores bajos de oxgeno
disuelto y un incremento progresivo de la demanda bioqumica de oxgeno.
En el tramo Vijes a Mediacanoa se tiene la condicin ms crtica a nivel de
concentracin de oxgeno disuelto, pues en general se encuentra entre 1 mg/l y 2 mg/l.
En este sector hay una fuerte exigencia en la demanda bioqumica de oxgeno. La
contaminacin en este sector es aportada por los municipios de El Cerrito, Guacar
y Yotoco. (Vlez, 2003).
En el tramo Mediacanoa a La Virginia el ro muestra una marcada recuperacin, pues
la carga contaminante es menor y esto posibilita la auto-recuperacin de la calidad de
agua. En este sector se observan descargas de aguas residuales e industriales, debido a
los ingenios, beneficiaderos de caf e industrias alimenticias, as como de los municipios
de Buga, Tulu, Riofro, Bugalagrande, Cartago y Caicedonia. (Vlez, 2003).

256

ESTADIsTICA DESCRIPTIVA PARA ING ENIER IA AMBIENTAL CON

SPSS

CAPTULO

10
Instrucciones en SPSS

En este captulo se presentan los procesos bsicos para el uso del programa estadstico
SPSS (Statistical Package for the Social Sciences), en su versin 11.5, para el
sistema operacional Windows (Las nuevas versiones tienen los mismos procesos
para la estadstica descriptiva que los presentados en este libro). SPSS es uno de los
programas ms comnmente utilizados para el anlisis estadstico de datos. Entre sus
ventajas se encuentran: cubre un amplio rango de los anlisis ms comunes y grficos
estadsticos, los datos pueden ser grabados en SPSS o pueden ser importados de
otros programas, como Excel. Los resultados del anlisis de datos estn claramente
estructurados en un archivo de salida, en el cual se pueden realizar modificaciones
y pueden ser editados en el procesador de texto Word (Microsoft).
'
Para ingresar al programa SPSS en el men de inicio se debe seleccionar:
Programas>SPSS for Windows>SPSS 11 .5 para Windows, o simplemente d
doble clic en el icono de SPSS si este se encuentra instalado en el escritorio, SPSS
automticamente abrir una hoja vaca: "Sin titulo - SPSS para Windows Editor
de datos". Para finalizar el programa SPSS se debe seleccionar Archivo>Salir, de
la barra del men o clic en el botn X, en la parte superior de la esquina derecha
de Windows.

10.1 Ingresando los datos a SPSS


El editor de datos abre automticamente cuando se inicia una sesin SPSS y contiene una
hoja electrnica para introducir, editar y mostrar el contenido de un archivo de datos.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

257

VIVIANA VARGAS FRANCO

Las filas en el editor de datos de la hoja electrnica son observaciones o casos y


las columnas variables. La lnea superior de las filas contiene el nombre de las
variables, mientras que la columna izquierda se refiere al nmero de la secuencia
de las observaciones o medidas, tal como se ilustra a continuacin.

Para definir las variables de la barra de men se debe seleccionar Datos>Definir


propiedades de variables ... o pulsando doble clic en la celda "varOOOOl" en
la lnea superior de las filas, donde se define el nombre de la variable 1; en la
siguiente columna, en "var00002", se puede definir el nombre de la segunda
variable y as sucesivamente hasta completar las variables del estudio. El nombre
de cada variable debe iniciar con una letra, con mximo ocho caracteres y puede
ser alfanumrico. El nombre no debe contener espacios en blanco, pero pueden
ser usados caracteres especiales.
En la caja: Definir propiedades de las variables de clic en Etiqueta, y en la
ventana abierta "Definir etiqueta", tipear el nombre completo de la variable o un
nombre ms extendido del tipeado en "var00002". Aqu se permiten espacios y
no existe una longitud mxima.
Mientras la caja Definir propiedades de las variables est abierta, es til tambin
seleccionar el tipo apropiado de cada variable, seleccionando Tipo; sta ofrece
una lista de diferentes posibilidades (numrica, fecha, cientfica, dlares, notacin
etc.). Indique el nmero de decimales en la instruccin Ancho, y pulse clic

258

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO

10 -

INSTRUCCIONES EN

SPSS

en continuar. D la Medida (escala, ordinal, nominal) y d clic en aceptar. A


continuacin se observa la caja de definir variable:

LiIIe di v.-... ......

s...

101 ..

v....

VlrilbleeclUlt

J""bo<-j,

EIiquM

NiYeldemecida

"'JE-IC-ala--iJ~

s.... " T~

V"'Iin~

r--

CeIIiMID

r
r
r

JNl.IIlbia:iJ [

Ancho:r- oea.n..: r

-@ NIade . . . . . . a le ..... o edflelat. Puede all v..... 1bajo.

R,,~v

1
2

Jn.biedICl

........
........
r

5
6

e
9

v...

1
1
1
1
1
1
1
1
1

. ---A
-o-Ir.-v=-d

[~;.:::'-

Pega!

AcepW

I ~;I

EIIIp

35.00
42.00
65.00
72,00
75,00
100,00
105.00
120,00
190.00

R~

,
I

c==-:u
~,

CenceIIr

I .. I

10.2 Importando archivos de Excel


Si los datos se encuentran almacenados en un archivo de Excel, donde las variables
estn por columnas y las observaciones por filas, es posible trasladar estos datos
al editor de datos de SPSS. Para realizar el traslado del archivo se deben seguir los
pasos que se presentan a continuacin; ilustrados con las variables; turbiedad y
slidos suspendidos.
Abra el archivo de Excel que contiene los datos a ser trasladados a SPSS .

.............

o .~:.~=

...
1

f'KM
04-......... ,

07 ...,.... '

..

-....-_- .....

A_a _

_...,5...
...
i

.1l,.,Jll.'

........

12..

71 00
'''00
_ .00

,.o.

".00
'''00

100.0

,to.O

MO

>0.

,oe.

_........

.. 10

... "

.......

, "

c .... .... . . ..
te

.......

ti

o f ":1

c:::::J

8UlO
'0000

.... 00
.7100
.....00
'2000

.,.2..
37.0

1_ GII._

17800

70.

12&0

32.

1t00
'3)00
'''00
OlOO
..00
123.00

. . . 00
" .00
7>00
"00

_..... . . ,___...-.___....l..._....l..._.-...._.I___
.. UO Otllrll . . ... .

a. . . .. a .lil .

ESTAD ISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

...L..._~_~_~
I

.tfl

259

VIVIANA VARGAS FRANCO

Seale los datos de las variables que se van a procesar y d clic en el icono de
copiar, en este caso turbiedad y slidos suspendidos,
.. 1<4

... I

!.-!I
.~
I

~
-

1-

+-

'Ir

Inicie el programa SPSS y posicinese en la primera columna y primera fila, es


decir, la celda Al, Y seleccione Edicin> Pegar.

-+

,
~

l-

-+----1--+ ---i

-r-

L
1-

+
j

r
f

.tj
j

- 1-'

.~

-t-. --i-- t
f" 1-1
t

-~

~-

j:

.
I

-~

t -

j-

t
tt

r-T-Y- -1- ---- t

-t--- "'.-

f
t

-.

'.l
tt

-..j:

..

-:

-+.

_.

--+-.

r
-;
.
f. t
~

.t

1"

- ++

1 1t.___ t
l-

.---t" -, -

.ffI
Los datos de las variables turbiedad y slidos se copiarn en el editor de datos
de SPSS. Para cambiar el nombre de las variables se debe habilitar la "pestaa";

260

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPfTULO

10 -

INSTRUCCIONES EN

SPSS

vista de variables, que est ubicada en la parte inferior de la pantalla. Tambin


se puede realizar ubicndose en la fila superior de cada variable.

_..

\CIt_

.00
"08

ItSOi!!
1100

).l.

.....
.....
.......
""
'''00

U).ao
14000

...

"00

.00

Inoo

'

__

11000

114(1)

:::!
"

.....

,
i

.
t

rt
j

t t f

t
t

~;;;;;!'r-~:::::::::----~=:l:'

--

+
+

,.

1-

.
~

i-

..

.~

Vista de variables

Se desplegar la pantalla que presenta la descripcin de variables, el nombre, el


tipo, la longitud, el nmero de decimales, la etiqueta, valores especiales, valores
perdidos, columnas, el tipo de alineacin y el tipo de medida.

Campos que deben ser diligenciados de acuerdo con el contexto del estudio.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

261

VIVIANA VARGAS FRANCO

I
I

,.,

,.

En el ejemplo especfico, el editor de datos en SPSS quedar definido de


la siguiente forma, quedando definidas las variables para el procesamiento
estadstico.
,.,

""*-

,'" ,",

~1 ~I.S ..II~I.f!I

'*lliIlaJ!!J
~ -.....

lIIdOe

n
- 3IlO

~
~

35

\W

\46
SII5

121
1CX)

1901

978 1

!!l

6SO
Dl

105
1$

\10

~
lA

\6

R
I
I

\
I

~
2t

- I ----;;;- I ~ ~ I ~
I
I
I
I
t-----

te

\20
99 t

125

\33

85

UO

,.-85 e
51

11

...

~ r ----;;;- ,.!

1
!...

I
I

--

f---._-.-

-,
54
129 ,

1M

...

......

....+--

f------- --_ ..._.

-_ - --u-r--

53

73

---;;;---

---+-_.

..

I
1

_.

.-- -- -

* 1

32

- m""'---2Ii81

~_

__

iliJ\-.-~ .:--...1
-_._262

{lrol.E!J_lrtI ~

-'!l
IliOi

136

65

-..... _ _ ,

7~r

~I

t:j

.--_.- ':42

,..-

Nd6a ....... t....r- ,...,

- .. ~.

" -_~_I

_. __ .

-t,

1
~

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

.:r
SPSS

CAPfTULO

10 -

INSTRUCCIONES EN

SPSS

10.3 Estadsticas descriptivas


Las estadsticas descriptivas que permite calcular directamente SPSS son: media,
suma, desviacin estndar, mximo, mnimo, varianza, amplitud (rango), coeficiente
de curtosis, coeficiente de asimetra y error tpico de la media. El proceso del clculo
se ilustrar con el ejemplo de la evaluacin de cinco filtros gruesos, presentado en
el captulo 7.
En la barra de men de SPSS seleccione: Analizar>Estadsticos Descriptivos>
Descriptivos ... , en este momento se despliega el cuadro de dilogo
Descriptivos.

c~.. mecIas
Modelo lneaI generlll

Modelos mixtos
Coneledones
R~

lOQlnNl
CIesflc..
RldJcdn de datos
Esealas
PruIbas no perllll6b1ces
Series teqIorlles
~

RespJeStes ~
AnilsIs de valores penIcIos

Seleccione del lado izquierdo del cuadro de dilogo las variables a las cuales desea
calcularles estadsticas descriptivas y pselas alIado derecho (Variables) mediante
el botn que se encuentra en el medio de las dos subventanas. Para seleccionar
las estadsticas descriptivas que desea calcular, d un dic en Opciones.

_.
- - - ---- .._------- _. ---~I ~ ~I
-~

--~

Acepte!

~feche
$llIInIgas3

F>.\lII

1lIInI~

Ctn:ei

I
I

Rttttbletll!

.leII\IghnJ
""",gh3
$""",gcb

I
I

~SJ>

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

263

VIVIANA VARGAS FRANCO

Seleccione las estadsticas descriptivas que desea calcular y d un clic en


Continuar, volver al cuadro de dilogo Descriptivos. Una vez est seguro de
que las variables deseadas estn en el lado derecho de la ventana, d un clic en
Aceptar.

'~~P~-Pki;~~"::,

..",.__..,_ ~
{anna}

~ SI.IlIa

~ Mea

Dispersin
~ Oesv. tpica

~ Minino

~ Varaanza

~ Mmoo

~ An1*ud

~=

~I
AjWa

E.T. mea

~ Asineb a

Orden de "'-Iz1IICi6n

(O LAta de vllrietlles

r
r
r

AlabIico
MediIIIs IICendenIes

Meas d.cendrri1llS

Una vez haya hecho clic en Aceptar se abrir una nueva ventana, la cual contendr
el resultado de los procedimientos realizados en la sesin de trabajo. Esta nueva
ventana, que se visualiza, es independiente del editor de datos de SPSS y se llama
Visor SPSS, donde se presentan los resultados de los procesos estadsticos. Los
resultados presentados en la ventana Visor de SPSS se pueden trasladar a un
editor de texto, como Word, mediante el proceso de sealar, copiar y pegar.
1:..tC!~I I~S l _Vl ~L~!!>.>. _ _ _ _~

____________ ......_

._~

... ~ .......

~.,:...,JII'

fII . . . . . .to ......

264

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPITULO

10 -

INSTRUCCIONES EN

SPSS

Con el proceso presentado anteriormente no es posible calcular algunas medidas


descriptivas como la mediana y la moda. A continuacin se presenta el procedimiento
para el clculo de estas estadsticas descriptivas a travs de tablas personalizadas.
En la barra de men de SPSS vaya a Analizar> Tablas> Tablas Personalizadas... ,
en este momento se despliega el cuadro de dilogo Tablas Personalizadas.

os

r_booc.... .

r_

.....

Corn0iecJ0005
~

..... ..

Tata;do , ~~ .. .

Tata; do freo..oerOas.

LoghNI
00sl1Ul'

Rll<UxJOO do datos
PruIIbas no paramblc.as

..

boIrpJraIos
SuperviYenda
~

- . . . de valores " " ' _. ..

En el cuadro de dilogo Tablas Personalizadas encontrar al lado izquierdo la


lista de variables disponibles en la ventana del Editor de datos de SPSS; aliado
derecho (en blanco) se encuentra la ventana donde se realizar el diseo de la
tabla. "Arrastre" al cuadro blanco en el rea de columnas, las variables a las
cuales desea calcular las estadsticas descriptivas.

_......

r~
_".. .
~:' ...
~

~ I I_I

' frJwU._
,:~==.
............
,

fuh3 111ti11

~ ~~

f---

" -' S _

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

265

VI VI ANA VARGAS FRANCO

Una vez que ha pasado las variables, d clic en el lado derecho del mouse y en
el men que se despliega elija Seleccionar todas las variables de columna.
~.;~-------

rat:la

--

.-_. --

---_.._.-

~~:

I Tilulo.l Eotod;,I=docon .,I.1 Opc:ion.. 1

VCli"bIes

[fIiiI

. ,~

No'l11Ii I!I

,cIo lclol
,

,.

--

lOe-

Cqp&"

cw.,..,.,

lecho {l ..

'nteg,od .
EJtacktoos de r~ ...
'.

'flo3 11g."
, Igac Ilgac)

CeteQOf_ '1 tot_

,ttm3IL

Inl:ercmbl.Y flM y 't'arWJIes de cdurrna

'g,:!{lgh3)
, Igds 1Idol
' ,emlguJ. .
',emlgac .

5clew""or to<b, la5 v.y\,ble5 de


:M\,(,IU...-I;t:;dasles:"."tl..:,

' _Ig""'-

OeshacerAf\adr ",anlJbMs
No so puede rt;)ebr

Cat.,gol iu

Cort.
Copiar

.-

'lo

Je<,;It~

. _ A>

r~-{vtJIWIe do
~

etn+x
ctrI+C

l'<9flI'

etn+_

Eimin.

5..-

t-bitrar nOrrOre de VoIY!abIe


<ti Mostrar eti~ de varl.!bje

----~:~~ ~~:!"~~:.~::~_._--_._~;.....
D~nr -------------.

E~"li<osde,.......nl -------------~

Nl ~,tMliWcQl: de ,~me. ..

PoIIcOl. CoIurmas

~ ~eQo , a ~ YlQtale.

.,..

~I

P01iein de cete{)Off."

Oeu.

Ongon' Yan""', do colJrrna

Una vez que se han seleccionado las variables en el rea de diseo de la tabla,
vaya al cuadro Definir (parte inferior izquierda) y localice el cursor sobre
Estadsticos de resumen y d un clic; inmediatamente se desplegar la ventana
donde podr seleccionar las diferentes estadsticas que desea calcular. Slo debe
buscar y seleccionar de la lista Estadsticos la estadstica de preferencia, luego
pasarla al cuadro Visualizacin mediante la flecha que se encuentra en medio
de las dos subventanas. Cuando haya terminado de seleccionar las estadsticas,
d un clic en Aplicar a seleccin, entonces volver a la ventana de diseo de la
tabla personalizada.
~blC'~ d.:- C''X I

~,....~~~, ~. I

V",ioble seleccionada: IM l~ v",iabl.. )

Vtluahzacin;

e-tadi,licos;
Pe,C<II"II199

.:

Eno'lpicode lamea

.z.

Detv. tpica

Suma
N total

I~'~"

I ~~

A.

I AplicO! eleccin I

266

I'''''''''''''ICO

ApliC<ll ~ lodo

Cenor

J~..J

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

10 - INSTRUCCIONES

CAPiTULO

EN

SPSS

Finalmente, seleccione Filas en el subcuadro Posicin del cuadro Estadsticos


de resumen, y d un dic en Aceptar.

-- ------_. -------_. --- ,.. ,...,


~~r!.~ p.~~~!1~~~~fi ~,~
-~

TaIJia

I Tlubal Etlad.~do"""'_1 0_1

lIa_

'

---~

do{dol

IIiI
I

'' nle!ilod
lecho!"'...
' 1ga<311g..

!fTnl{f.
tg\l{lgh3)

'

ip(lgijo]

'ICITlIgo.1..

'-'goc ...

~'~~':' .

I!I e_ .,

I 14M

<+........
1IIIo"ld
r.."!I''W'VY'I

Mido
Mldono
Modo
Mioimo
Mlnmo

'fooc~gocl

"
'

NOIft\II

190t3

I~

IIIIC

Iv

I'N'ln....n

IIm'I M

""mM

nnnn..nn

r,'l1'lJ'1'l

N HY\.ftl

rlflmm

rI'lI\I\.nn

fYTl'\/Wl

mm.m

ro

"""V1f\
r.",vY'

rrtrln,nn

flf'n1 '"'

r.nfY\.tYl

no

~ nnr,

....,..,J'JfI

tYlt'l'\.ff'l

"

(1'111'1)'1'",

M
~

Cgoff.:

F
~
M:4I4I""

Oefol

Ettadl*ot da M.WHn

~ j;1I1d1111C01 d........... ,

PtJoian:

SIi Cd;eg",", y M'oIeo

. r O....

AcOlIta

Po' lClon da cotooor f

Origen V<>rIoI:II .. do ,<+.. .....

I~

..

Ptr defecto

Rec\otNc. l

CoraIa

I~

Aparecer la ventana del Visor SPSS con los resultados de la tabla personalizada
disefiada, tal como se presenta a continuacin.

+ Tablas personallzactas

".dl.

M.atana

.oo,

.......
.Ini~

Vartanza
Desvl.clnlipltl
Rango otdlnol

",",GRIIO
13,50
48,00

.......

12,4!i

',00

" .00

14.00

5'0,00
17,00

115,00

5190,08
16.(}g

139,66
11 .82

56:J,oo

11:J,OO

2,00

ESTADISTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

,.......
"'"
11 ,14
18,00
" ,00

170,00
3,80
342,18

18.50
186,20

SPSS

21 ,19

11,00
17.00
130,00

'.90

256,57
'6.02
'26,10

'GHl
13,20

'ODa
10,!;1

9,45
'8.00

18.00

",00

140,00

>,"

2,"
228,31
15."
1:J7,40

100,02
10.00
70,2iI

14,00

267

VIVIANA VARGAS FRANCO

10.4 Histograma
Para realizar el histograma en SPSS se deben seguir los siguientes pasos:
En la pantalla de Editor de datos de SPSS vaya a Grficos y seleccione

Histograma .

En el cuadro de dilogo pase la variable, a la que desea construirle el histograma,


al subcuadro Variable (usando la flecha) , seale la opcin Mostrar curva normal
y d un c1ic en Aceptar. En la ventana de salida de SPSS se muestra el histograma,
alIado derecho del grfico se muestra la desviacin tpica, la media y el numero
de datos de la variable .

'!

'lislogrilITla

[!]

~ oo
~ Iecha
~ iga13

~,

~~
<t> 1gm.1

... ~ PInia - - _ . - - f
l' r lJlalal~~bde: :

<i> gu
<i> i!Ps
~ 1fJIOlI3
~~

~ oet#A3

268

Vm:

1. .

j -=:J
~ IiMosil.amraNi

.1
~
Ret!#m l

" " ~I "'l " J ",j"j ~t ~ ~II~

..t ',-:j :.JW ~, ;>,


"'- s-. .,~o

a~
I

w
D

('..miv l

~\

~.;<t."'i\'~~';;:''i,"

T...

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

10 - INSTRUCCIONES

EN

SPSS

Para editar el grfico d doble clic sobre el grfico, aparecer una ventana de
edicin llamada Editor de grficos de SPSS; en esta ventana podr editar el
nombre de los ejes, el tamao de la fuente y el nmero de decimales de los
ejes.
ArthJvo EdId6n

v.

~rie

DINIIo Series

AnIb. GrMlcol ?

!!l C]b llll I .J _1-1 " H lcol"'l T jAlhlij" l.nJ LlT


120.,-----------,
100

BO

60

40

20

INTEGRAD

Para editar cualquier elemento del grfico d doble clic sobre el componente que
desea modificar, aparecer el cuadro de dilogo correspondiente. Por ejemplo, si
se desea modificar el eje X, el cuadro de dilogo que aparecer es llamado Eje
de intervalo, como se muestra en la figura; en este cuadro se puede modificar
el ttulo del eje, los intervalos y el formato de las etiquetas. Si da un clic en
Etiquetas aparecer un nuevo cuadro de dilogo donde se puede modificar el
nmero de etiquetas, el tipo, el nmero de decimales, el factor de escala del eje
y la orientacin de las etiquetas.
,-

fje Ge;~leIVa,

~_
Mcnb. --

--

('" T..... I.. ~

r~

c..do

dirJJOIat

M..oao _ _

",p.~_

~T~~----------------~
~ P.no..... ('" fWngo

eir... decIn*..

Ic..a-I

c:..c.r. 1
...... 1

rS _ _ d e _

Eomc>Io

_____123f~

Fottorde 0rie!Uc6rc

ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

r-

1 _ :::J

269

VIVIANA VARGAS FRANCO

10.5 Grfico de frecuencias acumuladas


En el Editor de datos de SPSS vaya a Grficos> Interactivos> Histograma, como
se muestra en la figura. Aparecer el cuadro de dilogo Crear Histograma .

aarr.,....

.......

-".......,
",

!'ooao",

LheM~ .,

"'.....

Dlet;J'nas.c......
ISarrasde.-ror .. ,

En el eje vertical pase del lado izquierdo la variable Porcentaje ($pct) y en el


eje horizontal pase la variable a la cual desea graficar la ojiva o distribucin de
frecuencias acumulada, seleccione en la parte inferior Histograma acumulado,
como se muestra en la figura.
-

{ I cal

1"~hH~' <tnlr1

AtiQnor-IH...ogr.... 1ll\_1 0_1


, ..... L

~ R~o[Scow>

C_2.o . '

'[eIol

p.e"'1

,
,

FGAC[lgaccatl
FGAS3 [1_3cat1

[lgos3J

,
,
,

FGOS (lgc:I>caIl
(lgdal
FGH3 [lgI>3caIl

[Id'll

r JI> 1Po",..... ($pcI1


I
1'['_1

,
FGHM3 (lgIwn3c:.
,[I~
,
(int_ad1
,
'",_odoI r.....,.

I
"'----

'11-_1
,
,

(,-g0s31
(,-gdol

'('~I
,
(".",.....31

R_ _
Acepo-

270

1_

V_doI"."..

C"",*-

ESTAD fsTI CA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

CAPITULO

10 .

INSTRUCCIONES EN

SPSS

D un dic en Aceptar, el grfico se mostrar en la ventana de salida.

10.6 Grficos en tres dimensiones


En el Editor de datos de SPSS vaya a Grficos>Interactivos>Diagrama de
dispersin , como se muestra en la figura. Aparecer el cuadro de dilogo Crear
Diagrama de dispersin.

.....

....

~_

Al. . ,

-..

a.r.. di.,..,.,

----1

~. . o.c""

..,..dI.-ror ...

-_

o.._docojo. .

""0.....

"

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

...

SPSS

271

VIVIANA VARGAS FRANCO

Pase las variables que desea graficar del lado izquierdo a cada uno de los cuadros
marcados como ejes, como se muestra en la figura, luego en la pestaa ajuste
verifique que el Mtodo sea Suavizador, en la opcin Kernel que por defecto
utiliza la distribucin normal; puede elegir tambin la distribucin uniforme.

,,--- U:!fB5
,[---

"

_-\_1'_ ......1'_1_1

"c.o_
" ............
....
,~

..,

J.J

..

1.c.~)D-

1.

1-

(7oolodl

:::1
......

,~
,~,

,c.o.v-..
,c.o._.
, DeO_
,~

''000_
000 .........
'_-11_
,_
,DIOI<b>I

,,-'f......,.._

.. _ . - XI

'*
E'"

-,

'_1

_
----

~~

1_1

,."

-----

c-Io

~,tb60'

---r """",

...

:::J

11 u.. .. _~ .... een ...................

JOF""

X2~

v. . . . .~~_________

,--- v_. _-----,-_1

~ ... (

_ - - \ ' -......IT_I_I

....

r_

D un clic en Aceptar y el grfico en tres dimensiones aparecer en la ventana


de resultados.
, . u~u:'''r:)~ " ... {." ): .... ,
_ _ .... _ _ _

I;t_~SoIW5

IOIlg lallll ~!!l.:J .1bl.l~ Al..!.J;


~ .!.I..:.I _
t:llCI
~I c;;.1 ~I
I
____
o

..

........ 1

- ---

~'

s-
'-

--

0 i0II>-

~'272

= - __

~""
_.

~~ --7'
....
..

,---

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPITULO

10 -

INSTRUCCIONES EN

SPSS

10.7 Grficos de barras en tres dimensiones


En el Editor de datos de SPSS vaya a Grficos>Interactivos>Barras como se
muestra en la figura. Aparecer el cuadro de dilogo Crear grfico de barras.

:::: -I _ =~
. ___ .
...... ..

M6.

=~'--....

~
_
~ l -.'ii'---;;"I----,.-I
o..ar- . .....
a.r.,de fITrtII

Seale las variables que desea graficar y pselas alIado izquierdo, a cada uno de
los cuadros marcados como ejes, como se muestra en la figura.

--------------------------------------------".11',1""
(ff"U r.',l111IJ

di'

Ao9* "ariIIIIM

IX

10_ cW ",Mco'" 10M.. J a............ 1T,..... , o~ 1

I fP tPor--.t.," ($pct)

lJO!O
-

1,

V .......... ~
Color;

Eodo:

..........

FGH3 (fgh3cal)

IrQgID ",,-..J ---

I
I

Al ~

a.

pIIf

:1
1

...-------

V.w.IHcW......, - - - --

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

273

VIVIANA VARGAS FRANCO

D un clic en Aceptar y el grfico en tres dimensiones aparecer en la ventana


de resultados.

10.8 Grfico de tallos y hojas


En el Editor de datos de SPSSvaya aAnalizar>Estadsticos descriptivos>Explorar,
como se muestra en la figura. Aparecer el cuadro de dilogo Explorar.

-=--COn_
--

_ _ _ JI

.....,

."'-

_
_ dodotoo
deofk.

7$

!lO
!lO
65

n
n

5.t

69
75
79
E8

69
li6
65

69
!i6

51
81

274

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

CAPiTULO 10 - INSTRUCCIONES EN

SPSS

En el cuadro de dilogo, pase las variables al subcuadro Dependientes; en la


opcin Mostrar sefiale la subopcin Grficos. D un clic en el botn Grficos y
sefiale Tallo y hojas, como se muestra en la figura .

--

l ltpluf<H

I
I
R_I
Cancellt
...- 11

[!]

"-

F.clofea;

. ,I:l

[!]

[!]

r_r

M08Ib. -

--

rx

N.... delot'..."'.......

leomru. l

P T.... """"

~I

Alu!al

Oiopoqo6n por rweI"", pruebe do u......- - - - ,

ro

E_Ioo ..... _

E"",,_r.G'lficooj

_.- j[-

ro

ro---.......
rHto!otJ.....
C~ __
r GI_ con l>IUIboo do .......,,jod

,- 1 G,Mioot...

0_

r '"
Irr T,wI_.
'1

P"'..- JlOll""'....

norm3dor

::::J

D un clic en Aceptar y el grfico de tallo y hojas para cada variable aparecer


en la ventana de resultados.

P'GA.S3 Scem-and-Lea:f P lot

Frequeney

,00
33,00
63,00
16,00
21,00
2,00
13 , 00

Su.,

o
o

o
o

2222222333333333
4 4 44444444444444444455555555555

66666666667777777777777
8e8e8lS8IS8i9;9

o
1

223333
1144444555S55

1
1

66666711
8e81S999i
0111
233

21,00

18,00
11S,OO
8,00
6,00
4,00
7,00
4,00
6,00
2,00

Laaf

011
2

10,00 lxeremes

( > -33)

Se"", wideh:

10,0

E.ch leaf:

2 cuel")

" 1

Al: 17

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

Aii:;

275

VIVIANA VARGAS FRANCO

10.9 Grfico de cajas y alambres


En el Editor de datos de SPSS vaya a Grficos>Diagramas de cajas.

,.
12

..
..,.
111
111

12
12

54

.,
,,
0,0

'.'

:~~

"-j
",Q ~

83,1.

~:[

"747 1

"'1
n.!

:~1'

19

-:
-

55"

..56

En el cuadro de dilogo Diagramas de caja, elija la opcin Simple; en la opcin


Los datos del grfico son, elegir Resmenes para grupos de casos si va a graficar
una sola variable, y Resmenes para distintas variables si va a graficar varias
variables; luego d clic en Definir, pase al sub cuadro Las cajas representan: las
variables que desea graficar y d un clic en Aceptar y el grfico aparecer en la
ventana de resultados de SPSS.
I h.U~1 ,1111,' .. d" , -1)"

Ii!3s.

I
c-I

, Ooh

~--I '"-~--

;~"",........-

---

276

...~-.

lb

1,'111111'

,l. , q' q'"I'I., H,

~_od

......

~"""3

~I

('"1'1.......... " " ' . _ ... _

~
~~
~-'913

'11111, 111' I',H ,

10<03

I' [D

,11 ,,,11\

111

-1

1M

IoNI

~Iooc
~~
~fQhl

A.....' . '

c.-I

~1gcIo
I

~,*_"'1."
QJ [_100._ _ [ 5 ]
-.J

~FGAS31fooo3

<l>FGHN3_"

l. .

't

--

:::

:::

ESTAOrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPTULO

10 -

INSTRUCCIONES EN

SPSS

10.10 Percentiles
En la barra men de SPSS vaya a Analizar>Tablas>Tablas Personalizadas... ,
en este momento se despliega el cuadro de dilogo Tablas Personalizadas.
c"
Arctlyo

Ver

Etkln

Datos

l:..

Transformar

~ IiiIJ~ ~ ~~ ~ ~J r,

11:<10

Grftc:os

lJ:ldades

"'ertana 1

~J
.,

Informes
Estadstlcos deSCr1JtIvos

~2
do

9
10
11

62.00
63.00
63.00
63.00
64.00
64.00
64.00
65.00
65.00
65.00
66.00

1?

~h

1
2
3
4
5
6
7
8

nn

COrroarar medas
Modelo ..... a1 general

fecha
03-MAR91
Q4MAR91
Q4MAR91
Q4MAR91
05-MAR91
05MAR91
05-MAR91
ffi-MAR91
ffi-MAR9 1
ffi-MAR91
07MAR-91

Modelos mIXtos

CorrelacIOnes
Regre<ln
Le>;Iineal

Clad'lcar
Reduccin d. dotas
Escalas
Pruebas no pSl'IItn::-,s

5e!1.. temporole<
S4Jer""-'enda
R.spuO<t .. .rullples
An~sl s die valor.s percldas ..

ConjJntos: de res:luest:as mt~les ...

Tobl.. b...., ... ..


Toblo> Qoneroie,,,.
Tabl.. de res>.Jest .. .rul~, ...
T1IblllS de frecueflClllS. ,.

O
O
O
O

1m

OO
O

5.10
5.40
6,70
17.00
16.00
15.00
12.00

2,80
3.40
4.10
9,60
7,60
6,90
4,60

8,50
6)0
8,!ll

7htl

A An

"lq('!

n7.MJl.Q.Ql

2,60
700
5,60
8,80

En el cuadro de dilogo Tablas Personalizadas encontrar al lado izquierdo la


lista de variables disponibles en la ventana del Editor de datos de SPSS; alIado
derecho (en blanco) se encuentra la ventana donde se realizar el diseo de la
tabla. Arrastre al cuadro blanco en el rea de columnas las variables a las cuales
desea calcular las estadsticas descriptivas.
;:;~~;I:;;:;;;:';-;~.~~~~Ji1I~I

--I - -'"

,"ec. . ..

T<SbI. Tltuloo l Etladr.lCO.d.con~asI.1


VeriabiM

IHiiI

11. ...

,".."ocI.

--

Opciono.1
N~

l!l CoaPo

CaQ<OO

jOIUf"""

"ga. 3[f" ..
'fgac[f_J
' fr;r.m3 (I. ..
'frN[fr;J13J I
' fgrJ. (lgrJoJ

,
,

.mg>a3 ...
.m~

I".m<twn
--'"
,

ff

Celegorlet

5a. C4Ir:QoIId <

r'-"
.~

[Derri'

~ ~*I.ddo:l de

lettrne

Si J;ate.gofl~ y tot'*f

I [E~r'~M '~~
PO$IC16n:

CoI~

IOMI

Oogen: i.

P~on

de calegor

Por defecto

/>.oefiOl

1..

Pegar

ESTADISTICA DESCRIPTI VA PARA IN GENIER IA AMBIENTA L CON

I ResI<SbIeceIl

SPSS

Cancel ..

A.udo

I
h

277

VIVIANA VARGAS FRANCO

Una vez que ha pasado las variables, d clic en el lado derecho del mouse y en
el men que se despliega, elija Seleccionar todas las variables de columna.
~ I.!,.!:~!~cl.~
hblo

't~~""~~_""_,,_f!' ~I~

!TfU>s1Elladl_ de """oale l Op""..... 1

11 ..,100

~I!!ICqp.

..

,~ 00 1001

~fOCMP...
~",eg.d
~fgas311g
~fgac [facJ
~tojlm3~.

1I11

~ ~

Cokrme.
.

19<i

Estld'lticm de resl,lYl .... . ,

"ocio

_.1'"'1'1 fin I

~4to3 ~gh31

,.atev~las '1 h.~.s

nnnn"

lrtertombio!

..

f"'~ '1 ... ,y~es de colanne

Seitcclor'l&r todas 1M \f.m~s de ti.l

~fv:I'UgdoJ

..

~_.,.tJ

~I"""'C
'"'

~I""r/lm _
lb

I....!!!!!II

~Mo"y_s

' I~

~ Cegorf""
I
"'~
{vaIitJbIe'*'
I

~
."..

No se puede ,te! ~

u.

cort...

""o

Ctrl+v
5up<

Elri"l.

Mostrar l"IOn"II:n de Yaflable


" MO$trar etl!JJeta de va~

~. ~~.:TI~.-!-

Defri,------...,

Eotodlttioo,de_

~ ..d l _ ' d . _ ..

PooicOl: CciJoM..

ti

a rl+X
Orl+'

Cop ....

~oI.egcAl".,..tot.elt:~

Ongon

... :-~ ... _-'"':":.

_.

:_

1i 3

r ~ I P""''''d.. ~''og"".,
o>or d""',o

VftlOe, de "'......

I Ac:ep'" ! ~

!",.;".~ ...

Aestobleceo! e....,.. ! ~

Cuando se han seleccionado las variables, en el rea de disefio de la tabla, dirjase


al cuadro Definir (parte inferior izquierda) y localice el cursor sobre Estadsticos
de resumen y d un cHc. Se desplegar la ventana donde podr seleccionar las
diferentes estadsticas que desea calcular. Slo debe buscar y seleccionar del
cuadro Estadsticos los percentiles que desee calcular, las opciones que aparecen
son percentil 5, 25 , 75 , 95 Y 99, recuerde que la mediana es el percentil 50,
luego pselos al cuadro Visualizacin. Cuando haya terminado de seleccionar
las estadsticas, d un clic en Aplicar a todo. Volver a la ventana de disefio de
la tabla personalizada.

fstd,hs1iros de resumen : VdlidbJes de es, di"

'X

Variable ~ fgac
E$ladralicot:
Moda
1"1 .. '

1~

,'l

; I

t""

Rango

Error Hpco de la me<ia

ViaAaizaci6n;

E....tIatic:o
Percerd05
1P!ryri25
MIKianI

EIiauet.
05

f'ercentj
f'ercentj

MIKianI

...

25

....

~-

Percenti 75

D~.tr~
,. ._ ~

ApIicer a . .ci6n

278

Apiear a todo

c.n.

AIuda

ESTADrSTICA D ESCRIPTIVA PARA ING ENIERrA AMBI ENTAL CON SPSS

CAPITULO 10 - INSTRU CCIONES EN

SPSS

Finalmente, seleccione Filas en el subcuadro Posicin del cuadro Estadsticos


de resumen, d un clic en Aceptar.

..

v_

,-,..

l1li-- 18,--..

1'"

'do(dol

..

''o*"pAL
'Igoolll!l ..

'1fIrtaJ,-._
'1dl311oJ>31

_25

_1'5

'1gdr1lgdaJ

Igool

_os
-..

Igoc Ifgocl

~c..

~~".

19tw3

ldl3

rynn

mm"

'I'mJ'

...... n

on-n,

q-rrn

fTIIJ"I..fI

lude

rftY1.n

.....,.,'"
""""
rTau1

nrror."

...., ....

'"1"1"
r<rroI.

'ftlOIIDorl.,--,.....,...
.. ... .
".

CoIogaoc

,::;

.:

..

~
N.tt-._-
~

--'01

Doh - - - - - - - -

te!P

ar,

Inmediatamente aparecer la ventana del visor de SPSS con los resultados de la


tabla personalizada diseada .

.... '** _ ..... "- ......

-ilIUlollllll ~ !!I.::J ~

--

..!.I.!.J.!l.:.J d!2J ~

I!IT-::_1

_..

'SfIUa ___ l'

_. --

._-

"_.-

----

+ TIIIIIIIs persofMIIzadas

_:15
_15

<t r--l

......

~-~

fGOSJ

f~

5.1
U

-..
.~

11~

'U

71~

FGfO
)~

,.,..U

.60S

..
l.f
,~

,."

ESTADISTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

...-..J;

279

VIVIANA VARGAS FRANC O

10.11 Tablas cruzadas o distribucin de frecuencias con dos variables


Para realizar el cruce de variables cuantitativas en SPSS es necesario convertir estas
a nuevas variables que son categricas. Para eso se deben recodificar las variables
a partir de los rangos deseados.
En el Editor de datos de SPSS vaya a Transformar>Recodificar>En distintas
variables, como se muestra en la figura. Este procedimiento crea una nueva
variable, esta nueva variable ser categrica y las categoras correspondern a
los intervalos escogidos para la variable cuantitativa.

emt... _ _ _ . .
~

T'":J

1Isignar._

...

~--a ca5D5

_;

. ....

~""""a
oeor_~

~I

~-

-.....,wIores ...........

En el cuadro de dilogo seleccione la variable y psela al subcuadro Varo


numrica ... Varo de resultado; en el subcuadro Variable de resultado introduzca
el nombre de la nueva variable y la etiqueta, d un clic en Cambiar. Luego d
un c1ic en la opcin Valores antiguos y nuevos ... , en este momento aparecer
un cuadro de dilogo, con dos subcuadros: Valor antiguo y Valor nuevo.
En las diferentes opciones de Rango se introducen los valores correspondientes a
los intervalos en que se va a clasificar la variable cuantitativa y en Valor nuevo/
Valor se asigna la categora correspondiente, como se muestra en la figura,
luego d un c1ic en Aadir. Una vez que haya establecido las categoras, d un
clic en Continuar, inmediatamente regresar al cuadro Recodificar en distintas
variables ; d un clic en Aceptar. En el Editor de datos de SPSS debe aparecer la
nueva variable creada. Repita este procedimiento con cada una de las variables
cuantitativas que desea cruzar.

280

ESTADISTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPiTULO

... : - ,

l'

TI' ' J '

....

-......--- -);.

v. ........ v... __

' \, " " "

r _ ...._

EN

SPSS

---,..... - . .".

.!J

--,- 1

rr _~
c-_ _

...

... tS!I -41

...

";--_oI_

, c.. I ~

. ,.

JI' .. l
- - - - C!J ....
~ "'41'1,...-H1
1""-- ~
r t.._. _ _ _
r "-P

,~n"

r ................. _

.. I ......

- -r_-

;;;;;- ....... ,

GJ

'.~

10 - INSTRUCCIONES

r T..... _ _

",-""""
1 ... '

1-

Si requiere que en la Tabla cruzada generada por SPSS aparezcan los intervalos
y no las categoras, puede ir al Editor de datos de SPSS, y en la pestaa Vista
de variables (parte inferior derecha del editor) seleccionar las nuevas variables
creadas y asignar etiquetas, como se muestra en la figura.

..

v.ort'!S

-----

Tm-~'2.OO-~r

lOO-wmr

4,OO-"!!5Il-1~

lbIMirico
l'bMnco
lIbnnco
llUnrico
I'bnrico
lbIMirico

tUMnco

8
8
B
B
8
8
8

2
2
2
2
2
2
2

MnQuno
Ningwlo
Ningwlo
Ninguno
Ningwlo
MnQuno
Ningwlo
MnQuno
NInguno
Ningwlo
MnQuno
Ningwlo
Ningwlo
Inlegrldo CatelNjUo
FGAS3 Cllleg Ninguno
FGHI/D Categ MnQuno
FGH) Categon Ningwlo
FGAC Categor MnQuno

l<f;~;cediiiii$A\II$"" "" I/IlI""M ',.-------,1 ~ ...

10
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno
Ninguno

__________________

8
8
8
8
8
8
8
8
8
8
8
B

8
8
8
8

Oancha
Oancha

o...ct..
o.ndwo
Oe\'tCha
o.ndwo
Oincha

o...ct..
o.ndwo
Oatac:No
~

0IIrec:ha
o.ndwo
o...ct..
o.ndwo
~

Dancha
Oincha

.1

En la barra de men de SPSS vaya a Analizar>estadsticos Descriptivos>Tablas


de contingencia. .. , en este momento se despliega el cuadro de dilogo Tablas de
Contingencia. Seleccione del lado izquierdo del cuadro de dilogo, las variables
para las cuales se calcular, una en el subcuadro Filas y otra en Columnas. Si
selecciona ms de una variable en alguno de los cuadros, SPSS calcular tablas
cruzadas (2x2) para cada par de variables.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

281

VIVIANA VARGAS FRANCO

, , - - - - - - - - - - - - - - - - - - - - - - - -, r - - - - - -- -(<l "' ~

1I~

~,...

~_

r:o
~

4> ,;a
~

Ijtl"rn>,f'l"J

....

....
;;
......." - i
I

WJ ,.

~-a.)

c.. 1 0.1

:="'*""""-".

, c~1

FlecuenciMl

P e+!

; Observedas

c..-I

~
-' !~~

r-----

--.::J

~FOHl_'

Cancela

Esperadas
Ayuda

r ~&eIM

I
I

ResidJos,- - - - - - ,

Porcen.jes-

r
r

; FI.
; CokJmna

Iob".bpilicoret-. . . . . . . .

IdS

-1

;::"""""'Riiil

-#_l

::::::,

-----------~

Ta b las de co ntingencia' Most rdl e n

No,,",icodos
T~icodos

ToI"

Ti:lificodos caregijo.

~'..-I~~

Para obtener porcentajes por columna, fila y total; estadsticos de tablas de


contingencia, grficos y elegir la fonna en que las categoras se presentan en la
tabla, puede seleccionar alguna de las opciones que aparecen en la parte inferior
del cuadro de dilogo. D un clic en Casillas. Elija los Porcentajes que aparecern
en la tabla cruzada (contingencia) y d un clic en Continuar, volver al cuadro
de dilogo Tablas de Contingencia. Luego d un clic en Aceptar.
t;

R'-'~ Ul1drJO~ J

V l~O(

Arctwa Edd6n Y

_ 1<" 'x

!,IJI\\

lnMrta

fa1Mto

Ar'Iabar Grflcot: l..ddedet: 'nntM'lll 1

~1 1iJ 1.I[lI~~.:.:J CJlhl"I~~...!J

"1.1~ .r.:l I ~11:}1~ rr

m::-

Tablas de contingencia

- @l.........,.
b

...

"d ..

...

FMItm6n de4 lI(oc. .Nnltnlo de

R..... men

,_""o

V'lIdo.
N

1nt8lJrada Ctegorlca
.. FOAS3 Coalegorlca

294

k) .. eal4)1

CatOS
PercUdas

Porc.nh',
100,Oc;l,

Total

Porcant. I

Portlntll'.

mi

,0'-

100,0'-

Tabla de condnuenda ~ CaI\IgOI'ka fGASJ Careaorb


F0AS3 CatQDOrlca

10-5)
htsg,ada
cm gorlca

10-20)

Recu9nto
" el; Int&g~d

'1

>

.J

[20-30)
O

100.0'-

,0'1'0

,0'1'0

,0'1'0

12,2'4s

,0'54

,0'3

,0'O

'1> 1Io&lT'ohQf'Oa
Cafegorlc.

45.1'-

51 ,4'-

2,8'1'0

,0'-

849'-

588'1'0

J,8'-

0'1'0

CaltcMca
"el; FOA83 Ca1;gOrlCa

120-'0)

(10-20)

lS-l0)

Recuento

de FGAS3 Cateaorlca

~ "'P<ii-flMY*Mb Jld'AnnwwNin

El programa estadstico SPSS es uno de los ms utilizados para el procesamiento de


datos, tiene amplia utilizacin en reas como ciencias experimentales, ciencias de
la salud, ingenieras, finanzas y economa, entre otras. Es uno de los paquetes ms
extensos y potentes del mercado debido a su gran variedad y velocidad de procesos
en bases de datos de gran tamao y la amplia gama de salidas y presentaciones
grficas que proporciona (Visauta, 2002).

282

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

CAPTULO

11
Grficas en Excel

Para la presentacin de algunas grficas del conjunto de datos y de las medidas de


tendencia central y de dispersin, se escogi el software Excel, debido a que SPSS
presenta limitaciones cuando se necesita realizar grficos personalizados.
En este captulo se muestran los pasos para construir diversas grficas utilizadas
en los captulos anteriores. Las palabras en negrilla son instrucciones de Excel y
deben ser escritas con la misma sintaxis. Los comandos en Excel se pueden escribir
con mayscula o minscula; en este caso se escribirn en mayscula para resaltar
la instruccin.
Para la realizacin de grficos se deben introducir los datos de las variables de inters
en la hoja de clculo con formato numrico. En el presente ejemplo se tienen seis
series de datos que corresponden a valores de turbiedad en diferentes sistemas de
pretratamiento: integrada, FGAS3, FGAC, FGHM3, FGH3 YFGDS3 (Ver ilustracin
en la pgina siguiente).

11.1 Grfico para la media, desviacin estndar y el mximo

Dirjase a la ltima fila, donde termina la serie de datos, para calcular la media,
la desviacin estndar y el mximo, en cada sistema de filtracin gruesa.
Seleccione una casilla donde desee que aparezca el valor de la media, escriba
=PROMEDIO(rango); esta funcin calcular la media para la serie de datos.

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

283

VIVIANA VARGAS FRANCO

f --tii---- fE~-lrm~~-fG~--TGfm_ -~H3-pfuS3---L-----


r
62
0;._91
23,0

8,1
9~
.p
3~
~
4,1

.~

t'..

.!J
5

63

63

()4fw1lit91

63

04Ma,-91

6'
64
6'
65

05-"'ar-91
()5.M.,.9,
05-_91
06-",..91

25,0
84,0

3..9
2,6
3.4
."

6Jo O

12.0

17 P

o.-1JJl

_,_ ~,6

(6.M8f-91
(B..M.,..91
07.....-91
07-"'0<-91
07M;u91

33.0
29.0
'5,0
30,0
26,0

8.3

15JJ
8.9

16,0
ISD

'fJ

11 .0
6,1

12P
7,6

7S
6.9
',6

15

65
65
66
66
66

'fJ

6.2

3,9

4,4

16

67

(11.",,,-91

' 8,0

5.0

;!Jp

7P

3~

4,4

8.0

'.0

5,6

lB

67
67

C8-Mw-91
SO,O
13.0
(B-Mar-Sl
JEi.Q
9,6
09-"'..-91
31'p
6.9
09-_91
27,0
6.0
10-....-91
28.0
5,5
11 ....-91
12'.0
7)
11-"'..-91
240.0
7"
!J!r~~-=zt!il1~J

17.0
17,0
9.5
12.0
12.0
16.0

14,0
16,0
9~
9Jl
6,7
14))

9-

JQ..
"
12
1314

17
19
:l!L
21
22

6B
6B
69
70
70

04-",..-91

32,0
22,0
26,0

25,0

7.B
5,5

8,0
6,1
5,1

5,0
8.6

_pp

22.0

9)
8,0

4,0

6,8

3$J
2~

5,1
5,.4
6,7

17 P

6.2
6J
5 ,1
, .0
5)
6))

2~
7 JJ
51>
B~

8.5
62
8~

5,5

_
'

4p

3,4

3A
' .1

5p

14.0
8,8

5,,6
_ 57
43
62
8,1

,-

En rango debe escribir la ubicacin donde se encuentra la serie de datos a


la que se quiere calcular la media. En el ejemplo, la funcin especfica es:
=PROMEDIO(C3:C299). El rango se puede seleccionar a travs de sealar el
conjunto de datos con el "mouse" o ratn, luego presione enter y el resultado de
la frmula aparecer en la casilla seleccionada. El proceso se puede copiar, con
la instruccin copiar, sealando la celda donde se quiere calcular el promedio y
la instruccin pegar, tal como se presenta en la siguiente pantalla.

PaI<D/ll1.

'- - OO- - FctiA;w


2!11

E '
:BJ

291

191
192
192
192
193
193__
194
194

,292
293
294
~ 195
296
195
'B1

IIhM91

I I .Ju~91
I I .Ju~91
1 1 .Ju ~9 1

12.Ju~9 1
J 2~!,!:91

13-Ju ~9 1

13-M91
""4-PJ?;u~:-';9:;"-1-- 14-Ju~9 i

El clculo de la desviacin estndar se realiza con la instruccin =DESVEST(rango),


donde el rango incluye el conjunto de datos a procesar; en este caso la instruccin
seleccionando el rango queda definida como DESVEST(C3:C296). La instruccin
se copia para las otras columnas generando la siguiente pantalla.

284

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

CAPITULO 11 GRFICAS EN EXCEL

""'"

~
~

Anal

:do....'!<3c296)

.....CfNTL

1
lf!l
B

2li9
200

291
292

293
294

295
296

--------------------O
E
F
G
H

DO
191
192
192
192
193
193
194
194
195
195

FECHA

INTEGRADA

FGAS3

FGAC

l().Jul-91
11.Ju1.91
11.Jul-91
11.Jul-91
12.Jul-91
12.Ju1-91
13.Jul-91
13.Ju1-91
U .Jul-91

40.0
34.0
56 .0
55 .0
66 .0
26 .0

47

26 .0
21.0
17

4.0
4.0
4p

13.0
9 .4
15 .0
17 .0
9,6
6,9
9J1
9 J1

4.'
41

736

12.4

3p
4S
4J1

4A

26.0

1 ~Jul.91

2!18

FGHM]
6.5

7p

FGosa
7.5
6.8
7 .1
62
710

7S

5p
5S
5p
6p
6.0
5p

6Jl
6.7
6

6.2
6J1
6 .2

6,9
6 Jl
7 .1
6,9

21.2

13.3

16.5

9.5
10.0

9S
7.5

9p

21.7

FGH3
6 .0

6p

=deS'lllstc3 c296)
3D

El clculo del valor mximo se realiza a travs de la instruccin =MAX(rango).


En este caso la instruccin se convierte en =MAX(C3:C296) y se copia en forma
similar a las anteriores instrucciones, generando las siguientes pantallas:

..

'( \.J:'!I..Q..

,~t! _~..,ort.

' 1'0 .II...L..L ~..:.~

. """
PEMCDfT1L

B
FEC ......

291""'

DO
191
192
192
192
193

292

'*1--l. 1~.:-!~'91

1
7Hl
2BB
2BB

29D

10.Ju1-91

l1.J-

295
296.

~1 .....G2~

INTEGRADA

4il1l

. c',,"

dilO. ,..

;;:;t~ , ... _

..

,.:d m".,....
-iJ. -,

*....If.

47
3,6

;;g

4.8
44
40
4l!
4 .6
4 .4
41

73,6
761

12.4
11.8

21.7
18.5

45

26l!
26l!
2sl!

13-1u1-91
13-Ju1-91
l ~ul-91
1 4.Ju~91

. . . . . . . . E ..
FGAS3
FGAC
130
94
15
17
9
6
9
9.8
9.6
8 .6

:~
I :~~~~-r ~t
I

~ ""

:t&

..JI!'

"'-

-maxl'c3

ll -Ju~91

194
194
195
195

294

...

""" ' A L'!I'AI\. .10:. ..... .....

_ F
FGH\13
8.5
7 ,6
9.5

\f7:'

7:,

F~ I F~
6
5

7Ji

5
5

71
8.2
7A

6.0

6
6
5

8l!
87
8l!

6.2

21.2
16,0

13.3
10,0

8.Ii
6,9
8Jl
7.1

6.0
62

6.9

297

29B

;.
:rn

I!!I 'lk."",Jl tI-.: . 1


'fl Olio cr

....

15.1

....-

:Hl .

=W\X(C3 C296)

()()

2!18

....

yi';lI,It.lt ,,ut.e,,1>-:l'J'A

191
192
2e9 192
~ 192
291 193
~ 193
193 194
:294 194
295 195
296 195

=.

<30296)

Esot.VMI cnort.e
".....
! n , ,Q11:J . Jl.. ~ ~ LLII, i& ""J-"1.,.,.
. (" . EiIH \ E j 1 ~ 11 f1lI lIS I!I ,..... .~
1 l N 1 1. . 1Et.J 3I ;;,
.... ,- c: .:,,: - ~ :ti: I.ID x
!

C3XJ
A
1
7fIl
~.

_.x

~6.5

fECHA
IQ.JuI91
11..w91
11JW.!I1
l1.JW.Sl
1:.,u.91
12-Ju191

lN1EGRAIlA

FGAS3
47
3.6
4.5
4 .0
44

f GAC
13l!
9.4

FGH\13

4IJl!
34 11
56l!
56l!
66 l!

fGH3
6

.;<e

8p

8 ,5
7;
9 .S
10l!
9 :'
7 .5
7.5
8 Jl
81
8 Jl

12,4
11 .8

2V
18.5

21.2
16.0

13,3
10.0

11511

170l!

1:JJl!

81l!

2611

411

1 ~1

2611

lJ..U.91
1 ~1

2611
21 11
1711

4.0
4.6
4 .4
41

-.
,O-Uc"'OII_
tol....

73,6
76 1
!BlJl

1~

'5.0
17.0
9.6
6)1
9 J1
9.0

9~

J FGIlS3
7,5
6.11

5~

S.5
Sp
6.6
611
Si>
6,2
6 .11
62

7,1

92
7 ,1
6.6
6,9
9Jl
. ~ 7,1
6,9

16.5
15.1

141lJl

:Jl1

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

285

VIVIANA VARGAS FRANCO

Para realizar la grfica del promedio, la desviacin estndar y el valor mximo,


se activa el icono de Asistente para grfico

ID

en la barra de herramientas,

tal como se presenta a continuacin.

Entonces aparece el primero de cuatro cuadros de dilogo en el asistente. En


este paso se debe seleccionar Tipos personalizados, el tipo de grfico Lneas y
columnas 2. Haga c1ic en Siguiente y aparecer la ventana datos de origen, tal
como se presenta a continuacin:
~~

~1!!Ut.11t:!!~s.:!:"~ ~d~1 (l~r~E) r1flE2.~~~

lJ,l (""""""91'

~. ~

l ,....,

><~ ..~ ~

"',00

I lit ros

lJ,l c"""',en~

I'I)JIO

(OOm!s y ..""

..

",00

"'

~ L..... coiaidos

n;_

~~ I_ k~

IL..... ",dos ejes

....
10,00

~ L..... sua,;UIdos

~ r.i"

40,(10

,....

IIt L..... ycoUmos I

....

~GP',t;DI
~ Logorbn<o

----------=--=..

-'i~e:dl"''' de<do

!!!:tl!1.L!!12J. I~~!1~:M!<........ "~'"'>... 7<"''''''''''''''''''

'CAl'

f
M

~;:::::;;:;:::;;;::;::=;::=~

, OOelHcbporelyslJ/llo

!'CAe

1-

M&xino

~ ~.br.. :

.....-biedadl$E$300: jH$300

Ci!i!:J~

. ruqacb

B6tUo< del ojo de ,atogoas (Xl:

[.....-biedadl$f$1 :$1$1

del '"'l\l'ldo ele de catogorios (lI): --;

I en""

1 ~ISI""1. > I~

L:III-'

IC.r<""I~~~

En Datos de origen seale cada una de las series y en Nombre seale la casilla
que contiene el nombre Media y el Mximo; asgnele a cada uno sus Valores
correspondientes y en Rtulos del eje de categoras (x) seale el rango donde se
encuentran los nombres de las variables (pretratamientos).

286

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

C A PITULO

Nombre

11 - GRFICAS

EN EXCEL

Rtulos de eje de
Categorias (x)

Valores

Una vez seleccionados los datos de origen, d dic en Finalizar.

---FECHA293 13-Jul91
294 14-)ul91
295 U Jul91
29.
297
299

iiif
301
iif
303
ii-

DO

INTEGRADA

194
195
195

28.00
21.00
17 .00

FGAS3
4.60
4.40
4,10

medll
m.,uma

73,56
5Ill,00
76

12,.5
115.00
11

deSVIaClon

F
FGAC

G
FGHM3

FGH3

I
FGDS3

9.ao

8.00
8,70
8.00

6.20
6.ao
6.20

8.00
7,10
6,90

21,19
130,00
1602

13,26
81,00
1000

1~,oo

9.60
8,60

1eo,00
180.00
140.00
120,00
100,00
&O,()()

305

iis
307
iia

SOllO

311

16,1;1
15,11

~
-+-,",><>no

,()()

20,00

309

31ii'

ollO
FOAS3

FO"",

FOH<l

FOH3

312

Con doble dic sobre las barras se desplegar el cuadro de dilogo Formato
de serie de datos ; d un dic en la pestaa Barras de error Y; seleccione en
el subcuadro Presentar>Por exceso y en Personalizada:+ seale el rango
donde se encuentran los valores de la desviacin estndar para las variables
(pretratamientos ).

ESTADIsTICA DESCRIPTIVA PARA INGENI ERIA AMBIENTA L CON

SPSS

287

VIVIANA VARGAS FRANCO

~~~~d~~~~i~ "d-~~--~t:;~---_~--"'~-~'==>::=::::::=:':' ~I
Tr_

,.f,r-e-s:entar - - -

-------=il

rn . [JO
AnIb<>s

.:
..

Por "".-. Por doRdo NilQul!>

,cuante a. erNlf

[5

~aIar fijo,

O PQrt:Enta)e'
O t ! e S - _:
O finr tt>;co
@ Peo<notMda:+

15

[1

1- -ItD$Z! fiil

tiQ

I c:..nc..er

D un clic en Aceptar y el grfico le mostrar las barras de error que corresponden


a cada una de las desviaciones estndar de las variables (pretratamientos), tal
como se presenta a continuacin:

50 ~----------------~----------------------------~

180
150

40

120

30

90

20

60

10

30
O

FGAS3

FGAC

1-

FGHM3

Media -+-Mximo

FGH3

11.2 Grfico para media, mximo y mnimo


Calcule la media, el mximo y el mnimo para cada variable, como se indic en
el procedimiento anterior. Adicionalmente, calcule la distancia desde la media
hasta el valor mximo y la distancia desde el valor mnimo hasta la media para
cada variable. Para esto debe restar al mximo el valor de la media, este valor ser
el que aparecer en el grfico como el mximo, seguidamente reste a la media el
valor mnimo.

288

ESTAD fsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS

CAPrTULO 11 - GRFICAS EN EXCEL

1 ____
" 1 ,.. .

~ ~I& }~ a. 'o 'l. " ....... '.~ r . l ,-


-1 10 I .L _,L"
[-:~
cJat' 1-"'-... .. ........'l"
l.\

1.1

JI'owI
I'IRCDITI.

EtofJ6W\1lpnsoJlU

I Ia

. '[ _

ti x

.cl~!I
. .&...
. ,i!!!I

=DDHIBl

Haga clic en el icono Asistente para grficos l O e n la barra de


herramientas,
Seleccione el tipo de grfico Lneas como se muestra en la figura, d clic en
Siguiente,

Tilos estndar

~s personalizados

de Men:
lIi CoUmas

=: a..rrM

~~~........................~.
~ CiraJar

It:Xl'(~)

lIIfII iwas
@ AnIos

R.<IdoI

~~
~ lk6bujas

F~--~
Pr~

ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON

SPSS

-"""'' '

para VflIIlllU8Stra

289

VIVIANA VARGAS FRANCO

En Rango de datos seleccione el rango donde se encuentran los valores


correspondientes a la media de cada variable; en la pestafia Serie en Rtulos del
eje de categoras (x) , sefiale el rango donde se encuentran los nombres de las
variables (pretratamientos); escriba el nombre de la serie en la casilla Nombre
como se muestra en la figura, d un clic en Finalizar. El grfico aparecer en la
hoja de clculo.

~;;~~,, -

:i'i~l

~~
R.-o:Ict.datos I

Rangodedltos ~

~.~
Sena

1__ *...11

a...... dodoloo,

1_

Series:Wt:

..-....,..

1-""1

Ji]

oc_

,.,;,- - - - - -

.....-0_,...,..

c_

&_dolojodo_(X),

Ic"- I~~~

~~l : tH.l

1~~1 (NIr.

En el grfico d doble clic sobre la lnea y se despliega el cuadro de dilogo


Formato de serie de datos; en la pestafia Tramas seleccione la opcin Ninguna
para Lnea, luego vaya a la pestafia Barra de error y, seleccione en el sub cuadro
Presentar>Ambas; en Personalizada:+ el rango de datos correspondiente a los
valores de la distancia de la media al mximo y en Personalizada:- el rango de
datos para la distancia del valor mnimo a la media. D un clic en Aceptar.
!lm!~~!~_,._,'fi

--

T,_

n_

., Mwoda.
o~

0.....-

0 '"'""

0-

,0 - -

- 1- - 11 , ~
g,Iar, I~.=
=:.:: ~

_.

-. I

'-o ~

I- .
r-c-i::Jt:--""

.... 1-

"P>'

Qo

1 .... do .... ' 1_"_1 OoW>do"'_

[!JCh]O

Par.allO Pw *'-ID ......

<~dtti~

Olelar"'"
O~:

OQoMOn-.w,
0 __

1_ [:JI '"
0_

c:....1
E=tI

- - : + I_1_--

,"
!Si:]

290

1 .....11.:.- 1

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

spsS

CAPfTULO 11 - GRFICAS EN EXCEL

A continuacin aparecer el grfico que representa la media, y las lneas del


mnimo y del mximo para cada variable.
180 ~------------------------~
150 '---~---ir-""""----------120 -b-~----~~~~--~------+--i

__'"

90
60

+-~----+-~~~--~----~~

30

+--+----~--------~r_---~~

l. Medial

o ~~----~~--..~----~~~
FGAS3

FGAC

FGHM3

FGH3

FGDS3

11.3 Grfico de series de tiempo


El grfico de series de tiempo consiste en graficar los valores de la variable en el eje
y versus los intervalos de tiempo en el eje X.

ID

Haga clic en el icono Asistente para grficos

en la barra de

herramientas.
Seleccione el tipo de grfico XY (Dispersin) y el subtipo de grfico Dispersin
con puntos de datos conectados por lneas sin marcadores de datos, como se
muestra en la figura, d un clic en Siguiente; en Rango de datos seleccione el
rango correspondiente a la serie de datos; este rango debe incluir, adems, una
variable que sern los valores del eje X, que para el ejemplo es el da de operacin
(DO), los datos de turbiedad (eje Y) de las variables (pretratamientos) con sus
respectivos nombres. D un clic en Finalizar .

...........,..
,

-.........
.

\,

"",..
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ --1
,

ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

,~, <Jo J

11 .,.

SPSS

,.

.,.

.1 1

..

1M

...

291

VIVIANA VARGAS FRANCO

En este momento aparecer en la hoja de clculo el siguiente grfico.


180 160
140
120
100
80
60
40
20 -

111,
II
;.., Aul/\ 1:. .H

~J~~"'~

100

50

150

200

F GAS3
F GAC
F GHM
F GH3
FGDS3

250

Para observar mejor el comportamiento de las series, se puede editar el grfico


para que la escala del eje Y se muestre en escala logartmica; adems, puede elegir
mostrar la leyenda en la parte inferior del grfico. Para mostrar la leyenda d clic
derecho del mouse y en el men que se despliega elija Opciones de grfico, en
el cuadro de dilogo en la pestaa Leyenda, seleccione Abajo en Ubicacin y
d un clic en Aceptar.
!.J~:'"

~"J'.I!;.o(..."';:,,j 'f' u'.-.U

!lII::. "'~ . - ~~..


!D'b _~.
~ If-l ~ "1~~~.;. ~

~~dt~~tlfli2"":=::===--==-Jl~

,pe ....... ..

,~__-JA;_-=t~i--'--

JI'
TF

'"

,-~
' IlO

.:u.
W.
'"

O
fF

ir

...."

(..

~.'r

\T

4,_

~~

VI:.

''P1IM''(I'~

.........

iijj
':
..
. '--t-

~
(

: ';"..1.:

o"

' ..,

.~ t

,..

I,_:..
_"_'::::~_

:ni

llf
.tr

H
~_c;c;;;;7'iV

292

t-

Para editar el formato de los ejes d doble clic sobre el eje que necesita editar;
para el eje Yen Escala seleccione la opcin Escala logartmica. Para el eje X,
puede cambiar los valores mximo y mnimo del eje; para este ejemplo el da de
operacin mnimo es 50, por lo que podemos escribir en valor mnimo 50 para
que los valores del eje X empiecen en 50 y no en cero.

ESTADIsTICA DESCRIPTI VA PARA ING ENI ERIA AMBIEN TAL CON

SPSS

CAPiTULO 11 - GRFICAS EN EXCEL

~J'!P.!PJI..:.JJ:;:''-'~''''''H ..... _~.....to:,....._ _ ..~...._~ ~

_:

........"'.

/J M<>mo:

tridad ........ :

I.tidodnUI(J"':

1:00 .
~::::J
1'0

Mi:ono.:
~ UnldodmaJ""' :
~ li*Iod me",, :

io

lJ'*Iede:s cID ..... .,d6n: !ffrQ&Al4

g'\2OM:

...~ i!3 Moltr(l' r~ de trldades:

I _In I

~
250

SO
lO

150

;.dodesdovisuoliz";';":

I ~".

~~i<o~"-E

IJ EsulaPlriab

r:J ti. de yalorfl 00 0'UZ8 en '1lla mixno

(] e cM wkres (Y) cruI!a en VoIbr *'O

f'J ..,.,.., Ofden~

.~

_ . rtUode..-.dollos

D "-"onor_~

"'......

""-o

/J Ejc de """,.. ('1)

E}6o. vafores(X)
gUli..- !

I ...rte I

~doI*de"GOI"CS()O

dt v.onas (Y)

-IrQ:

El

Aut_

~ Escol.

..... L"""'*-I_IAftocin !

~dIII ...

~~~~:.::.=:::::,-f!

ca-aIor

1I

C........

Una vez editado el grfico, quedar ~omo se muestra en la siguiente figura.

1~ .----------------------------------------100 ~------------------+-------------------

1 +-----~------~--------------r_------------~
75
50
100
125
150
175
200

FGAS3

FGAC

FGHM3

FGH3

Excel es una poderosa herramienta para organizar y procesar datos, principalmente


numricos. La hoja electrnica o de clculo, estructurada como tabla de filas
y columnas, permite elaborar de forma fcil diversos procesos y grficas
estadsticas.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

293

CAPiTULO 11 - GRFICAS EN EXCEL

~J'!P.!PJI..:.JJ:;:''-'~''''''H ..... _~.....to:,....._ _ ..~...._~ ~

_:

........"'.

/J M<>mo:

tridad ........ :

I.tidodnUI(J"':

1:00 .
~::::J
1'0

Mi:ono.:
~ UnldodmaJ""' :
~ li*Iod me",, :

io

lJ'*Iede:s cID ..... .,d6n: !ffrQ&Al4

g'\2OM:

...~ i!3 Moltr(l' r~ de trldades:

I _In I

~
250

SO
lO

150

;.dodesdovisuoliz";';":

I ~".

~~i<o~"-E

IJ EsulaPlriab

r:J ti. de yalorfl 00 0'UZ8 en '1lla mixno

(] e cM wkres (Y) cruI!a en VoIbr *'O

f'J ..,.,.., Ofden~

.~

_ . rtUode..-.dollos

D "-"onor_~

"'......

""-o

/J Ejc de """,.. ('1)

E}6o. vafores(X)
gUli..- !

I ...rte I

~doI*de"GOI"CS()O

dt v.onas (Y)

-IrQ:

El

Aut_

~ Escol.

..... L"""'*-I_IAftocin !

~dIII ...

~~~~:.::.=:::::,-f!

ca-aIor

1I

C........

Una vez editado el grfico, quedar ~omo se muestra en la siguiente figura.

1~ .----------------------------------------100 ~------------------+-------------------

1 +-----~------~--------------r_------------~
75
50
100
125
150
175
200

FGAS3

FGAC

FGHM3

FGH3

Excel es una poderosa herramienta para organizar y procesar datos, principalmente


numricos. La hoja electrnica o de clculo, estructurada como tabla de filas
y columnas, permite elaborar de forma fcil diversos procesos y grficas
estadsticas.

ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS

293

Bibliografa

Ander-Egg, Ezequiel (1992). Tcnicas de Investigacin Social. Editorial


HVMANITAS . Buenos Aires.
Behar G. Roberto y Grima, C. Pere (2004).55 respuestas a dudas tpicas de estadstica.
Ediciones Daz de Santos S.A. Espaa.
Behar G. Roberto, Yepes A. Mario (1996). Estadstica. Un Enfoque Descriptivo.
Universidad del Valle. Facultad de Ingeniera. Departamento de Produccin
e Investigacin de Operaciones. Colombia.
Berthouex, Paul Mac. Brown, C. Linfield (1994). Statistics for Environmental
Engineers. Lewis Publishers. USA.
Bunge, Mario. La ciencia, su mtodo y su filosofa. Orin Editores Ltda.
Colombia.
Cardona, P., J.N. (1994). Comparacin de Diferentes Velocidades de Filtracin en
Cinco Alternativas de Pretratamiento para Sistemas de Abastecimiento de
Agua. Tesis de Pregrado. Universidad del Valle. Cali-Colombia.
Cinara - IRC (1989). Proyecto Integrado de Investigacin y Demostracin en
Filtracin Lenta en Arena. Informe final. Versin resumida. Universidad
del Valle. Cali. Colombia.

ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

295

VIV IANA VARGAS FRANCO

Chao, L. Lincoln (1980). Estadstica para las Ciencias Administrativas. McGrawHill. Mxico.
Craun, F. Gunther (1993). Safety of Water Desinfection: Balancing Chemical &
Microbial Risks. ILSI Press. Washington D.C.
Davies, L. Owen (1995). Mtodos Estadsticos aplicados a la Investigacin y a la
Produccin. Con especial referencia a la industria qumica. Aguilar S.A. de
Ediciones. Espaa.
Freund, John E. y Walpole, Roland E. (1990). Estadstica Matemtica con Aplicaciones.
Cuarta edicin. Prentice-Hall Hispanoamericana, S.A. Mxico.
Fernndez, Humberto P. (1990). Cmo Investigar. Metodologa de la Investigacin.
Editorial Espiga Dorada. Bogot.
Galvis, C., G. (1999). Development and Evaluation ofMultistage Filtration Plants.
An Innovative, Robust and Efficient Water Treatment Technology. Thesis of
Doctor ofPhilosophy (Ph.D.). University ofSurrey, United Kingdom.
Gmez, R. Francisco (1993). Estadstica Metodolgica. Teora Completa y Ejercicios
Resueltos y Explicados. Ediciones Fragor. Venezuela.
Iversen, G.T. and Norpoth, H. (1982). Analysis ofVariance. Sage University Paper
series on Quantitative Applications in the Social Sciences. Beverly Hill.
Sage Pubns.
Kuehl, O. Robert (2001). Diseo de Experimentos. Principios estadsticos para el
diseo y anlisis de investigaciones. Thompson Learning. Mxico, D. F.
Marn, Rodrigo R. (1992). Estadsticas sobre el recurso agua en Colombia. Ministerio
de Agricultura. Instituto Colombiano de Hidrologa, Meteorologa y
Adecuacin de Tierras. Santaf de Bogot.
Mason, Robert D., Lind, A. Doglas (1995). Estadstica para Administracin y
Economa. Alfaomega Grupo Editor, S.A. Mxico. D.F.
Mendenhall, W.; Scheafer L., R.; Wackerly D., D. (1986). Estadstica Matemtica con
Aplicaciones. Grupo Editorial Iberoamrica. Mxico, D. F.
Milewski, Emil G. (1991). The Essentials of Statistics I. Research and Education
Association. Piscataway, New Yersey. USA.
Mondragn. L.A. (1996). Plan Estratgico del Sector de Agua Potable y Saneamiento
Bsico. Diagnstico y Bases Tcnicas para la orientacin del Sector.
Conferencia Internacional de Mejoramiento de la Calidad de l Agua.
CINARA. Santiago de Cali.

296

ESTAOlsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON

SPSS

BIBLlOOGRAFrA

Ostle, Bernard (1992). Estadstica Aplicada. Limusa. Grupo Noriega Editores.


Mxico.
Pagano, R. Robert (1999). Estadstica para las Ciencias del Comportamiento. Quinta
Edicin. Internacional Thomson Editores. Mxico.
Portus G. , L. (2001). Curso Prctico de Estadstica. Segunda edicin. McGraw Hill.
Colombia.
Quiroga, Francisco. Programa Acadmico de la Asignatura Disefio de Experimentos.
Universidad del Valle - Cali - Colombia.
Rincn A Luis Alberto (1995). Modelos de Regresin. Desarrollo y aplicacin con
computador. Universidad Nacional de Colombia. Sede Palmira.
Sabino, Carlos A. (1989). El Proceso de Investigacin. El Cid Editor. BogotColombia.
Sabino, Carlos A . (1996). Los Caminos de la Ciencia. Panamericana Editorial.
Bogot-Colombia.
Spiegel, Murray R. (1970). Teora y Problemas de Estadstica. McGraw-Hill.
Mxico. D.F.
Vargas, F. , V. (1996). Modelo de Decisin para la Seleccin de un Sistema de
Tratamiento de Agua con Tecnologa por Filtracin en Mltiples Etapas,
FiME. Tesis de MSc. Universidad del Valle. Cali-Colombia.
Vargas, F., V. (2002). Modelos de Disefio Experimental para la Comparacin de Filtros
Gruesos para Potabilizacin de Agua por Tecnologa FiME. Universidad
Nacional de Colombia. Simposio de Estadstica. Bogot-Colombia.
V lez, C. ; Galvis, A ; Duque, A ; Restrepo, G. (2003). La Modelacin Matemtica en
el Estudio de la Calidad del Agua del Ro Cauca. Antecedentes y Perspectivas.
Seminario de Hidro-informtica. AGUA2003. Instituto Cinara - Universidad
del Valle. Cartagena de Indias. Colombia.
Villegas G. , Carlos (1981). Fred aprende estadstica bsica. Editorial Trillas S. A ,
Mxico. Mxico. D.F.
Visauta, V. Bienvenido (2002). Anlisis Estadstico con SPSS para Windows.
Volumen 1. Estadstica Bsica. Segunda edicin. McGraw Hill, Espafia.
Vischer, 1. T. (1996). Tendencias en la Poltica del Sector de Agua y Saneamiento
en Proceso de Cambio. Conferencia Internacional de Mejoramiento de la
Calidad de Agua. CINARA. Universidad del Valle. Santiago de Cali.

ESTAD rSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS

297

VIVIANA VARGAS FRANCO

Walpole, E.,R. Y Myers, H., R. (2000). Probabilidad y Estadstica. McGraw-Hill.


Cuarta Edicin. Mxico. D.F.
WHO (1993). Guidelines for Drinking-Water Quality. Volume 1. Recomendations.
Geneva.
y fiez, 2001. Conferencia en el marco de la semana de la Estadstica. Universidad
del Valle - Cali - Colombia.

Referencias URL
http://escuela.med.puc.cl
htpp://www.uaq.mx/matematicas/estadsticas.html
htpp://www.dagmacali.gov.co
htpp://www.sma.df.gob.mx/simatlpnindicadores.html

298

ESTADrSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

VIVIANA VARGAS FRANCO

Walpole, E.,R. Y Myers, H., R. (2000). Probabilidad y Estadstica. McGraw-Hill.


Cuarta Edicin. Mxico. D.F.
WHO (1993). Guidelines for Drinking-Water Quality. Volume 1. Recomendations.
Geneva.
y fiez, 2001. Conferencia en el marco de la semana de la Estadstica. Universidad
del Valle - Cali - Colombia.

Referencias URL
http://escuela.med.puc.cl
htpp://www.uaq.mx/matematicas/estadsticas.html
htpp://www.dagmacali.gov.co
htpp://www.sma.df.gob.mx/simatlpnindicadores.html

298

ESTADrSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON

SPSS

'STrr""
9 789583 393198

You might also like