You are on page 1of 17

RClimTool

MANUAL DEL USUARIO


Lizeth Llanos Herrera, estudiante de Estadstica

Esta herramienta ha sido diseada para el apoyo, automatizacin


de procesos y anlisis de series climticas dentro del convenio
CIAT-MADR. No se pretende competir, ni suplantar otras
herramientas disponibles y desarrolladas por otras entidades. Por
el contrario, buscamos un trabajo colaborativo y de
retroalimentacin constante entre metodologas.

www.aclimatesectoragropecuariocolombiano.org

RClimtool ha sido diseada con el objetivo de facilitar a los usuarios el


anlisis estadstico, control de calidad, llenado de datos faltantes,
anlisis de homogeneidad y clculo de indicadores para las series
climatolgicas diarias de temperatura mxima, temperatura mnima y
precipitacin.

INSTALACIN Y EJECUCIN DE R
Debido a que la herramienta fue creada bajo el lenguaje de R, es indispensable tener ste programa
instalado, especficamente la versin R 2.15.0, que puede ser descargada desde el siguiente link:
http://cran.r-project.org/bin/windows/base/old/2.15.0/
Una vez lo hemos instalado, al abrirlo aparecer la siguiente ventana:

www.aclimatesectoragropecuariocolombiano.org

INSTALACIN Y EJECUCIN DE RClimTool


Para ejecutar la interfaz de la aplicacin debemos cargar el cdigo fuente tal como se muestra en la
siguiente figura:

Una vez se ha cargado el cdigo exitosamente aparecer la siguiente interfaz grfica:

www.aclimatesectoragropecuariocolombiano.org

En la figura 1 se observa la ventana principal de la herramienta, la cual se encuentra dividida en


diferentes mdulos, cada uno ubicado en los paneles de la parte izquierda de la interfaz. El contenido de
estos mdulos ser desarrollado ms adelante.

QU HACE RClimTool?
RClimTool ofrece diferentes opciones de anlisis, diseadas con el objetivo de brindar una aplicacin
que rena todo lo necesario para llevar a cabo un estudio completo de las series climatolgicas.
Para ilustrar las funciones de cada uno de los mdulos, a continuacin se muestra el anlisis de las series
climatolgicas diaria para las variables temperatura mxima, temperatura mnima y precipitacin de 10
estaciones meteorolgicas.
1. Lectura de datos:
En el mdulo de lectura de datos encontraremos diferentes botones que nos permitirn leer y
cargar las bases de datos que contienen la informacin de las variables de inters. Importante: No
utilizar tildes ni la letra para nombrar carpetas y archivos que se utilizarn con la herramienta,
ya que esto genera conflicto al momento de usar la aplicacin.
El botn cambiar directorio (1) ofrece la opcin de seleccionar el directorio donde se encuentran los
archivos que se van a cargar, tambin ser la ubicacin para guardar todas las salidas de la
aplicacin.

Figura 1. Ventana para lectura de datos

www.aclimatesectoragropecuariocolombiano.org

En la parte (2) de la figura 1 se encuentran los botones que permite cargar la informacin cada una
de las variables. Por ejemplo, al dar clic en el botn Temp. Mxima aparecer una ventana
emergente en la cual se debe ubicar el archivo que contiene las temperaturas mximas diarias de las
diferentes estaciones. Este procedimiento se realiza para las dems variables a analizar.

i
a
g
n
o
s
Ventana emergente
t
i
c
Figura 2. Ejemplo de seleccin
de archivo
s
R
e
En esta ventana se selecciona la ubicacin y el archivo
que deseamos cargar. Seleccionamos el
p
archivo y damos clic en ok como se ve en la figura 2. Recuerde cerrar la ventana emergente cada vez
o
que se cargue una variable diferente.
r
t
( en Anexos.
Nota: El formato de los datos de entrada se especifica
)

2. Anlisis grfico descriptivo:


Una vez tenemos los datos cargados para todas las variables a analizar, procedemos a realizar el
anlisis descriptivo para cada una de ellas, para ello debemos especificar el perodo de anlisis, til
si se desea analizar solo una seccin de la serie, por ejemplo Marzo-1990 hasta Enero-1991, si por el
contrario se desea analizar la serie completa entonces estos campos deben estar vacos.

www.aclimatesectoragropecuariocolombiano.org

Opcin de
anlisis por
perodo

Figura 3. Ejemplo anlisis descriptivo


Despus de seleccionar la variable a analizar tal como se muestra en la figura 3, procedemos a dar
clic en el boto Descriptivas, los resultados se pueden visualizar en la consola de R (ver figura 4).

Consola en R

Figura 4. Anlisis descriptivo

www.aclimatesectoragropecuariocolombiano.org

Para el anlisis grfico se tiene la opcin de generar diferentes tipos de Grficos automticos, los
cuales se generan para todas las variables. Si se desea trabajar con informacin climatolgica
mensual (promedio mensual para temperatura y total mensual para precipitacin) se debe
seleccionar Mensual en la opcin Tipo de anlisis, luego al dar clic en alguno de los botones
(Grficos Plot, Grficos Boxplot o Grficos de dispersin) aparecer un mensaje con la ubicacin de
los grficos generados (ver figura 5).

Opcin para
grficos mensuales

Figura 5. Anlisis grfico automtico

Otra opcin es realizar los grficos de forma personalizada, al dar clic en los botones del mdulo
Grficos Personalizados aparecer una ventana donde se encuentran los campos necesarios que se
deben especificar; para los argumentos x e y, se escogen las variables mediante un lista desplegable.
Los dems argumentos, como el ttulo, etiquetas de los ejes, color, entre otros sirven para
personalizar el grfico (para consultar la ayuda sobre los argumentos del grfico dar clic en el botn
Help).
Una vez seleccionadas las variables y modificados los argumentos damos clic en ok y en una nueva
ventana se desplegar el grfico (ver figura 6).

www.aclimatesectoragropecuariocolombiano.org

Figura 6. Anlisis grfico personalizado


3. Control de calidad:
Un aspecto importante a tener en cuenta en el anlisis de las series climatolgicas, es el control de
calidad, que consiste en generar algunos criterios y/o filtros para ayudar a identificar datos no
razonables y/o errneos.

Figura 7. Control de calidad

www.aclimatesectoragropecuariocolombiano.org

En la figura 7 se encuentra el mdulo Control de calidad, aqu se encuentran algunos campos


editables que deben ser llenados a criterio del usuario, como el No. de desviaciones estndar, un
criterio til para identificar datos atpicos en la serie (por defecto son 3). El Rango de la variable se
debe especificar de acuerdo con los valores lgicos esperados que puede tomar la variable.
Al dar clic en el botn Validar aparecer un ventana que indica el estado de cada estacin respecto
al rango establecido para la variable. Los criterios ejecutados en la consola son (ver figura 8):

% Datos atpicos: Se definen como el porcentaje de datos que no se encuentran dentro del
siguiente intervalo [
], donde y es el promedio muestral y la desviacin estndar
muestral de la variable a validar respectivamente. Nota: Este criterio no es recomendable para la
variable precipitacin ya que su distribucin suele ser asimtrica.

% Datos fuera del rango: Indica el porcentaje de datos que se encuentran por fuera de los
lmites definidos para el rango de la variable. Los datos identificados para este criterio sern
automticamente reemplazados por NAs.

% Datos tmax<tmin: Se calcula nicamente para temperaturas e indica el porcentaje de


datos en los que la temperatura mxima fue menor que la temperatura mnima en la misma
fecha. Los datos identificados para este criterio sern automticamente reemplazados por
NAs.

% Datos variacin10 (TM_10): Slo se calcula para la variable temperatura, y ste nos
indica el porcentaje de das en los cuales la variacin de un dato de temperatura con
respecto a otro fue mayor o igual a 10C.

% Datos consecutivos: Identifica los datos iguales en un perodo mayor a cinco das
consecutivos en la serie analizada y stos son reemplazados por NAs.

Figura 8. Criterios para el control de calidad

Para los filtros datos atpicos y datos TM_10, se crearn diferentes archivos en Excel para cada una
de las estaciones, en ellos encontraremos los datos que fueron identificados aqu, acompaados con
su respectiva fecha. Se deja a criterio del usuario el reemplazar o no por NAs los datos identificados

www.aclimatesectoragropecuariocolombiano.org

por stos filtros, el cual se debe llevar a cabo manualmente sobre los archivos generados en la
carpeta Datos faltantes, donde se encuentran los archivos despus haber realizado el Control de
calidad a todas las variables (ver figura 9).
Si se desean reemplazar los
datos identificados en el Control
de Calidad por NAs se deben
hacer sobre estos archivos.

Carpetas con archivos de los


datos no razonables y/o
errneos para c/estacin

Figura 9. Identificacin y reemplazo de datos no razonables por NAs

Figura 10. Creacin del informe preliminar


Al dar clic en el botn generar pre-informe, automticamente se crear un archivo Word con un
informe que incluye un anlisis descriptivo preliminar y los criterios generados en el mdulo del
Control de calidad, complementado con los grficos que realiza la aplicacin. El pre-informe
quedar guardado en el directorio que aparece en la ventana emergente, como se muestra en la
figura 10.

www.aclimatesectoragropecuariocolombiano.org

4. Datos faltantes:
El llenado de datos faltantes es realizado mediante el paquete RMAWGEN de R, el cual a partir de la
estimacin de modelos VAR realiza el llenado de los datos. Es importante resaltar que esta
metodologa es til cuando se tienen porcentajes de datos NA bajos e informacin de varias
estaciones que se encuentren relacionadas y que no presenten mucha variabilidad.
Para este mdulo es indispensable que se tengan datos de varias estaciones en el MISMO PERODO
para las variables temperatura mxima, temperatura mnima y precipitacin, ya que interactan
entre s para completar los datos faltantes.

Figura 11. Llenado de datos faltantes

www.aclimatesectoragropecuariocolombiano.org

En la figura 11 se muestran los campos necesarios que se deben especificar para el llenado de datos
faltantes, al dar clic en el botn completar datos, se iniciar el proceso que puede tardar varios
minutos.
Una vez finalice el proceso, aparecer de nuevo una ventana indicando que el proceso ha finalizado.
En la carpeta Datos faltantes se crearn las bases de datos para cada una de las variables y los
grficos de la serie original versus la serie generada (ver figura 12).

Carpetas con
salidas grficas

Archivos con datos


generados (Sin datos
faltantes)

Figura 12. Ubicacin archivos Datos faltantes


5. Anlisis de Homogeneidad de la serie:
En este mdulo se implementaron varias pruebas estadsticas con el fin de analizar la homogeneidad
de la serie:

Pruebas de normalidad: estas pruebas comprueban si los datos de la variable en estudio


proceden de una distribucin normal, si se cumple este supuesto se deben utilizar pruebas
paramtricas; sino se cumple debemos acudir a las pruebas no paramtricas.

Estacionalidad (tendencia): Se propone la prueba del Rango de Correlacin de Spearman* y


el Test de Mann-Kendall. Para estimaciones futuras es necesario que se cumpla este
supuesto

Estabilidad en varianza: Test F* aplicado en subconjuntos de informacin.

Estabilidad en Media: Incluye el Test T* y el Test U Mann-Whiney como alternativa no


paramtrica al Test T, usando las medianas como estadstico ms robusto que la media.

Nota: Las pruebas con * requieren del cumplimiento del supuesto de normalidad.
En la figura 13 se observan algunos de los resultados obtenidos para este mdulo, en el ejemplo se
utiliz la variable tmax y un nivel de significancia del 5%. En la consola se muestran las tablas

www.aclimatesectoragropecuariocolombiano.org

obtenidas para cada prueba, las cuales incluyen para cada estacin el valor-p y la decisin de
acuerdo al nivel de significancia escogido.

Figura 13. Anlisis de homogeneidad de las series


Para este mdulo se encuentra opcin de generar un informe que resume todas las pruebas
estadsticas incluidas en el anlisis de la homogeneidad, para realizarlo damos clic en el botn
Generar Informe.
6. Calculo de indicadores:
Para el clculo de indicadores se tienen los siguientes sub-mdulos:

Indicadores anuales: Se calcula el nmero de das para cada ao que cumplen con la
condicin indicada (Mayor que o Menor que), el valor del criterio que define la condicin se
deja libre al usuario.
Indicadores mensuales: Para este sub-mdulo se calculan los mximos o mnimos
mensuales para la variable escogida.

Para llevar a cabo estos clculos, primero seleccionamos el perodo y la variable a analizar, luego se
escoge el valor para el indicador de inters, y procedemos a dar clic sobre el checkbox del mismo. En
la carpeta Indicadores se generarn archivos de Excel con los indicadores calculados (ver figura 14).

www.aclimatesectoragropecuariocolombiano.org

Figura 14. Clculo de indicadores anuales y mensuales


7. Condicin ENSO (El Nio/Oscilacin Sur):
RClimTool cuenta con informacin sobre la condicin ENSO desde el ao 1950 hasta el 2013 que se
puede consultar (ver figura 15). Despus de seleccionar el perodo de inters se procede a dar clic
en la consulta que se desee realizar y aparecern los resultados en la consola de R (ver figura 16).

Figura 15. Consulta Condicin ENSO

www.aclimatesectoragropecuariocolombiano.org

Figura 16. Ejemplo consulta Condicin ENSO

PROBLEMAS CONOCIDOS:
Un problema identificado para esta versin se encuentra en el mdulo de datos faltantes, el rango de las
fechas de las variables debe estar desde el 1 de enero del ao inicial de anlisis hasta el 31 de diciembre
del ao final, para poder llevar a cabo el llenado de datos.
REPORTE DE PROBLEMAS
Por favor reporte cualquier problema a Lizeth Llanos l.llanos@cgiar.org y David Arango
d.arango@cgiar.org junto con los mensajes de error y los datos que se usaron para el anlisis. Tambin
apreciamos las sugerencias que contribuyan a mejorar la herramienta.

www.aclimatesectoragropecuariocolombiano.org

ANEXO A: FORMATO DE ENTRADA DE LOS DATOS


Los archivos que vayan a ser utilizados deben estar en formato CSV (delimitado por comas). Se deben
emplear bases diferentes para cada una de las variables, con las estaciones que se deseen analizar. Estas
bases deben cumplir con los siguientes aspectos:
1. Columnas en las siguientes secuencias: day, month, year seguido de los nombres de las estaciones.
NOTA: unidades de Precipitacin= milmetros y unidades de Temperatura= grados Celsius
2. Para los casos en el que se presenten datos faltantes, se deben codificar como NA; los registros de
datos deben estar en orden cronolgico. No se permite fechas faltantes.

Ejemplo de formato de datos de entrada para RClimTool:

Nombres
Estaciones

Figura 17: Formato de entrada variable precipitacin

www.aclimatesectoragropecuariocolombiano.org

Figura 18: Formato de entrada variable temperatura mxima

Figura 19: Formato de entrada variable temperatura mnima

www.aclimatesectoragropecuariocolombiano.org

You might also like