You are on page 1of 56

ANÁLISIS DE LA DIVERSIDAD BIOLÓGICA Y

METODOLOGÍAS DE ESTUDIO FLORÍSTICO EN LOS


BOSQUES ANDINO-AMAZÓNICOS DEL SUR PERUANO

Curso Teórico-Practico
Cusco-2016

Isau Huamantupa. Universidad Nacional San Antonio Abad del Cusco, Escola Nacional de
Botánica Tropilcal JBRJ-Brasil.
TEMATICA 1
ANÁLISIS EXPLORATORIO, DESCRIPTIVO Y
COMPARATIVO DE DATOS

Isau Huamantupa. Universidad Nacional San Antonio Abad del Cusco, Escola Nacional de
Botánica Tropilcal JBRJ-Brasil.
QUE ES ESTADÍSTICA?
La Estadística se ocupa de los métodos y procedimientos para recoger,
clasificar, resumir, hallar regularidades y analizar los datos, siempre y
cuando la variabilidad e incertidumbre sea una causa intrínseca de los
mismos; así como de realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en su caso formular
predicciones.

Podríamos por tanto clasificar la Estadística en descriptiva, cuando los


resultados del análisis no pretenden ir más allá del conjunto de datos, e
inferencial cuando el objetivo del estudio es derivar las conclusiones
obtenidas a un conjunto de datos más amplio.
VARIABLES ESTADÍSTICAS
Cuando hablemos de variable haremos referencia a un símbolo (X,Y,A,B,. ..) que
puede tomar cualquier modalidad (valor) de un conjunto determinado, que
llamaremos dominio de la variable o rango. En función del tipo de dominio, las
variables las clasificamos del siguiente modo:

Variables cualitativas, cuando las modalidades posibles son de tipo nominal.


Por ejemplo, el grupo sanguíneo tiene por modalidades: Grupos Sanguíneos
posibles: A, B, AB, O

Variables cuasicuantitativas u ordinales son las que, aunque sus modalidades


son de tipo nominal, es posible establecer un orden entre ellas. Por ejemplo, si
estudiamos el grado de recuperación de un paciente al aplicarle un tratamiento,
podemos tener como modalidades: Grado de recuperación: Nada, Poco,
Moderado, Bueno, Muy Bueno. A veces se representan este tipo de variables en
escalas numéricas, por ejemplo, puntuar el dolor en una escala de 1 a 5. Debemos
evitar sin embargo realizar operaciones algebraicas con estas cantidades. ¡Un
dolor de intensidad 4 no duele el doble que otro de intensidad 2!
Variables cuantitativas o numéricas son las que tienen por
modalidades cantidades numéricas con las que podemos hacer
operaciones aritméticas. Dentro de este tipo de variables podemos
distinguir dos grupos:

Discretas, cuando no admiten siempre una modalidad intermedia


entre dos cualesquiera de sus modalidades. Un ejemplo es el numero
de hijos en una población de familias: Numero de hijos posibles: 0, 1, 2,
3, 4, 5, ...

Continuas, cuando admiten una modalidad intermedia entre dos


cualesquiera de sus modalidades, v.g. el peso X de un niño al
nacer.
PARÁMETROS ESTADÍSTICOS BÁSICOS
Tomada una muestra unidimensional (x1, x2, ..., xn) de tamaño n, interesa reducir la
información encerrada en ella a sólo unos pocos parámetros, siendo algunos de los más
habituales los siguientes:

La MEDIA ( o mx) es el más conocido e intuitivo, siendo su objeto localizar alrededor


de qué punto se sitúan todas las observaciones. Su cálculo es bien sencillo:

La MEDIANA (med), como la media, es un parámetro de localización, siendo su objeto


resumir en una sola cantidad los valores muestrales. Se define como el número tal
que F(med) = 1/2, siendo F la función de distribución muestral. Intuitivamente, es el
valor numérico que queda en el centro cuando se ordena toda la muestra.

La VARIANZA ( ) mide la dispersión alrededor de la media; cuanto más pequeña sea,


más concentrados estarán los puntos alrededor de :
El VALOR (p)
El p-valor que corresponde al nivel de significación más pequeño posible que puede
escogerse, para el cual todavía se aceptaría la hipótesis alternativa con las observaciones
actuales. Cualquier nivel de significación escogido inferior al p-
valor (simbólicamente pv) comporta aceptar H0. Obviamente, al ser una probabilidad, se
cumple que:
0 ≤ pv ≤ 1
El p-valor es una medida directa de lo verosímil que resulta obtener una muestra como
la actual si es cierta H0. Los valores pequeños indican que es muy infrecuente obtener
una muestra como la actual, en cambio, los valores altos que es frecuente. El p-valor se
emplea para indicar cuánto (o cuán poco) contradice la muestra actual la hipótesis
alternativa.
Informar sobre cual es el p-valor tiene la ventaja de permitir que cualquiera decida qué
hipótesis acepta basándose en su propio nivel de riesgo α. Esto no es posible cuando se
informa, como ha sido tradicional, indicando sólo el resultado de la decisión, es decir, si se
acepta o se rechaza H0 con un α fijo.

Al proporcionar el p-valor obtenido con la muestra actual, la decisión se hará de


acuerdo a la regla siguiente: si pv ≤ α, aceptar H1
si pv > α, aceptar H0
¿QUÉ ES UNA PRUEBA DE HIPÓTESIS?
Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si
existe suficiente evidencia en una muestra de datos para inferir que cierta condición
es válida para toda la población.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se
probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o
"no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder
concluir que es verdadero.

Con base en los datos de la muestra, la prueba determina si se debe rechazar la


hipótesis nula. Para tomar la decisión se utiliza un valor p. Si el valor p es menor que
o igual al nivel de significancia, que es un punto de corte que usted define, entonces
puede rechazar la hipótesis nula.

En realidad, una prueba mantendrá la validez de la hipótesis nula hasta que haya
suficiente evidencia (datos) en favor de la hipótesis alternativa.
Testando la hipotesis
PARA CONOCER LA NATURALEZA DE MIS DATOS
QUE REQUISITOS DEBE CUMPLIR?
En muchas ocasiones, el hecho de querer comparar las medias de dos
o más muestras hace que tengamos que lidiar con test estadísticos de
diferentes nombres y con diferentes requisitos. ¿Cuál usar? ¿cuándo?
¿por qué? Con ese motivo, he decidido diseñar un esquema
comparativo básico para poder escoger en cada caso, qué test
estadísticos realizar para obtener resultados fiables.

Antes de querer aplicar test estadísticos para comparar las medias, es


básico saber si las muestras provienen de una distribución normal
(Normalidad) y si presentan en conjunto igualdad de varianzas
(Homocedasticidad):
Exploración de datos

La aplicación de un procedimiento de inferencia estadística requiere


que los datos provengan de una población que cumpla determinadas
características.

El análisis exploratorio de datos es el paso previo a la aplicación de


cualquier método de análisis inferencial.
LENGUAJE DE GRAFICOS ESTADÍSTICOS PARA EXPLORAR LAS
TENDENCIAS DE LOS DATOS

Es casi preceptivo en la fase exploratoria la confección de gráficos que permitan


comprender mejor algunos comportamientos de los datos:

Histogramas

En estadística, un histograma es
una representación gráfica de una
variable en forma de barras,
donde la superficie de cada barra
es proporcional a la frecuencia de
los valores representados, ya sea
en forma diferencial o acumulada.
Diagramas de dispersión

Si los valores de ambas variable se revelan


independientes entre sí, se afirmaría que
no existe correlación. El diagrama de
dispersión es una herramienta gráfica qe
ayuda a identificar la posible relación
entre dos variables.
La representación gráfica más útil
para describir el comportamiento
conjunto de dos variables es el
diagrama de dispersión o nube de
puntos, donde cada caso aparece
representado como un punto en el
plano definido por las
variables y Para obtener un
diagrama de dispersión la secuencia
es:
Diagrama cuantil-cuantil

Buena parte de los procedimientos


estadísticos al uso exigen como
codición básica para su
aplicabilidad que la muestra tenga
distribución normal. Es así que surge
la necesidad de disponer de algún
método para chequear si esta
condición de normalidad se cumple.
En resumen, dada la muestra
EL ENTORNO PAST

Current version (August 2016):


3.13
Ventajas Desventajas

 Rápido y libre.  No trae todos los análisis.


 Estado del arte: en mejora.  No tiene el entorno gráfico muy
 Sólo R, SYSTAT, MATLAB son potente
mejores en producir gráficos.
 Comunidad de usuarios estudiantes y
profesionales muy activa.
 Uno de los programas estadísticos
más fáciles de usar y comprender.
 Fuerza a que uno piense sobre el
análisis
 “Conversa” con software de bases de
datos (SQL por ejemplo).
HORA DE
DIVERTIRSE!!!!!!
Ejemplos
?
Pesos de hojarasca en 36 localidades (parcelas) en 3 diferentes años
Abrimos archivo Exploratorios-pesos.
?
Conclusiones
CLAVE INTERACTIVA PARA TEST ESTADÍSTICOS
COMPARATIVOS
TEST DE NORMALIDAD

1. Test de Shapiro-Wilk
Se aplica sobre cada una de las muestras que queramos comparar. Si tenemos 4
muestras por ejemplo, tendremos 4 p-valores del test, cada uno de su muestra.

El test de Shapiro-Wilk se usa para contrastar si un conjunto de datos siguen


una distribución normal o no. Este hecho es de vital importancia porque otros
muchos análisis estadísticos requieren de la normalidad de los datos para poder
llevarlos a cabo.

Ejemplo: Analizaremos tres grupos de datos, que corresponden a individuos de


especies de aves que estan presentes en diferentes localidads del sur peruano.

Abrimos el archivo de Shapiro-W-Aves


2. Test de Homocedasticidad
Determina si las varianzas entre las muestras a comparar son iguales. Por lo
tanto, sólo se aplica el test 1 vez para todas las muestras. En este caso,
dependiendo del número de muestras, se usa un test u otro:
1. Dos muestras: se aplica el test F de Fisher.
2. Más de dos muestras: se aplica el test de Bartlett.

Ejemplo
Testamos los datos para
ver la
homocedasticidad

Abrimos hoja Shapiro-


W-Aves
Conclusiones
Una vez determinados los dos pasos previos, aplicamos los test de comparación
de medias dependiendo de si los cumplen o no:

1.Test paramétricos: las muestras son normales y homocedásticas. Dependiendo


del número de muestras, se usa un test u otro:
1. Dos muestras: se aplica el test Welch (T test).
2. Más de dos muestras: se aplica el test de ANOVA.

2.Test no paramétricos: no se cumple alguno de los requisitos de normalidad


y/o homocedasticidad.
1. Dos muestras: se aplica el test Wilcoxon-Mann-Whitney. En ocasiones
se pueden ver como test de Wilcoxon o test de Mann-Whitney, por
separado.
2. Más de dos muestras: se aplica el test de Kruskal-Wallis.

En el caso de que las muestras no sean normales y/o homocedásticas, pueden


transformarse todas las variables (en logaritmos, por ejemplo) y volver a testear
si con la transformación se han convertido en normales y/o homocedásticas.
Test de Welch (T test).
Valor de P
Valor de t
Conclusiones
ANOVA DE UN FACTOR

Contraste de hipótesis
•H0: la media de todas las muestras son iguales
•H1: al menos una de las medias es diferente del resto

Requisitos
•Normalidad de los datos, en cada una de las muestras
•Homocedasticidad (igualdad de varianzas entre todas las muestras)
Ejemplo

Queremos conocer si hay diferencias en esas


tres mediciones (3 años) de las mismas
localidades.
Existen diferencias
Abrimos la hoja Aves-Anova
en las tres medidas

?
Con análisis post-Hot veo la difrencia entre cada grupo
Conclusiones
TEST NO PARAMÉTRICOS

No se cumple alguno de los requisitos de normalidad y/o


homocedasticidad.
Test de Wilcoxon

Se aplica para comparar dos muestras con distribución no normal


y emparejadas (relacionadas).
Ejemplo

Se compara dos tratamientos de cámaras


trampa que captaron a mamiferos
frugivoros-dispersores en 2 temporadas
(lluvias secas).
Abrir hoja Wilcoxon-Frugivoría.
En past- ?
ventanilla
Conclusiones
Test de Mann-Whitney.

Se aplica para comparar dos muestras con distribución no normal,


independientes (no relacionadas).
Ejemplo

Se compara la herbivoría en dos tipos


de bosque (aguajal y tierra firme).

Abrir hoja Mann-Whitney-


Herbivoría.
?
Conclusiones
Test de Kruskal-Wallis.

Se aplica para mas de dos muestras independientes

Ejemplo

Se compara el efecto de la luz


solar sobre la diversidad de
plantas en 3 estratos
horizonatles (interior, borde,
exterior).

Abrir hoja Kruskal-Wallis-Luz


En el entorno de Past.
?
Conclusiones

You might also like