You are on page 1of 16

INTRODUÇÃO A MÉTODOS DE ESTIMATIVA DE RIQUEZA E ANÁLISE

DE BIODIVERSIDADE

Marcos Vinícius Carneiro Vital1

Lucas dos Anjos2

Bruno Vilela de Moraes e Silva3


1 - Instrutor; 2 - Monitor em edições anteriores (de 2009 a 2010); 3 - Monitor atual.

Apresentação

Esta apostila é apenas um breve guia para auxiliar os participantes deste curso
em futuras análises de dados. Pensem nisto como um pequeno caderno de anotações e
lembretes, que irá ajudá-los a continuar a trabalhar com os métodos estudados. Ele não
é, então, um guia completo que pode ser usado como material para se aprender estas
metodologias, ok? Se o seu objetivo é de fato estudar os métodos aqui apresentados,
veja a seção “bibliografia recomendada”, onde sugiro alguns bons livros de referência.

Como um complemento, esta apostila possui dois artigos em anexo. Ambos


estão escritos em português, e são uma ótima leitura básica para quem ainda esta se
familiarizando com a realização de análises de dados de diversidade biológica. Sugiro
que os dois sejam a leitura introdutória de quem está começando a explorar o assunto.
Alguns outros artigos científicos da área estão disponíveis no CD que você receberá ao
final deste curso, e juntamente com os livros sugeridos estes artigos seriam o próximo
passo para quem pretende se aprofundar no assunto.

E não se esqueça: este é um curso instrumental, focado nas metodologias


disponíveis e nas ferramentas computacionais que permitem aplicá-las, mas um método
não possui nenhum significado sem contexto! Durante o curso, vocês irão aprender a
aplicar estas análises corretamente; mas a única maneira de aplicá-las coerentemente
é conhecendo as teorias ecológicas que estão por trás – e este é um recado
especialmente importante para aqueles interessados em publicar artigos científicos sobre
diversidade biológica. Se, mesmo conhecendo a fundo cada detalhe destas ferramentas,
você ficar em dúvida sobre por que usá-las, pare um pouco e procure estudar as áreas da
Ecologia relevantes para entender o seu problema, enquanto deixa um pouco de lado as
metodologias relevantes.
Introdução

Conjuntos de dados que envolvem informações sobre várias espécies ao mesmo


tempo podem ser extremamente complexos, e muitas vezes estão associados a alguns
problemas que são bem particulares dos estudos sobre diversidade biológica. É muito
comum nos perguntarmos, por exemplo, se nós já coletamos o suficiente para se
conhecer a diversidade de um determinado ambiente; se a diversidade de um
determinado local é maior do que a de outro; se um conjunto de diversas variáveis
ambientais está relacionado à abundância das espécies estudadas, etc.

Neste curso, vamos abordar alguns métodos que são especificamente úteis para
estudarmos a diversidade de espécies. Partiremos de um breve apanhado geral sobre
métodos de coleta; falaremos de medidas de diversidade (e chamaremos a atenção para
se evitar o uso dos famosos índices de diversidade); sobre como é possível estimar a
riqueza de espécies; sobre como podemos levar em consideração a identidade das
espécies para compreender a relação de similaridade entre áreas; sobre como esta
similaridade pode ser de fato avaliada de maneira objetiva, a partir de testes estatísticos
de hipóteses; e como podemos explorar as relações entre a presença ou a abundância das
espécies com diversos fatores ambientais simultaneamente.

Tenha em mente de que este é um curso em constante construção, e que pode ser
moldado (dentro de certos limites, claro) às necessidades da turma. Não se surpreenda,
então, se curso abordar conteúdos que não se encontram aqui neste texto.

PLANEJANDO

Por onde começar? Nada melhor do que do planejamento! Qualquer trabalho de


pesquisa é enormemente mais eficiente quando planejado (e tanto faz se estamos
falando de um trabalho acadêmico – como um futuro artigo – ou de algo mais aplicado
– como um relatório de impacto ambiental). Isto parece bem óbvio, mas, por incrível
que pareça, esta é uma etapa freqüentemente negligenciada (algo que, após a realização
deste curso, eu espero que vocês nunca façam).

É claro que não existe uma “receita de bolo” para um bom planejamento, mas
dois pontos são fundamentais: a clareza dos objetivos (e, em algumas situações, das
hipóteses) e o conhecimento básico da metodologia de análise que será aplicada aos
dados coletados. Planejar uma coleta de dados sem ter estes dois pontos em mente pode
ter um resultado bastante frustrante: realizar um grande esforço de campo e depois
descobrir que, da forma como foram coletados, os dados são pouco úteis ou até mesmo
completamente inúteis!
A primeira coisa que devemos fazer ao planejar um trabalho, então, é responder
à pergunta: quais são os objetivos? Uma boa maneira de traçar objetivos é tentar definir
quais as perguntas queremos responder. Seria uma simples caracterização da
diversidade biológica de uma área? Uma comparação do que aconteceu com a riqueza
de um grupo antes e depois de um impacto ambiental? Ou queremos testar uma hipótese
baseada em uma teoria científica?

Em todo caso, a partir do momento que sabemos os objetivos de um trabalho,


podemos começar a pensar quais tipos de dados precisamos, e como iremos os analisar.
Neste momento é necessário se conhecer, mesmo que apenas de uma maneira geral, os
métodos de análise que poderão ser aplicados para atingirmos o objetivo do trabalho.
Esta é uma etapa importante, pois deve definir com mais clareza como os dados devem
ser coletados para realizarmos uma análise eficiente e confiável.

Por fim, não se deixe seduzir pelos métodos! Pode parecer estranho, mas é uma
coisa muito comum de se acontecer... Veja bem: uma metodologia nova pode ser bem
empolgante de se aprender e de se aplicar a dados reais, e todos nós sabemos que um
trabalho que apresenta uma metodologia sofisticada sempre passa uma impressão muito
boa. O foco de um trabalho, porém, não deve ser a metodologia, e sim os seus objetivos
(certo, podem sim existir trabalhos focados em metodologia, mas eles serão a exceção
para a maioria de vocês). O risco que todos corremos aqui é de pensar em um trabalho
como “quais dados devo coletar para se aplicar aquele método legal que acabei de
aprender?”, no lugar de pensar “qual método devo usar para responder aquela pergunta
que me interessa?”. E a diferença entre estas duas maneiras de pensar é enorme! A
primeira pode sim gerar um bom trabalho, mas sofre do risco de que o resultado final
sejam dados lindamente analisados, mas sem um objetivo claro, e sem gerar uma
contribuição interessante. Em suma, a ordem geral do planejamento deveria ser quase
sempre assim: (i) defina seu objetivo; (ii) pense em qual metodologia será mais
adequada para alcançá-lo; (iii) planeje a coleta de dados. Na prática, as etapas (ii) e (iii)
podem se misturar, o que não é um problema; só tomem cuidado para não saltar a
primeira!

Métodos de coleta em campo

Apesar de este curso lidar apenas brevemente com os métodos de coleta, vale à
pena chamar a atenção para dois pontos que afetarão as análises: o delineamento do
estudo e a organização dos dados coletados.
Delineamento amostral

A maior parte dos métodos – sejam os testes estatísticos “tradicionais” ou as


técnicas apresentadas neste curso – assume que os dados coletados são independentes.
Este é um assunto complexo, mais adequado para um curso de estatística, mas algumas
dicas podem ajudar:

- Sempre que possível, use um método aleatório de amostragem. E note que ir para
campo e escolher suas amostras “no olho” não é aleatório!

- Se você não pode coletar muitas amostras e a aleatorização gerou um desenho


amostral claramente tendencioso, aleatorize de novo!

- Se, por razões práticas, você não pode ter amostras aleatórias, deixe claro (na
metodologia do seu artigo ou relatório) como as amostras foram escolhidas, e leve isto
em consideração durante a interpretação dos seus resultados. Não é o ideal, mas também
não é o fim do mundo.

- Use o bom senso e seu conhecimento da biologia dos organismos de estudo para tomar
decisões como tamanho da área de amostragem, distância entre amostras, etc. Evite usar
um delineamento sem uma razão melhor do que “todo mundo que trabalha com este
organismo faz assim”.

Organização dos dados

A regra de ouro é: unidades amostrais nas linhas, e variáveis nas colunas.


Quando falamos de diversidade, isto quer dizer que cada coluna deverá representar uma
espécie (ou outra unidade taxonômica), com valores de abundância ou de
presença/ausência (normalmente simbolizados pelos números ‘um’ e ‘zero’,
respectivamente), enquanto cada linha representará uma unidade amostral (parcela,
quadrat, armadilha, etc). Alguns softwares podem exigir formatos diferentes, mas
converter um formato em outro é normalmente muito fácil.

É claro que sempre pode surgir a dúvida do que seria uma unidade amostral...
Imagine, por exemplo, que o seu experimento envolveu dispor armadilhas do tipo pitfall
em blocos de quatro em quatro armadilhas. O que seria uma unidade amostral? Cada
armadilha individual, ou cada bloco de quatro armadilhas? A decisão final é bastante
importante, mas se ela ainda não foi tomada, uma dica é: prefira organizar sua planilha
de forma a usar a menor unidade amostral possível, para depois agrupá-las se for
necessário. No caso deste exemplo, isto significaria incluir cada armadilha em uma
linha. Então, se o fato de elas estarem dispostas de maneira agrupada fizer com que
você venha a considerar cada bloco como uma única unidade amostral, você teria que
alterar sua planilha para que cada bloco seja somado; felizmente, esta é uma
modificação bem fácil de ser feita. Agora, se você por algum acaso já criou a planilha
inserindo cada bloco como uma unidade amostral, e mais tarde decidiu que cada
unidade seria representada por uma armadilha, aí sua vida estará um pouco complicada,
pois esta não é uma modificação possível de ser feita, e a planilha obrigatoriamente teria
que ser refeita do zero!

Então, se você está em dúvida, lembre-se sempre: se você inseriu os dados em


uma planilha e depois descobriu que deverá somar coisas que deveriam estar juntas,
então você tem uma tarefa fácil pela frente; mas se você fez o contrário, e depois precisa
separar coisas que ficaram juntas, poderá ter uma grande dor de cabeça, principalmente
se não tiver as planilhas originais de campo facilmente disponíveis. Algo similar
acontece com as informações de abundância: transformar dados de abundância em
informações de presença/ausência é bem simples, mas o contrário é impossível. Se você
ainda não tem certeza se vai ou não usar informações como o número de indivíduos,
então preserve-a, pois ela pode ser facilmente deixada de lado mas não pode ser
recuperada se foi descartada na construção da planilha.

E jamais se esqueça: o gerenciador de planilhas é seu melhor amigo! Durante o


curso vocês terão a oportunidade de aprender alguns “truques” muito úteis para se lidar
com bancos de dados. Se, após a digitação dos seus dados, você está fazendo uma longa
e tediosa transformação ou adaptação, valor por valor, então existe uma chance enorme
de que exista uma maneira mais simples de fazer isso! Coisas como transformar dados
de abundância em dados de presença e ausência, calcular médias e medidas de variação,
somar informações de amostras diferentes, são tarefas triviais, que podem ser feitas com
poucos comandos no Excel ou outro gerenciador de planilhas de sua preferência. Este
curso não será um guia completo neste sentido, mas deve servir para mostrar algumas
funções importantes. E, mais importante do que isso, espero poder mostrar como vocês
podem procurar por funções que façam o que vocês precisam!

Por fim, é importante sempre se lembrar que, diferente dos métodos de análise,
os métodos de coleta são muito dependentes de sua experiência de campo. Um bom
livro pode te ensinar como realizar um teste de aleatorização de matrizes para testar
hipóteses ou um estimador de riqueza de espécies pelo método bootstrap, mas apenas a
experiência prática irá lhe ensinar como usar uma rede de neblina ou como capturar uma
libélula com um puçá!

Conhecendo as ferramentas

Existe uma quantidade incrivelmente grande de softwares que podem ser


aplicados em análises de dados de diversidade biológica. Neste curso, nosso foco será
em três programas. Começaremos com o Excel (ou, para os usuários do Open Office, o
Calc, que apresenta as mesmas funcionalidades); mais do que apenas uma ferramenta
para inserirmos dados, podemos realizar muitas análises usando um gerenciador de
planilhas, e vamos exercitar algumas de suas funcionalidades mais úteis – além de usar
e abusar de seus gráficos. Vocês verão que muitos métodos simples podem ser
realizados no próprio gerenciador de planilhas, sem que precisemos partir para
programas mais específicos. Isto é particularmente útil quando lidamos com uma nova
proposta de método que ainda não está implementada em outros programas.

Dividiremos o restante da nossa atenção para dois softwares gratuitos: o


EstimateS e o PAST. O primeiro realiza a maior parte dos cálculos de índices de
diversidade e estimadores de riqueza, e já é uma ferramenta bastante estabelecida na
área. O segundo é um programa mais recente, que ainda recebe várias atualizações, e
nos permitirá realizar análises de agrupamento, de ordenação e de aleatorização de
matrizes (dentre várias outras funções que não chegaremos a explorar). Ambos possuem
suas vantagens e suas limitações em meio a uma imensa quantidade de ferramentas
disponíveis (dentre pagas e gratuitas), e vamos apontar alguns destes aspectos, além de
indicar qual caminho tomar quando estes softwares não atenderem às nossas
necessidades. No final desta apostila estão algumas sugestões importantes neste sentido.

ESTIMANDO, MEDINDO E REPRESENTANDO A BIODIVERSIDADE

Índices de diversidade

Uma das questões centrais por trás da análise de dados de diversidade biológica
é encontrar a maneira ideal de representá-la. Afinal, como podemos medir diversidade?
Sabemos que é possível “quebrar” o conceito de diversidade em dois principais
componentes distintos: a riqueza (ou seja, o número de espécies) e a equabilidade (a
abundância – ou outra medida de representatividade – relativa), e avaliar cada
componente separadamente. Por outro lado, a idéia de lidar com os dois componentes
ao mesmo tempo, em um único valor que represente a diversidade “completa” é
tentadora... E é exatamente esta idéia que nos leva aos famosos (e excessivamente
usados) índices de diversidade.

Pode parecer uma maneira um tanto radical de se começar a abordar o assunto,


mas se eu fosse dar um único conselho para alguém que ainda está aprendendo a lidar
com dados de diversidade biológica, ele seria: não use índices de diversidade. Sim, eles
podem, de fato, ser necessários para um trabalho; mas na esmagadora maioria das vezes
em que os calculamos, eles não são. De uma maneira geral, boa parte dos trabalhos que
apresentam índices de diversidade poderia muito bem ser realizada usando apenas
riqueza de espécies (ou um estimador de riqueza, se for o caso). Portanto, se você
pretende calcular um índice de diversidade, tenha um bom motivo pra isso (e, por favor,
jamais use o velho argumento de que “todo mundo usa”).

A expectativa de um índice de diversidade é que ele represente mais do que o


mero número de espécies, e leve em consideração também a abundância relativa e a
raridade das espécies estudadas. Apesar de interessante, esta idéia costuma complicar
bastante as coisas, pois os índices tendem a ser sensíveis ao tamanho amostral, e seu
valor, por si só, pode não ter significado biológico claro.
Como calcular

Na prática, calcular um índice de diversidade é bem simples. No EstimateS,


basta marcar a opção “Diversity Indexes”, na aba “Other Options” na opção “Diversity
Settings” do menu “Diversity”, e depois realizar a análise normalmente (selecionando
“Compute diversity stats”, no mesmo menu). No PAST, selecione os dados a serem
analisados, e clique na opção “Diversity indices” no menu “Diversity”.

Índices de diversidade: generalizando para perfis de diversidade

Um dos grandes problemas ao lidarmos com um índice de diversidade é a


escolha exata de qual índice utilizar. Ao tomarmos uma decisão, estamos
automaticamente descartando uma quantidade enorme de outros índices disponíveis, e
nem sempre esta é uma escolha facilmente justificável. Da mesma forma, se usarmos
vários índices ao mesmo tempo, podemos ter respostas contraditórias!

O grande fator que diferencia os índices é o peso relativo que ele dá para a
equabilidade em relação à riqueza; isto torna possível uma contradição entre as medidas
de diversidade geradas por dois índices distintos aplicados a um mesmo conjunto de
dados. O que é interessante aqui é que cada índice de diversidade possível é apenas um
caso particular de se pesar relativamente a riqueza e a equabilidade de um conjunto de
unidades amostrais. Uma das maneiras de representar isto é usar os perfis de
diversidade. Um perfil de diversidade apresenta os valores de diversos índices
possíveis para o mesmo conjunto de dados, a partir da variação destes pesos relativos;
ou seja, no lugar de calcularmos o índice de Shannon ou o Índice de Simpson, nós
traçamos um gráfico que mostra os valores de diversidade destes índices, de outros
índices conhecidos e de diversos índices que nunca foram descritos formalmente!

Fazer isto é simples: podemos, por exemplo, usar a série de Hill, uma equação
matemática bem simples que irá calcular um índice diferente para cada valor de a que
escolhermos. Quando o valor de a é zero, o índice é igual á riqueza de espécies. Quando
a vale um, temos um valor quase idêntico ao índice de Shannon. Quando a vale 2,
temos o índice de Simpson. E desta forma, temos diversos valores possíveis, de acordo
com o peso que damos para a equabilidade, de acordo com o parâmetro a!

Esta é uma forma bastante elegante de apresentar a diversidade de um ambiente,


e evita boa parte das armadilhas presentes nos índices de diversidade tradicionais.
Como calcular

Na prática, é bem fácil. A série de Hill é uma fórmula bem simples, e pode ser
implementada no Excel com a maior facilidade. Ela é descrita pela equação:

       
  …    /

Onde Na é o valor do índice para o parâmetro a e ps é a proporção de indivíduos


da espécie s. Basta calcular o valor do índice para cada valor de a desejado, e depois
traçar um gráfico com o perfil das amostras.

A outra opção é traçar a série de Rényi (ela e a série de Hill são intercambiáveis)
pelo PAST: basta selecionar os dados, e selecionar a opção “Diversity profiles” no
menu “Diversity”. O programa retorna o gráfico e os valores, usando cada coluna para
traçar uma série.

Calculando curvas de abundância relativa

Uma maneira prática e elegante de se apresentar riqueza e equabilidade ao


mesmo tempo, é em uma forma gráfica conhecida como curvas de espécie/abundância
(e vários outros nomes, como diagrama de Whittaker, diagrama de dominância, e alguns
outros). Basta construirmos um gráfico de dispersão (também podemos trabalhar com
gráficos de barras, ou de linhas; é mais uma questão de preferência do que de uma
maneira correta), e, no eixo x, ordenamos as espécies da mais abundante para a menos
abundante; no y, colocamos a abundância de cada espécie. A forma geral do gráfico é
um ótimo indicador da estrutura da comunidade, e pode ser comparado com modelos
teóricos que tentam descrever, por exemplo, como a competição pode determinar a
estruturação de uma comunidade biológica.

Vale mencionar que nos casos nos quais uma ou poucas espécies possuem uma
abundância muitas escalas de grandeza maior do que a da maioria das outras, pode ser
interessante representar o logaritmo da abundância no lugar dos valores brutos, pois esta
operação matemática irá reduzir a diferença entre as espécies.

Como calcular

Aqui não precisamos de nenhum programa específico, basta um gerenciador de


planilhas. Precisamos apenas ordenar as abundâncias, e criar o gráfico como descrito
acima. Caso você se tenha algum interesse de comparar os dados com um modelo
teórico de distribuição de abundâncias relativas, dê uma olhada na opção “Abundance”
do menu “Model” do PAST – mas esta metodologia tem algumas limitações muito
sérias, que discutiremos no curso.
Curvas de acúmulo de espécies e rarefação

Uma pergunta que costuma atormentar quem lida com dados de diversidade é:
“será que eu coletei o suficiente”? Nunca há uma resposta fácil, mas uma curva de
acúmulo de espécies pode servir como um indicador do quanto seu esforço amostral é
capaz de revelar sobre um ambiente. Uma curva de acúmulo de espécies representa a
riqueza esperada para um determinado esforço amostral (ou número de indivíduos), com
um intervalo de confiança. Esta é uma maneira útil de tentarmos definir se mais
amostras são necessárias, ou se já nos aproximamos do que deve ser a real riqueza de
espécies em um determinado ambiente. Por fim, nós também podemos utilizar esta
técnica para compararmos dados com diferentes esforços amostrais – desde que
tenhamos acesso aos dados brutos.

Como calcular

O EstimateS sempre calcula a rarefação pelo método de “Mao Tau”, com


intervalo de confiança de 95%. Então basta pegar estes resultados, e criar um gráfico em
outro programa (como o Excel). Perceba, porém, que o que usarmos no eixo x como
referência fará toda a diferença na interpretação do resultado! Se usarmos o número de
amostras, temos uma boa maneira de ter acesso à eficiência de coleta. Por outro lado, se
pretendemos comparar amostras com diferentes esforços, o ideal é usar o número de
indivíduos coletados no eixo x (discutiremos a razão disso no curso).

Mais rarefação

Existe um caso particular de rarefação no qual precisamos apenas do número de


espécies e do número de indivíduos coletados. Esta é uma maneira muito grosseira de se
comparar dados de esforços amostrais diferentes para os quais não temos acesso aos
dados brutos – mas uma maneira grosseira pode ser bem interessante se não temos outra
alternativa.

Como calcular

No PAST, basta selecionar os dados para análise, e usar a opção “Individual


Rarefaction” no menu “Diversity”. Há uma opção de gráfico com intervalo de confiança
de 95%; alternativamente, podemos levar os dados para o Excel e criar um gráfico por
lá.
Estimando a riqueza

Existem dezenas de métodos de estimativa de riqueza de espécies, que tentam


dar um “chute calculado” para quantas espécies existem em um ambiente com base nos
dados coletados por você. Assim como no caso dos índices de diversidade, devemos ter
bons motivos para usar um estimador, e evitar incluí-lo em um trabalho sem que ele
necessariamente seja útil. Usar um estimador pode ser interessante, por exemplo, para
complementar uma curva de rarefação que vise discutir a eficiência de coleta e uma boa
maneira de comparar

Como calcular

O EstimateS automaticamente calcula uma série de estimadores de riqueza e


seus respectivos intervalos de confiança. Então, na prática, basta utilizar o valor final,
ou construir o gráfico como no caso da rarefação.

AGRUPANDO, ASSOCIANDO E COMPARANDO A BIODIVERSIDADE

Análises de agrupamento

Em algumas situações, queremos comparar diversas áreas ou comunidades


biológicas diferentes, e tentar agrupá-las de acordo com suas semelhanças e diferenças
no que diz respeito à composição de espécies (ou mesmo em relação a outros conjuntos
de variáveis que coletamos). Neste caso, lidar apenas com riqueza e equabilidade pode
parecer insuficiente, então tentamos lidar com todos os componentes ao mesmo tempo,
a partir de uma matriz de distância (ou de similaridade).

A partir de uma matriz de distância, podemos criar uma representação gráfica


hierárquica (conhecida como dendograma) que agrupa as áreas mais semelhantes.
Devemos ter o cuidado de atentar para as várias etapas deste tipo de análise: a escolha
do método de distância e do método de agrupamento merecem atenção especial.
Também é importante lembrar que, apesar de permitir a comparação entre áreas,
amostras ou ambientes, esta não é uma análise que realiza um teste de hipóteses.

O processo de uma análise de agrupamento começa com a escolha de uma


medida da distância entre os objetos a serem medidos (e repare que distância e
semelhança são medidas intercambiáveis, então podemos partir de uma métrica de
similaridade e transformá-la em distância). Neste momento, o mais importante é que
escolhamos uma métrica que seja compatível com o que estamos comparando. Se
nossos objetos são unidades amostrais com informações de presença e ausência de
espécies, então devemos usar uma medida adequada para comparar presenças e
ausências (como os coeficientes de Jaccard e de Sorensen), e não uma medida
geométrica como a distância euclidiana, por exemplo. Se, por outro lado, temos
estimativas da abundância, então seria interessante aplicar um coeficiente como o de
Morisita, que é adequado para levar em consideração a abundância das espécies.

Durante esta etapa também pode ser necessária a transformação dos dados, uma
operação que tem que ser encarada com extrema cautela! A transformação pode ser
necessária para se tentar “aliviar”, por exemplo, o efeito da presença de uma espécie
muito mais abundante do que as demais – como a aplicação do logaritmo, que diminui a
variação dos dados. Mas lembre-se de dois detalhes importantes: primeiro, a
transformação é, por definição, uma distorção dos dados originais, e os novos resultados
devem ser vistos com cautela; segundo, nem sempre o efeito de uma espécie muito
abundante deve ser considerado um problema, pois este pode ser exatamente um
aspecto muito importante daquele ambiente!

Prosseguindo, após a escolha da métrica, ainda temos que escolher o método de


agrupamento! Como vamos agrupar hierarquicamente vários objetos, temos que ter um
conjunto de regras de por onde começar e como calcular a distância de um objeto
qualquer para o agrupamento de outros dois objetos. Por exemplo: imagine que temos
três unidades amostrais, A, B e C. A está a uma distância 2 de B e 4 de C; B está a uma
distância 5 de C. Então podemos começar nosso agrupamento “juntando” A e B pela
distância 2; mas agora qual seria a distância do grupo A+B para C? Seria 4? Seria 5? Ou
ainda, seria a média, 4.5? Este exemplo apresenta a lógica básica de três métodos: o
método do vizinho mais próximo (a distância seria 4), o do vizinho mais distante (a
distância seria 5) e o método UPGMA (a distância seria 4.5).

Por fim, devemos perceber que a combinação entre métrica, distância e método
de agrupamento pode alterar drasticamente o resultado, então devemos tomar estas
decisões com cautela. Um passo final que pode ser útil é medir o coeficiente de
correlação cofenético, uma medida do quanto o agrupamento gerado tem de semelhança
com a matriz original de distância. Quando maior o valor do coeficiente, melhor, e
valores baixos indicam inconsistências, sugerindo que as escolhas não foram boas.

Como calcular

O PAST tem uma boa variedade de métricas de distância, o que o torna bastante
flexível para construirmos agrupamentos. Basta selecionar os dados e escolher a opção
“Cluster analisys” no menu “Multivar”. O programa nos dará diversas opções de
métricas, algumas opções de métodos e o coeficiente de correlação cofenético.
Testes de aleatorização de matrizes

Apesar da análise de agrupamento não nos permitir testes de hipóteses, existem


maneiras de trabalhar com matrizes de distância com este fim. Dois testes são
particularmente interessantes na análise de dados de comunidades: o teste de Mantel e a
Análise de Similaridade (a ANOSIM). O primeiro permite que a matriz de distância
“biológica” seja comparada com outras matrizes (poderia ser uma de distância física,
por exemplo), e cria uma aleatorização para determinar a probabilidade de que aquela
associação seja encontrada apenas por acaso (ou seja, um bom e velho valor de p). Já a
ANOSIM faz o mesmo, mas comparando a matriz biológica com uma classificação (por
exemplo, em tipos de ambiente).

Estes são métodos interessantes para serem aplicados em situações nas quais
tenhamos testes de hipóteses. O teste de mantel é uma boa maneira de testar efeitos de
autocorrelação espacial e da relação da composição de espécies com variáveis
ambientais. Já a ANOSIM é uma análise interessante para se comparar a composição
entre ambientes diferentes, ou ambientes que estejam sob algum fator específico (como
ambientes antropizados VS não antropizados, por exemplo). Ambos são, por definição,
testes de significância, então o conhecimento básico sobre a lógica deste tipo de análise
é bem importante para a sua interpretação (especialmente no que diz respeito aos
valores de p).

Como calcular

No PAST, as duas análises aparecem no menu “Multivar”, com os nomes de


“one-way ANOSIM” e “Mantel test”. Nos dois casos, todos os dados devem estar na
planilha, e as matrizes diferentes (no caso do mantel) ou os grupos (no caso da
ANOSIM) devem ser marcados com cores diferentes, usando a opção “Row
color/symbol” no menu “Edit”.

Técnicas de ordenação

Existe uma ampla variedade de métodos que permitem um resultado


razoavelmente semelhante: a visualização dos objetos (que neste caso podem ser as
espécies, as unidades amostrais, as variáveis ambientais ou mesmo alguma combinação
destes elementos!) em um mapa. A idéia é medir a distância entre os objetos, e
representá-los em sistemas de coordenadas (normalmente optamos por representar em
duas dimensões, pela facilidade de interpretação; mas lidar com três dimensões também
é possível graficamente).

Não vamos explorar a fundo os detalhes matemáticos destes métodos (que se


apóiam em algum conhecimento de álgebra de matrizes), mas sim nos concentrarmos na
lógica básica por trás deles. De uma maneira geral, as técnicas de ordenação permitem a
visualização de relações multidimensionais em um número reduzido de dimensões. Isto
é possível, em parte, porque é muito comum que várias das nossas variáveis estejam
relacionadas entre si! Por exemplo: imagine que você esteja interessado em saber o
efeito das características ambientais (clima, topografia, etc.) sobre a riqueza de espécies,
e tenha coletado uma quantidade enorme de variáveis ambientais. Seria possível
relacioná-las à riqueza de espécies uma a uma, mas seria uma tarefa trabalhosa e com
algumas “armadilhas” estatísticas. A temperatura, por exemplo, pode estar
correlacionada com a altitude, então seria redundante usar as duas de maneira
independente. Uma maneira de se lidar com isso é tentar reduzir o número de dimensões
ambientais, criando representações que “resumam” as nossas variáveis. Isto é
perfeitamente possível com técnicas como a Análise de Componentes Principais ou a
Análise de Coordenadas Principais, por exemplo, que nos permitiriam substituir as
variáveis ambientais por uma quantidade menor de variáveis que representem a maior
parte da variação das variáveis originais.

Cada método disponível possui suas particularidades, vantagens, desvantagens e


objetivos específicos, que discutiremos durante o curso. Apesar de não ser obrigatório
ter o conhecimento da estrutura matemática por trás destes métodos, devemos nos
esforçar para conhecer os seus detalhes lógicos. Isto é importante porque nem todas as
técnicas de ordenação são adequadas para todos os conjuntos de dados, e, assim como o
que acontece com os métodos de ordenação, a escolha do método poderá alterar
dramaticamente o resultado final! Uma boa maneira de encarar este tipo de problema é
ter em mente que quanto mais complexa é uma ferramenta estatística, mais devemos
atentar a respeito dos seus detalhes para usá-la com segurança. Para os que têm mais
aversão à matemática, uma boa alternativa é partir para textos escritos para aplicações
biológicas; mesmo assim, tenha em mente que algum esforço será necessário no sentido
de se entender um pouco dos cálculos realizados nos “bastidores” destes métodos

Como calcular

Boa parte dos métodos mais comuns de ordenação (PCA, PCoA, NMDS, análise
de correspondência, análise de correlação canônica) estão facilmente acessíveis na
primeira parte do menu “Multivar” do PAST. Então basta selecionar o conjunto de
dados e escolher a opção desejada.
Indo além!

Como dissemos no início desta apostila, este não é um material de estudo, e sim
uma série de indicações práticas para o planejamento, execução e análise de projetos
envolvendo estudos de biodiversidade. Todos os interessados em trabalhar seriamente
na área deveriam, então, recorrer à bibliografia especializada. Nesta seção,
apresentamos algumas sugestões.

Bibliografia recomendada (livros)

- Ecologia – de Indivíduos a Ecossistemas. Michael Begon, John L. Harper & Colin.


R. Townsend, 2007, ARTMED. Este não é um livro específico sobre biodiversidade ou
ecologia de comunidades, mas sim um livro texto geral sobre Ecologia, e o que eu
recomendo com uma das melhores referências gerais para se estudar esta área.

- Community Ecology. R. J. Putman, 1994, Chapman & Hall. Uma boa referência
geral para o estudo de Ecologia de Comunidades, e uma visão geral sobre as teorias
que servem de pano de fundo para os métodos que estudamos aqui.

- Measuring Biological Diversity. Anne E. Magurran, 2004, Blackwell Science. O


livro da Magurran apresenta ao mesmo tempo os métodos e um pouco das teorias por
trás, o que o torna uma leitura bem importante.

- Ecological Methodology, 2nd edition. Charles. J. Krebs, 1999, Benjamin Cummings.


Este é um livro (como o próprio nome sugere!) bem mais metodológico, e uma boa
leitura que é voltada para quem trabalha com Ecologia.

- Métodos estatísticos multivariados, 3ª edição. Bryan J. F. Manly, ARTMED. Não


conheço esta versão em português, mas se a tradução foi bem feita, então é uma
aquisição que vale à pena! Por ser um livro de estatística, sue foco é exclusivamente na
metodologia, mas com o diferencial de explicar os métodos de maneira bem acessível.

- Numerical Ecology, 2nd edition. Pierre Legendre & Louis Legendre, 1998, Elsevier.
O “peso pesado” da área! É um livro que apresenta boa parte dos métodos tratados no
curso com um grau de detalhe impressionante. Não é uma boa primeira leitura, por ser
mais detalhista, mas é uma ótima fonte para se aprofundar.

Bibliografia recomendada (artigos)

Seria impossível criar uma lista completa de artigos que podem ser úteis para quem
desejar se aprofundar nesta área... No lugar disso, então, criamos uma seleção de artigos
em formato pdf que estão disponíveis no CD que vocês receberam durante o curso. Eles
são apenas um apanhado pequeno de sugestões de leitura, e devem ser apenas o ponto
de partida, ok?
Softwares utilizados

EstimateS: http://viceroy.eeb.uconn.edu/EstimateS

O EstimateS tem um excelente manual on-line, que explica todos os métodos


disponíveis e de quebra apresenta uma grande quantidade de referências bibliográficas
úteis (muitas delas já com o link para baixar!).

PAST: http://folk.uio.no/ohammer/past/

O PAST possui um manual em formato pdf que pode ser baixado no site oficial,
além de alguns exemplos de aplicações e de dados. Como este é um software em
constante construção, recomendo que a página principal seja acessada regularmente,
para acompanhar o lançamento de novas versões.

Outros softwares indicados

Como vocês viram, os programas que utilizamos neste curso possuem seus
méritos e suas limitações, e são apenas dois dentre várias opções disponíveis. Algumas
das outras opções gratuitas são:

The R Project for Statistical Computing: http://www.r-project.org/

O R é um ambiente e uma linguagem de programação de código aberto voltado


para aplicações estatísticas. O interessante do programa é seu funcionamento modular:
existem vários pacotes disponíveis, e cada um deles se especializa em um tipo de função
ou área de pesquisa. Apesar de ser um programa um pouco mais difícil de se aprender a
usar (seu funcionamento básico é em linhas de comando), após algum aprendizado ele
se torna uma das mais flexíveis ferramentas de análise de dados existente! E para os
iniciantes, existem alguns projetos de interface gráfica (isto é, para usar o R a partir de
menus, ícones e janelas), como o R commander.

As sugestões de pacotes mais importantes para os interessados em trabalhar com


diversidade biológica são: ‘vegan’, ‘ade4’ (e este possui uma interface gráfica, o
‘ade4TkGUI’) e o BiodiversityR (que também funciona com uma interface gráfica).

Biodiversity Pro: http://www.sams.ac.uk/research/software

Este é um programa bem amigável e fácil de usar, e que realiza uma parte
razoável das análises que vimos no curso. Infelizmente suas funções são um pouco
limitadas, mas vale uma olhada.
Entre em contato com os instrutores

Após o curso, o trabalho está apenas começando! Sinta-se à vontade para entrar
em contato conosco (Marcos e Bruno), tirar dúvidas, propor trabalhos, etc.

Marcos Vinícius Carneiro Vital atualmente é professor adjunto da Universidade


Federal de Alagoas, em Maceió. Ministra disciplinas de Biomatemática, Bioestatística e
Ecologia para o curso de graduação em Ciências Biológicas, e disciplinas de Estatística
Multivariada e de Modelagem em Ciências Biológicas para o curso de pós-graduação
em Diversidade Biológica e Conservação nos Trópicos. Realiza pesquisas nas grandes
áreas de Ecologia, Evolução e Biologia da Conservação, com abordagem voltada para o
uso de técnicas de modelagem.

Email para contato: marcosvital@gmail.com

Bruno Vilela de Moraes e Silva (monitor do curso) atualmente é estudante do curso


de pós-graduação em Diversidade Biológica e Conservação nos Trópicos na
Universidade Federal de Alagoas, em Maceió. Possui experiência na área de
Herpetologia, com ênfase em ecologia de anuros.

Email para contato: brunovilelasilva@hotmail.com

Lucas dos Anjos (ex-monitor do curso) atualmente é estudante de graduação em


Ciências Biológicas na Universidade Federal de Goiás, em Goiânia. É estagiário do
Laboratório de Ecologia Teórica e Síntese, e tem interesse em Métodos Quantitativos
em Ecologia, Macroecologia e Biomatemática.

Email para contato: bio-lucas@hotmail.com

You might also like