Manual Usurio FITOPAC 2.1.2

March 30, 2018 | Author: Otávio Marques | Category: Matrix (Mathematics), Text File, Spreadsheet, Microsoft Excel, Window (Computing)


Comments



Description

FitopacShell 1.6.4 Manual Versão Preliminar G.J.Shepherd (2006) 1 2 Pr rsã eli o m in ar Ve Table of Contents Introdução .................................................................................................. 5 FitopacShell - Introdução Instalação Configuração Considerações gerais Os tipos de dados usados por Fitopac A Tela Principal o menu principal Os botões de funções 5 7 7 8 8 9 10 10 Instalando e Configurando Fitopac ........................................................... 7 Utilizando Fitopac ....................................................................................... 8 comando arquivos .................................................................................... 12 Preparando e lendo dados ....................................................................... 14 Preparando dados Lendo e convertendo dados num arquivo FPD Examinando, editando e imprimindo dados Formatos de Arquivo Excel Lotus 123 PC-Ord ASCII/ASCII delimitado SYSTAT NT-SYS Cornell MVSP Convertendo dados crus em matriz Tipos de dados em matrizes Variáveis mascaradas e Marcadores Importando e exportando matrizes Usando a planilha matriz arquivos matriz cabeçalho eliminando linhas ou colunas matriz transformar matriz juntar matriz espécies raras Nomes suspeitos Tela "Nomes suspeitos" Tela "Nomes duplicados" O formulário de resultados Criando Gráficos Criando gráficos diretamente Diagramas de dispersão Modificando as escalas A Tela de Opções em Diagramas de Dispersão 14 14 15 16 16 16 16 17 17 17 17 17 18 19 20 21 22 26 27 28 28 29 32 33 34 35 37 39 39 41 43 43 Trabalhando com matrizes....................................................................... 18 Visualizando resultados de análises....................................................... 37 Gráficos em Fitopac ................................................................................. 39 Pr rsã eli o m in ar Ve 3 ....Introdução Biplot de Gabriel A Tela de Ordenação As Opções Visualizando e interpretando resultados de uma ordenação ..... 47 Calculando Distâncias e Coeficientes de Semelhança.............................................. 54 Ordenação 64 Dados faltando em análises multivariadas.................................................................... 75 referências bibliográficas 4 Pr rsã eli o m in ar Ordenação ................................................. 48 Análise de Agrupamentos (Cluster Analysis) ...................... 70 70 71 75 Bibliografia ................................................. 69 janela decorana janela twinspan Ve Chamando outros programas..............Diagramas de vetores Gráficos de linha Dendrogramas Gráficos de Barra Gráficos de caixa Gráficos 3D Calculando Parâmetros Fitossociológicos Coeficientes de semelhança e distâncias em Fitopac A tela Coefs Modificando e manipulando arquivos de coeficients Coeficientes e distâncias usados em Fitopac Introdução a análise de Agrupamentos Tela de Análise de Agrupamentos A Tela do Dendrograma Analisando grupos em dendrogramas Colorindo matizes Opções para dendrogramas 45 45 45 45 46 46 47 48 48 49 49 54 54 56 58 60 62 64 65 65 67 68 Parâmetors fitossociológicos ("PARAMS").............................................................. Adicionalmente. pastas.. Se quiser usá-los. facilitando o uso do pacote em Windows. etc. FitopacShell pode chamar os programas "DECORANA" e "TWINSPAN" do pacote Cornell para fazer análises que não estão disponíveis dentro do próprio FITOPAC. especialmente nas versões "Windows". M. Os programas individuais do pacote original (Prepare. Embora foi testado com diversos conjuntos de dados. Caderno e Params) continuam os mesmos . Hill e NÃO são parte do FITOPAC. pois ainda apresenta diversas falhas e "bugs". Os programas que compõem o pacote FITOPAC são descritos no Manual de Usuário distribuído em formato "Adobe Acrobat" [pdf] junto com este pacote. precisa obter e instalar cópias (só copiar) dentro da pasta com os arquivos de FITOPAC. que devem ser utilizados com um certo grau de cautela. sem a necessidade de entrar no DOS. junto com o FitopacShell. Esta versão do FITOPAC. Recomenda-se o uso da versão de Oksanen & Minchin (1997). junto com os programas do próprio FITOPAC.Introdução FitopacShell é um programa para Windows que "traduz" parte do pacote FITOPAC para o ambiente Windows e que "embrulha" o resto dos programas originais do FITOPAC. O atual arquivo de ajuda descreve somente o FitopacShell. O programa é considerado Pr rsã eli o m in ar Ve 5 . este pacote deve ser tratado como preliminar.ainda são programas DOS mas foram recompilados para permitir o uso de mais memória. estão sendo liberadas para uso geral.O.Introdução FitopacShell . Os programas "DECORANA" e "TWINSPAN" são da autoria do Dr. sem restrições. acomodando matrizes maiores (até 1000 x 1000 na atual versão). que tem diversas correções e modificações que tornam os programas mais confiáveis. permitindo utilizar todos os recursos de Windows para manipular arquivos. br.6 em referências bibliográficas.isto é.083-970 SP. Embora não prometo que vou poder resolver individualmente todos os problemas que surgem no uso do FitopacShell e FITOPAC. junto com uma cópia do conjunto de dados sendo utilizados e uma descrição de que estava sendo feito quando ocorreu o erro para:george@unicamp. Shepherd Depto. pode ser distribuído livremente. é importante que os usuários me avisam de "bugs" e dificuldades encontrados. Brasil."Freeware" . Para notícias e discussão do Fitopac. mas não pode ser vendido ou modificado sem autorização expressa do autor. Todos os direitos autorais são reservados pelo autor. Se possível. encaminhe uma descrição do erro encontrado. © George J. e a data de publicação é 30/11/2006. de Botânica IB da UNICAMP CxP 6109 Campinas 13.0" Agradecimentos a Eduardo Dalcin! 6 Pr rsã eli o m in ar Ve . consulte o forum fitopac no site: "http://taxondata. Esta versão de FITOPAC deve ser chamada FITOPAC 1.org/forum/index. especialmente se estes causam erros mais sérios de cálculo ou inutilizam parte dos recursos dos programas.php?board=12. sem custo. Instalando e Configurando Fitopac Instalação Ainda não está pronto – Sorry ! Configuração Ainda não está pronto – Sorry ! Pr rsã eli o m in ar 7 Ve . Utilizando Fitopac Considerações gerais Em geral. armazenando os resultados de todas as análises feitas desde o início até desligar o programa. estas exigem. mas é necessário tomar muito cuidado com o arranjo de dados em colunas. o "notepad" que vem junto com todas as versões de Windows) ou usando um processador de texto mais sofisticado como "Microsoft Word" ou "Open Office Writer" e gravando como "somente texto". Formulário de resultados texto dados arquivo Fitopac arquivos texto Fitopac Os tipos de dados e os arquivos usados estão descritos na seção "Os tipos de dados usados por Fitopac " e o uso da saída texto na seção "Visualizando resultados de análises ". Gráficos são gravados individualmente. para cada indivíduo. Estes dados são armazenados em arquivos "FPD" {FitoPac-Dados} e são o ponto de partida para todas as análises em Fitopac. É importante lembrar que os resultados de uma análise NÃO são gravados automaticamente – na maioria dos casos o usuário deve solicitar explicitamente a gravação do arquivo de resultados. e é cumulativa. a entrada destes dados e via arquivos "ASCII" que podem ser criados com um editor de texto (por ex. ou podem ser copiados para a área de transferência ("clipboard") e colados em documentos. e gravar a versão final como texto para utilizar esta opção com sucesso. A saída em forma de texto pode ser visualizada usando um botão marcado "visualizar resultados". podendo ser gravada em forma de arquivo "rtf" ou "txt". quando se executa análises em Fitopac. altura e um código de espécie e são agrupados por parcela ou por ponto de amostragem [método de quadrantes]. algum arquivo de dados no formato apropriado. Detalhes do formato de arquivo estão no manual da versão 1. Nesta versão. que contem as medidas de indivíduos que foram incluídos no levantamento [levantamentos por parcelas ou por quadrantes ou variantes destes métodos] ou de contatos individuais [levantamentos que utilizam o "método de agulhas"]. se deseja manter um registro da análise que foi realizada.0 do Fitopac. Planilhas como "Excel" podem ser usadas. Tipicamente. distribuído junto com a atual versão. de entrada. Os tipos de dados usados por Fitopac Fitopac utiliza três tipos de conjuntos de dados: 1. além de outros arquivos que podem ser utilizados em outras análises. "dados crus" – são os dados resultantes de levantamentos fitossociológicos. tem medidas de diâmetro. e produzirão resultados na forma de texto e gráficos. 8 Pr rsã eli o m in ar gráficos Ve arquivos de dados . Estas matrizes geralmente são geradas a partir de uma matriz FPM. "PC-Ord" e "NTSYSpc". Estas funções podem ser usadas via o menu principal ou utilizando os botões de função. 3. na prática pode ser utilizado para qualquer situação onde análise multivariada ou taxonomia numérica é apropriado. permitindo que Fitopac seja utilizado junto com outros programas de análise estatística ou multivariada. quando se deseja utilizar o programa para análises fenéticas (taxonomia numérica). incluindo Excel. ou importadas/exportadas em alguns formatos (NTSYSpc. utilizando o comando/botão "Criamat". ou para dados morfológicos.2. Estes dados são armazenados em arquivos "FPM" {FitoPac-Matriz}. químicos. Assim. etc. embora Fitopac foi concebido principalmente para análise de dados fitossociológicos. Matrizes deste tipo podem ser importadas/exportadas para diversos formatos. Estas matrizes também são o formato natural para dados ambientais. utilizando o comando "Coef". "SYSTAT". "matrizes de distâncias ou coeficientes de semelhança" – estes matrizes contém dados que representam distâncias ou grau de semelhança entre amostras/objetos e são essenciais para o uso de análise de agrupamento o para algumas formas de ordenação. na forma de uma matriz com uma linha para cada amostra e uma coluna para cada espécie. São armazenadas em arquivos "FPC" {FitoPac-Coeficientes}. "matrizes amostra x espécie" – contem dados representando a quantidade de cada espécie presente em cada uma das amostras. onde foram medidas algumas características do ambiente para cada uma das amostras de um levantamento. As interligações entre os tipos de dados/arquivos são resumidas neste gráfico: A Tela Principal A tela principal que abra quando o programa é acionado permite escolher arquivos e o tipo de análise que quer fazer. SYSTAT). e geralmente são gerados a partir de arquivos FPD. Pr rsã eli o m in ar Ve 9 . como PCO. sem a necessidade de passar por todos os passos do menu principal. além de permitir abrir arquivos de resultados de análises já concluídas. Se não tiver um arquivo selecionado.chama os programas "DECORANA" e "TWINSPAN" do pacote de programas da universidade de Cornell. estão disponíveis somente as opções de configuração do FITOPAC. Estes botões estão agrupados de acordo com o tipo de função que executam.permite selecionar um ou mais arquivos de dados para análise ou processamento. Dados .CADERNO e CRIAMAT para arquivos FPD. paRametros . ou se um arquivo foi selecionado em primeiro lugar.este comando é usado para ter aceso aos programas de manipulação de dados . Os principais comandos são :- Arquivos . Este comando está disponível somente com arquivos FPD. exportar. Arquivos – funções de abrir. Note que a maioria dos itens disponíveis no menu principal estarão disponíveis somente quando um arquivo de dados for selecionado. Estes programas não fazem parte do FITOPAC e você deve obter cópias (disponíveis grátis na Internet) e copiá-los na mesma pasta onde está instalado o próprio FITOPAC. Pr rsã eli o m in ar . 10 Ve similaridade e distâncias).o menu principal O menu principal fornece diversas opções de análise ou manipulação de dados. coNfigurar . antes de tentar usar este comando. MATRIZ para os arquivos FPM. Multivar . de acordo com o tipo de arquivo selecionado.permite modificar a configuração do pacote FITOPAC. Os comandos do menu também podem ser acionados via os botões de função. e PREPARE para conversão de dados crus (DAD e NMS).chama o programa "PARAMS" para calcular parâmetros fitossociológicos para dados de indivíduos de um levantamento. importar arquivos de diversos tipos. ler.chama os programas de análise multivariada "COEF" (cálculo de coeficientes de Cornell . e podem variar. e sua disponibilidade depende do tipo de arquivo selecionado. Disponível somente para arquivos FPM e FPC. "CLUSTER" (análise de agrupamentos) e "ORD" (ordenação). Os botões de funções Muitas das tarefas comuns podem ser acionados diretamente pelo uso dos botões de funções. fazer análise de agrupamento com programa "CLUSTER" (somente arquivos FPC). fazer ordenação com programa "ORD" (arquivos FPM – PCA. CA. Análise multivariada – (opções disponíveis com arquivos que contém matrizes de dados ou coeficientes de semelhança/distância) – calcular coeficientes de semelhança/distância com programa "COEF". arquivos FPC – PCO) ou utilizar os programas "DECORANA" e "TWINSPAN" do pacote Cornell [estes programas não são parte do FITOPAC !] Ve Fitossociologia – (opções disponíveis com arquivos de dados do tipo "FPD") – fazer análises fitossociológicas (calcular parâmetros. Pr rsã eli o m in ar 11 .) e visualizar dados ou gerar matrizes a partir dos dados.Modificar dados – modificar matrizes de dados ou de coeficientes de semelhança ou distância. etc. Dados crus – são os arquivos de nomes e dados numéricos usados para gerar um arquivo FPD. e incluem: SYSTAT ASCII delimitado (ou "CSV") MVSP Dados p/ PREPARE. onde se pretende usar o programa "PREPARE" para fazer esta conversão.Gerar uma nova matriz de dados em branco (para entrada de Ve . etc.comando arquivos O comando Arquivos abre diversos subcomandos que permitem manipular arquivos – Abrir– abre um arquivo de dados FITOPAC.matriz (*.coeficientes (*. Excel Lotus123 PC-Ord Cornell ASCII NTSYS Outros formatos também podem ser lidos. que contem coeficientes de semelhança ou distâncias entre objetos para análise de agrupamento ou ordenação. dados).PDF) distribuído dentro deste pacote. Veja "Preparando Dados " para mais informações. respetivamente. 12 Pr rsã eli o m in ar Novo .FPC). Para a maioria de análises. Tem as extensões "NMS" e "DAD". . que contem dados de indivíduos de um levantamento fitossociológico FITOPAC .FPD).NMS") no subcomando "Nomes".dados (*.DAD") no subcomando "Dados" e um arquivo de nomes (de famílias e espécies .FPM). Os detalhes do formato e preparação deste arquivos são descritos no "Manual de Usuário" em formato "Adobe Acrobat" (. é necessário especificar um arquivo de dados numéricos (geralmente com a extensão ". FITOPAC .geralmente com a extensão ". que contem uma matriz de dados para análise multivariada. estes arquivos serão dos tipos: FITOPAC .No caso de dados de indivíduos que ainda não foram convertidos para o formato FPD (dados crus). pode modificar este nome. abre uma tela que permite examinar arquivos contendo gráficos produzidos pelos programas do pacote FITOPAC Saida . Se quiser.Você pode modificar o nome do arquivo de saída. etc.rtf" que pode ser lido e importado diretamente por programas como "Word".rtf" que pode ser lido e importado diretamente por programas como "Word".exportar uma matriz FITOPAC para outro formato (PC-Ord. e é indicado no terceiro painel da tela principal. Geralmente este terá o formato "XXX.Exportar Matriz .de modo semelhante. eXaminar arquivo. Este arquivo de listagem contém todos os resultados das análises que mandou imprimir durante a atual sessão de uso de Fitopac. gerado automaticamente pelo FITOPAC. Note que os programas do FITOPAC geralmente vão anexar os resultados produzidos e não vão sobrescrever os resultados obtidos anteriormente a partir de uma outra análise do mesmo arquivo. onde XXX é o nome do arquivo original de dados e a extensão LST indica uma listagem. examinar Gráfico.LST". escolhendo ou criando um novo nome utilizando este comando. Pr rsã eli o m in ar Sair – sair do programa Ve 13 . Pode imprimir ou gravar os resultados como texto ou como um arquivo "Rich Text Format . alem de gravá-lo em formato "Rich Text Format .abre uma tela mostrando o conteúdo de um arquivo de texto e permite fazer editoração deste texto.) Visualizar resultados– abre o arquivo de resultados acumulados durante a atual sessão. quando se usa a extensão padrão para os arquivos de entrada. É este arquivo FPD que é utilizado pelos outros programas do pacote. Detalhes do programa Prepare estão descritas no manual da versão 1. Estes são arquivos "ASCII" e podem ser produzidos usando qualquer editor ou programa capaz de gravar dados neste formato. os dados de medidas de plantas individuais geralmente usados para análises fitossociológicas. Para iniciar o processo. os dados numéricos descrevendo os indivíduos. Dados em forma de matrizes podem ser entrados diretamente. pode usar o botão "Dados para Prepare" ou "Arquivos/Dados p/ Prepare" no menu principal. onde pode escolher os arquivos de entrada.Preparando e lendo dados Preparando dados A relação entre os principais tipos de dados em Fitopac pode ser vista na seção tipos de dados usados por Fitopac.6 como arquivo PDF.e outro contendo os dados numéricos (com extensão "DAD"). O programa principal então chama o programa DOS "Prepare" para completar o processo de conversão dos dados. é necessário preparar arquivos contendo os nomes das espécies encontradas (num formato específico) e. A preparação inicial dos "Dados Crús". Lendo e convertendo dados num arquivo FPD Para produzir um arquivo "FPD". são necessários dois arquivos de entrada: um contendo os nomes dos táxons no levantamento (com extensão "NMS"). As extensões não são obrigatórios. O programa abre uma pequena janela . esta tela fecha e o próximo passo é de "clicar" no botão "Prepare" ou em "Dados/Preparar" no menu principal. está descrita no manual do Fitopac v. Pr rsã eli o m in ar . Em síntese. ie. 1 que é distribuído junto com Fitopac 1. num segundo arquivo. Microsoft Word (gravar como "somente texto") ou até planilhas com "Excel" (mais difícil pois a saída pode ser difícil de controlar). Estes arquivos depois são convertidos num arquivo FPD pelo programa PREPARE. como "notepad" do Windows. 14 Ve Os detalhes da preparação destes arquivos estão descritos no manual da versão 1 do Fitopac que acompanha a atual versão na forma de um arquivo "PDF" (manual PDF). Após de escolher os arquivos e usar o botão "ok". mas tornam ao uso do programa mais fácil pois o Fitopac sabe quais arquivos procurar e gera todos os outros nomes automaticamente. utilizando a planilha de dados do Fitopac. as seguintes operações são implementadas – Famílias – editar nomes Espécies – editar nomes.e. Fitopac utiliza o programa DOS "Caderno". etc). embora não esteja formalmente descrito naquele manual. Editando os dados. que pode ser acionado através do botão Caderno ou menu "Dados/Caderno". ainda está incompleta e só permite usar algumas opções do menu principal: Filtro – especifica um filtro para limitar os dados que são lidos – por ex.A atual versão do Fitopac gera diversos nomes de arquivos. Este programa abre numa janela DOS. O programa Caderno. diâmetro. ordenar e exportar dados de levantamentos. ordenar (por família e depois espécie ou diretamente por espécie) e gravar os nomes num arquivo de texto Amostras – editar nomes Dados (numéricos) – ordenar (por diversos critérios como altura. infelizmente. apagando ou modificando os nomes que aparecem na janela principal do programa Prepare. pois o FitopacShell é configurado para utilizá-las automaticamente e vai gerar nomes mais apropriados como parte do processamento pós-Prepare. dentro desta opção.tmp". bastante usada para determinar se a amostragem de uma área está razoavelmente completa ou não. Sugiro não modificar estes nomes. Caderno pode produzir uma Curva de Coletor. excluir indivíduos com DAP < 10cm e altura < 5 m e incluindo somente parcelas 10-20. Esta última opção é bastante útil se quiser analisar os dados com outros programas como "SYSTAT" que podem ler o arquivo ASCII resultante. do final do arquivo até o início Pr rsã eli o m in ar Ve 15 . e seu uso é parecido com os outros programas mencionados no manual v1. Imprimir (para um arquivo) e exportar (para um arquivo ASCII). isso pode ser feito principalmente com os dados numéricos e permite somente certas opções Curva – calcula e mostra uma Curva de Coletor. Ler – ler os dados Editar – Editar os dados – no momento. Curvas de Coletor O programa tem opções para produzir diversos tipos de curva que incluem: "normal" – a curva construída a partir dos dados na sua ordem original de entrada no arquivo de dados Inversa – a curva construída a partir dos dados em ordem inversa – i. alguns estranhos como "ZZZZFPD. Examinando. número de indivíduo. editando e imprimindo dados Para examinar. Além das listagens dos dados. listar. e o resto da planilha contendo dados numéricos ou variáveis texto. e se não tiver. seguindo o gradiente. além de algumas outras restrições. Fitopac é capaz de intrpretar somente planilhas simples. {Novidade da versão 1. com os nomes das variáveis (descritores) na primeira linha. onde o "n" é determinado pelo usuário. O programa tenta determinar se o arquivo tem o formato correto. Chega perto a ser um formato universal para pacotes estatísticos. A combinação randômica-n + normal + inversa é particularmente interessante pois ajuda a detectar gradientes de riqueza ou descontinuidades num gradiente. permite tentar abrir o arquivo como uma planilha Lotus 123 simples. pois quase todos são capazes de ler estes arquivos e alguns programas (como PC-Ord) ainda usam este formato como padraõ. Excel Arquivos que usam o formato da planilha do Microsoft Office.XLS) (*. Capaz de ler somente planilhas simples. (Ambos usam a mesma extensão "wk1") (*. (*. Note que o programa não é capaz de interpretar corretamente planilhas que tem mais que uma linha de cabeçalho. a importação/exportação é limitada a casos de matrizes de estrutura simples. Lotus 123. O padrão usado pelo programa Microsoft Excel. células fundidas ou formatação mais sofisticada.SYD) Lotus 123 Este formato foi usado pelo (então) popular programa de planilha.6} (*.randômica – produzirá uma curva onde a ordem de entrada das amostras é aleatória randômica – n – repete a curva randômica "n" vezes. se as amostras foram entradas em seqüência. Excel. Amplamente usado por outros programas estatísticos.WK1) 16 Pr rsã eli o m in ar Ve . e não é possível trabalhar com estruturas de dados muito complexas.SYS. células fundidas ou formatação mais sofisticada. *. os nomes dos objetos (amostras. com os nomes das variáveis (descitores) na primeira linha e os nomes dos objetos (amostras ou UTOs) na primeira coluna. Na verdade são arquivos Lotus 123 com dados sobre o número de colunas e linhas em células específicas. Note que o programa não é capaz de interpretar corretamente planilhas que tem mais que uma linha de cabeçalho. Fitopac pode importar e exportar diversos formatos de arquivo para permitir intercâmbio de dados com outros programas que tem facilidades que o Fitopac não possui. Formatos de Arquivo Embora tem seus próprios formatos de arquivo que maximizam as informações armazenadas e facilitam o uso do pacote. UTOs) na primeira coluna e o resto dados numéricos ou de texto.WK1) PC-Ord São arquivos usados pelo programa PC-Ord. Em todos os casos. as outras opções são diferentes combinações destas curvas básicas. TXT. Ve 17 . *.). Na forma delimitado.MVS). (é equivalente à opção "somente texto (*. cada número é separado por um caractere (tab. etc. formatação. sem códigos de controle. *.CSV) SYSTAT O formato usado pelo pacote estatístico "SYSTAT" (*. e texto é colocado entre aspas ("texto"). Pr rsã eli o m in ar O formato "Cornell" (*.SYD. vírgula. que pode ser especificado.NTS) Cornell MVSP O formato usado pelo programa MVSP (*. É equivalente ao formato CSV usado por Excel e diversos outros programas.ASCII/ASCII delimitado Arquivos ASCII contem somente caracteres.SYS) NT-SYS O formato usado pelo programa de taxonomia numérica "NT-SYS" (*. (arquivos *. espaços e quebra de linha. utilizado pelos programas do pacote Cornell como TWINSPAN e DECORANA.DTA). etc.txt)" em MS-Word). é necessário converter os dados para o formato de uma matriz "amostras x espécies". área basal ou. Esta matriz tem as amostras (por ex.Trabalhando com matrizes Convertendo dados crus em matriz Embora o ponto de partido para análises fitossociológicos normalmente seja o arquivo de dados crus (arquivo "FPD"). bastante cautela na remoção de espécies raras – em muitos casos é melhor gerar uma matriz completa e depois testar o efeito de remoção de espécies usando o comando "outros/remover espécies raras" na planilha.) nas linhas e descritores (caracteres. No caso de levantamentos usando quadrantes. sendo utilizado em praticamente todas as situações onde se deseja usar análise multivariada ou taxonomia numérica. é possível gerar matrizes com características específicas – por exemplo eliminando indivíduos com diâmetros e/ou alturas abaixo ou acima de limites especificados no filtro. e não pode ser considerado como uma amostra representativa da comunidade Para converter dados crus de um arquivo FPD em matriz. Embora número de indivíduos seja comumente empregado. Nestas circunstâncias. pelo menos em termos de biomassa. carregue primeiro o arquivo FPD que deseja converter e use o botão "Criamat" ou item "Dados/Criar Matriz" do menu para abrir a tela de criação de matrizes – As principais opções disponíveis são: Quero eliminar espécies raras – permite retirar espécies raras enquanto a matriz é preparada. podem indicar uma mudança em condições ambientais que poderia passar despercebida se todas estas espécies fossem eliminadas. etc. para realizar análises mutivariadas ou diversas outras tipos de estudo. basta retirar todos os indivíduos com diâmetros abaixo de 10 cm quando se gera a matriz (note que isso não funcionaria com um levantamento do tipo "quadrantes"!). pois normalmente contribuem poucas informações úteis e tendem a dificultar a realização e interpretação da análise. Este recurso é particularmente útil quando se deseja limitar a análise a um subconjunto dos dados – por exemplo. embora seria possível tratar os pontos de amostragem como amostras. esta matriz tem objetos (Amostras. o programa abre uma tela que oferece algumas opções de critérios para escolher as espécies que serão descartadas. em vez de eliminar estas espécies imediatamente. volume ou presença/ausência.. UTOs. Botão "Filtro" – permite estabelecer um filtro de dados antes de gerar a matriz. Esta operação está disponível somente para arquivos com dados de levantamentos com parcelas ou de "agulhas". Com um filtro. É prática comum retirar as espécies raras quando se utiliza análises multivariadas. variáveis) nas colunas. e normalmente registra o número de indivíduos de cada espécie presentes em cada amostra. para comparar um levantamento com parcelas onde o limite de inclusão de indivíduos foi de três cm de diâmetro com outro que utilizou 10 cm. No caso de uma matriz tipo presença/ausência. e em casos onde muitas espécies raras ocorrem um uma ou poucas amostras. Ao optar para remoção das espécies raras. Recomenda-se. volume talvez dariam uma aproximação melhor à verdadeira importância das espécies. 18 Pr rsã eli o m in ar Ve tipo de matriz – permite escolher entre matrizes de número de indivíduos. este parâmetro pode dar uma importância exagerada para espécies que são numerosas mas ocorrem somente como indivíduos de pequena porte. portanto. área basal. o programa coloca o valor "1" em qualquer célula da matriz onde uma espécie ocorre e "0" em células onde não ocorre. não se recomenda este procedimento pois cada ponto tem um numero baixo e fixo de indivíduos. Volume é calculado como a soma dos volumes dos indivíduos. tratando cada um como um cilindro de diâmetro constante. . Em termos mais gerais. especialmente em comunidades com grande diversidade. sendo muito numerosas. indivíduos. mais ainda. parcelas) como linhas e as espécies como colunas. A eliminação de espécies raras deve ser feito com muito cautela – não existem critérios objetivos para decidir o nível de corte usado. é interessante designar estas variáveis como "marcadores" . As vezes. mas este processo também tem limitações. usando a planilha (botão direito ou menu "transformar "). etc. temperatura. Se é essencial transpor uma matriz para realizar algum tipo de análise. Pr rsã eli o m in ar (verde) Ve 19 . Quando variáveis texto estão presentes. Isso só é permitido se a matriz for inteiramente numérica. Os diferentes tipos de variável são destacadas na planilha pela cor do texto. peso. para fazer análise de agrupamento das variáveis). Fitopac trata uma matriz como tendo as variáveis ou descritores nas colunas da matriz. volume. sendo que variáveis quantitativas tem o texto em preto e os outros tipos em outras cores. usando o botão direito para selecionar variáveis individuais na planilha ou o botão "excluir" na tela de edição dos dados do cabeçalho da matriz (veja "matriz cabeçalho "). não é permitido transpor matrizes mistas. mas conterão somente dois valores : 0. Na maioria das análises numéricas.) Registram somente presença/ausência e "dado faltando" 2) Multiestado – Variáveis que contém valores discretos. Isto é. não existe uma ordem evidente para os diferentes estados – um exemplo seria cor de flor. Os diferentes tipos de variável podem ser misturados na mesma matriz e serão tratadas em diferentes maneiras.veja "Variáveis mascaradas e Marcadores"). embora freqüentemente não apresentam escalas uniformes. contendo números em algumas linhas e texto em outras. informações são perdidas quando se converte no sentido "quantitativo –> multiestado –> binário" e não podem ser recuperadas. presente/ausente. etc. dependendo da análise sendo feita.0 e 1. variáveis binárias podem ser convertidas em variáveis quantitativas. mas podem ser usadas para "etiquetar" pontos em gráficos e outras funções onde é importante identificar observações individuais (neste caso.0. a principal sendo que não é possível transpor matrizes com variáveis texto. 3) Quantitativas (contínuas) – contém medidas continuas como comprimento. Podem armazenar valores como nomes de família em arquivos com espécies como objetos. além dos nomes dos objetos. mas em muitos casos são úteis como "etiquetas" suplementares. 4) Texto – Variáveis contendo texto não podem ser usadas para análises numéricas. Embora variáveis texto podem ser misturadas com variáveis numéricas. etc. é necessário excluir as variáveis texto primeiro. pode ser interessante transpor a matriz. Dados multiestado ordenados devem ser designados como quantitativas. tratando o que eram os objetos nas linhas como descritores. Não é possível tratar uma coluna deste tipo como uma variável e. Mais especificamente. De maneira semelhante. nas colunas (por exemplo. e que são tratados no Fitopac como não-ordenados.Tipos de dados em matrizes Fitopac distingue entre 4 tipos de variáveis: 1) Binárias – 0 ou 1 ( ou sim/não. note que esta mistura impõe algumas restrições na matriz. as colunas resultantes seriam heterogêneas. portanto. mais conveniente para números maiores de variáveis Os diferentes tipos de variáveis podem ser convertidos de um para outro. nomes de localidades em matrizes de levantamentos. variáveis texto são descartadas. geralmente representando um número limitado de classes. Mudança importante na versão 1. Nas versões anteriores. permanecendo presentes e mascaradas na próxima leitura do arquivo. sem excluí-las da matriz. Variáveis marcadores tem uma função semelhante.assim não será incluída na análise mas estará disponível nas tabelas de resultados para permitir levar a análise em diante.6 ! Usuários de versões anteriores de Fitopac devem notar que a atual versão trata variáveis mascaradas diferentemente quando a matriz é gravada..Variáveis mascaradas e Marcadores Em muitos casos. etc. Variáveis podem ser mascaradas utilizando o botão direito na planilha ou o botão "mascarar" na tela de "cabeçalho da matriz" (mais conveniente quando se deseja mascarar um número maior de variáveis). Este comportamento é muito útil em casos onde tem vaiáveis auxiliares que se quer projetar sobre os resultados de ordenações e outras análises – se são designadas variáveis marcadores. serão transportadas para as matrizes de resultados e podem ser utilizados para colorir gráficos ou separar diferentes classes de objeto. Estas variáveis podem ser mascaradas – indicando para o programa que estas variáveis não devem ser usadas. onde se quer fazer uma análise de Componentes Principais somente com os dados quantitativos mas quer depois "marcar" os indivíduos como masculina ou feminina na análise dos resultados. Um exemplo seria uma variável indicando sexo numa matriz de medidas morfológicas. Note que as propriedades "mascarada" e "marcadora" são independentes. sem a necessidade de gerar uma outra cópia da matriz contendo somente as variáveis selecionadas. mas a situação mais comum seria aquela onde a variável é marcadora e mascarada. PCA) incluída na análise não incluída na análise incluída na análise não incluída na análise Ve tabelas de resultados não será transportada para as matrizes de resultados não será transportada para as matrizes de resultados será transportada para matrizes de resultados será transportada para matrizes de resultados . O comportamento das variáveis é resumido na seguinte tabela: mascarada não não sim não não sim sim sim 20 Pr rsã eli o m in ar MARCADORA ANÁLISE (EX. transformadas. sendo copiadas para matrizes de resultados também. e podem ser aplicadas em qualquer combinação. a variável binário é mascarada e designada uma variável marcadora . mas recebem um tratamento diferenciado. variáveis mascaradas são mantidas dentro da matriz e marcados como mascaradas no arquivo. São variáveis usadas para marcar objetos na matriz. Neste caso. uma matriz pode conter variáveis que são códigos que definem o tipo de objeto em cada linha. e que são tratadas como sendo permanentemente ligadas com estes objetos. Na atual versão. ou alguma variável que não queremos por outros motivos incluir dentro de uma dada análise. estas variáveis foram descartadas quando a matriz foi gravada. Este recurso é particularmente útil quando se deseja analisar um subconjunto das variáveis de uma matriz. armazenando somente uma metade de uma matriz quadrada e simétrica. De qualquer modo. Embora o programa tenta detectar diversos tipos de erro (por exemplo. Os principais tipos de arquivo que podem ser lidos ou convertidos em matrizes Fitopac são : FPM .delimitado Excel Lotus 123 SYSTAT NT-SYS PC-Ord Cornell MVSP Pr rsã eli o m in ar 21 Ve .em geral. é praticamente impossível prever todas as possíveis combinações de dados e formatações que podem ser empregadas e que podem gerar problemas na importação. etc.Fitopac Matriz . É necessário entrar somente a metade da matriz (à esquerda. e será exportada em formato correto para uso com CLUSTER e ORD no Fitopac (*. é o formato preferido para todas as operações com matrizes. A planilha Fitopac pode ser usado quando se quer entrar com uma matriz de coeficientes de similaridade ou distância que não foram calculados pelos programas de Fitopac (por exemplo. use a opção "Exportar" da tela de modificação de matrizes de coeficients (veja "Modificando e manipulando arquivos de coeficientes " para mais detalhes). tirados de um livro ou publicação). simétrica.arquivo padrão FPM do Fitopac.Importando e exportando matrizes Fitopac pode importar e exportar matrizes em diversos formatos e pode ser usado para "traduzir" os arquivos de um pacote para outro. ASCII e ASCII . com diversas linhas de cabeçalho ou com subtabelas. nomes duplicados). recomenda-se que a matriz importada seja inspecionada com muito cuidado para verificar se não ocorreu algum tipo de erro durante a "tradução".FPC).Arquivos FPC contém coeficientes de semelhança ou distâncias. Matrizes com formatação mais elaborada. porém. gráficos.Fitopac Coefs . que existem severas limitações no tipo e formatação de matriz que pode ser importado . não serão interpretadas corretamente e devem ser simplificadas antes de tentar importá-las. Quando se quer transformar uma matriz de coeficientes numa matriz quadrada. em baixo do diagonal). É importante notar. FPC . Fitopac só consegue ler/gravar matrizes simples onde a primeira linha contem os nomes das variáveis (colunas) e a primeira coluna contém identificadores dos objetos (amostras. UTOs) e o resto da matriz contém somente dados. modificar os valores.. caso queira preservar a versão original. A planilha de FitopacShell é simples. Abre a janela Modificar Cabeçalho Juntar . mas a próxima vez que a matriz é carregada. mas permite uma série de modificações úteis. transformar ou eliminar ou mascarar linhas ou colunas individuais. 22 Pr rsã eli o m in ar Ve . Em casos onde quer manter as modificações somente para uso imediato em alguma análise. não podem ter variáveis tipo "texto") Transformar– permite transformar a matriz inteira ou somente variáveis selecionadas. pode ser vantajosa utilizar a opção de "transformar" no menu "pop-up" obtido quando se clica no botão direito com o mouse.. disponíveis a partir de um menu "pop-up" Sair– volta ao programa principal. Note que eventuais mudanças feitas na matriz NÃO SÃO GRAVADOS automaticamente – se quiser manter as mudanças permanentemente.permite alterar os dados de cabeçalho da matriz (título. entre outras. Esta opção está disponível somente para matrizes inteiramente numéricas (i. Transpor– usado para transpor as linhas e colunas da matriz.) e permite editar os nomes das colunas e linhas da matriz. clique na parte correspondente da figura: Gravar– grava a matriz atual. perguntará se você não quer gravar a matriz modificada.permite combinar dados de duas matrizes em diferentes maneiras. o botão de gravação fica destacado e ao sair da planilha sem gravar. Cabeçalho. ordenar as linhas e colunas.e. transformar os dados e diversas outras operações que podem ser úteis para manipular matrizes. Quando o programa detecta alguma mudança na matriz.Usando a planilha A planilha permite examinar os dados. é necessário gravar a nova versão da matriz . Se quiser transformar somente uma ou duas variáveis. com diversas opções de formato indicadas no menu "pop-up" que aparece Visualizar. incluindo modificações dos dados. etc.. Para ver as funções dos diferentes botões. vai voltar ao seu estado original. Abre a janela de fusão de matrizes Outros– fornece uma série de outras funções para manipular dados e matrizes . não é necessário gravar.imprime a matriz no arquivo de resultados e abre uma tela mostrando os resultados.ou com o mesmo nome (vai sobrescrever a matriz original). responsável. Abre uma janela de Opções de Transformação. ou com outro nome. Esta opção é fornecida para casos onde se quer criar uma matriz quadrada e simétrica depois de importar um arquivo de coeficientes de similaridade ou distância. a parte da matriz acima do diagonal será destruída e substituída pela parte abaixo do diagonal. Espelhar . Esta opção é útil para localizar valores inesperados em matrizes grandes que poderiam causar problemas com transformações. não simétrica. mas ambas tem exatamente as mesmas funções. pode destacar células com valores negativos. com somente a parte inferior preenchida. use esta opção.normalmente a planilha mantém os nomes das colunas e linhas separadas e estes não podem ser modificados.ao clicar o botão direito do mouse. mas normalmente deve ser desligada para não deixar a planilha visualmente confusa e "poluída" . e variáveis marcadores e mascaradas em azul pálido.a planilha mostra os variáveis mascaradas ou designadas como "marcadores" com uma cor de fundo diferente do resto da planilha. Opcionalmente. que são: Pr rsã eli o m in ar Ve 23 . mas não mascaradas em verde. Se você utiliza esta opção com uma matriz retangular. aparece um menu do tipo "pop-up" que traz uma serie de opções relacionados com a coluna ou linha ativa (onde está a célula ativa. com texto marcado com outra cor). Para completar o triângulo superior da matriz. As cores usadas são mostradas abaixo: Editando nomes. clicando na caixinha apropriada no painel "destacar". variáveis marcadores. Este normalmente é importado como uma matriz triangular. Variáveis (colunas) ou objetos (linhas) mascaradas ficam com fundo "ciano".Destacando variáveis e valores. Este menu está dividido numa seção "colunas" e outra de "linhas". Em casos onde se quer modificar algum nome. Este recurso permite fazer diversas modificações rapidamente quando envolvem somente uma coluna ou linha da matriz. com valores iguais a zero e com dados faltando. Menu "pop-up". esta opção desliga a proteção dos nomes e religa quando clica de novo. mas não eliminada da matriz.(iável) Marcador – designa uma variável como variável marcador que será mantida junto com os dados originais em analises multivariadas. para servir de marcador ou "etiqueta" em gráficos.aplicar uma transformação à coluna/linha Inserir . O programa pede uma chave secundária que é usada para ordenar quando os valores da chave primária (atual coluna ou linha) são iguais. Casos especiais são a substituição de valores faltando pela média da variável ou por zero. Neste caso.acrescentar uma nova linha no final da matriz Transformar . etc. Útil em diversos testes estatísticos. 24 Ve Eliminar . Copiar – copia uma linha coluna para outra. Acrescentar . Permutar – permuta os valores dentro da própria variável. Linhas mascaradas tem um fundo de outra cor e não podem ser modificadas.Mascarar .insere uma coluna/linha antes da coluna/linha atual Acrescentar – acrescenta uma nova linha/coluna no final da matriz Ordenar . a linha é mascarada.Elimina uma ou mais linhas da matriz Pr rsã eli o m in ar Var. utilizando diversos tipos de transformação.mascarar a linha atual da matriz. tabelas.transformar a linha atual. Substituir – substitui um valor por outro.ordenar as linhas da matriz pela coluna atual ou ordenar as colunas da matriz pela linha atual. Pode ser desmascarada mais tarde.(veja "variáveis mascaradas e marcadores" para maiores explicações) . Desmascarar – vai desmascarar todas as colunas atualmente mascaradas. Transformar . escolhido. etc. 4.preenche a coluna/linha com números aleatórios.. etc.simplesmente preenche a coluna/linha com o valor "dado faltando". mas se escolher outros valores.15. sem ter que digitar "dado faltando" para todas as células que não tem dados. Útil quando se quer randomizar a ordem das linhas/colunas da matriz (acrescenta uma coluna/linha.preenche a coluna/linha com uma seqüência de números onde o valor inicial e o tamanho de incremento pode ser alterados. 1 – preenche com valores de "1" (um) 0 – com valores = 0 (zero) Seqüência simples . Pr rsã eli o m in ar Ve Aleatório . Verificar se há nomes de coluna/linha duplicados.5.. O valor preestabelecido é 1 para ambos.. 25 .. onde Fitopac geralmente vai interpretar os nomes como dados. Útil quando se importa um arquivo com nomes numéricos. Outra Seqüência . procurando nomes que estão duplicados. mas não há diferença entre gaussiano e uniforme.. onde a probabilidade de obter qualquer número entre 0 e 1.Formato de coluna – ajustar detalhes da formatação da coluna (largura. preenche com números aleatórios e ordena por aquela coluna/linha) ou simplesmente quando precisa de uma variável ou linha com números aleatórios para testes estatísticos.permite preencher uma coluna com diversos tipos de valores. desde a célula escolhida até o final da coluna.) Converter – converte uma variável (coluna) de um tipo para outro. É útil quando se precisa acrescentar uma coluna ou linha que contem uma seqüência de números que pode ser usada para identificar a seqüência original das amostras quando se produz gráficos ou para reordenar a matriz ou para limpar uma coluna/linha inteira.2. antes de entrar com novos valores.10. No caso de variáveis binários. permitindo preencher somente uma parte ou de diferentes partes de uma coluna em diferentes maneiras... na prática a duplicação de nomes leva a dificuldades na identificação de objetos nas tabelas e pode causar problemas sérios na fusão de matrizes... pode produzir outras seqüências .3. As oito subopções são: Dado Faltando . dando uma seqüência de 1.. Note que algumas conversões não são possíveis – texto em quantitativa.. Usar para nome de linha – transfere a coluna para a lista de nomes dos objetos (linhas).percorre os nomes das variáveis ou objetos. a proporção de 1:0 pode ser escolhida para dar variáveis com características diferenciadas. etc. Útil quando precisa entrar dados muito incompletos. Em variáveis quantitativas pode optar por números aleatórios gaussianos (distribuição normal. Preencher . Constante – preenche a coluna/linha com um valor constante escolhido. inicial = 0 e incremento = 5 dá a seqüência 0.por ex.5. O preenchimento é feito a partir da posição do cursor – isto é.. Embora Fitopac não proíbe nomes assim.preenche a coluna/linha com uma seqüência de números de 1 a "n". com média de desvio padrão a escolher) ou uniformes.0 é igual para todos. Abre uma tela de correção de nomes se encontra alguma duplicação. Coefs (*.TXT.WK1) Cornell (*.SYS) NT-SYS (*.XLS) Lotus 123 (*. salvar Como . Ao escolher este comando. *.SYD. ASCII e ASCII delimitado (*.NTS) PC-Ord (*. 26 Pr rsã eli o m in ar Ve . abre-se uma pequena janela que permite escolher o formato de arquivo que deseja gravar : Fitopac . SYSTAT.DTA) MVSP (*.MVS).matriz arquivos Matriz . etc.grava a matriz atual como um arquivo padrão do Fitopac (*.FPC).permite exportar a matriz para outros formatos.FPM) Fitopac . Mantém o mesmo nome de arquivo (se o original foi um arquivo FPM) e você pode escolher se vai sobrescrever o arquivo original ou utilizar um outro nome para criar um arquivo novo.CSV) Excel (*.Arquivos O item "Arquivos" no menu principal da janela Matriz oferece diversas alternativas :Salvar .Matriz (*.FPM). *.WK1) SYSTAT (*. usados por outros programas como NTSYS. Note que estes mudanças valem somente para arquivos Fitopac. Embora estas informações não sejam essenciais. Também permite gravar este arquivo em formato "rtf" que pode ser lido diretamente por MS-Word e outros processadores de texto. são incluídas na saída impressa e ajudam a lembrar o que cada matriz representa.imprime a matriz diretamente na impressora.Imprimir .FPM). Note que os números de colunas ou linhas não podem ser alterados nesta opção. Visualizar impressão . imprimir o conteúdo de um arquivo de resultados. embora alguns outros formatos tem pelo menos um título (SYSTAT.por exemplo "parcelas" e "espécies". NT-SYS). pessoa responsável e os nomes usados para descrever as linhas e colunas da matriz . especialmente em casos onde tem muitas matrizes representando diferentes levantamentos ou conjuntos de dados. matriz cabeçalho Esta opção permite alterar os dados de cabeçalho de arquivos Fitopac (*. Pr rsã eli o m in ar 27 Ve . Estes incluem o título. se quiser.abre uma janela que permite visualizar e. Os botões marcados ">>" ou "<<" transferem todos os itens de uma vez. no programa MATRIZ. Ao selecionar este comando. o botão "OK" deve ser usado para continuar. e a do direito contendo os itens eliminados/mascarados. centragem). Para algumas transformações (por ex.eliminando linhas ou colunas Para escolher linhas ou colunas de uma matriz que serão eliminadas ou mascaradas. Quando a lista de itens a serem eliminados/mascarados está completa. não importa se é aplicada por linha ou coluna. Logaritmo. Diversas transformações estão disponíveis e são as mesmas descritas no "Manual de Usuário" do Fitopac. utiliza-se uma tela com duas listas. Os nomes das colunas ou linhas não aparecem até você escolher qual dos dois conjuntos você quer transformar. "ranging".). mas para outras (por exemplo estandardização. Raiz Quadrado. a da esquerda contendo os itens não eliminadas/mascaradas. Pr rsã eli o m in ar . matriz transformar A opção "Transformar" na janela Matriz aplica uma transformação a qualquer conjunto de colunas ou linhas da matriz. que permite escolher se a transformação será aplicada por linha ou por coluna da matriz. abre-se uma janela. 28 Ve Os botões marcados ">" ou "<" transferem itens selecionados (clicando individualmente ou usando "shift"-Clique ou Ctrl-Clique para escolher diversos itens) de uma lista para a outra. etc. faz uma grande diferença. Recomenda-se o uso da visualização da matriz na planilha para verificar que a transformação foi aplicada corretamente. raiz quadrada. as transformações serão feitas. Ve Ao apertar o botão de "OK". etc. Tipicamente. que certas transformações não podem ser aplicadas a matrizes que contem valores negativos ou zeros (logarítmo. por exemplo. Note. Quando se escolha este comando. matriz juntar A opção "Juntar" tem a função de fundir matrizes de dados quando se quer analisar dois ou mais conjuntos de características numa única matriz. Pr rsã eli o m in ar 29 . o programa abre uma janela que permite escolher o arquivo que será fundido com a matriz já na memória e o método usado para juntar as duas matrizes.Em seguida.). pode escolher o tipo de transformação desejada e quais variáveis serão transformadas. também. pode ser necessário. juntar matrizes de dados vegetativas e reprodutivas que foram medidos nos mesmos indivíduos ou acrescentar uma variável representando a qual grupo de uma análise de agrupamento uma dada amostra pertence quando se prepara figuras representando uma ordenação. É possível aplicar uma seqüência de diferentes transformações à mesma matriz. Note que variáveis mascaradas não serão transformadas. com as colunas da primeira matriz preenchidos com "dados faltando". use a opção "juntar lado ao lado forçado" (abaixo). Nesta opção. O resultado pode ser representado por matriz 1 1111 1111 "Lado ao Lado forçado" – é usado em situações onde se quer juntar matrizes "lado ao lado". o programa cria uma matriz com o número máximo de linhas e preenche as células vazias com "dado faltando". mas os nomes das linhas são diferentes ou podem ser duplicados. As opções são :"Lado ao Lado" . Se precisa juntar linhas de matrizes com nomes diferentes. que os objetos também precisam ter os mesmos nomes* nas duas matrizes). 30 Pr rsã eli o m in ar matriz 2 2222 2222 Ve matriz final 11112222 11112222 . as parcelas (note. o programa procura linhas que tem exatamente o mesmo nome. é necessário escolher o tipo de fusão entre matrizes desejada. e neste caso as linhas das duas matrizes representam os mesmos objetos. Em casos onde o número de linhas é diferente nas duas matrizes. o programa permite escolher o arquivo que contem a segunda matriz que será combinada com a matriz atualmente na memória. Como exemplo. e forma uma nova linha contendo os dados combinados das duas matrizes. as linhas são juntadas seguindo a ordem que tem dentro da matriz e sem qualquer tentativa de "reconhecer" quais linhas tem o mesmo nome. Um exemplo seria o caso onde temos dois conjuntos de parcelas contendo o mesmo conjunto de espécies ou dois conjuntos de exsicatas onde foram medidas exatamente os mesmos caracteres. Caso ocorram nomes não idênticos. Para juntar as matrizes. serão tratados como novas linhas.é usado em casos onde as colunas das matrizes são idênticas e as linhas representam dois conjuntos de amostras/objetos. os nomes devem ser idênticas* nas duas matrizes. porém. serão tratados como novas colunas. Em seguida. poderíamos ter duas matrizes representando plantas herbáceas e lenhosas respetivamente para um único conjunto de parcelas. Mais uma vez.Ao clicar no botão "Escolher Segundo Arquivo". "Empilhar" . com as linhas da primeira matriz preenchidos com "dados faltando". Caso ocorram nomes não idênticos.é usado quando as amostras/objetos (as linhas da matriz) são iguais e as duas matrizes representam diferentes conjuntos de variáveis medidas nos mesmos amostras/objetos. Como exemplo. tendo muitas espécies em comum.é usado em situações onde é necessário juntar colunas de duas matrizes que tem colunas com nomes diferentes.esta opção é fornecida para casos (raros ?) onde se deseja unir conjuntos de dados onde algumas espécies/caracteres e/ou amostras/objetos são iguais entre as duas matrizes e outros são diferentes. a opção "Empilhar" não funcionaria porque nem todas as espécies são idênticas entre as áreas e é necessário manter estas espécies separadas enquanto combina os dados para espécies idênticas dentro de uma mesma coluna da matriz. Quando se utilize esta opção. e assim por diante. Se deseja unir estas matrizes para criar uma matriz que inclua todas as amostras numa única matriz. O resultado pode ser representado por :- A C P1 1 1 P2 1 P3 1 P4 1 matrizes 1 e 2 1 1 1 depois de "mesclar" A P1 P2 P3 P4 P5 1 1 3 1 2 2 2 B C 1 1 1 1 D 1 1 3 1 2 2 2 E F 1 1 1 1 Pr rsã eli o m in ar D F A B D E 1 1 P3 2 2 2 2 1 1 Ve + P5 P6 P7 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 31 . o programa tenta juntar as colunas sem verificação de nomes. e não se pretende juntar colunas que tem nomes idênticos. as colunas que não tiver equivalentes serão preenchidos com "dado faltando". Esta opção tenta resolver este caso.O resultado pode ser representado assim :matriz 1 1111 1111 matriz 2 2222 2222 matriz final 1111 1111 2222 2222 "Empilhar Forçado". coluna 2 com coluna 2. mas não todas. Se uma matriz tem maior número de colunas que a outra. "Mesclar" . Neste caso. temos o caso onde levantamentos de dois conjuntos de parcelas foram feitos em áreas próximas. e o caso análogo onde pode ter algumas linhas em comum entre matrizes e outras não. Isso quer dizer que o programa juntará coluna 1 da segunda matriz com coluna 1 da primeira. vai resultar nestas colunas/linhas sendo tratadas como sendo distintas. portanto. 32 Pr rsã eli o m in ar Ve . *Mudança importante na versão 1.6 !! Foi introduzida uma mudança importante no processo de juntar matrizes. matriz espécies raras O comando "Espécies Raras" é utilizado em análises de levantamentos ecológicos onde é freqüente que se deseja remover as espécies raras antes de fazer. nesta opção. Ao escolher este comando. mesmo que seja presença/ausência de uma vírgula ou ponto. Note. uma ordenação. mas este processo tem grandes limitações e nem sempre é capaz de detectar erros deste tipo. para evitar "surpresas" durante o processo de juntá-las. os resultados podem ser surpreendentes e não produzem a matriz esperada. que as colunas ou linhas que devem ser tratadas como sendo idênticas entre as duas matrizes realmente tenham nomes que sejam idênticas mesmo. De qualquer modo. por exemplo. porem. O programa agora detecta e reúne as linhas ou colunas com o mesmo nome. isso quer dizer que não é mais necessário ter as linhas/colunas rigidamente na mesma ordem como em versões anteriores. o programa abre uma janela que permite definir o que se considera uma espécie rara. com muito cuidado. recomendo examinar. Convém. verificar a ortografia dos nomes da duas matrizes com muito cuidado. O programa tenta detectar nomes aparentemente parecidos (veja "Nomes suspeitos "). que qualquer diferença entre os nomes das duas matrizes será tratado como indicando linhas/colunas distintas. as linhas/colunas correspondentes são identificadas.P6 P7 2 2 2 2 2 2 2 2 É essencial. os resultados de qualquer operação de junção/fusão de matrizes pois as vezes. pois mesmo estando em ordens distintas nas duas matrizes. Recomenda-se fortemente que após uma operação deste tipo. a matriz resultante deva ser inspecionada (na planilha) com muito cuidado para verificar que a mesclagem realmente produziu os resultados esperados. Qualquer diferença em nomes. sendo que qualquer espécie com menos que este nível será removida.talvez o critério mais comum. clicando na versão desejada. Quando o programa detecta situações deste tipo abre uma tela (tela "Nomes suspeitos").remove espécies cuja soma de valores é menor que o valor indicado como o mínimo aceitável. Pr rsã eli o m in ar Número de amostras . É particularmente importante detectar este tipo de erro quando se pretende "mesclar" as matrizes pois o programa reconhece quais linhas/colunas devem ser mescladas ou mantidas somente pelos nomes usados. Em muitos casos. É comum.remove espécies cuja soma de valores representa uma porcentagem do total de valores na matriz menor que o valor indicado como sendo o mínimo aceitável. mostrando os pares de nomes considerados "suspeitos". O nome escolhido fica com um fundo vermelho. e será usado em vez do nome que não foi clicado. espécies que estejam presentes em menos que cinco amostras (valor mínimo aceitável = 5). O Valor mínimo aceitável representa o nível de corte. e permite escolher entre as versões. Se não clicar em um dos pares de nomes. por exemplo. o programa tenta detectar "nomes suspeitos" que são casos onde os nomes tem pronúncias muito parecidas mas ortografias diferentes – por exemplo "Cinnamomum" e "Cinammomum". O mesmo acontece quando se clica em ambos Ve Porcentagem do total .As espécies podem ser consideradas raras por diversos critérios : Valor Absoluto . ou. em levantamentos maiores. estes nomes devem ser idênticos e a diferença se deve a um erro de digitação. Nomes suspeitos Antes de fundir matrizes. sem considerar a quantidade da espécie que ocorre em cada amostra. 33 . remover espécies que ocorrem numa única amostra (valor mínimo aceitável = 2). nenhuma correção é feito e os dois nomes aparecerão na matriz final. remove espécies que ocorrem em menos que um número escolhido de amostras. pois o Soundex não inclui a parte numérica quando detecta as semelhanças – por ex.os nomes (você pode mudar de idéia clicando novamente num nome). e freqüentemente vai detectar nomes "suspeitos". mesmo que sejam perfeitamente legítimos – por ex. Tela "Nomes suspeitos" A tela "Nomes suspeitos" aparece quando 34 Pr rsã eli o m in ar Ve . clique no botão "ok" para efetuar as mudanças ou em "cancelar" par deixar todos os nomes como estão. quando está satisfeito com as substituições que serão feitos. e os dois nomes serão mantidos. Este problema é muito comum onde códigos ou nomes muito curtos foram usados e especialmente onde parte do nome é numérica. Nestes casos. Finalmente. nenhuma correção deve ser feito. SJC1 e SJC2 serão tratados como idênticos. O algoritmo usado para detectar semelhança entre nomes ("Soundex") não é muito "inteligente". "lancifolia" e "longifolia".. quando o programa está realizando uma fusão de matrizes e detecta nomes aparentemente parecidos. internamente. a presença de nomes duplicados é. os dois nomes serão tratados como distintos e acrescentados como duas linhas ou colunas diferentes. abre uma tela solicitando instruções sobre como proceder. Em caso 3. se não indicar uma forma preferida. [se realmente precisa ter nomes duplicados por algum motivo e quer juntar matrizes. o programa detecta nomes de variáveis diferentes quando duas matrizes estão sendo "empilhadas" . no mínimo. é praticamente uma certeza que a matriz resultante terá erros e vai ligar duas ou mais vezes a mesma linha da segunda matriz com mais que uma linha da primeira. Embora não seja proibido pelo Fitopac. 3. se você não indica uma versão preferida. Fitopac detecta somente a primeira ocorrência de um nome. Portanto. onde o programa não pode determinar quais linhas das duas matrizes devem ser unidas. Como. Em casos 1 e 2. Tela "Nomes duplicados" A tela "nomes duplicados" aparece durante a importação de arquivos ou na fusão de matrizes quando existem nomes iguais em duas ou mais linhas (ou colunas) da matriz. Neste caso. utilize as opções "lado ao lado forçada " ou "empilhar forçado "] Pr rsã eli o m in ar Ve 35 . quando Fitopac detecta esta situação na importação ou fusão de matrizes.1. Neste caso. acima. inconveniente pois as listagens produzidas pelas análises vão conter dois itens com o mesmo nome sem meios de determinar qual é qual. 2. é esperado que os nomes dos objetos (linhas) sejam iguais. a forma na coluna à esquerda ("matriz 1") será adotada. a presença de linhas com o mesmo nome cria uma situação ambígua. Se uma das formas de um nome está correta. clique na versão correta (a cor do fundo deve mudar) e esta versão será usada na matriz final. Esta tela mostra duas listas de nomes lado ao lado. Em operações de fusão de matrizes. que talvez devem ser tratados como idênticos. o programa detecta nomes de objetos (linhas) diferentes quando duas matrizes estão sendo juntadas "lado ao lado". é esperado que os nomes das variáveis (colunas) sejam iguais. acrescentando um sufixo numerado às instâncias duplicadas – isto é. Parar esta análise – abandona a análise sendo executada. Este sufixo tem o formato "_x". todas as ocorrências do nomes após a primeira. os conteúdos das variáveis serão somados. com diferentes tipos de variável. No caso de colunas. um a um – abre a tela de modificação do cabeçalho da matriz. Eliminar as cópias – simplesmente elimina (permanentemente) as linhas com nomes duplicados. pois não é possível somar uma variável quantitativa com uma variável texto. permitindo acesso aos comandos de editoração dos nomes onde pode procurar e modificar os nomes individualmente. 2. recomenda-se não deixar nomes duplicados em matrizes. Recomenda-se que esta opção seja usada com muito cautela em matrizes heterogêneas. Em geral. podem ocorrer problemas em matrizes com dados mistos. especialmente em fusões de matrizes. onde "x" = 1. Use com cuidado – não tem "desfazer"! Mascarar as cópias – deixa as linhas com cópias dos nomes mascaradas – mais seguro que "eliminar" – não remove as linhas. o programa avisa que não é possível completar a ação e cabe ao usuário resolver a situação. embora seja altamente questionável se este procedimento é correto. Para dados quantitativos. 3. Nestes casos. os valores são somados e em variáveis multiestado. mas em certas operações as linhas mascaradas podem atrapalhar. os valores nas linhas/colunas com nomes duplicados são somados na linha/coluna com a primeira ocorrência do nome e as outras eliminadas. 36 Pr rsã eli o m in ar Ve . por exemplo. mas somente se a primeira variável for quantitativa. Modificar diretamente. Diferenciar os nomes automaticamente – gera novos nomes. Onde ocorre uma variável quantitativa com nome duplicado em variáveis binários ou multiestado. enquanto em variáveis binários. o equivalente de uma operação "OR" é utilizado – isto é. uma presença em qualquer uma das linhas/colunas duplicados resulta em presença e o resultado será uma ausência somente em casos onde todos os valores são 0 (ausência). "Somar" as linhas/colunas com os mesmos nomes – neste casos.As opções são: Deixar como está – continuar sem modificação. está opção NÃO é recomendada porque pode levar a erros na fusão. o valor máximo é usado. etc. Pode ser útil onde se descobre que os nomes em duas colunas representam sinônimos e faz sentido unir as ocorrências de ambas. e gerar resultados inesperadas. Em operações de fusão de matrizes. impressa. O texto também pode ser editado. Imprim(ir) – imprime diretamente na impressora Config(urar) pág(ina) – configuração da página e outras características da impressora Vis(ualisar) impres(são) – visualizar a impressão antes de imprimir Fonte – mudar a fonte do texto selecionado Centrar – centrar o parágrafo selecionado Pr rsã eli o m in ar 37 Ve . que permite uma formatação limitada (fonte.grava o conteúdo como arquivo "rich text format" (rtf) que preserva a formatação e é compatível com "Word". em parte. Este texto é colocado dentro de um formulário especial que normalmente pode ser examinado usando um botão marcado "Vis. resultados" ou simplesmente "Resultados".Visualizando resultados de análises O formulário de resultados "Bug" – ocorrem algumas diferenças entre a formatação vista inicialmente e a formatação final. por exemplo.txt) ou como arquivo "rich text format" (*. Deve-se notar. porém. apagando partes desnecessárias. e que você precisa mandar gravar e/ou imprimir os resultados se quiser preservá-los.rtf). A maioria das análises no Fitopac produz algum tipo de saída na forma de texto (geralmente tabelas. os resultados são acumulados e a saída de uma análise não apaga o anterior. itálico. etc. etc. Se o formato exato da sída for importante. As principais opções são : Grav(ar) txt – grava o conteúdo como arquivo de texto simples (txt) Grav(ar) rtf . etc). O conteúdo pode ser gravado como um arquivo de texto simples (*. Todos os resultados da sessão que foi iniciada quando o usuário mandou executar o Fitopac são armazenados neste formulário – isto é. O texto aparece dentro de uma janela com algumas opções para formatação. recomendo copiar tudo para a área de transferência ou gravar como rtf e utilizar o "Word" ou outro processador de texto para preparar o texto final. conseqüência de incompatibilidades com o componente "rich text edit" do Windows. antes de gravar ou imprimir. negrito. etc. Estes problemas são. que o conteúdo deste formulário NÃO é gravado automaticamente (para evitar o acúmulo de grandes quantidades de saída indesejável).) e que pode ser lido por programas como "Microsoft Word". gravação. Selec(ionar) tudo – seleciona o texto inteiro (para mudar fonte.) Copiar – copia o texto selecionado para a área de transferência Cortar – cortar o texto selecionado e colocar na área de transferência Colar – colar texto que está na área de transferência 38 Pr rsã eli o m in ar Ve . etc. Além dos gráficos em duas dimensões. etc. Estes gráficos são particularmente úteis para visualização dos resultados de ordenações. Estes utilizam a linguajem VRML ("Virtual Reality Markup Language"). Fitopac também tem recursos para fazer alguns tipos de gráfico em 3 dimensões. Opera. Os principais tipos produzidos são: Diagrama de Dispersão ("scatter plot") Diagrama de vetores Dendrogramas Gráficos de Barra/Histogramas Gráficos de "caixa" ("Box and Whiskers plot") Gráficos compostos gráficos como "biplots" e "triplots" que são compostos de componentes distintos como um gráfico de dispersão junto com um diagrama de vetores. no caso de um "biplot" de PCA.) equipado para visualizar arquivos escritos usando VRML. onde a possibilidade de representar três eixos simultaneamente pode ser importante. abre-se uma janela de gráficos:- Pr rsã eli o m in ar Ve 39 . Fitopac também pode ser utilizado para produzir gráficos a partir de arquivos de dados já gravados via o botão "gráficos" da tela principal (veja: Criando gráficos diretamente). Firefox. veja: Gráficos 3D Criando gráficos diretamente Ao apertar o botão "gráficos 2D" da tela principal. e requerem um "browser" (Internet Explorer.Gráficos em Fitopac Criando Gráficos A maioria das análises feitas no Fitopac podem gerar um ou mais gráficos. podem ser mostrados como vetores partindo da origem. botão Sair: volta ao programa principal. 40 Pr rsã eli o m in ar Ve . Cada "ficha" permite escolher ou trocar a matriz (botão abrir). Gráfico de linha onde os dados são representados como uma linha contínua Gráfico de Barras onde os dados são representados como barras individuais Diagrama de dispersão. gravar uma matriz que foi modificada (botão gravar) e abrir a matriz na planilha para modificar os dados (editar valores. Tipo de gráfico– escolhe o tipo de gráfico que deseja. A maioria dos gráficos simples utilizam somente a matriz principal. Matriz secundária e Matriz terciária. especialmente nas análises PCA e RDA. mostrando os dados como pontos Matrizes: a tela mostra 3 fichas chamadas Matriz principal. entre 1.botão Mostrar Gráfico: mostra o gráfico que foi especificado de acordo com as opções escolhidas.). Esta forma é útil para "biplots" e "triplots". transformar. mas especificamente no caso dos "biplots" e "triplots" usados para analisar ordenações. etc. Eixo X– escolhe qual variável (coluna) será usado como eixo horizontal do gráfico. mas alguns requerem mais que uma matriz. 2. Mostrar como vetores– em vez de representar os dados como pontos em diagramas de dispersão. 3. Eixo Y– escolhe qual variável (coluna) será usado como eixo vertical do gráfico. devido a um problema no pacote usado para produção dos gráficos. principalmente em "Windows 98". as escalas dos dados na matriz secundária ou terciária pode ser incompatível com a escala da matriz principal (comum em "biplots" de PCA). Visível . mudanças de posição de etiquetas e algumas outras modificações do gráfico não são gravados corretamente. mas é relativamente complexo. Eixos – permite escolher se os eixos estão centrados ou não e o texto (título) associado com cada eixo.Ajustar a escala– em muitos casos. mudanças de posição de etiquetas e algumas outras modificações do gráfico não são impressos corretamente.grava o gráfico no formato emf (Enhanced Windows Metafile). a escala dos eixos do gráfico é da matriz principal e não da matriz secundário ou terciário. Neste caso. Infelizmente. Neste caso. Pode então ser "colado" em outros programas como "Word" ou "PhotoShop". devido a um problema no pacote usado para produção dos gráficos. Esta tela permite alterar um grande número de características dos gráficos. etc. Se usar esta opção. use os comandos de "copiar e colar" para transferir o gráfico corretamente. Os controles estão localizados na barra de comandos na margem superior da tela e podem ser divididos em três blocos principais : 1. use os comandos de "copiar e colar" ou grava como arquivo "emf" para transferir o gráfico corretamente para "Word" ou "PowerPoint".determina se os dados da matriz estão visíveis ou não no gráfico. Útil quando se quer comparar os gráficos produzidos com e sem as diferentes matrizes. Copiar – copia o gráfico para a área de transferência de Windows. Neste caso. Imprimir – imprime o gráfico diretamente na impressora As vezes. este comando não tem opção de "desfazer". Pr rsã eli o m in ar Salvar . e deve ser usada com um certo grau de cautela. Diagramas de dispersão Os gráficos de dispersão tem uma série de opções que permitem alterar a aparência do gráfico e salvar ou imprimir os resultados. um formato que pode ser importado facilmente por programas Windows como MS Office. Config – abre a tela de configuração de gráfico do pacote "TeeChart" usado par criar os gráficos em Fitopac. Ve 41 . os botões de função – As vezes. a escala da matriz escolhida será ajustada para ficar semelhante à escala das variáveis escolhidas da matriz principal. Este arranjo permite mais flexibilidade. pode ter mais que um conjunto de etiquetas que são controlados individualmente. no caso de gráficos compostos como "biplots". Veja "A Tela de Opções de Diagramas de Dispersão " para mais detalhes. a cor. entre outras possibilidades. Em gráficos mais complexos com "biplots". e tamanho de símbolos.eixos centrados eixos não – centrados Opções – abre uma tela de opções que permite modificar o gráfico. por ex. ao clicar neste botão. Etiquetas – este botão liga ou desliga as "etiquetas" dos pontos no diagrama de dispersão. precisa optar entre os diferentes componentes do gráfico – os escores dos objetos ou os vetores representando as variáveis originais no caso de uma análise PCA – e que as opções selecionadas terão efeito somente no conjunto escolhido. pois cada componente pode ser configurado independentemente. 42 Pr rsã eli o m in ar Ve . Note que. mudando o tipo. Quando esta opção está ligado. Este ajuste é muito útil quando se deseja gráficos onde as distâncias vistas na tela são proporcionais às distâncias nas unidades originais – por exemplo gráficos de ordenações. As escalas dos eixos estão iguais quando os elipses adquirem formato circular e coincidem com os círculos. As principais comandos e opções são: Ve A Tela de Opções em Diagramas de Dispersão Pr rsã eli o m in ar Basicamente. formatos e tamanhos diferentes. A caixa "ajuste fino" pode ser ligada ou desligada para modificar a sensibilidade dos controles deslizantes. O botão de "restaurar as escalas originais" retorna às escalas originalmente calculadas pelo programa para ocupar o máximo da tela. Os círculos de calibração podem ser usados junto com os controles deslizantes para ajustar as escalas manualmente. Gráficos deste tipo em Fitopac podem utilizar duas matrizes de dados para determinar como será a aparência final do gráfico – a matriz primária contém os dados que indicam a posição dos pontos ao longo dos eixos. O botão "eixos iguais" ajusta as escalas nos dois eixos para ficarem iguais – isto é. É importante notar aqui que as opções disponíveis podem ser ligeiramente diferentes. O ajuste das escalas pode ser conferido utilizando os círculos de calibração. Note que o ajuste automático não estará disponível se as escalas forem muito diferentes (uma mais de 40 vezes a outra). 43 . ou para verificar e eventualmente ajustar as escalas após o ajuste automático. em cores diferentes. dependendo da origem do gráfico dentro do Fitopac. a largura e altura do gráfico são controladas pelos controles deslizantes.Modificando as escalas As escalas verticais e horizontais podem ser modificadas usando os controles de escala: A tela de opções para diagramas de dispersão é relativamente complexa porque permite um grande número de escolhas sobre a aparência do gráfico e a maneira em que o conjunto de dados é representado. um unidade na escala horizontal fica igual em tamanho a uma unidade na escala vertical na tela. Gráficos que foram gerados diretamente de um arquivo contendo os escores terão somente a matriz primária. Por exemplo. A matriz secundária pode ser idêntica à matriz primária ou pode ser completamente diferente. e a matriz secundária é usada para "pintar" os símbolos individuais com cores. gráficos de dispersão produzidos por ordenações normalmente usam um conjunto de escores como a matriz primária e a matriz de dados originais que geraram a análise como matriz secundária para colorir os símbolos ou determinar o seu formato ou tamanho. aparecem na tela um conjunto de elipses e outro de círculos. pelo menos inicialmente. Para muitas análises.importa uma nova matriz secundária para determinar a aparência dos símbolos. A caixa "matriz de variáveis para ‘pintar’" com três botões de opção controla quais conjuntos de variáveis estão disponíveis para "pintar" os símbolos com diferentes cores formas e tamanhos. por exemplo. Pr rsã eli o m in ar . Estes comandos permitem escolher qualquer par de variáveis na matriz primária como eixos e não limitam a escolha às primeiras três variáveis como os botões de seleção rápida. e estão associadas com outras caixas de texto ou caixas de listagem que permitem escolher variáveis ou valores de acordo com a opção selecionada na caixa de opção. que no caso de gráficos compostos como "biplots". "Cores" e "Símbolos" controlam como os símbolos representando os dados serão desenhados. 2 a segunda e 3 a terceira na matriz primária. As caixas de listagem X e Y permitem selecionar quais variáveis da matriz primária são usadas como eixos X e Y do gráfico. examinar o quarto componente em diante numa PCA. Estas opções estão disponíveis somente quando a matriz primária e a matriz secundária estão presentes. É importante notar.Botões: Importar . As opções disponíveis são: 44 Ve Examinar – inspecionar ou editar a matriz secundária usada para determinar a aparência dos símbolos. "escores" – as da matriz primária e "Ambos" combina os dois conjuntos. estes são os eixos mais importantes. Esta opção é importante quando se pretende. Os eixos também podem ser escolhidos utilizando as caixas de opção "X" e "Y" que permitem escolher qualquer variável da matriz primária como eixo e não confina a escolha às primeiras três variáveis. 1x3 e 2x3. As opções são: "Dados originais" – disponibiliza as variáveis da matriz secundária. também. As caixas de opção "Tamanho". sendo que 1 é a primeira variável. a mudança de eixos afeta somente o conjunto selecionado (por exemplo os pontos representando os escores) e não os outros componentes (como vetores representando variáveis originais) que precisam ser modificados individualmente. Eixos – três botões permitem a seleção rápida das combinações dos eixos 1x2. Por grupo – semelhante. Símbolos – Uniforme – os símbolos usados para representar os dados são todos iguais. representando o valor mínimo da variável. não ordenados. obtidos numa análise de agrupamento) num gráfico de ordenação. proporcionais aos valores na variável selecionada na caixa de listagem que abre ao escolher esta opção. Gráficos de Barra Sinto muito – ainda não está pronto ! Pr rsã eli o m in ar 45 Ve .Tamanho – Uniforme – todos os símbolos são desenhados em tamanho uniforme que pode ser selecionado na caixa de texto logo abaixo Variável – os símbolos são desenhados em tamanhos diferentes. Diagramas de vetores Sinto muito – ainda não está pronto ! Gráficos de linha Dendrogramas Os dendrogramas produzidos em Fitopac permitem um número substancial de opções e acima de tudo. Normalmente. Por Grupo – os símbolos variam de acordo com os valores numa variável escolhida na caixa de listagem que aparece logo abaixo. esta variável é multiestado e não deve ser contínua. até vermelho. O símbolo usado pode ser escolhido na caixa de listagem que aparece em baixo. Cores – Uniforme – todos os símbolos são desenhados utilizando a cor selecionada acionando o botão "Cor fixa" logo abaixo Variável – as cores são alocadas de acordo com os valores de uma variável selecionada na caixa de listagem que aparece logo abaixo. oferecem alguns recursos para análise dos resultados que são incomuns em outros programas de análise de agrupamentos. onde não é apropriado usar uma escala contínua. representando o valor máximo. Esta opção é particularmente útil quando se deseja sobrepor alguma classificação em grupos (por exemplo. obtidos numa análise de agrupamento) num gráfico de ordenação. Esta opção é particularmente útil quando se deseja sobrepor alguma classificação em grupos (por exemplo. mas neste caso as cores (e os valores na variável) são descontinuas e geralmente representam grupos ou valores multiestado. as cores são contínuas e variam de azul. Nesta opção. mas ainda assim. grava o arquivo VRML (que tem a extensão "wrl").vapourtech.com/cortona) tem se mostrado bastante satisfatório. e os arquivos são de texto puro e podem ser modificados manualmente.Gráficos de caixa Sinto muito – ainda não está pronto ! Gráficos 3D Fitopac pode produzir gráficos 3D simples no formato VRML(Virtual Reality Modeling Language). 46 Pr rsã eli o m in ar Ve .parallelgraphics. uma linguagem utilizada para descrever cenas em três dimensões.com/tutorials/vrml97/ ou http://tecfa. além de outros browsers. O plug-in "Cortona" da companhia "parallel Graphics" (http://www. Tem a vantagem de ser relativamente simples. Para visualizar os gráficos.ch/guides/vrml/vrmlman/ " para introduções simplificadas).unige. com um pouco de conhecimento de VRML (veja "http://web3d. Se não tiver um browser com um visualizador de VRML. e pode ser instalado em "Internet Explorer" ou "Firefox". é necessário ter um programa de visualização de VRML ou (mais prático). o programa não mostra o gráfico. amplamente usada em sites na Web. um "plug-in" do browser que permite visualizar os arquivos. . Pr rsã eli o m in ar Ve 47 .Parâmetors fitossociológicos ("PARAMS") Calculando Parâmetros Fitossociológicos Esta versão ainda utiliza um programa DOS ("PARAMS. Se você optou para gravar arquivos de parâmetros para espécies.6) e não serão descritos aqui. junto com Fitopac 1.EXE") para calcular os parâmetros fitossociológicos para um conjunto de dados de um levantamento contidos num arquivo FPD. 1 (distribuído como arquivo "pdf". etc. Ao acionar um destes. aparece a tela que permite escolher quais tabelas quer gravar (em formato FPM) par uso com outras análises ou programas. Ao escolher um arquivo FPD. o FitopacShell executa o programa Params. o botão "Params" e item "paRametros" do menu se tornam disponíveis. estes podem ser utilizados em Fitopac ou exportados para uso em outros programas como "Excel" ou "SYSTAT". Os comandos e opções do programa estão descritas no manual de Fitopac v. Ao apertar a tecla "ok". Os valores calculados são armazenados em arquivos do tipo "FPC" ("FitoPac Coeficientes") como uma matriz triangular –é necessário armazenar somente uma metade da matriz quadrada de semelhança/distância pois estas normalmente são simétricas ao redor do diagonal da matriz. o botão "Matriz" abre a planilha. Caso queira. é necessário. enquanto um arquivo de dados somente binários terá disponível um outro conjunto de coeficientes. mas o arquivo é gravado somente quando o usuário aperta o botão "Gravar" ou o escolha o item Arquivos/Gravar no menu. se desejado. porém. mais comumente. Modificações incluem cálculo de complemento da matriz. O botão "Visualizar" permite inspecionar a matriz de coeficientes e. por algum motivo. o botão "Gravar" muda de cor e aparece um aviso que existem dados não gravados. A tela Coefs Ao abrir a tela de cálculo de coeficientes. Note-se. Caso queira transformar ou modificar os dados antes de calcular os coeficientes. primeiro. usada como entrada para análises com Análise de Agrupamentos ou Análise de Coordenados Principais (PCO). calcular coeficientes apropriados para dados quantitativos com dados binários. converter os dados em dados quantitativos (veja transformações e conversões de dados). combinação de diferentes matrizes. Esta matriz pode ser examinada diretamente para determinar o grau de semelhança entre os objetos ou. Fitopac NÃO grava os coeficientes automaticamente ! Quando se calcula uma matriz de coeficientes. cálculo do coeficiente cofenético entre matrizes e teste de Mantel para associação entre matrizes. O módulo de cálculo de coeficientes é ativado apertando o botão "coef" ou o item do menu "Multivar/coefs" (disponíveis somente quando um arquivo do tipo FPM já foi aberto). os principais passos são: 1) escolher o coeficiente ou distância desejado. A lista dos coeficientes disponíveis depende do tipo de dados na matriz de entrada sendo que arquivos de dados quantitativos ou mistos oferecem uma lista de coeficientes apropriados para dados quantitativos. Veja "coeficientes e distâncias usados em Fitopac para mais detalhes sobre coeficientes individuais. imprimi-la. 2) Calcular os coeficientes (Botão "Calcular") 3) Gravar os coeficientes. que matrizes grandes produzem uma saída muito extensa que pode ocupar dezenas de páginas quando impressas – cuidado! 48 Pr rsã eli o m in ar Ve . Arquivos de coeficientes/distâncias já criados podem ser modificadas usando os comandos de modificação de matrizes de coeficientes disponíveis via o botão "Coefs" ou o item Dados/coeficientes no menu principal.Calculando Distâncias e Coeficientes de Semelhança Coeficientes de semelhança e distâncias em Fitopac Fitopac é capaz de calcular diversos coeficientes de semelhança ou distâncias entre objetos que estão representados pelas linhas de uma matriz retangular (tipo FPM) e descritos por descritores ou variáveis que são as colunas da matriz. 49 . d 2 ij = ( b + c) N para dados binários. é a média das observações para amostra i. as formulas utilizam a seguinte tabela :UTO i + a Distância euclidiana quadrada 2 d ij=∑ ( xik − x jk ) 2 k =1 N Ve ij distâncias/coeficientes que utilizem dados quantitativos - Distância euclidiana simples d = d 2 2 ij Distância euclidiana quadrada média d d = N 2 ij ij Distância euclidiana média Pr rsã eli o m in ar c d U T O j + b d 2 ij = ( b + c) para dados binários. para todas as variáveis de 1 a N. para variáveis contínuas.Modificando e manipulando arquivos de coeficients Coeficientes e distâncias usados em Fitopac Os coeficientes de semelhança e distâncias usados em Fitopac são definidos pelas seguintes fórmulas:- x x ik é o valor observado para variável k na amostra i. ik Para dados binários. d ij = (b + c) para dados binários. para dados binários.d ij = d N 2 ij d ij = (b + c) N para dados binários. 1975). espécie k. 1975 para detalhes). Distância Manhattan total {"city block metric"} d Mij=∑ xik − x jk k =1 N d Mij =(b + c) para dados binários. Distância Manhattan média {"Mean Character Difference"} d Mij= 1 N ∑ − N k =1 xik x jk d Mij = (b + c) N para dados binários Bray .0 (veja Clifford e Stevenson. Note que as duas formas da distância Canberra substituam valores de zero com um valor = menor valor na matriz/5. Morisita C Lij = (λi + λ j) N i N j 2 ∑ nik n jk nik = no.Curtis d BC = ∑ (x + x k =1 ik k =1 N "Canberra metric" incluindo zero duplo d CANij 1 = N x ∑( x N k =1 Forma original e mais comum deste coeficiente. 50 Pr rsã eli o m in ar ik jk jk ∑ x −x N ) d BC = (b + c) [ 2a +(b + c)] para dados binários Ve ik ik − x jk + x jk ) d CANij = ( b + c) N para dados binários d CANij = ( b + c) (a + b + c) . "Canberra metric" excluindo 0 duplo igual ao anterior. excluindo zero duplo onde λi = ∑ n (n − 1) N ( N − 1) ik ik i i . mas excluindo comparações onde ambos as amostras tem o valor 0. (veja Clifford & Stephenson. de indivíduos em amostra i. Morisita modificado por Horn ∑ λ= n N igual ao anterior. x jk ) (∑ xik + ∑ x jk ) k =1 k =1 k =1 M M M coeficientes que utilizem dados binários - Pr rsã eli o m in ar ou 2 d ij = N N 1 (∑ xik − ∑ x jk ) 2 N 2 k =1 k =1 d ij = (b − c) 2 N 2 para dados binários r ij = ( ad − bc) ( a + b )( c + d )( a + c)(b + d ) ou = SSOR para dados binários 51 . mas i i 2 ik 2 Distância corda d ij = 2(1 − cos θ ) cos θij = onde ∑x x k =1 ik M 2 M jk 2 ∑x ∑x k =1 ik k =1 M jk Diferença de tamanho Diferença de forma d ij = ou Correlação Ve d ij = ik i 2 N N 2 1 N 1 ∑ ( xik − x jk ) − N 2 (∑ xik − ∑ x jk )2 N k =1 k =1 k =1 N (b + c)−(b − c) 2 N2 para dados binários r ij = ∑ (x − x )(x − x ) ∑ (x − x ) ∑ (x − x ) jk j ik i jk j (dados binários) Marczewski-Steinhaus S St = 2∑ min( xik .e Ni = no. total de indivíduos em amostra i. Urbani & Buser S RT BUB = ad + a ( ad + a + b + c) Rogers-Tanimoto Hamann Yule Ve Y S = Chi . se Xik ou Xjk está faltando.Concordância simples {"Simple matching"} S SM = ( a + d) N Jaccard S JAC = a (a + b + c ) Dice/Sorenson/Czekanowski S SOR = 2a (2 a + b + c ) Kulczynski S OCH KUL a a 1 = [ + ] 2 (a + b) (a + c) Ochiai S = a [(a + b)(a + c)] Baroni .0. então wk = 0. Para cada variável.quadrado com correção de Yates 2 Coeficients para misturas de varíaveis Coeficiente de Gower W é o peso para cada comparação. k.0 . Pr rsã eli o m in ar S H S = ( a + d) (a + d)+ 2(b + c) = (a + d) − (b + c) (a + b + c + d) ad − bc ad + bc χ 2 ij = N (ad − bc) 2 (a + b)(c + d)(a + c)(b + d) S para variáveis quantitativas : 52 k = 1− X (X ik − max k X −X jk min k )w k = 1.quadrado N ( ad − bc − N ) 2 χij = (a + b)(c + d)(a + c2)(b + d) Chi . 0 onde xik ou xjk = 1 (=SJAC) SG = ∑ wk S k =1 N k ∑w k =1 N k Pr rsã eli o m in ar 53 Ve . e wk = 1.0 se Xik = Xjk = 1.para variáveis multiestado Sk = 1.0 se Xik = Xjk wk = 1.0 para variáveis binárias Sk = 1. gerar dendrogramas e fornece algumas ferramentas para ajudar na interpretação dos resultados. Fitopac é capaz de fazer análise de Agrupamentos utilizando os chamados métodos SAHN (Sequential. Nonoverlapping – veja Sneath & Sokal 1973 para uma explicação detalhada). produzindo uma "escada" que é pouca informativa e sem grupos bem formados. precisa primeiro gerar e carregar uma matriz de semelhança/distância (arquivo "FPC"). mínima. Tela de Análise de Agrupamentos A tela de análise de agrupamentos permite escolher diversas opções antes de realizar uma análise de agrupamento. Hierarchic. onde os objetos se ligam no dendrograma um a um. é considerado talvez o menos útil de todos os métodos. Este método tende a formar grupos 54 Pr rsã eli o m in ar Ve .Q) e (R). Consulte Sneath& Sokal () ou Dunn & Everitt para mais detalhes sobre os métodos.Q) e (R) é a menor distância/maior semelhança entre os membros dos grupos (P. que por sua vez abrem a tela de Análise de AgrupamentosTela_de_Análise_de_Agrupamentos. Este método forma grupos bem irregulares e estendidas no espaço.Análise de Agrupamentos (Cluster Analysis) Introdução a análise de Agrupamentos Análise de agrupamentos é um conjunto de métodos usados para detectar ou confirmar a presença de agrupamentos dentro de um conjunto de dados. o ponto de partido para este tipo de análise é uma matriz de semelhança ou distância (arquivo "FPC"). que pode ser gerada utilizando a opção "Coef". vizinho mais próximo) – o critério usado para calcular a distância entre o grupo (P. A tela oferece os seguintes comandos: Tipo de Agrupamento– escolhe entre os métodos de agrupamento. tendo um tendência de contrair o espaço de medição original. Ligação completa (vizinho mais distante) – neste caso o critério é a maior distância/menor semelhança entre os membros dos grupos (P.Q) e (R). mas pode ser o método de escolha em situações onde sabe-se que existem grupos bem irregulares e estendidos. Estes métodos diferem no critério usado para calcular a distância/semelhança entre um grupo recém formado (P. tornando o botão "Agrupar" ou opção Multivar/Agrupar disponível. Para usar esta opção.Q) e qualquer outro grupo na matriz (R). Por este motivo. Geralmente. No total são oito métodos e incluem – Ligação simples (lig. Tem uma forte tendência a encadeiamento. Agglomerative. criado a partir de dados aleatórios). portanto. Em casos onde existe incompatibilidade. Pr rsã eli o m in ar Ve 55 . mesmo que o número de objetos em P for muito maior ou menor que aquele do Q (ao contrário de média do grupo onde a distância final é ponderado pelo número de objetos em cada). produzindo resultados semelhantes a ligação simples ( ß próximo a 1. Neste caso a distância (P. mas evitando os efeitos mais extremos de encadeiamento encontrados no método de ligação simples.0).0 é idêntico ao WPGMA. Tem propriedades semelhantes a média de grupo. Este método pode produzir inversões no dendrograma. ????). o usuαrio pode modificar o comportamento do método. mesmo em situações onde não são justificáveis. Centróide (UPGMC) – neste método. mas tem uma tendência de formar grupos. deve ser usado com um certo grau de cautela Média de grupo (UPGMA.uma versão ponderada do centróide. Tem propriedades semelhantes à ligação completa. Por outro lado. levando alguns autores a rejeitá-lo.25 é recomendado por muitos autores. com níveis de fusão indicados por uma barra horizontal. porém. Se quiser. ??) não é válido para todas as combinações de coeficiente e método de agrupamento. Estilo de dendograma– permite escolher se quer o dendrograma em formato "normal (ou tradicional)". a responsabilidade para interpretação da bagunça resultante é inteiramente do usuário! (veja a seção "compatibilidade de coeficientes e métodos"). em situações de gradiente ecológico Método flexível . mais uma vez. Mediano (WPGMC. É necessário. Este método tem propriedades intermediários.um dos métodos mais indicados por estudos de avaliação de metodologia de análise de agrupamento. O principal problema com este método é a tentação de ficar "ajustando" a análise. Inversões podem ser evitados pela escolha da função objetiva em vez de distância. ter uma pouco de cautela na interpretação. examinando a estrutura dos dados de uma forma muito mais completa. Neste caso.Através do parâmetro Beta (nos limites –1. os grupos (P.esféricos e compactos. em formato "cladograma".0) ou ligação completa (ß próximo a -1. é excelente como método para criar blocos relativamente homogêneos.0). Média ponderada (WPGMA. mas é mais indicado em casos onde tem grupos de tamanhos muito desiguais pois dá pesos iguais para os grupos (P. Isso não é um uso legítimo do método flexível! O algorítmo usado para calcular as matrizes intermediárias durante o processo de agrupamento (Wishart. mas pode dar resultados melhores em casos onde o número de objetos em diferentes grupos. Muito parecido em características com centróide. mas deve estar ciente que a análise resultante NÃO é uma realização daquele método de agrupamento com aquele coeficiente.Q)-(R) é obtida a partir do valor médio de todas as distâncias entre (R) e (P. método de Gower) . Geralmente bem mais satisfatório que ligação simples.Q). ligação média) . Este método.Q) recebem pesos iguais. a principal virtude do método é de permitir que se varia continuamente as propriedades de agrupamento. o programa destaca as combinações que não são válidas em outra cor e emite um aviso caso o usuário opta por uma destas. é calculado o centróide de cada novo grupo e a distância entre grupos é simplesmente a distância entre centróides. mas estudos de simulação sugerem que valores mais próximos a –0. até achar um agrupamento que concorda com as idéias preconcebidas do pesquisador.4 podem ser melhores quando existem muitos "outliers" nos dados (Milligan.Q). mesmo em casos onde não existem grupos bem distintos (por exemplo. Método de Ward (Variância mínima) . Um valor de ß = 0. e expande o espaço. pois este método produzirá grupos aparentemente bem separados e dendrogramas visualmente atraentes.um dos mais úteis de todos os métodos de agrupamento. produzindo grupos menos compactos. mas a prática e estudos de avaliação de metodologia sugerem que este método geralmente produz agrupamentos relativamente fáceis de interpretar. via diferentes valores de ß. mesmo se um for muito maior que o outro. e geralmente conserva o espaço de medição original. método de McQuitty) – tem propriedades muito semelhantes à média de grupo. mas uma transformação não muito bem definida da matriz original. pode continuar a análise. alegando que torna-se quase impossível a interpretação do dendrograma quando ocorrem muitos inversões. Um valor em torno de –0.0 ? β < 1. Enfim. onde. emf] – format usado pelo próprio windows e facilmente importada para MS Office. "Bitmap" [. O botão Dendrograma– manda desenhar o dendrograma. Estas opções e análises são controlados pelos botões e outros controles encontradas na barra de comandos acima do dendrograma. ou "treeview" que é uma representação simplificado do dendrograma em formato de uma janela "treeview" do Windows. especialmente se pretende inserir o gráfico dentro de um documento Word.onde o nível de fusão é representado por um ponto e a aparência geral do dendrograma é semelhante a um cladograma. com árvore de consenso que não está disponível em FITOPAC). ou quando não é necessário ampliar muito a imagem.bmp] – um formato bitmap padrão de Windows que tem tamanho e resolução fixos. e outros programas. As funções mais importantes são 1) as opções de dendrograma 2) análise de grupos escolhidos no dendrograma e a análise de qualidade da representação da matriz original via 3) correlação cofenética e 4) representação colorida das matrizes originais.wmf] – versão simplificada do anterior. quando as opções foram escolhidas. etc. O botão ver resultados– permite examinar o texto produzido pela análise (coeficiente de correlação cofenético. o primeiro conjunto de botões inclui: Gravar– grava uma cópia do dendrograma com arquivo no disco. Note que a resolução obtida é da tela do seu micro e pode variar de um micro para outro. geralmente é preferível usar a escala de distância que é mais fácil de relacionar com a matriz original. que pode ser usado par desenhar ou analisar o dendrograma (por ex. dependendo da configuração. Útil para alguns programas de gráficos que não aceitam metafiles. Quando de amplia. pode ser necessário para alguns programs que não são capazes de ler a versão "enhanced". Opções de formato de arquivo são "Enhanced Windows Metafile" [. por exemplo. O principal motivo para uso da função objetiva é que esta escala não produz inversões no dendrograma quando se utiliza os métodos centróide/WPMGC. "Windows Metafile" [. 56 Pr rsã eli o m in ar Ve . Recomenda-se este formato.). os "pixels" que formam a imagem podem ficar visíveis. pois a função objetiva sempre cresce com sucessivas fusões e não produz as inversões comuns com estes métodos quando se usa a escala de distância. com resultados de boa qualidade. Com os outros métodos. Note que o que é produzido no formato "Cladograma" ainda é um dendrograma ou "fenograma" – não é um cladograma verdadeiro! Medida de fusão– permite optar pela distância (ou coeficiente) original ou a função objetiva como escala no dendrograma. É um formato vetorial que permite usar toda a resolução da impressora. "Dendrograma" grava o dendrograma no formato de arquivo do programa NY-SYSpc. A Tela do Dendrograma A tela que abre quando se manda desenhar um dendrograma permite uma série de opções que modificam o dendrograma ou análises subsidiárias que ajudam a interpretar o dendrograma produzido. ordem dos objetos. mas neste caso. usando o botão esquerdo do mouse e movimentando o mouse para a direta ou esquerda. mas este número é arbitrário. uma medida do grau de concordância entre dendrograma e a matriz de distância/coeficiente original. não é possível colocar o dendrograma inteiro na tela e ainda ter espaço suficiente para separar os nomes dos objetos. pode arrastar o gráfico. mas permite modificar uma série de características que não são acessíveis no próprio FITOPAC. Imprimir– abre uma janela de "visualização de impressão" de onde pode modificar as opções da impressora e imprimir o dendrograma. é provável que os nomes vão ficar ilegíveis. e valores menores podem ser aceitáveis. garantindo espaço suficiente para deixar os nomes legíveis e as linhas do gráfico bem separadas. Em geral. Corr. as subopções disponíveis são : 1) calculo da "correlação cofenética com gráfico" – calcula a correlação e mostra um gráfico de dispersão dos valores de fusão no dendrograma vs. Ajuda a avaliar melhor a qualidade da representação da matriz original fornecida pela dendrograma. se disponível. sobreposição das variáveis originais. Alternativamente. Modificando as dimensões do dendrograma na tela. etc.[urar] – permite configurar o dendrograma usando um controle do pacote "TeeChart" que foi utilizado para produzir os gráficos em FITOPAC. 2) cálculo sem gráfico – produz somente o cálculo da correlação (no arquivo de saída). Pr rsã eli o m in ar Ve 57 . Colorir matriz– produz uma representação colorida da matriz de distância/semelhança original e. Este gráfico permite examinar a qualidade da representação com maiores detalhes. Para ver as partes "escondidas". Se for alto ou largo demais. [veja "tela de opções do dendrograma"]. Note que o programa tenta ler o arquivo de dados que foi usado para calcular os coeficientes/distâncias usados no dendrograma (necessário para funcionamento de algumas opções) e dará mensagens de erro se não consegue ler este arquivo. Grupos– permite acesso às funções de análise dos grupos selecionados no dendrograma. Embora o programa tenta adaptar o dendrograma ao tamanho da tela. dependendo do tipo de dados e propósito da análise. Esta matriz pode ser usada para calcular a correlação cofenética posteriormente (no módulo de manipulação de matrizes de distância/semelhança) ou para comparar com outros dendrogramas. Note que o dendrograma é copiado em formato "Enhanced Metafile". pois é fácil fazer mudanças que alteram profundamente a imagem. o gráfico resultante pode ser insatisfatório por diversos motivos. Neste caso.Copiar– copia o dendrograma para a área de transferência ("clipboard") e posteriormente pode ser "colada" em outros documentos. como representação da matriz original. etc. pode "encolher" o espaçamento entre os objetos usando o controle deslizante à direita dos botões de seta. pode ser reduzido usando os botões com setas para "encolher" o gráfico no sentido indicado pela seta. Recomendo um pouco de cautela (grave uma cópia antes de modificar) no uso deste comando.abre a tela de opções de dendrograma que permite escolher diversas modificações do dendrograma básico. da matriz de dados usada para gerá-la. Config. incluindo cores. Opções . sem a produção do gráfico. Veja a seção "Colorindo matrizes" para mais detalhes.[elação] cofen[ética]– calcula a correlação confenética do dendrograma.7 ou mais são considerados satisfatórios. até conseguir mostrar o dendrograma inteiro na tela. É melhor utilizar este índice principalmente para indicar de a representação obtido no dendrograma é adequada. e o programa desenhará somente uma parte do dendrograma. Veja a seção "Analisando grupos em dendrogramas" para mais detalhes. os valores correspondentes na matriz original. Um problema mais comum ocorre com análises onde o número de objetos sendo analisados é muito alto. e 3) gravar a matriz cofenética que corresponde ao dendrograma obtido. pois pode ser demonstrado que alguns métodos sempre produzirão correlações maiores que os outros (pelo menos com alguns coeficientes). valores de 0. Este controle é relativamente complexo. Não se recomenda o uso direto deste coeficiente para escolher entre métodos de agrupamento. FITOPAC tem facilidades para marcar grupos e depois analisa-los usando diversas técnicas. Uma vez que foram escolhidos um ou mais grupos. Esta é uma outra maneiro de visualizar dendrogramas grandes que não cabem inteiros na tela 4) desfazer um "zoom" feito anteriormente. trocar os ramos direito e esquerda do nó. Para utilizar estes recursos é necessário. clica no fundo do dendrograma com o botão direito do mouse e escolha "ligar marcar grupos". Analisando grupos em dendrogramas Uma vez que algum grupo foi designado na tela de dendrograma. determinar o que é que separa os grupos e como defini-los em termos das caracteres que foram medidos originalmente. os nós do dendrograma são destacados com um círculo. enquanto as linhas verticais são os "fios" flexíveis conectando as barras). porém. 58 Pr rsã eli o m in ar Ve . você pode escolher um nome e a cor usada para mostrar o grupo na tela. com o botão direito do mouse você pode: 1) "girar" o nó – isto é. nós" ou. Neste modo. 2) "limpar" os grupos e/ou cores escolhidos anteriormente 3) fazer um "zoom" para o nó selecionado que fica como raiz da parte visível do dendrograma. o botão "Grupos" torna-se disponível e quando acionado. mudando somente a seqüência dos objetos dentro do grupo designado pelo no escolhido. Para designar um grupo. primeiro. (veja a seção "Analisando grupos em dendrogramas " para mais informações). o botão "Grupos" é ativada e os recursos do módulo de análise dos grupos ficam disponíveis. o grupo será mostrado na tela na cor escolhida e fica marcado até desligar o modo de seleção dos grupos ou até mandar "limpar" os grupos [botão direito do mouse]. Esta mudança não afeta o dendrograma (que pode ser visualizado como um "mobile". O modo de seleção é ativado quando se clica na caixa "selec. Quando se completa as escolhas de nome e cor. É muito trabalhoso.Escolhendo grupos e o modo "seleção de grupo" O principal objetivo da análise de agrupamentos é a detecção e definição de agrupamentos nos dados. ao clicar com o botão esquerda no nó que representa a "raiz" ou base do grupo desejado. abre uma nova tela de análise de grupos. Para ajudar neste processo. com as barras horizontais rígidas e capazes de girar. alternativamente. colocar a tela de dendrograma no modo de seleção de grupos e marcar os grupos que deseja analisar. A presença e composição dos grupos reconhecidos podem ser determinadas por inspeção do gráfico. Além de ligar/desligar o modo de seleção. num outro arquivo. é importante que o número de linhas neste arquivo seja igual ao número de objetos na análise de agrupamento. Ve Salvar Grupos – Grava o grupo a qual cada objeto pertence para uso em outras análises ou como variável marcadora para gráficos. Neste caso. mas organizados por variável. Por grupo – fornece uma análise das variáveis originais (média.Listar membros – Produzir uma listagem dos membros de cada grupo. etc. a mediana (linha horizontal central) e uma caixa cujos limites são os quartis. Isso quer dizer que 50% das observações estão "dentro" da caixa. máximo. 3) Gravar os dados em alguma outra matriz. com os grupos analisados individualmente dentro de cada variável. Pr rsã eli o m in ar As principais opções disponíveis são: 59 . criado com uma única variável chamado "Grupo" contendo os números que correspondem aos grupos marcados no dendrograma. mínimo) dentro de cada grupo – isto é. Pode 1) gravar os grupos marcados num arquivo novo. Particularmente útil com análises grandes onde pode ser difícil identificar todos os membros de cada grupo. além de dar uma idéia do tipo de distribuição que tem dentro de cada grupo. Este gráfico mostra para cada grupo os limites extremos de variação (separados como pontos isolados no caso de valores realmente extremos – "outliers"). Por variável – os mesmos dados que a opção anterior. desvio padrão. 25% acima e 25% abaixo. Esta representação facilita a comparação entre grupos e mostra claramente se existe sobreposição entre grupos. 2) Gravar os grupos dentro do arquivo de dados originais – particularmente útil quando se pretende usar a mesma matriz para ordenação e quer comparar os grupos obtidos com os resultados da ordenação. cada variável é analisada dentro de cada grupo. Gráfico BW – produz um gráfico do tipo "Box and Whiskers" para cada variável escolhida. são colocadas no centro da matriz. Neste caso. 2) da matriz de dados originais – da mesma maneira. com agrupamentos bem separados e esta estrutura é fielmente representada pelo dendrograma. De novo. este processo é difícil e muito trabalhoso e sujeito a erros. 2) colorir as células da matriz de acordo com os valores que contém. No caso de análise de agrupamento. fica evidente na forma de uma série de blocos bem separados de alta semelhança ao longo do diagonal da matriz. Pr rsã eli o m in ar Colorindo matizes . é necessário investigar o conteúdo de uma matriz de semelhança/distância ou uma matriz de dados para avaliar se uma análise foi bem-sucedida e reflete a estrutura da matriz satisfatoriamente. Fitopac oferece esta opção para análise de matrizes nos módulos de análise de agrupamentos e ordenação. com pouca correlação com a sequência do dendrograma. As células são coloridas com valores altos de semelhança (baixas distâncias) em vermelho. e valores baixas de semelhança (grandes distâncias) em azul. especialmente quando a matriz for grande. tendo os objetos (normalmente as linhas da matriz) na mesma seqüência que o dendrograma e. Valores intermediários terão cores intermediários. dois tipos de visualização são possíveis: 1) da matriz de distância/semelhança – neste caso. a matriz é reordenada de acordo com a seqüência de objetos no dendrograma. Quando uma matriz tem estrutura bem-definida. Embora seja possível fazer uma análise deste tipo por inspeção dos valores presentes na matriz original usada para a análise. Desta maneira. a matriz de dados pode ser reordenada. as colunas ordenadas de acordo com a correlação entre os valores da variável e a seqüência de objetos – isto é. refletindo valores baixos e altos respetivamente. no caso de análise de agrupamentos. Quando os grupos tem pouca sobreposição. as variáveis com maior correlação com o agrupamento obtido estão nos extremos (correlações negativas e positivas) e variáveis que são indiferentes. facilitando o processo de avaliação. a coloração é aplicada individualmente dentro de cada variável 60 Ve Em alguns casos. refletindo a alta semelhança dentro do grupo e a falta de semelhança com outros grupos. os valores são coloridos numa seqüência de azul até vermelha. os blocos são triangulares. Este processo pode ser facilitada por duas modificações: 1) rearranjo das linhas e colunas para refletir os resultados da análise – a ordem dos objetos no dendrograma em análise de agrupamentos ou a seqüência dos objetos/variáveis ao longo do primeiro (ou outro) eixo de uma ordenação. a estrutura da matriz pode ser visualizada diretamente.Matriz – examinar a matriz de dados. Exemplos de matrizes com estrutura bem definida e bem representada pelo dendrograma: uma matriz com estrutura fraca. geralmente somente a segunda representação está disponível. com estrutura de gradiente): Pr rsã eli o m in ar 61 Ve . pode "desligar" a opção "por coluna".(coluna) – equivalente a estandardização por variável. Se desejar estandardizar dentro dos objetos (linhas). e as linhas e colunas estão ordenadas pelos escores correspondentes no primeiro eixo da ordenação (escores linhas/colunas na CA e escores/autovetores na PCA). bem representada por uma ordenação (neste caso. No caso de ordenação. mal-representada no dendrograma: matriz de dados com estrutura forte. Os nomes das linhas devem corresponder exatamente com os nomes das UTOs. a matriz sendo acrescentada deve ter o mesmo número de linhas que o número de UTOs no dendrograma. Algumas opções (especialmente a opção de colorir ou "pintar" o dendrograma com cores representado as variáveis originais) necessitam da matriz original de dados usados para calcular os coeficientes ou distâncias que deram origem ao dendrograma. Não deve haver duplicação de nomes das linhas da 62 Pr rsã eli o m in ar Ve . usar uma outra matriz de dados para colorir o dendrograma pelos valores das variáveis que contém ou para ordenar os ramos do dendrograma por algum critério externo. também. é possível verificar visualmente se eventuais agrupamentos na vegetação estão correlacionados com fatores externos como solo. utilizando a planilha Acrescentar dados – acrescenta dados de uma outra matriz num arquivo indicado pelo usuário. Desta maneira. Esta operação permite acrescentar variáveis que não foram usadas para produzir os coeficientes ou distâncias que formaram o dendrograma. Esta opção tem algumas limitações: idealmente. Por exemplo. valores par variáveis de solo poderiam ser sobrepostos num dendrograma que foi construído utilizando somente dados de composição da vegetação. É possível.Opções para dendrogramas A tela de opções para dendrograms permite selecionar uma série de opções que modificam o dendrograma e ajudam a interpretar os resultados. Modificar – a matriz de dados. etc. Assim. Caso ocorra algum problema.). Em casos onde foram utilizadas variáveis binárias. Difere da opção "por variável" por que espera dados discretos que podem ser tratados como marcadores de classes distintos e não contínuas. Colorir o dendrograma – o programa oferece diversas opções para colorir ou "pintar" os ramos do dendrograma:uniforme – deixa todos os ramos com a mesma cor por grupos – deixa os ramos coloridos de acordo com os grupos escolhidos no próprio dendrograma. as cores refletem a freqüência dos estados 0 e 1 em cada ramo do dendrograma. e os dados serão acrescentados como novas colunas da matriz. é possível representar visualmente a variação de uma variável escolhida no dendrograma inteiro. O efeito desta opção é de colorir os ramos que correspondem às UTOs com uma cor que corresponde ao valor da variável escolhida. como na opção anterior. as mensagens de erro são aquelas do processo "juntar matrizes lado ao lado ". com as cores variando continuamente de azul para o valor mínimo da variável até vermelho para o valor mais alta.matriz ou das UTOs no dendrograma. enquanto valores intermediários recebem tonalidades variando de verde até amarelo e laranja. Variável para cores – escolhe a variável usada para colorir o dendrograma Pr rsã eli o m in ar Ve 63 . mas pode ser desligada por outras opções e este comando permite recuperar esta coloração. por variável – talvez o mais interessante das opções. o programa fará uma operação de juntar matrizes lado ao lado. Note que as cores usados para demarcar os grupos também são descontínuas. esta permite colorir o dendrograma de acordo com os valores de uma das variáveis na matriz de dados (com as variáveis originais ou com o acréscimo de outras variáveis – veja "Acrescentar dados". O valor numérico correspondendo à cor pode ser revelado se ligar as "etiquetas" dos nós com a opção "valor para cores". por grupo em variável – difere da opção "por grupo" porque usa valores de grupo contido numa variável da matriz de dados. usando o recurso "marcar grupos". Ao escolher uma matriz a ser acrescentada. Quando se marca grupos desta maneira. taxon. ou qualquer variável descontínua que pode ser considerada como um delimitador de grupos (tipo de solo. acima). os ramos posteriores que representam agrupamentos recebem uma cor que reflete a média aritmética dos membros do grupo. Estes grupos podem representar resultados de outros métodos de agrupamento já armazenados num arquivo ou métodos completamente diferentes como TWINSPAN. esta opção é ligada automaticamente. A PCO é utilizada para investigar a estrutura de matrizes de semelhança ou distância. portanto. geralmente representando a ocorrência de espécies dentro das amostras de um levantamento fitossociológico. segundo a terminologia de ter Braak e Prentice (1988). Análise indireta de gradientes analisa uma única matriz. etc. Fitopac contém uma pequena seleção de métodos de ordenação que permite realizar algumas das analises mais simples. quando uma matriz de abundância não está disponível. desde análise de comunidades a taxonomia e muito além (inclusive análises de textos literários. Comparada com PCA. astronomia. Para análises mais especializadas ou complexas. PCO] e 2) análise direta de gradientes [RDA. CA geralmente é preferível. e se tem somente uma estimativa da semelhança ou distância entre objetos. geralmente com a intenção de explicar a estrutura de uma comunidade ou o padrão de variação observado dentro de um conjunto de observações morfológicos. produzindo uma análise que não é tão sensível a relações curvilineares como PCA. esta análise é simétrica. o uso mais freqüente de ordenação é na investigação de gradientes ambientais. mas onde é usada corretamente (ie. geologia.Introdução A ordenação consiste é um processo de ordenar amostras/objetos ou espécies/características de acordo com algum critério para realçar algum aspecto ou aspectos dos dados. sendo menos afetados por "outliers" (dados extremos) e interpretáveis em termos geométricas. em geral. Análise de Componentes Principais (PCA) . sendo pouco informativos para o conjunto de dados como um todo. As análises fornecidas em Fitopac incluem 1) análise indireta de gradientes [PCA.Esta análise tenta produzir um novo sistema de eixos que maximiza a quantidade de variância do primeiro eixo em diante. Nestas circunstâncias. Uma desvantagem desta análise é a sua sensibilidade a "outliers" ou dados mais extremos (por exemplo uma espécie relativamente rara que ocorre em abundância em poucas amostras). geografia. os resultados freqüentemente são melhores e mais fáceis de entender que aqueles produzidos por CA. e infere a natureza do(s) gradientes(s) presente(s) a partir das correlações entre as espécies (PCA) ou a relação entre espécies e amostras (CA). Análise de Correspondências (CA) . em diferentes campos de estudo. Alguns autores tratam PCA como obsoleta para análise de dados ecológicos. em gradientes relativamente curtos e lineares). que não muda o ângulo entre eixos. várias destas análises tem sido reinventadas mais que uma vez. pois a presença de um gradiente impõe uma estrutura no conjunto de dados que pode ser detectada por diversos métodos de ordenação. Por causa da diversidade de áreas de aplicação. podendo ser usados para diversos tipos de estudos em diferentes áreas de pesquisa. Estes métodos. Esta é a análise mais simples de todo o conjunto de métodos de ordenação incluídos neste pacote. tratando linhas e colunas da matriz da mesma maneira e em escalas diretamente comparáveis. são de aplicação muito ampla. analisa os desvios das proporções esperadas a partir das somas marginais da matriz de dados.). ponderando as amostras pela quantidade de indivíduos em cada e as espécies pelo número de amostras onde ocorrem. CCA]. CA. sempre sujeito à limitação que os eixos são ortogonais – isso quer dizer que a rotação dos eixos encontrada por PCA é uma rotação rígida.Ordenação Ordenação . As técnicas usadas para ordenar dados variam de métodos relativamente simples a métodos extremamente complexos e difíceis de interpretar. sugiro o uso de "pacotes" específicos como "CANOCO" ou pacotes estatísticos como "SYSTAT" ou "Statistica".Originalmente concebida para análise de tabelas de contingência. e com diferentes nomes. sujeito a graves problemas quando os dados sendo analisados representam um gradiente longo e curvilinear. 64 Ve A) Análise indireta de gradientes - Pr rsã eli o m in ar . arqueologia. Pressupõe que a relação entre espécies (descritores ) seja linear e é. Recomenda-se o uso desta análise em situações onde tem gradientes moderados e onde o efeito de "arco" ou "ferradura" pode dificultar a interpretação de uma análise PCA. nem as distâncias entre objetos. Em estudos ecológicos. mas altera o espaço de ordenação antes de procurar os eixos de variância (ou neste caso "inércia") máxima. que pode resultar em eixos que efetivamente separam somente uma única amostra/espécies do resto. a interpretação da ordenação é altamente duvidosa e deve ser tratado com muito cautela. como uma forma de Análise de Correlação Canônica (CANCOR) onde se maximiza a variância explicada entre as matrizes e não a correlação. Dual Scaling. esta análise é mais indicada em casos onde os gradientes sendo investigados são relativamente curtas e lineares. alternativamente. pois pode utilizar quase qualquer distância ou coeficiente de semelhança. Compartilha as mesmas vantagens e desvantagens que a CA. Esta análise também é conhecido como "Classical Scaling" ou "metric Multidimension scaling". e segundo McCune.Analisa matrizes de distância ou semelhança. RDA é menos sensível a "outliers" que a CCA. Palmer http://ordination. mas esta análise produz escores em escalas diferentes que representam melhor ou as amostras ou as espécies. ou a partir das variáveis ambientais (escores LC). e os resultados refletem as propriedades da distância ou coeficiente escolhido.edu/ e Legendre e Legendre 1998). e a análise é equivalente a CA com a restrição que os escores. Como PCA e CA. O programa oferece os dois tipos de escore como opções. Biplot de Gabriel B) Análise direta de gradientes Análise de Redundâncias (RDA) . Esta é uma análise extremamente versátil.Esta é uma análise canônica que tenta encontrar eixos que descrevem o máximo possível de variância na matriz de dados. Em geral. Sujeito às mesmas limitações e vantagens que a PCA. recomenda-se utilizar os escores LC (baseados nos dados ambientais).okstate. As diferentes escalas e métodos de calcular os escores são explicados em detalhes em Legendre e Legerdre (1998). se as variáveis ambientais tem uma relação linear com o gradiente. Análise Canônica de Correspondências (CCA) – Outra análise canônica. porém. CCA tornou-se uma das análises mais utilizadas em estudos de comunidades. e podem levar a situações onde alguns autovalores são negativos. de novo. sujeito à limitação que os escores obtidos sejam uma combinação linear das variáveis contidas numa segunda matriz contendo os dados ambientais.estes não tem uma representação exata no espaço. com o uso de coeficientes não métricos (??) . As amostras e espécies são tratadas da mesma maneira como em CA. A variância explicada desta maneira é chamada de redundância e é daí que vem o nome da análise. Pode ser descrito como um PCA com restrições impostas pela matriz de dados ambientais ou. mas até um certo ponto pode remover o efeito de arco em gradientes mais longos. mas não existe consenso total sobre o melhor conjunto de escores (veja McCune 1997. Um problema sério pode ocorrer. Os eixos correspondentes não podem ser interpretados e. devido à complexidade dos resultados produzidos.Também é conhecida como "Médias Reciprocas – Reciprocal Averaging (RA)" e diversos outros nomes (Correspondence Analysis. Os escores das amostras também podem ser calculadas a partir dos escores das espécies (escores WA). sejam combinações lineares das variáveis ambientais.) Foi desenvolvida inicialmente para análise de tabelas de contingência e posteriormente ampliada para uso com outros dados quantitativos. Análise de Coordenados Principais (PCO) . etc. em casos onde o valor absoluto dos autovalores negativos chega próximo aos valores dos maiores autovalores positivos. mas sua interpretação requer bastante cuidado. os escores WA são preferíveis quando existe muito "ruído" no dados ambientais. produzindo um sistema de eixos descrevendo as posições dos objetos no espaço de tal maneira de as distâncias entre os objetos reproduzem a matriz original. Pr rsã eli o m in ar Ve 65 . . abre-se uma janela que permite escolher o tipo de ordenação e a configuração da ordenação. mas neste caso a PCA é substituída por CA. A Tela de Ordenação Ao escolher Ordenação. Analyse Factorielle des Correspondances. botão Modificar Dados Ambientais– fazer modificações da matriz secundária de dados ambientais. CA. aspecto.Use a caixa "Tipo de análise" para escolher entre os principais tipos de ordenação. declividade. Não tem efeito para análises simples (PCA. etc. após a configuração da análise. eliminação de amostras e variáveis. etc. já que estas análises são utilizadas para investigar a relação entre pares de matrizes. botão Ordenar– executa a análise escolhida.) para análises canônicas (RDA e CCA). botão Modificar Matriz– fazer modificações da matriz principal como transformações. antes de começar a análise. [veja usando a planilha] botão Dados Ambientais– usado para escolher um arquivo contendo a matriz de dados ambientais (por exemplo. Ativado somente quando uma matriz de dados ambientais já foi escolhida. [veja usando a planilha] 66 Pr rsã eli o m in ar Ve . uma de dados de uma comunidade e a outra de dados ambientais. elevação. Os tipos disponíveis nesta versão são: A) Análise indireta de gradientes - Análise de Componentes Principais (PCA) Análise de Correspondências (CA) Análise de Coordenados Principais (PCO) Biplot de Gabriel B) Análise direta de gradientes Análise de Redundâncias (RDA) Análise Canônica de Correspondências (CCA) Note que as opções RDA e CCA estarão disponíveis somente depois de indicar uma matriz de variáveis ambientais. PCO e Biplot). características de solo. pois os escores neste caso preservam corretamente as distâncias entre espécies. quando se trata de uma análise PCA de comunidades muito distintas. Alguns autores sugerem que os eixos resultantes da análise não centrada são mais polarizados e fáceis de interpretar. PCO: No momento. Dados faltando não são permitidos nestas análises – ao detectar dados faltando.por exemplo. CCA: Ao escolher CCA. A versão não centrada utiliza o zero da escala original de medição das variáveis como origem. 19?? para detalhes). 19?? e Pielou. Antes de executar a análise. Esta opção deve ser usada quando as variáveis incluídas na análise tem escalas de medição ou unidades muito diferentes (ex. Por outro lado. não há opções para este tipo de análise. ficam disponíveis duas escalas para apresentação dos resultados – tipo 1 e tipo 2 . escala tipo 1 é apropriada quando se deseja enfatizar as relações entre as amostras – neste caso os escores representam corretamente as distâncias Χ2 entre as amostras.que correspondem aos "scaling 1" e "scaling 2" de Legendre e Legendre (1998). Note que estes opções são independentes. Biplot (Gabriel): No momento. Esta opção produz uma análise onde toda as variáveis contribuem igualmente. espécies dominantes num levantamento) que tendem a dominar a análise quando se usa a matriz de covariância. Esta é a forma de análise mais comum. cada variável tem média = 0. a opção Covariância extrai os autovalores e autovetores de uma matriz de covariância e deve ser usada quando as variáveis tem escalas e unidades semelhantes. e onde o total de variância é igual ao número de variáveis. e torna a análise mais sensível a abundância (tamanho) e da menos ênfase a proporção (forma). Covariância/Centrada e Covariância/NãoCentrada. A escala tipo 2.e. ou quando se deseja reduzir o efeito de variáveis com variâncias maiores (ex. peso em kg e altura em metros).0. o programa tenta detectar eventuais problemas – variáveis sem variação. "Scaling type 3" de Legendre e Legendre (1998) não está disponível. 19?? par mais detalhes e discussão). não há opções para este tipo de análise. não há opções para este tipo de análise. Efetivamente. e quando se deseja que variáveis com maiores variâncias fazem uma contribuição maior à variância total . e geralmente é mais fácil de interpretar. utilize o botão "Ordenar" para realizar a análise. Esta opção é equivalente ao uso das variáveis originais. Isso quer dizer que o origem do sistema de coordenados é no centróide da nuvem de pontos que representam os dados no espaço multidimensional. Pr rsã eli o m in ar 67 . Centrada/Não Centrada – a opção "Centrada" utiliza um sistema de coordenados onde o origem de cada eixo está na média da variável correspondente.o uso da opção "correlação" extrai os autovalores e autovetores da matriz das correlações entre variáveis. – e elimina as linhas/colunas que estão causando o problema alem de tentar detectar condições que não são permitidas pelo método de análise escolhido – por exemplo. e é equivalente à utilização de dados estandardizados – i. com pouca sobreposição nas espécies presentes em cada (veja Grieg-Smith. o programa oferece as opções de 1) substituir os valores faltando pela média da variável 2) excluir a linha (objeto) 3) excluir a coluna (variável) e 4) abandonar a análise. sendo possível escolher 4 combinações : Correlação/Centrada. linhas que só tem dados faltando. Esta forma de PCA é relativamente pouco usada. etc. Após a escolha das opções. A substituição pela média permite usar a Ve CA : No momento. Os resultados também podem ser interpretados em termos de riqueza e diversidade (veja ter Braak.0 e desvio padrão = 1. no momento. Correlação/Não-Centrada. RDA: No momento. valores negativos em CA ou CCA. Disponível somente com matrizes de semelhança ou distância. não há opções para este tipo de análise. sem qualquer estandardização. A ação mais apropriada depende dos dados e da intenção do investigador. uma análise de dados de abundância de espécies dentro de uma comunidade onde o foco principal de interesse é nas espécies dominantes. é indicada para casos onde se deseja dar ênfase às espécies.As Opções PCA : Correlação/Covariância . e tende a enfatizar proporções (ou forma) mais do que abundância (tamanho). ao contrário. especialmente para análises canônica e não-canônicas. Note que este saída NÃO é gravado automaticamente.FPM" onde o matriz de dados foi "genebra. Resultados – visualiza os resultados como texto no formulário de saída. "Genebra-CA-escores das linhas.. 2) gravação dos resultados (tabelas) como arquivos Fitopac (FPM) que podem ser usados para outras análises ou com outros programas (por exemplo para produção de gráficos). Visualizando e interpretando resultados de uma ordenação A tela de resultados de ordenação varia com o tipo de ordenação realizada. mas ambos consistem de 3 partes principais – 1) visualização dos resultados na forma de tabelas e listagem.matriz inteira mas.. introduz alguma distorção que pode ser severo se o número de valores faltando seja grande. 3) Gráficos mostrando os principais resultados. Não é necessário gravar estes arquivos. Note. Gravar – gravar os arquivos contendo as tabelas de resultados (em formato Fitopac – FPM). Opções 2 e 3 provavelmente são mais corretas. inevitavelmente. PCO. causando problemas na interpretação dos resultados. mas somente quando o usuário manda gravar de dentro do formulário de resultados. Arq(uivo) – visualizar um arquivo. CA. mas são convenientes se pretende fazer outras análises usando os resultados obtidos ou se quiser usar algum outro programa para fazer gráficos dos resultados.) . Biplot) . Em casos onde é importante fazer a análise apesar da presença de dados faltando.botões: Vis. Para análises não-canônicas (PCA. mas envolvem a perda de pelo menos um objeto ou variável. Os arquivos gravados são determinados pelas caixas de seleção no painel "Gravar". seguido por uma análise PCO da matriz de distância/similaridade. Os nomes dos arquivos são gerados automaticamente pelo programa e consistem do nome do arquivo de dados original com o acréscimo de uma descrição do conteúdo .por ex. 68 Pr rsã eli o m in ar Ve . porém. uma alternativa é o cálculo de uma matriz de distâncias ou similaridades entre objetos (veja a seção Calculando Distâncias.fpm". que permite valores faltando.. que a presença de valores faltando pode tornar uma matriz que normalmente seria métrica numa matriz não-métrica. etc. A média usada é a média aritmética da coluna da matriz onde o dado faltando se encontra.) d) Parar a análise. Não deve ser usada quando faltam muitos dados – nesta situação. Pr rsã eli o m in ar Em casos onde faltam muitos dados (>5% da matriz). a análise vai ser modificada de maneiras imprevisíveis e as estimativas não são confiáveis. exceto a última! Nesta situação é preciso decidir se realmente vale a pena continuar com uma análise que inevitavelmente será muito pouco confiável. eliminando este problema.Dados faltando em análises multivariadas Em diversos tipos de análise multivariada. b) Eliminar a coluna ou colunas contendo os dados faltando. Ve 69 . Aceitável quando tem poucos valores faltado. mas vai produzir estimativas viciadas de autovalores. ou se não seria mais prudente tentar completar a matriz com dados reais. é provável que os resultados obtidos serão questionáveis com qualquer uma destas opções. etc. A melhor opção quando os dados faltando são numerosos e tendem a ficar concentrados em poucas variáveis ( por exemplo alguma característica que é difícil de medir ou que falta freqüentemente em muitos espécimes) c) Eliminar a linha ou linhas contendo os dados faltando. escores em eixos. as opções disponíveis em Fitopac incluem: a) substituir o valor da média do variável no lugar do dados faltando. Melhor opção quando os valores faltando estão concentrados em uma ou poucas amostras que são particularmente incompletas (espécime faltando diversos órgãos. Nestes caos. a matriz não pode ter dados faltando. se for marcado (padrão). Caso queira alterar estes valores. contendo os escores das Colunas e Linhas da matriz original respetivamente. desmarca esta caixa. de segmentos. Análise Distendia . Utilizar "Análise Padrão" . etc. sem alterar os valores preestabelecidos. no formato descrito por Oksanen e Minchin. Recomenda-se uma leitura cuidadosa do manual do usuário deste programa antes de alterar as opções. aparece mais uma tela que permite escolher quais são as amostras que serão eliminadas.Se esta caixa for marcada.Chamando outros programas janela decorana A janela DECORANA permite escolher diversas opções antes de executar o programa.no.se for marcado (padrão).determina se será utilizada DCA (valor preestabelecido) ou CA (se a caixa estiver em branco) Criar arquivo de saida . os valores pré-selecionados pelo FitopacShell correspondem aos valores "default" do programa como descrito por Hill. Em geral. Saida Fitopac . mas não diretamente por FITOPAC ou diversos outros pacotes. grava um arquivo "XXX. e para muitas análises. Pode ser usado por outros programas. Algumas destas opções são complexas e requerem um bom conhecimento do programa DECORANA para serem usadas corretamente. Note que as amostras não são removidas do arquivo original. Veja "Eliminando ou Mascarando itens". Estes arquivos podem ser utilizados por outros programas do FITOPAC ou convertidos a outros formatos utilizando "MATRIZ" ou "Winmat" Eliminar Amostras . Ao apertar este botão. "rescaling".SCR" contendo escores para linhas e colunas da matriz original XXX. e os campos adicionais aparecerão."XXXEscoresDasColunas.permite eliminar algumas amostras antes de executar a análise.FPM" e "XXXEscoresDasLinhas. 70 Pr rsã eli o m in ar Ve .FPM". seria suficiente executar o programa. converte o arquivo "SCR" do DECORANA em dois arquivos FITOPAC . a análise será feita utilizando os valores padrão (defaults) do DECORANA . Recomendo não alterar estes valores se não entende o que significam ! (veja o manual do usuário de DECORANA para mais detalhes). será suficiente executar o programa.ceh. pois permite utilizar as facilidades de Windows para responder às perguntas do programa DOS que não é muito "amigável" na sua forma original.canodraw. (veja o manual do usuário de DECORANA par mais detalhes). e para muitas análises.quando marcada.este botão deve ser acionado para voltar ao programa FitopacShell quando termina a análise e exame dos arquivos de resultados está completa Ve 71 . Pr rsã eli o m in ar Sair . facilitando seu uso.provavelmente desejável na maioria de análises onde a matriz contem muitas espécies raras. quando acionado. porém. pode ser mais interessante fazer transformações utilizando MATRIZ ou Winmat e gravando o resultado antes de usar DECORANA. Deve ser notado.htm ou de http://www. recomendo usar a versão Windows (gratis.o botão executar vai executar o programa DECORANA.ac. Estes resultados podem ser gravados como um arquivo rtf que pode ser importado diretamente por "Word" e diversos outros programas. e que a atual versão efetivamente é obsoleta. os valores pré-selecionados pelo FitopacShell correspondem aos valores "default" do programa como descrito por Hill. Transformar dados . Executar . Em geral. Download do site : http://www. e deve ser acionado quando tem feito todas as alterações que deseja fazer nas opções do programa. embora produz os cálculos corretamente.Reduzir peso de espécies raras .se for escolhida esta opção.com/wintwins. aparece este botão que. sem alterar os valores preestabelecidos.uk/products/software/wintwins. uma transformação dos dados é aplicada. Recomenda-se uma leitura cuidadosa do manual do usuário deste programa antes de alterar as opções. aplica uma análise onde o peso das espécies raras é reduzido . janela twinspan Esta tela oferece um interface que permite usar a versão DOS do programa "TWINSPAN" a partir do Fitopac.para cancelar a análise DCA antes de executá-la. que já existe uma versão Windows do programa. mostra o arquivo de saída principal do programa contendo os resultados da análise.Após a execução do programa. Em muitos casos. A janela TWINSPAN permite escolher diversas opções antes de executar o programa. utilizando o formato do próprio DECORANA.html) – é provável que este interface não será mantido na próxima versão do Fitopac. Algumas destas opções são complexas e requerem um bom conhecimento do programa TWINSPAN para serem usadas corretamente. Em geral. Cancelar . Ver resultado . É essencial que você entende este formato para utilizar esta opção. Assim. máximo de espécies na tabela .controla quantas espécies vão aparecer na listagem da tabela final. Eliminar Espécies e Eliminar Amostras . No momento. mas em levantamentos muito grandes.controla o número máximo de espécies indicadoras selecionadas para cada divisão feita durante a análise. pode ser necessário usar 5 ou 6 níveis. 3 ou 4 níveis são suficientes. Pseudoespécies .opção do TWINSPAN para gravar os resultados da divisão dos grupos num arquivo que pode ser usado por outros programas.não são removidas da matriz original. Normalmente deve ser igual ao número total de espécies. FITOPAC não é capaz de ler estes arquivos.No.este é um dos campos mais importantes pois determina como o programa utiliza dados quantitativas. A idéia é que diferentes densidades (ou outra medida) de uma espécie sejam representadas como se fossem espécies distintas (as "pseudoespécies") e estas podem ser usadas como indicadores e não somente a presença ou ausência da espécie. é meio reduzida. mas na maioria dos casos (especialmente quando a matriz não é muito grande). (Veja "Eliminando ou Mascarando itens"). Com matrizes grandes. o programa imprime um diagrama para cada divisão.indica o número de níveis de subdivisão dos grupos. portanto. máximo de indicadores por divisão . via o mecanismo de criação de "pseudoespécies".se esta caixa for marcada. etc. pode ser interessante limitar o número de espécies para evitar que a tabela fique muito extensa. uma alta densidade de uma dada espécie pode ser usada como indicador de um 72 Ve No. Gravar resultados em arquivo . Se o grupo for menor que este valor. Note que esta remoção é temporário . Quer diagramas das divisões . Pr rsã eli o m in ar Tamanho mínimo de grupo . não será mais subdividido .indica o tamanho mínimo do grupo para subdivisão. Veja o manual de TWINSPAN para maiores explicações. máximo de níveis de divisão . No. e não conheço programa com esta capacidade. A utilidade desta opção. mostrando amostras mal-classificadas.estes botões acionam uma tela que permite escolher quais espécies/amostras serão removidas da análise. tipo de vegetação, mesmo que a espécie esteja presente em baixa densidade em todos os outros tipos de vegetação. Para definir as pseudoespécies, é necessário fornecer os níveis de corte para subdivisão das espécies. Três opções são oferecidas aqui 1) os valores "default" do programa TWINSPAN, com 5 níveis de corte de 0 2 5 10 20. Isso quer dizer que terá os seguintes pseudoespécies :valor x=0 0 < x <= 2 2 < x <= 5 5 < x <=10 10 < x <= 20 x > 20 pseudoespécie ausente (0) 1 2 3 4 5 2) um único nível de corte - 0. Tudo é tratado como presença ou ausência (isto é, qualquer valor diferente de 0 é tratado como "pseudoespécie 1") 3) valores definidos pelo usuário. São permitidos até 9 níveis de corte. Se escolher esta opção, é aberta uma caixa de dialogo onde o número de níveis é informado, e o programa então abre uma tabela onde pode inserir os níveis de corte, junto com os peso das pseudoespécies e seus potenciais indicadores. O peso (valor inteiro de 0 - 1000000) e potencial indicador (0 ou 1) da pseudoespécie determinam o peso que aquela pseudoespécie receberá nos cálculos e se pode ser usada como espécie indicadora, respetivamente. Normalmente estes valores seriam 1, mas se quiser dar, por exemplo, importância maior para pseudoespécies representando maiores valores, pode dar peso maior que 1. É comum querer que espécies indicadoras sejam espécies "reais" e não pseudoespécies e, neste caso, pode dar um potencial indicador de 1 para o primeiro nível e 0 para os outros. Os pseudoespécies devem estar em ordem crescente de abundância. Note que o FitopacShell não faz qualquer tipo de verificação dos valores e simplesmente passa tudo diretamente para o programa TWINSPAN. (Veja o manual do TWINSPAN para maiores detalhes sobre estas opções). Executar - o botão executa o programa TWINSPAN, e deve ser acionado após a escolha de todos as opções da análise. Pr rsã eli o m in ar Ve 73 Ver resultado - este botão aparece somente após de executar o programa e permite examinar o arquivo de resultados produzido e, se quiser, gravar como arquivo rtf que pode ser lido por Word, etc. Sair - voltar para FitopacShell depois de completar a análise Cancelar - cancelar e voltar para FitopacShell. 74 Pr rsã eli o m in ar Ve Bibliografia referências bibliográficas Legendre e Legendre Sneath & Sokal 1973 Pr rsã eli o m in ar 75 Ve ......................................................................................................................................................................................................58 Análise multivariada .....................................................................60 Comando Arquivos ...................15 F FitopacShell ............................................................................................................................................................10 Dendrogramas ......................................................................................................................................................................................................10 Arquivos FPD .....................................................................................................................10 C CADERNO .......................................10 COEF ....................10 Coeficientes de semelhança e distâncias em Fitopac .................................................................................................................................................................................10 E eliminando linhas ou colunas ..........9 Agrupamentos ............................................................10 Analisando grupos em dendrogramas ...........................................................................45 Distâncias ..................................................10 Dados crus..................................................................................................................................................10 CRIAMAT .........................................................................................................................................................................................................Introdução............................................................................................................................................48 coeficientes e distâncias usados em Fitopac........................................................28 Examinando editando e imprimindo dados .........................................48 A Tela de Opções em Diagramas de Dispersão .................................................................................................................................10 Calculando Parâmetros Fitossociológicos....................................................................................................................................................................................................................10 Dados faltando em análises multivariadas ................................................................................................................10 Considerações gerais....10 76 Pr rsã eli o m in ar Ve ...................................39 Criando gráficos diretamente ...........................16 FPC ...............................................................................10 Criando Gráficos ..........12 Configuração.........................................................................................................................................................................................................................................................................................................................................................................65 A tela Coefs...........................................................................................................................................................................................................................................................................................................................................................................................41 Diagramas de vetores ................................................................................................................................................................................................................................................................................................................................................28 Eliminando ou Mascarando...............................................Index A A Janela Ordenação ........7 Configuração do FITOPAC ........................................5 Formatos de Arquivo ............45 Diagramas de dispersão......................................................................................................................................................................................................................................................................................................................................................................................................49 Colorindo matizes .....................................................................8 Convertendo dados crus em matriz ..........................................................................................................................................................................................................47 Calcular parâmetros fitossociológicos ........................................................................................................................................................39 D DAD......................................................................................................56 A Tela Principal ...........................................................69 DECORANA ..............43 A Tela do Dendrograma........................18 Cornell..........10 Arquivos FPM.............................................10 CLUSTER.........................................................................................................................................................................10 Coeficientes.. .........................................................................................................................................19 TWINSPAN ........................................................................................8 P PARAMS ...........................................................................................................................................34 Tipos de dados em matrizes .....................................................................................................................................45 I Importando matrizes..............................Introdução...............................................................32 Modificando e manipulando arquivos de coeficients ...............................................................64 Os botões de funções.....................................................................................................................................................22 Pr rsã eli o m in ar N Ve 77 ....................................37 O Menu Principal .........................................................................................................................................................10 Ordenação ................................................21 Instalação ....................................................................46 Gráficos de Barra .....................................................................................................................................................................................................................................................................................5 Introdução a análise de Agrupamentos ........................................................................................................................10 Nomes suspeitos....................................................................................................................................................................10 matriz espécies raras ....45 Gráficos de caixa................................................................46 Gráficos de linha ........................10 Os tipos de dados usados por Fitopac ........35 Tela Nomes suspeitos...........................................................................49 NMS.........................................................................................................................................14 M MATRIZ ...............................................................................................................................................10 R referências bibliográficas .........................................................70 Janela TWINSPAN ................................................................................................................................................................................................................................14 PREPARE ............................................................................................................................................................................................................................................................G Gráficos 3D ..................................................54 J Janela DECORANA ..............................................10 T Tela de Análise de Agrupamentos ......................................................................................................................................................................................................10 Opções para dendrogramas .............................................................................................................................................................................33 O O formulário de resultados...........................75 S Similaridade .....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................10 U Usando a planilha.....................................................................71 L Lendo e convertendo dados num arquivo FPD .............................62 Ordenação ....................................................................................................................7 Introdução ...............................54 Tela Nomes duplicados ....10 Preparando dados ................. ............................V Variáveis mascaradas e Marcadores .....................................................................20 Visualizando e interpretando resultados de uma ordenação..................................68 78 Pr rsã eli o m in ar Ve ...................
Copyright © 2024 DOKUMEN.SITE Inc.