ApostiladeCRP194EstatisticaExperimental (3)

UNIVERSIDADE FEDERAL DE VIÇOSACAMPUS DE RIO PARANAÍBA APOSTILA DA DISCIPLINA CRP 194 – ESTATÍSTICA EXPERIMENTAL Profº. Carlos Eduardo Magalhães dos Santos Rio Paranaíba/MG 2011 UNIVERSIDADE FEDERAL DE VIÇOSA Campus de Rio Paranaíba CRP 194 – Estatística Experimental – 2011/II Professor: Carlos Eduardo Magalhães dos Santos 1. CONTEÚDO Capítulo 1 – Introdução a Estatística Experimental Capítulo 2 – Testes de hipóteses Capítulo 3 – Contrastes Capítulo 4 – Introdução à Experimentação Capítulo 5 – Delineamento Inteiramente Casualizado Capítulo 6 – Procedimentos para Comparações Múltiplas Capítulo 7 – Delineamento em Blocos Casualizados Capítulo 8 – Delineamento em Quadrado Latino Capítulo 9 – Experimentos Fatoriais Capítulo 10 – Experimentos em Parcelas Subdivididas Capítulo 11 – Regressão e Correlações 2. AVALIAÇÕES Prova 1 2 3 Data 08/09 (Qui) 13/10 (Qui) 24/11 (Qui) Horário 08:00 08:00 08:00 Local GOU 002 GOU 002 GOU 002 O sistema de avaliação constará de: Avaliações Prova 1 Prova 2 Prova 3 Avaliação (Assiduidade, Listas de Exercícios e Sabatinas) Peso 30% 30% 30% 10% Serão ministradas sabatinas sobre o conteúdo explicado, com valor a ser definido pelo professor, a perda da mesma acarretará em perca da pontuação, mesmo havendo justificativa. Será aplicada uma quarta prova escrita com peso de 30%, que abordará todo o assunto do semestre, para o estudante que perder pelo menos umas das três provas por motivo condizente. O cálculo do rendimento acadêmico será realizado tomando-se os três valores das provas realizadas mais o valor da avaliação do aluno. Levar tabelas dos testes de hipóteses e calculadora para as provas, pois são de uso individual. As listas de exercícios sugeridos deverão ser entregues, impreterivelmente, no dia da realização da prova daquele conteúdo. 1 No momento das provas não será permitida qualquer comunicação entre os alunos e utilização de meios ilícitos (cola), provocando cancelamento da prova do(s) aluno(s) interceptado(s). O professor marcará um único período de revisão para cada uma das provas que deverá ser respeitado, dado que não serão abertas exceções para revisões de provas fora do período estabelecido. O período de revisão de prova será divulgado no quadro de avisos do Campus e no SAPIENS. A data da prova final será marcada pelo Registro Escolar. 3. BIBLIOGRAFIA BANZATTO, D. A.; KRONKA, S. N. Experimentação agrícola. FUNESP: Jaboticabal, 1989. 249 p. BARBIN, Décio. Planejamento e análise estatística de experimentos agronômicos. Editora UFV: Viçosa, 2003. GOMES, F. P. Curso de estatística experimental. 14ª edição, Livraria Nobel S.A.: São Paulo, 2000. 475 p. MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. 2ª edição, LCT Editora: Rio de Janeiro, 2003. 463 p. RAMALHO, M. A. P., FERREIRA, D. F., OLIVEIRA, A. C. Experimentação em genética e melhoramento de plantas. Lavras: Editora UFLA, 2005. 322 p. RIBEIRO JÚNIOR, J. I. Análises estatísticas no Excel – guia prático. Editora UFV: Viçosa, 2004. 249 p. VIEIRA, S.; HOFFMANN, R. Estatística experimental. Editora Atlas: São Paulo, 1989, 179 p. 2 4. PLANEJAMENTO Aula 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Dia 01/08 04/08 08/08 11/08 15/08 18/08 22/08 25/08 29/08 01/09 05/09 08/09 12/09 15/09 19/09 22/09 26/09 29/09 03/10 06/10 10/10 13/10 17/10 20/10 24/10 27/10 31/10 03/11 07/11 10/11 14/11 17/11 21/11 24/11 28/11 01/12 Assunto Apresentação da disciplina Testes de hipóteses: conceitos e aplicações Teste t para uma média Teste F para duas variâncias Teste t para duas médias independentes Teste t para duas médias dependentes Contrastes: conceitos Métodos para obtenção de contrastes ortogonais Princípios básicos da experimentação Recesso (ExpoALTO 2011) Delineamento Inteiramente Casualizado (DIC) Prova 1 Análise de variância (ANOVA) Teste de Tukey e Duncan Testes t e de Scheffé Delineamento em Blocos Casualizados (DBC) Aplicações do Delineamento em Blocos Casualizados Delineamento em Quadrado Latino (DQL) Aplicações do Delineamento em Quadrado Latino Experimento Fatorial (EF) Resolução de exercícios Prova 2 Interação A x B não significativa de EF Interação A x B significativa de EF Experimentos em parcelas subdivididas (EPS) Interação A x B não significativa de EPS Interação A x B significativa de EPS Regressão linear de 1º grau Regressão linear de 2º grau Regressão linear com delineamento experimental: Aplicações Recesso (Comemoração do Dia do Servidor Público) Correlações: conceito Exercícios Prova 3 Interface de sistemas estatísticos Exercícios 3 . análise e interpretação deles. um vaso com plantas. uma área do terreno com plantas. dentre outros. doses de fungicidas para controle de Alternaria solani na cultura da batata. análise dos dados e interpretação dos resultados obtidos. além de um amplo entendimento das análises a serem feitas quando todos os dados estiverem disponíveis. um animal. coleta.INTRODUÇÃO À ESTATÍSTICA EXPERIMENTAL 1. elemento ou material cujo efeito desejamos medir ou comparar em um experimento. dentre outros. delineamento em blocos casualizados e delineamento em quadrado latino. ___________________________________________________________________________________ 1 . A estatística experimental tem por objetivo o estudo dos experimentos. Existem alguns conceitos básicos relacionados a essas etapas da experimentação agrícola. quantidade de fertilizantes para a cultura do milho. d) Delineamento experimental: é o plano utilizado na experimentação e implica na forma como os tratamentos serão designados às unidades experimentais.0 .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 1. fornecendo métodos para geração. que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos. que passaremos a enunciar: a) Experimento ou ensaio: é um trabalho previamente planejado. descrição. Uma parcela por ser: uma planta ou um grupo delas. b) Tratamento: utilizado para designar o método. Como exemplo de delineamentos experimentais. podemos citar: delineamentos inteiramente casualizados. Um tratamento pode ser por exemplo: variedades de soja. organização. c) Unidade experimental ou parcela: é a unidade que vai receber o tratamento e fornecer os dados que deverão refletir seu efeito. isto é: seu planejamento. execução. recipiente para a produção de mudas de espécies florestais.1– Introdução A estatística é entendida como a matemática aplicada a dados observados. e o planejamento de experimentos é essencial para indicar o esquema sob o qual as hipóteses podem ser testadas. desta forma. 1. os níveis dos fatores podem ser combinados de maneiras diferentes.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ e) Esquema: quando no mesmo experimento são avaliados dois ou mais fatores. uma suposição sobre causas. Na prática.2 – Pesquisa Científica ___________________________________________________________________________________ Prof. Hipótese científica é aquela passível de ser testada. f) População ou conjunto universo: é o conjunto constituído por todos os dados possíveis com relação à característica em estudo. Carlos Eduardo Magalhães dos Santos 2 . isto é. j) Hipótese: é uma suposição fundamentada sobre o porquê de um fato. ou seja. i) Erro experimental: é o efeito de fatores que atuam de forma aleatória e que não são passíveis de controle do experimentador. ou por meio de suas conseqüências. e. trabalhamos com amostras (experimentos) para obter informações que serão utilizadas nas populações amostradas. Para tanto é necessário um conjunto de observações ou dados. o procedimento geral é o de formular hipóteses e verificá-las. h) Variável resposta: é a variável mensurada usada para avaliar o efeito de tratamentos. g) Amostra: é uma parte representativa da população. Exemplos: esquemas fatoriais e esquemas de parcelas subdivididas. se desejamos estudar a produtividade de milho na região do Alto Paranaíba. Em qualquer pesquisa científica. a população será constituída pelas produtividades das lavouras de milho de toda a região do Alto Paranaíba. um subconjunto do conjunto universo. diretamente. As hipóteses são testadas por meio de métodos de análise estatística que dependem do modo como as observações ou os dados foram obtidos. Por exemplo. o planejamento de experimentos e a análise dos dados estão intimamente ligados e devem ser utilizados em uma certa sequência nas pesquisas científicas. Análise Figura 1 – Fluxograma da pesquisa científica.Objetivo 8 – Reformulação do conhecimento 3 .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 2 – Formulação de questões e hipóteses 1 .Testes 5 .Planejamento 7 .Conclusões 4 – Coleta dos dados 6 . ___________________________________________________________________________________ 3 . Por outro lado. a obtenção de conclusões válidas para toda a população. Os testes de hipóteses fazem parte de um conjunto de procedimentos inferenciais usados em estatística. com base em amostras retiradas dessa população.0 – TESTES DE HIPÓTESES 2. É lógico que podemos tomar decisões erradas devido à amostragem. Por exemplo. inferimos que todo o lote é azedo. corremos o risco de levar abacaxi azedo para casa. Por exemplo. em ciência é necessário que todos os procedimentos sejam padronizados e bem especificados. quando vamos a feira para comprar abacaxi e um feirante nos oferece um pedaço de abacaxi. se o pedaço for azedo. com base na observação de amostras. Isto pode acontecer porque o lote de abacaxi pode não ser completamente uniforme no teor de açúcar. O uso de tais procedimentos permite ao pesquisador fazer inferências a respeito de uma população a partir de uma ou mais amostras representativas da população da qual as amostras foram retiradas. Porém. ou seja. concluímos que todo o lote de abacaxi vendido por aquele feirante é doce. No dia a dia usamos de inferência para tomarmos certas decisões.1– Introdução Um dos principais objetivos da Estatística é a tomada de decisões a respeito da população. O objetivo deste capítulo é fornecer os conceitos teóricos fundamentais para um correto uso dos testes de hipóteses mais comuns para comparar no máximo parâmetros de duas populações. Carlos Eduardo Magalhães dos Santos 4 . Este é um exemplo prático que ilustra o principio básico do teste de hipóteses. Outros testes de hipóteses aplicáveis para comparações de parâmetros envolvendo mais de duas populações serão apresentados no capítulo sobre comparações múltiplas. ou porque experimentamos um abacaxi doce no meio de um lote composto por abacaxis azedos.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ 2. mesmo que na prova tenha sido doce. Qual o nosso procedimento? Se aquele pedaço de abacaxi for doce. ___________________________________________________________________________________ Prof. Assim sendo para se obter o valor de um parâmetro é necessário coletar informação a respeito de uma ou mais variáveis em todos os indivíduos dessa população. ou seja. tais como não-tendenciosidade. Alguns exemplos de medidas de posição são a média aritmética (m = μ = E(X)). realizar um censo da mesma. Para contornar este problema. σˆ 2 e V Observe que algumas vezes a simbologia usada para representar os parâmetros e seus respectivos estimadores é muito parecida. podemos ˆ . m para estimar a média populacional. As medidas de posição são também conhecidas como medidas de tendência central. ˆ . pois elas indicam em que posição. a distribuição dos valores de uma população tende a se concentrar. a mediana (Md) e a moda (Mo). porque ou a população é muito grande ou é de tamanho infinito. o pesquisador pode retirar uma amostra da população e a partir desta amostra caracterizar a população de onde a amostra foi retirada sem nenhum viés. As medidas de dispersão indicam quanto os valores de uma população estão dispersos em torno de sua média. É possível caracterizar uma população por meio de duas medidas principais: posição e dispersão. Para alcançar este objetivo deve-se usar fórmulas estatísticas. 2. ou seja.2 – Estimador: quando na maioria das situações não é possível realizar o censo de uma população. e para a variância amostral são ˆ (X). que é usada para estimar a variância populacional.1 – Parâmetro: é uma medida usada para caracterizar uma população. dentre outros. Outras simbologias comuns para a média amostral são μˆ e xˆ . variância mínima. a diferença representar a média populacional por m e seu estimador por m entre o parâmetro e o seu estimador é o chapéu que existe no símbolo usado para ___________________________________________________________________________________ 5 . Como exemplo de medidas de dispersão temos a variância ( σ 2 = V(X)) e o desvio-padrão ( σ ). que apresentem características estatísticas desejáveis.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 2. fornecer estimativas que se aproximem do valor paramétrico à medida que o tamanho da amostra aumenta.2 – Conceitos fundamentais em testes de hipóteses 2. que é usada Exemplos de estimadores são a média aritmética amostral. s2. Por exemplo.2. conhecidas como estimadores. e a variância amostral.2. Estes diferentes valores que um estimador assume são também conhecidos como estimativas. As hipóteses estatísticas devem ser formuladas de modo a minimizar os erros de decisão. 2. Em termos estatísticos esta hipótese é expressa por: m ’Cristalina’ = m ’Roundup Ready’ Em que: m 'Cristalina’ : média da produtividade/ha da variedade de soja ‘Cristalina’. pois seus valores mudam de amostra para amostra.55. que será verificada por um teste de aderência. Isto acontece porque os elementos que pertencem a uma amostra geralmente não são os mesmos em outras amostras. isto não é possível. o pesquisador deve deixar claro qual a hipótese que ele deseja testar. Neste procedimento. nada mais é o que levou a realizar a sua investigação. Consequentemente é possível estabelecer uma distribuição de probabilidades para os valores de um estimador. A hipótese científica do pesquisador. exemplo. Por outro lado. pois para a obtenção do mesmo são usados todos os elementos da população. suponha que um pesquisador deseja verificar se as variedades de soja ‘Cristalina’ e ‘Roundup Ready’ apresentam a mesma produtividade por hectare. Para realizar um teste de hipótese e divulgar as conclusões é necessário seguir um procedimento aceito pela comunidade científica. a diferença conceitual entre parâmetro e estimador é enorme. Conforme mencionado anteriormente. pois se assume que ele tem um valor constante. ou uma afirmação quanto a natureza da população. Para o parâmetro. os estimadores podem assumir valores diferentes em amostras diferentes. Por isto recomenda-se muito cuidado para usar corretamente a simbologia para o parâmetro e para o estimador.2.3 – Hipóteses em um teste estatístico É uma suposição quanto ao valor de um parâmetro populacional que será verificada por um teste paramétrico. o estimador representa uma variável aleatória.5 s 2 = 4. O parâmetro é sempre um valor constante. Isto parece ser uma diferença mínima. e ___________________________________________________________________________________ Prof. X = 10.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ representar o estimador. Para isto ele precisa escrever em termos estatísticos a sua hipótese científica. Por exemplo. Carlos Eduardo Magalhães dos Santos 6 . mas do ponto de vista estatístico. a hipótese de nulidade é construída com o expresso propósito de ser rejeitada. ele lança a sua desconfiança a respeito do que pode acontecer. No entanto. Então ele tem que ter uma alternativa para esta hipótese inicial. se ele desconfiar que a variedade ‘Roundup Ready’ tem uma média de produtividade/ha maior que a variedade ‘Cristalina’. num teste de hipóteses. Neste caso. O pesquisador deseja testar esta hipótese porque ele desconfia que a média de produtividade ha-1 não seja a mesma para as duas variedades.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ m ’Roundup Ready’ : média da produtividade/ha da variedade de soja ‘Roundup Ready’. Nesta alternativa. Já a outra hipótese que contém um sinal de desigualdade. Como o próprio nome diz. apenas se desconfiar que exista diferença significativa entre as médias de duas populações. ela é uma alternativa a hipótese de nulidade. a hipótese alternativa é expressa por m 'Cristalina’ ≠ m ’Roundup Ready’ Neste ponto fica claro que para realizar um teste de hipóteses é necessário que o pesquisador lance duas hipóteses. quando um pesquisador realiza um experimento. então a hipótese alternativa é expressa por m 'Cristalina’ < m ’Roundup Ready’ Uma outra alternativa seria a situação em que ele não tem nenhuma desconfiança de qual variedade teria uma média de produtividade/ha maior do que a outra. quem teria o trabalho de realizar um experimento se achasse que duas médias são iguais? Qualquer um se daria ao trabalho de instalar um experimento. ___________________________________________________________________________________ 7 . então a hipótese alternativa é expressa por m 'Cristalina’ > m ’Roundup Ready’ Por outro lado. Na verdade. Isto faz sentido porque. comumente denotada por H 0 . até que se prove o contrário. É dado este nome pois ela representa uma nulidade de diferença entre médias. a Ho é considerada como a hipótese verdadeira. A primeira que contém um sinal de igualdade é conhecida como hipótese de nulidade. Se ele desconfiar que a variedade ‘Cristalina’ tem uma média de produtividade/ha maior que a variedade ‘Roundup Ready’. comumente designada por Ha ou H1. é conhecida como hipótese alternativa. Portanto pode-se construir uma distribuição de probabilidades para os valores de um estimador. apenas uma possibilidade foi lançada. O que um teste de hipóteses geralmente faz é comparar duas fontes de variação.4 – Decisão em um teste de hipóteses Para decidirmos se devemos ou não devemos rejeitar a hipótese de nulidade. supondo que o pesquisador não desconfie a princípio qual variedade que apresenta maior média de produtividade/ha. o par de hipóteses a ser lançado é expresso por Ho: m ’Cristalina’ = m ’Roundup Ready’ Ha: m 'Cristalina’ ≠ m ’Roundup Ready’ Observe que apesar de ser possível existir três possibilidades para Ha. Conforme mencionado anteriormente. o valor estimado será idêntico àquele especificado para o parâmetro. ou seja. Não faz sentido lançar as hipóteses usando os estimadores. pois como o estimador é uma variável aleatória. Se as duas fontes de variação apresentarem valores semelhantes então o valor do parâmetro não difere do valor especificado na hipótese de nulidade. a ___________________________________________________________________________________ Prof. Raramente. baseamos na comparação do valor especificado para o parâmetro com aquele estimado a partir de uma amostra da população. A segunda fonte de variação diz respeito à variação existente na população. pois os mesmos não possuem um valor fixo. sendo que existem intervalos de valores mais prováveis de ocorrer do que outros. é esperado que ele possa assumir valores dentro de um intervalo. O valor fornecido pelos estimadores poderá diferir do ponto de vista matemático. apresentam valores diferentes para amostras diferentes. enquanto que o parâmetro possui um valor fixo. Esta diferença matemática nem sempre representa que a hipótese de nulidade deve ser rejeitada. do valor esperado para o parâmetro. Outro ponto importante é que as hipóteses foram lançadas em termos dos parâmetros e não em termos dos seus estimadores. A primeira fonte de variação diz respeito à variação entre o valor paramétrico e uma estimativa.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ Para o exemplo dado. um estimador pode assumir valores diferentes para amostras diferentes. Carlos Eduardo Magalhães dos Santos 8 . Neste caso. 1.2. 5 Variável X ___________________________________________________________________________________ 9 .3 m = 1. Conclui-se.50 metros.3 0. ou seja. Suponha que um pesquisador desconfie que a estatura média dos adolescentes na faixa etária de 13 a 15 anos é menor do que aquela informada por um órgão oficial como sendo igual a 1.6 0. Neste caso a variação entre o valor paramétrico e a estimativa é significativa. Este pesquisador sabe de fontes seguras que a estatura é uma variável aleatória que segue uma distribuição normal com variância igual a 0. precisamos conhecer a distribuição de probabilidades do estimador usado para estimar o parâmetro. 0. o que leva a rejeitar-se a hipótese de nulidade. se as duas fontes de variação apresentarem valores bem diferentes.5 0. a média de estatura for igual a 1.0 2.8 0. Se a informação do órgão oficial for verdadeira.2 0.25 metros2. 1 0.1 0 0. digamos X.8 2.9 0.0 1. poderíamos descrever a distribuição de valores da variável estatura. Para isto.5 1. portanto que a hipótese Ho não deve ser rejeitada. conclui-se que a variação entre o valor especificado para o parâmetro e o de sua estimativa não é própria dos dados. Vamos ilustrar esta situação no seguinte exemplo.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ variação observada entre o valor paramétrico e sua estimativa é uma variação própria dos dados.7 f(X) 0.8 1.4 0. como X ~ N (1.25) e representar esta distribuição por meio do gráfico.5 metros. Para então decidirmos entre rejeitar ou não-rejeitar a hipótese de nulidade devemos estabelecer o que é uma “pequena” e uma “grande” variação.3 2. Por outro lado.50.5 0. por exemplo. m ˆ ~ N(1. a variância é igual á variância original dividido pelo tamanho da amostra e que a variável ˆ também segue distribuição normal. 0. Carlos Eduardo Magalhães dos Santos 10 . Da população de adolescentes é possível retirar um grande número de diferentes amostras de tamanho 10. É evidente que a segunda opção é operacionalmente mais fácil.025). pois o pesquisador teria condições de conhecer o verdadeiro valor da média de estatura. ou seja. Na segunda opção. Pode ser demonstrado que a média de todas as médias amostrais é igual à média da variável original. o pesquisador teria que usar uma média da amostra para tomar a sua decisão. Na primeira opção nenhum teste de hipóteses seria necessário. O gráfico da aleatória m distribuição das médias amostrais seria ___________________________________________________________________________________ Prof. f(X) é dada por: 1  x −m   σ  2  1 f (X ) = e 2 σ 2π Para verificar se a informação do órgão oficial é correta. Cada amostra fornece um valor para a média amostral. ou seja.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ A função densidade de probabilidade de uma variável aleatória contínua que tem distribuição normal. ou então tomar uma amostra de adolescentes e medir a estatura dos mesmos e usar um teste de hipóteses. no caso. o pesquisador deve escolher um tamanho de amostra adequado. pois o custo e o tempo gasto são muito menores. ele conheceria o parâmetro média daquela população de adolescentes. Para a realizar a segunda opção. suponha que para este exemplo o tamanho amostral ideal seja igual a 10 indivíduos. o pesquisador tem duas opções: medir a estatura da população de todos os adolescentes.5. 49 e o valor suposto igual a 1. principalmente se a população for muito grande. Pode-se-ia atribuir esta variação ao acaso. é mais concentrada em torno da média do que a variável original X. em que Xb = m Como pode ser notado. vamos supor diferentes resultados possíveis para a média amostral obtida a partir de uma amostra de 10 estudantes.8 0.4 1.5 metros Para se entender a lógica dos testes de hipóteses.2 0 0.5 1.75 1 1.4 0.25 2. As hipóteses estatísticas para esta situação seriam: Ho: m altura = 1.2 1 f(Xb) 0.5 0. Deve ficar entendido que é possível retirar um número muito grande de amostras de mesmo tamanho de uma população. a variação entre o valor observado igual digamos m a 1.6 0.50 é muito pequena. esta variação é uma variação própria de uma população que apresente média igual a 1. Isto acontece porque a variância das médias amostrais é menor do que a variância da variável original estatura.75 2 2. a distribuição das médias amostrais para a variável estatura.5 metros Ha: m altura < 1.5 Variável: Xb ˆ e f(Xb) = f( m ˆ ). numa pesquisa geralmente toma-se decisão usando-se apenas uma única amostra.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 1. representadas no gráfico por Xb. obtenha uma média amostral. No entanto.49 metros. Neste caso.5 metros. Em termos probabilísticos poderíamos dizer que existe uma grande probabilidade de numa população com média igual a 1. igual a 1. Suponha inicialmente que o pesquisador. ˆ .50 ___________________________________________________________________________________ 11 .25 m = 1. ou seja. Capítulo 2 – Testes de hipóteses _____________________________________________________________________ metros existir grupos de 10 indivíduos que apresentem uma média de estatura igual ou inferior a 1,49 metros. Justificativa semelhante poderia ser atribuída a médias amostrais que tivessem valores próximos ao valor suposto, tais como: 1,48; 1,47; 1,42; etc. Por outro lado, se a média amostral apresentar um valor muito distante do valor suposto, como por exemplo, 0,60 metros, o pesquisador tem a tendência de rejeitar a hipótese de nulidade, isto porque há um forte indício de que a amostra foi retirada de uma população que apresenta uma média menor do que a suposta de 1,5 metros. Em termos probabilísticos poderia se dizer que a probabilidade de encontrar um grupo de indivíduos com média igual ou inferior a 0,60 metros é muito pequena, em uma população que apresenta uma média igual a 1,5 metros. Veja a figura a seguir 1.4 1.2 1 f(Xb) 0.8 0.6 0.4 0.2 0 0.5 0,60 0.75 1 1.25 1.5 1.75 2 2.25 2.5 Variável: Xb A função densidade de probabilidade da média amostral de uma variável aleatória que tem distribuição normal, no caso, f(Xb), é dada por: f (Xb) = 1 e 2π σ n     1  x −m  2 σ     n  2 ___________________________________________________________________________________ Prof. Carlos Eduardo Magalhães dos Santos 12 CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ A área sob a curva abaixo do valor 0,60 m indica a probabilidade de se encontrar um valor igual ou inferior a 0,60 metros em uma população com média igual a 1,5 metros. Como pode ser notada, esta probabilidade é pequena em relação à área total do gráfico. Com base neste raciocínio é que o pesquisador estabelece um valor crítico que o ajuda a decidir sobre a rejeitar ou não-rejeitar a hipótese de nulidade. Este valor crítico pode a princípio ser estabelecido de duas maneiras. A primeira delas seria a situação em que o pesquisador de posse de seu conhecimento prévio no assunto estabeleceria um valor crítico antes de coletar a amostra. Este valor crítico seria um valor para a média amostral tal que acima dele o pesquisador não-rejeitaria a hipótese de nulidade e abaixo dele rejeitaria a hipótese de nulidade. Digamos que neste caso o valor crítico adotado fosse igual a 1,0 metro. O valor para a média igual a 1,0 metro determinaria duas regiões na distribuição das médias amostrais, conforme é apresentado na figura a seguir. Estas duas regiões são denominadas como Região de Não-Rejeição da Hipótese de Nulidade (RNRHo) e Região de Rejeição da Hipótese de Nulidade (RRHo). Como os respectivos nomes indicam, se o valor da média amostral estiver contido na RNRHo, o pesquisador não deve rejeitar a hipótese de nulidade. Caso, contrário, se o valor da média amostral estiver contido na RRHo, o pesquisador deve rejeitar a hipótese de nulidade e considerar a hipótese alternativa como sendo a hipótese verdadeira. ___________________________________________________________________________________ 13 Capítulo 2 – Testes de hipóteses _____________________________________________________________________ Deve-se observar que ao adotar o critério acima, o pesquisador sempre estará sujeito a cometer um de dois erros possíveis. Um destes erros, conhecido como erro tipo I ou erro alfa (α ) , se refere à probabilidade de rejeitar uma hipótese verdadeira, no caso a hipótese de nulidade. Na figura citada anteriormente, o critério adotado pelo pesquisador foi que se a média amostral assumisse um valor menor que 1,0 metro, então rejeitar-se-ia a hipótese de nulidade. É exatamente a adoção deste critério que pode levar o pesquisador cometer um erro em sua tomada de decisão, pois como se pode observar na figura, em uma população que realmente apresenta média igual a 1,5 metros, existe uma pequena percentagem de indivíduos que podem apresentar uma altura média inferior a 1,0 metro. No entanto, o pesquisador acaba assumindo que devido ao fato daquela chance ser muito pequena, ele decide que se uma amostra de elementos apresentar média menor que 1,0 metro, ela pertence a uma população com média inferior à especificada de 1,5 metros, conforme é mostrado na figura seguir. H0: m = 1,5 Ha: m < 1,5 Nesta figura, pode-se observar duas curvas: a da esquerda quando se assume que a população tem uma média inferior a especificada, isto é a curva para a hipótese alternativa (Ha) com m < 1,5 metros; e a curva da direita para a situação em que a população apresenta média igual à especificada, ou seja, curva para a hipótese de ___________________________________________________________________________________ Prof. Carlos Eduardo Magalhães dos Santos 14 no caso 1. é bem maior numa população com m < 1.5 metros do que numa população com média m = 1. conhecido como erro tipo II ou erro beta (β) .5 metros. Este erro se refere à probabilidade nãorejeitar a hipótese Ho quando Ho é falsa (ver figura anterior).5 metros. mas a probabilidade de encontrar indivíduos com média inferior ou igual ao valor crítico.0 metro. quanto menor for o valor crítico.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ nulidade (Ho) com média m = 1.9 m. fizermos que o valor crítico para a média amostral seja igual a 0. No exemplo que estamos trabalhando. o qual aumenta o seu valor à medida que se diminui o erro alfa. ___________________________________________________________________________________ 15 .5 metros. valores nesta região podem levar a duas conclusões que a rigor ambas estariam “corretas”. ele na verdade acaba por concluir que a população de onde foi retirada a amostra pertence aquela população com média m < 1. este erro beta será tanto maior. No entanto. Um raciocínio lógico que se tem é tentar fazer este erro ser o menor possível. Observem. Isto foi definido anteriormente como erro alfa. a área sob a curva da hipótese Ho que leva a sua rejeição se refere à probabilidade de se rejeitar Ho quando Ho é verdadeira. em todo teste de hipóteses existe também um outro erro. Quando o pesquisador toma a decisão de rejeitar a Ho. É esta diferença nas probabilidades que leva o pesquisador a rejeitar Ho ao invés de não rejeitá-la. Conforme mencionado anteriormente. Se por exemplo. então a nova proporção entre os erros alfa e beta seria conforme a figura a seguir. a qual se baseia no fato do pesquisador estabelecer o valor crítico de rejeição da hipótese Ho com base em seu prévio conhecimento do problema. Carlos Eduardo Magalhães dos Santos 16 . a que nível de significância que o teste de hipóteses será realizado. pois existe uma tendência que. Este procedimento. É de consenso que se publique. embora computacionalmente não seja uma tarefa fácil. o valor crítico é conhecido a partir do nível de significância estabelecido e o uso de tabelas estatísticas. o nível de significância esteja dentro de uma faixa de valores aceito pela maioria dos pesquisadores.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ Nós acabamos de ver a maneira empírica de realizar um teste de hipótese. para determinada área do conhecimento. O valor obtido de uma ou mais amostras retirada da(s) população(ões) é então usado para calcular o valor de uma estatística que tem distribuição de probabilidades idêntica àquela usada para identificar o valor tabelado. embora seu forte apelo prático traga a desvantagem de não poder estabelecer a princípio qual seria a probabilidade de ser cometer o erro tipo I. beta. A diferença está basicamente que no método nãoempírico. A determinação do nível de significância quando se usa o método empírico é possível. Desta forma. Existe uma tabela estatística apropriada para cada tipo de teste de hipóteses. o método não-empírico é o mais usado. a que nível de significância um teste de hipóteses foi realizado. ou seja. pois envolve a integração de funções complexas tais como exponenciais. O quadro abaixo sintetiza as probabilidades de uma escolha decisiva: Realidade Decisão Ho é verdadeira Ho é falsa Rejeitar Ho α 1− β Aceitar Ho 1− α β O procedimento para um teste de hipóteses usando o método não-empírico é similar ao método empírico. A comparação dos valores calculado e tabelado permite ao pesquisador decidir entre rejeitar ou não-rejeitar Ho. é possível comparar os resultados e conclusões de diferentes trabalhos de pesquisa. ___________________________________________________________________________________ Prof. dentre outros. Estas tabelas fornecem valores críticos que delimitam regiões de rejeição e de não-rejeição de Ho. gama. que nos trabalhos científicos. Devido a todas estas razões. 05 (ou 5%).  n  Usando-se a variável normal padronizada ou reduzida Z. ensaiou-se 50 lavouras em diferentes pequenas propriedades. Seja uma variável aleatória X ~ N µ. n = tamanho da amostra.3 – Testes de hipóteses 2. Pode-se demonstrar que a média amostral X também segue está distribuição normal com a mesma média µ porém a  σ2  variância está dividida pelo tamanho da amostra X ~ N µ.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Os próximos itens deste capítulo irão tratar sobre alguns testes de hipóteses que usam este método não-empírico.54 ___________________________________________________________________________________ 17 . σ 2 . Pode-se confirmar a eficiência do melhoramento da cultura ao nível de significância de 0. Mediante avanços no programa de melhoramento genético desta cultura na UFV proclamou-se que a produtividade pode ser aumentada. Para testar esta declaração.3. R: Z cal = 3. tendo-se determinado a produtividade média nestas de 1850 Kg.1 – Teste Z 2.1. temos Z = Z= x − µo σ 2x ou x − µo .  .1 – Teste de hipóteses para uma média populacional Caso em que X é normalmente distribuído com variância populacional ( ) conhecida. Exemplo: a) A produtividade média por hectare do feijoeiro vermelho na Região de Viçosa/MG é de 1800 Kg e o desvio padrão de 100 Kg. onde: σ n x = média amostral.3. 2. µ o = valor da hipótese Ho. σ = desvio padrão populacional. ao nível de significância α . Sejam X A e XB as médias obtidas em duas amostras de tamanho n A e n B . testar: Ho : µ A = µB ou Ho : µ A − µB = 0 Ha : µ A > µB 1 .Capítulo 2 – Testes de hipóteses _____________________________________________________________________ b) Considerando o mesmo problema anterior.1) Ho : µ = 1800 Kg Ha : µ ≠ 1800 Kg α = 5% b.3. ou µ A ≠ µB 3 Utilizaremos então a estatística: Z= (X ) e XB − (µ A − µB ) A ( V X A e XB ( ) ) Sob Ho segue-se que X A e XB vai seguir uma distribuição normal com média ( ) 2 2 2  2    zero e variância  σ A + σB  . σ A + σB  . testar: b.2 – Teste de hipóteses para duas médias populacionais Caso em que X A e X B são normalmente distribuídos com variância populacionais conhecidas. Considerando-se as variáveis aleatórias X A e XB independentes. respectivamente. Carlos Eduardo Magalhães dos Santos 18 . então: nB  nA nB   nA  Z= (X σ A 2 A ) e XB − 0 nA +σ 2 B Z= ou nB (X σ 2 A A nA e XB + σ ) 2 B nB Exemplo: ___________________________________________________________________________________ Prof.2) Ho : µ = 1800 Kg Ha : µ ≠ 1800 Kg α = 1% 2. ou então: X A e XB ~ N 0. com variâncias σ 2A e σB2 conhecidas é médias µ A e µB desconhecidas. ou µ A < µ B 2 . A n n A B  Nosso problema é. retiradas de duas populações normais P A e P B .1. tende-se que: (X A ) 2   σ2 + σB  e XB ~ N µ A − µ B . Sabe-se que os tempos de execução em minutos através dos métodos A e B. Ha 1 : p > p o . Um veículo testou 50 pneus do tipo A e 40 pneus do tipo B. testar a hipótese de que a vida média dos 2 tipos é a mesma. σB2 = 10. ou Ha 2 : p < p o . retirou-se uma amostra de 48 operações realizadas com o trator A e 36 operações realizadas com o trator B. Afim de chegar a uma decisão. Adotando-se um risco α = 4% . b) Um fabricante faz 2 tipos de pneus para o tipo A (σ A = 2500 milhas ) e para o tipo B (σB = 3000 milhas ) .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ a) Dois diferentes tratores são indicados para a execução de determinada tarefa na propriedade. 2º passo: Fixar α. são normalmente distribuídos com variâncias σ 2A = 8. A que conclusão chegaremos ao nível α = 1%. Deseja-se saber se são igualmente eficientes no sentido de tempo exigido para execução da mesma. A seguir os tempos de execução foram medidos obtendo-se as seguintes médias amostrais (minutos): X A = 40 e XB = 42. obtendo 24000 milhas e 26000 milhas de duração média dos respectivos tipos. Teste para a proporção 1º passo: Ho: p = p o . ou Ha 3 : p ≠ p o . variável escolhida é a Z 3º passo: Região crítica (demonstrado no quadro) ___________________________________________________________________________________ 19 . p o = valor de Ho. Para amostras com tamanho superior a 30.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ 4º passo: Calcular Z Z= f − po p o (1 − p o ) n onde: f = freqüência relativa do evento na amostra.6.3. As condições de mortalidade de uma suinocultura são tais que a proporção de nascidos que sobrevivem até 60 dias é de 0. n = tamanho da amostra. 2.2 – Teste t de Student – Teste para pequenas amostras A aplicação do teste t é indicada quando o tamanho amostral é igual ou inferior a 30 elementos. Testar está hipótese ao nívelα= 5% se em 1000 nascimentos amostrados aleatoriamente verificou-se 530 sobreviventes até 60 dias. recomenda-se o ___________________________________________________________________________________ Prof. Conclusão a) Se Z α ≤ Z ≤ − Z α → Rejeita-se Ho (Teste bilateral) 2 2 b) Se Z ≥ Z α → Rejeita-se Ho (Teste unilateral à direita) c) Se Z ≤ − Z α → Rejeita-se Ho (Teste unilateral à esquerda) Exemplo. 5º passo. Carlos Eduardo Magalhães dos Santos 20 . CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ teste Z. O uso do teste t pressupõe que a característica em análise é normalmente distribuída com variância populacional desconhecida. O teste t tem três aplicações principais: teste para uma média populacional, teste para duas médias populacionais e teste para mais que duas médias populacionais. As duas primeiras aplicações vão ser apresentadas neste capítulo. A terceira aplicação será apresentada no Capítulo sobre Comparações Múltiplas. 2.3.1.1 – Teste de hipóteses para uma média populacional Este teste é usado para verificar se a média de uma característica de uma população assume um valor especificado, digamos m o . Para aplicação deste teste devemos selecionar uma amostra aleatória de tamanho n da população. Digamos que os elementos amostrais sejam: X 1 , X 2 ,...., X n . Com base nestes elementos amostrais, ˆ , e seu desvio padrão, s. Estas estatísticas são então calculamos a sua média, m utilizadas para calcular o valor de t usando a expressão t= ˆ − mo m s n Esta estatística t, tem distribuição t de Student com n-1 graus de liberdade, ou seja, é uma distribuição de probabilidades que depende do número de graus de liberdade associado. A figura a seguir, ilustra a distribuição t para três valores diferentes no número de graus de liberdade. ___________________________________________________________________________________ 21 Capítulo 2 – Testes de hipóteses _____________________________________________________________________ As hipóteses num teste t, para uma média populacional, são do seguinte tipo Ho: m = m o versus Ha: m > m o ou Ha: m < m o ou Ha: m ≠ > m o Para decidirmos entre Rejeitar ou Não-Rejeitar Ho, comparamos o valor de t com o valor tabelado de t obtido por t tab = t α (n − 1) . A tabela apresentada no anexo desta apostila é uma tabela elaborada para testes bilaterais. Neste caso, para encontrarmos o valor tabelado basta entrar com o valor de α e o respectivo número de gruas de liberdade. Por outro lado, se desejarmos realizar um teste unilateral e usarmos uma tabela bilateral, devemos entrar na tabela com 2α como nível de significância. Este procedimento garante que realizaremos o teste ao nível de significância α como desejado para testes unilaterais. Depois de obtido o valor calculado e o valor tabelado de t, usamos a seguinte regra decisória: - se t ≥ t tab então Rejeita-se Ho. - se t  t tab então Não-Rejeita-se Ho. ___________________________________________________________________________________ Prof. Carlos Eduardo Magalhães dos Santos 22 CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Exercícios 2.1 – Em indivíduos sadios, o consumo renal de oxigênio distribui-se normalmente em torno de 12 cm3/min. Deseja-se investigar, com base em cinco indivíduos portadores de certa moléstia, se esta tem influência no consumo renal médio de oxigênio. Os consumos medidos para os cincos pacientes foram: 14,4 12,9 15,0 13,7 13,5 Qual a conclusão ao nível de 1% de significância? 2.2 – Uma amostra de seis elementos, extraída de uma população normal, forneceu 6 ∑X i=1 i = 84,0 e 2 ∑ (Xi − mˆ) = 55,0 6 i=1 Deseja-se saber se a média da população pode ser considerada como superior a 11. Qual a conclusão, ao nível de 5% de significância? 2.3.1.2 – Teste de hipóteses para duas médias populacionais O objetivo deste teste é verificar se suas populações, digamos população 1 e população 2 apresentam um mesmo valor médio para uma determinada característica, isto é, deseja-se verificar se m 1 = m 2 . Com esta finalidade é necessário obter uma amostra de cada população. Estas duas amostras podem ser relacionadas ou não, ou seja, podem ser dependentes ou independentes uma da outra. Esta distinção no relacionamento das duas amostras gera dois testes distintos. 2.3.1.2.1 – Teste de hipóteses para o caso de duas amostras independentes Duas amostras são ditas independentes quando não existe nada que as relacione. Nesta situação, os valores amostrais foram obtidos em conjuntos amostrais distintos, ou seja, os elementos amostrais que originaram os valores de uma amostra são distintos dos elementos amostrais que originaram a segunda amostra. Conforme mencionado anteriormente, para comparar as médias das duas populações, toma-se uma amostra de cada população. Suponha que as amostras geradas sejam X 11 , X 12 ,..., X 1n e X 21 , X 22 ,..., X 2m , onde o tamanho das amostras podem ser diferentes, ou seja, n pode ser diferente de m. Para cada amostra, então calcula-se a sua média e variância. Um estimador comum para a variância é obtido ___________________________________________________________________________________ 23 se t ≥ t tab então Rejeita-se Ho. O tamanho da amostra é utilizado como um peso para o cálculo desta variância média ponderada. ou seja: . . A fórmula geral para o cálculo da variância amostral é dada por: Uma vez obtidas estas estimativas.2)graus de liberdade. é usada para testar a hipótese de nulidade H 0 : m 1 = m 2 versus Ha: m 1 > m 2 ou Ha: m 1 < m 2 ou Ha: m 1 ≠ m 2 A regra de decisão é idêntica ao caso anterior. A fórmula do estimador comum é: em que s12 e s 22 são as variâncias amostrais das populações 1 e 2. Carlos Eduardo Magalhães dos Santos 24 . A obtenção de um estimador comum para a variância pressupõe que a variância das duas populações sejam idênticas. ou seja σ 12 = σ 22 . ___________________________________________________________________________________ Prof.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ tomando-se uma média ponderada das estimativas de variância obtidas para as duas amostras.se t < t tab então Não-Rejeita-se Ho. A comparação do valor calculado de t com o valor tabelado dado por t tab = t α (n 1 + n 2 – 2). respectivamente. calcula-se o valor da estatística t dada por: Esta estatística tem distribuição t de Student com (n 1 + n 2 . Digamos que esta nova avaliação resulte nos seguintes valores amostrais X 21 . Por exemplo. X 2n .1. Para verificar se houve alteração na média.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 2. Portanto para verificar se houve alteração na média de uma população avaliada em duas condições diferentes. Em termos de desvios. Se a condição 2 não tiver nenhum efeito.. pode-se testar a hipótese de que o desvio médio ser estatisticamente igual ___________________________________________________________________________________ 25 . avalia-se uma característica de interesse do pesquisador num conjunto de elementos amostrais tomados ao acaso na população quando a mesma esteja sob a condição 1.. espera-se que em média os valores observados nas duas condições sejam iguais.3 – Os dados que seguem referem-se a cinco determinações da resistência de dois tipos de concreto. Digamos que a avaliação da característica resulte nos seguintes valores amostrais X 11 .. Os mesmos elementos amostrais são novamente avaliados para a mesma característica na nova condição 2.2 – Teste de hipóteses para o caso de duas amostras dependentes Duas amostras de elementos são ditas serem dependentes quando existe algo que as relacione.3. embora se suponha que os elementos populacionais sejam os mesmos nas duas condições... sejam submetidos à condição 2. Cada condição representa uma população distinta. O objetivo neste caso é verificar se houve alteração na média de uma população quando a mesma é avaliada sob duas condições diferentes. podemos dizer que as duas amostras de valores são dependentes uma vez que foram tomados de um conjunto de elementos amostrais comum... se a alteração das condições não resultasse em nenhum efeito significativo. se os valores de duas amostras forma obtidos de um mesmo conjunto de elementos amostrais. os elementos amostrais que originaram a primeira amostra. há evidência de que o concreto 1 seja mais resistente que o concreto 2? Concreto 1 54 55 58 51 57 Concreto 2 50 54 56 52 53 2.2. X 12 . poderíamos dizer que a diferença entre os valores observados na primeira condição e na segunda condição seria em média igual a zero. Depois de feita esta avaliação. X 22 .. Ao nível de 5% de significância. X 1n . Capítulo 2 – Testes de hipóteses _____________________________________________________________________ a zero. Portanto, a partir de duas amostras obtém-se uma outra baseada nos desvios, conforme é mostrado a seguir Elemento amostral i 1 2 ... n Amostra 1 X 11 X 12 ... X 1n Amostra 2 X 21 X 22 ... X 2n d i = X 1i – X 2i d1 d2 ... dn Apresentado desta forma, o teste para duas amostras dependentes reduz-se teste t para uma média populacional, visto anteriormente. No presente caso, deseja-se testar se a média dos desvios é igual por exemplo a um valor m o . Escrevendo em termos de hipóteses estatísticas teríamos Ho: m = m o versus Ha: m > m o ou Ha: m < m o ou Ha: m ≠ > m o Para decidir entre rejeitar ou Não-Rejeitar a hipótese de nulidade, deve-se calcular o valor da estatística t dada por t= ˆ − mo m s n em que  n   ∑ di  n 2 di −  i=1  ∑ n s 2 = i=1 n −1 n ˆ = m ∑d i=1 i n 2 Sob H o , esta estatística t tem distribuição t de Student com n-1 graus de liberdade. A comparação deste valor calculado com o valor de t tab dado por t tab = t α (n1). ___________________________________________________________________________________ Prof. Carlos Eduardo Magalhães dos Santos 26 CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Depois de obtido os valores calculado e tabelado de t, usamos a seguinte regra decisória: - se t ≥ t tab então Rejeita-se Ho. - se t < t tab então Não-Rejeita-se Ho. Exercícios 2.4 – Com o objetivo de avaliar se determinado produto químico é eficiente para repelir insetos pragas, foi realizada uma contagem de número de insetos, antes e após a aplicação deste produto químico, em 7 lavouras. O número de insetos observado em cada residência foi Lavouras 1 2 3 4 5 6 7 Antes da aplicação 8 6 7 8 9 6 7 Após a aplicação 4 0 3 5 3 4 2 Por meio destes dados e ao nível de 5% de probabilidade, é possível concluir, em termos médios, que o produto utilizado é eficiente para repelir insetos? 2.5 – Com finalidade de testar se determinado método de secagem rápida consegue reduzir significativamente a quantidade média de água de grãos de cereais, uma porção de cada um dos seguintes tipos de cereais: Milho, Cevada, Trigo, Arroz e Sorgo, foram expostas ao referido método de secagem. Os resultados obtidos, para o peso da porção (em g) amostrada por cereal, com a realização do experimento foram: Milho Cevada Trigo Arroz Sorgo Sem a secagem 30 34 41 25 36 Com a secagem 21 28 33 21 31 É possível concluir ao nível de 5% de significância que o método de secagem proposto, é eficiente para secar os grãos? 2.3.3 – Teste F para Comparações de Variâncias de Duas Populações ___________________________________________________________________________________ 27 Capítulo 2 – Testes de hipóteses _____________________________________________________________________ A distribuição F está entre aquelas distribuições de probabilidades mais importantes na estatística, principalmente na estatística experimental, com enorme emprego na análise de experimentos. Este teste é indicado para verificar se duas populações, digamos 1 e 2, apresentam igual valor para o parâmetro variância. Sejam as variáveis aleatórias independentes 1 e 2, com distribuição de qui-quadrado ( χ 2 ), com n 1 e n 2 graus de liberdade, respectivamente. Denomina-se F a variável aleatória definida por: V1 n1 F= V2 n2 Considerando 2 amostras de tamanho n x e n y das variáveis aleatórias normais X e Y respectivamente, pode-se demonstrar que: (n − 1) s2x V1 = x σ 2x n s2 = 1 2x σx (n V2 = y − 1)s 2y σ 2y = n2 s 2y σ 2y Considerando Ho: σ 2x = σ 2y = σ 2 , então: 2 1 n1 s x n1 σ 2 s 2x F= = n2 s 2y s 2y 1 n2 σ 2 ou seja, F tem distribuição de Fisher-Snedecor, com (n x -1)= n 1 e (n y -1)= n 2 graus de liberdade. Em termos de hipóteses estatísticas teríamos: Ho : σ12 = σ 22 versus Ha : σ12 > σ 22 ou Ha : σ12 < σ 22 ou Ha : σ12 ≠ σ 22 OBS Neste curso, vamos adotar sempre colocar a maior variância no numerador, de modo a obter um F calculado maior que 1, é usaremos a tabela unilateral para F>1. ___________________________________________________________________________________ Prof. Carlos Eduardo Magalhães dos Santos 28 forneceu. A conclusão do teste é feita mediante a comparação do valor de F com o valor de F tab = F α = (n 1 . ou seja: F= s12 s 22 Sob a hipótese de nulidade.55 e desvio padrão 0.6 283.8 285.0 ___________________________________________________________________________________ 29 .2 284.6 – Com o intuito de controlar a homogeneidade da produção de certas partes ao longo do tempo. ao passo que.7 284.3 283. com n 1 e n 2 graus de liberdade. para três diferentes pares de graus de liberdade é ilustrado na figura a seguir. Caso contr ário Não - Rejeita-se H o .9 284. este quociente tem distribuição F. Uma primeira amostra. forneceu média 284. numa segunda amostra. a distribuição de probabilidades da estatística F depende dos números de graus de liberdade n 1 e n 2 . de dez elementos. Se F ≥ Ftab ⇒ Rejeita-se H o ao nível α de probabilidade. ou seja. Exercícios 2. nas mesmas unidades. Um gráfico para a distribuição F. n 2 ). de FisherSnedecor.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ A estatística F usada para decidir entre Rejeitar ou Não-Rejeitar Ho é dada pelo quociente entre as duas estimativas de variância.320. os seguintes valores: 284. amostras semanais são retiradas da produção corrente. Capítulo 2 – Testes de hipóteses _____________________________________________________________________ Ao nível de 5% de significância. e. sorteou-se uma amostra de 16 operários. de que seus rebites são melhores? Use o nível de 5% de significância? Exercícios Suplementares 1 – Queremos verificar se duas máquinas produzem peças com a mesma homogeneidade quanto à resistência a tensão.8 41.8 39.01? 2 – O tempo médio. com um desvio padrão de 15 minutos. tendo-se obtido as seguintes cargas de ruptura: Rebite 1 2 3 4 5 6 Marca A 34.9 37. e obtivemos as seguintes resistências: Máquina A 145 127 136 142 141 137 Máquina B 143 128 132 138 142 132 O que se pode concluir para α = 0. Introduziu-se uma modificação para diminuir esse tempo.5 38.9 35. O tempo médio da amostra foi de 85 minutos. Carlos Eduardo Magalhães dos Santos 30 . para executar uma tarefa. por operário.5 39. sorteamos em um determinado dia amostras de 6 peças de cada máquina. podemos concluir que a semana 2 apresentou maior variabilidade que a semana 1? 2. Seis rebites de duas marcas foram ensaiados ao cisalhamento.7 42. Estes resultados trazem evidências estatísticas da melhora desejada para um nível de significância de 5% de probabilidade? ___________________________________________________________________________________ Prof. Para isso. tem sido 100 minutos.0 40. após certo período.4 Estes resultados ratificam a afirmação do produtor da marca B.7 37. com desvio padrão de 12 minutos.7 – A qualidade de rebites é tanto melhor quanto maior sua homogeneidade.6 Marca B 38. medindo-se o tempo de execução de cada um.2 33. 2 35.2 anos Desvios Padrões 0. Para testar a hipótese H 0 .8 42.5 38.6 102.2 40.6 95. o processo B foi introduzido. produziu os seguintes resultados: Estatísticas Homens Médias 3. Com o objetivo de melhorar a média de resistência das peças.2 35. 10 ambientes foram selecionados ao acaso e expostos a uma determinada fonte de radiação de calor.2 94.4 Processo B 101. relativos à temperatura de rompimento das peças. Com os dados amostrais abaixo.5 104. de 50 homens e 50 mulheres de um grande complexo industrial.2 37.4 96.5 103. Teste a afirmação da empresa.1 33.9 anos entre o tempo de adaptação de homens e mulheres? b) A sua conclusão seria diferente se as amostras tivessem sido de 5 homens e 5 mulheres? 4 .4 34. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas com desvio-padrão de 60 horas. quando submetidas a determinado grau de temperatura. Os dados obtidos (em ºC) são fornecidos abaixo. Ambiente 1 2 3 4 5 6 7 8 9 10 s/isolante 30.4 92.2 42.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 3 .3 33.2 34.6 99.6 40.3 41.5 36.8 91.1 30. Processo A 90.7 anos 0.5 c/isolante 28.4 98.3 93.5 35.5 5 – Um material isolante foi utilizado com a finalidade de reduzir a temperatura média interna em ambientes similares. uma amostra aleatória.3 43. Testar a hipótese H0 e concluir para α= 5%.Num estudo comparativo do tempo médio de adaptação. ao nível de significância de 1%. testar a hipótese Ho e concluir para α= 5%.Uma fábrica de cerâmica produz um tipo de peça usando o processo A de fabricação.6 38.8 96. ___________________________________________________________________________________ 31 .8 anos a) Pode-se dizer que existe diferença significativa Mulheres 3.4 6 – A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma amostra de 27 elementos forneceu s2=2. Uma amostra dos indivíduos em posições de gerenciamento será selecionada pelo pesquisador. a) Formule as hipóteses nula e alternativa que auxiliarão a decisão de paralisar e calibrar a linha de produção. Deseja-se saber se é possível afirmar.6 H 1 : µ > 8. Os dados sobre os tempos de leitura dos jornais serão usados para testar as seguintes hipóteses nula e alternativa.6 minutos por dia lendo jornais.6 a) Qual é o erro do tipo I? Quais são as conseqüências de se cometer esse erro? ___________________________________________________________________________________ Prof. Tomou-se uma amostra aleatória de 50 famílias que acusou um seguro médio de R$9. 10 .600. Uma amostra de caixas de papelão é periodicamente selecionada e pesada para determinar se está ocorrendo subenchimento ou sobre enchimento. ao nível de 5% de significância que a variância da população é inferior a 5? Quais as hipóteses necessárias? 9 .Uma operação de linha de produção foi programada para colocar 320 mg de detergente em pó em cada caixa de papelão. Carlos Eduardo Magalhães dos Santos 32 . Um pesquisador acredita que os indivíduos nas posições de gerência gastam mais do que o tempo médio nacional por dia lendo jornais. Com base na evidência amostral.12.Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de seguro de vida. Se os dados da amostra levarem à conclusão de subenchimento ou sobre enchimento. a campanha deve ser iniciada ou não (nível de 1% de significância)? Quais as hipóteses necessárias? 8 . H 0 : µ = 8.00. a linha de produção será paralisada e calibrada para se obter o enchimento apropriado das caixas. b) Comente a conclusão quando H 0 não pode ser rejeitada. se verificar que a quantia média segurada por família é inferior a R$10.Capítulo 2 – Testes de hipóteses _____________________________________________________________________ 7 .Os americanos gastam uma média de 8.00. c) Comente a conclusão quando H 0 pode ser rejeitada.000.00 com desvio padrão de R$1.000. Para testar tal suposição. Por similaridade com outros processos de fabricação. com desvio padrão de 100 unidades monetárias. a variável aplicação em caderneta de poupança tem média de 420 unidades monetárias.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ b) Qual é o erro do tipo II? Quais são as conseqüências de se cometer esse erro? 11 . supomos o desvio padrão populacional conhecido e igual a 120 horas. Foi feita uma suposição. que acusou uma média de 415 u.m. pode-se concluir que houve alteração? 12 . Qual é a conclusão? ___________________________________________________________________________________ 33 .Historicamente. Utilizando α =1%. Usando α=5%.A vida média de uma amostra aleatória de 100 lâmpadas de certa marca é 1615 horas. em certa cidade. tomou-se uma amostra de 100 depositantes. que atualmente esta situação tenha se alterado. desejamos testar se a duração média de todas as lâmpadas dessa marca é maior de 1600 horas. Com o uso de contrastes é possível ao pesquisador estabelecer comparações. principalmente quando o experimento em análise é composto por mais do que dois tratamentos.2 – Definições 3.2. não se trabalhar com ˆ . que também é uma função linear de médias contraste C mas com o seu estimador C obtidas por meio de experimentos ou amostras. entre tratamentos ou grupos de tratamentos.0 – CONTRASTES 3.1– Introdução O estudo de contrastes é muito importante na Estatística Experimental. Assim tem-se que o estimador para o contraste de médias é dado por: ˆ =am ˆ ˆ ˆ C 1 1 + a 2m 2 +  + aImI ___________________________________________________________________________________ 34 .Capítulo 3 – Contrastes _____________________________________________________________________ 3.2 – Estimador do Contraste Na prática. geralmente não se conhece os valores das médias populacionais m i . obter a estimativa para cada contraste estabelecido. + a I m I I C será um contraste entre médias se satisfazer a seguinte condição: ∑a i=1 i =0 3. Este capítulo visa dar fundamentos para estabelecer grupos de contrastes.1 – Contrastes Considere a seguinte função linear de médias populacionais de tratamentos C = a 1 m 1 + a 2 m 2 + . Todos os conhecimentos adquiridos neste capítulo serão utilizados no capítulo sobre Comparações Múltiplas para a realização de testes de hipóteses para grupos de contrastes estabelecidos. que sejam de interesse... 3. mas suas estimativas. bem como estimar a variabilidade associada a cada um destes contrastes.2. Assim. em Estatística Experimental. 30m) + amendoim 62.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Exercício 3.5 3 – Abacaxi (0. Carlos Eduardo Magalhães dos Santos 35 .80 x 0. as médias de produção de frutos de abacaxi (em t/ha).1 Num experimento de consórcio na cultura do abacaxi.4 Pede-se obter as estimativas dos seguintes contrastes: C 1 = m 1 + m 2 – m 3 –m 4 C2 = m1 .80 x 0.2. a qual é obtida por: ___________________________________________________________________________________ Prof. dado por: ˆ =am ˆ ˆ ˆ C 1 1 + a 2m 2 +  + aImI A variância do estimador do contraste é dada por: () ˆ = V (a m ˆ ˆ ˆ VC 1 1 + a 2m 2 +  + aImI ) Admitindo independência entre as médias () ˆ ) = a V (m ˆ ) + a V (m ˆ ) +  + a V (m ˆ ) V (C ˆ = V (a m ˆ ˆ ˆ VC 1 1 ) + V (a 2m 2 ) +  + V (aImI ) 2 1 ˆ i ) = σi Sabe-se que: V (m 2 2 1 2 2 I I 2 rI .30m) + feijão 60. Então o que normalmente se obtém é o valor do estimador da variância do estimador do contraste.3 – Medidas de dispersão associadas a contrastes Considere o estimador do contraste C.0 4 – Abacaxi (0.30m) monocultivo 56.m2 C 3 = m 3 –m 4 3. assim () ˆ = a 2 σ1 VC 1 2 + a 22 σ 2 2 r1 +  + aI2 σI 2 r2 rI Admitindo-se homogeneidade de variância σ 2 . foram as seguintes: Tratamentos î m 1 – Abacaxi (0.90 x 0.5 2 – Abacaxi (0. Esta estimativa é denominada como estimador comum ( sc2 ). mas sua estimativa a qual obtida por meio de dados experimentais. com 5 repetições.90 x 0.30m) monocultivo 53. 2.0 m r4 = 5 ˆ 4 = 21. sejam ortogonais entre si. por: ˆ =am ˆ ˆ ˆ C 1 1 1 + a 2m 2 +  + aImI ˆ =bm ˆ ˆ ˆ C 2 1 1 + b 2m 2 +  + bImI ˆ eC ˆ . Logo.45 C1 = m1 + m2 – m3 – m4 C2 = m1 – m2 C3 = m3 – m4 3.. ˆ 1 = 11... respectivamente. para i = 1. é obtida A covariância entre C 1 2 por ( ) ˆ . Sejam os estimadores dos contrastes de C 1 e C 2 dados.2 – Por meio dos dados e dos contrastes fornecidos abaixo. Alguns tipos de testes indicados para este objetivo necessitam que os contrastes que compõem o grupo a ser testado.5 m r1 = r2 = 6 r3 = 4 ˆ 3 = 10. 2. ___________________________________________________________________________________ 36 .0 m sc2 = 0.C ˆ = a b V (m ˆ 1 ) + a 2b 2 V (m ˆ 2 ) +  + aIbI V (m ˆ I) Cov C 1 2 1 1 ˆ i ) = σi A variância da média amostral é dada por: V (m 2 ri . I. . supondo independência entre tratamentos.2 m ˆ 2 = 10.Capítulo 3 – Contrastes _____________________________________________________________________ () I 2 ˆ = s 2 ai Vˆ C c∑ i=1 ri Exercício 3.4 – Contrastes Ortogonais Em algumas situações desejamos testar um grupo de contrastes relacionados com o experimento em estudo. A ortogonalidade entre os contrastes indica independência linear na comparação estabelecida por um contraste com a comparação estabelecida pelos outros contrastes. obter as estimativas dos contrastes e as estimativas das variâncias das estimativas dos contrastes. 3 – Verificar se os contrastes do Exercício 2. ( ) I ˆ . Para um experimento com mesmo número de repetições. isto é: ( ) ˆ .C ˆ = a b σ1 Cov C 1 2 1 1 2 + a 2b 2 σ 2 2 r1 +  + aIbI σI 2 r2 rI Admitindo que exista homogeneidade de variâncias entre os tratamentos.1 formam um grupo de contrastes ortogonais.C ˆ =  a1b1 + a 2b 2 +  + aIbI σ 2 = σ 2 aibi Cov C ∑ 1 2  r r2 rI  i=1 ri  1 Sabe-se que. no entanto cada grupo deverá conter no máximo (I – 1) contrastes ortogonais. podem ser formados vários grupos de contrastes ortogonais. Dentro de um grupo de contrastes ortogonais. o que corresponde ao número de graus de liberdade para os tratamentos.C ˆ =0 Cov C 1 2 Para que a covariância seja nula. Assim. de duas variáveis aleatórias são independentes.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ ( ) ˆ . a covariância ˆ eC ˆ são independentes. Exercícios 3. Carlos Eduardo Magalhães dos Santos 37 . satisfazendo as mesmas pressuposições (médias independentes e homogeneidade de variâncias). todos os contrastes tomados dois a dois. ou seja: σ12 = σ 22 =  = σI2 = σ 2 . então. a covariância entre entre elas é igual a zero. é necessário. se C 1 2 eles é igual a zero. a condição de ortogonalidade se resume a: I ∑a b i=1 i i =0 Para um experimento com I tratamentos. portanto que: I ∑ i=1 aibi =0 ri Esta é a condição de ortogonalidade entre dois contrastes para um experimento com número diferente de repetições para os tratamentos. ___________________________________________________________________________________ Prof. serão também ortogonais. 5 – Métodos para obtenção de grupos de contrastes mutuamente ortogonais 3.5.5 – Foi instalado um experimento para avaliar a produção de 4 híbridos cujas as características são apresentadas na tabela a seguir. seja levado em consideração • o porte. ___________________________________________________________________________________ 38 . É desejável que os valores a serem atribuídos. será sempre necessário atribuir valores a algumas incógnitas. a partir deste é que os demais são obtidos. • o início do florescimento.2. um contraste que seja de interesse e. a princípio. deve-se estabelecer. Por meio da imposição da condição de ortogonalidade e da condição para ser um contraste. permitam que os coeficientes sejam números inteiros.4 – Verificar se os contrastes do Exercício 2. 3.Capítulo 3 – Contrastes _____________________________________________________________________ 3. cujas incógnitas são os coeficientes das médias que compõem o contraste. Como o número de incógnitas é superior ao número de equações existentes. Obtenha um grupo de contrastes ortogonais que permita testar as comparações segundo os critérios citados.2. Exercício 3.2 formam um grupo de contrastes ortogonais. • o índice de acamamento. Híbrido 1 2 3 4 Porte Alto Alto Alto Baixo Inicio do Florescimento Precoce Tardio Tardio Precoce Índice de acamamento Baixo Alto Alto Baixo ri 3 3 3 3 Suponha que ao estabelecer as comparações dos híbridos com relação a produção.1 – Obtenção por meio de sistema de equações lineares Neste método. obtém-se equações lineares. Para isso atribui-se sinais positivos para membros de um grupo e negativos para membros do outro grupo. 60 dias após a semeadura. No caso em que o número de repetições é igual para todos os tratamentos.2 – Obtenção por meio de regras práticas Por meio desta metodologia. deve-se. este passo pode ser eliminado. Calcula-se o mínimo múltiplo comum (MMC) entre g 1 e g 2 . para cada contraste: Verificar o número de parcelas experimentais envolvidas no 1º grupo. subdividindo-os em subgrupos. é possível estabelecer facilmente um grupo de contrastes ortogonais. digamos g 2 . O resultado será o coeficiente de cada média do 2º grupo. Multiplicar os coeficientes obtidos pelo número de repetições da respectiva média. Se possível. Dividir o MMC por g 1 . 1989): Divide-se o conjunto das médias de todos os tratamentos do experimento em dois grupos.5. Dentro de cada grupo formado no passo anterior. que possui mais que uma média. e o número de parcelas experimentais envolvidas no 2º grupo. Dividir o MMC por g 2 . Os tratamentos utilizados e os resultados foram (Banzatto e Kronka. Exercício 3. simplificar os coeficientes obtidos por uma constante. Ao final. com 4 repetições. O resultado será o coeficiente de cada média do 1º grupo. foram comparados os efeitos de 5 tratamentos em relação ao crescimento de mudas de Pinus oocarpa. O primeiro contraste é obtido pela comparação das médias de um grupo contra as médias do outro grupo. devemos ter formado (I – 1) comparações.6 – Num experimento inteiramente casualizado. A metodologia pode ser resumida nos seguintes passos (Banzatto e Kronka. Repete-se este passo até que se forme subgrupos com apenas uma média. digamos g 1 . Carlos Eduardo Magalhães dos Santos 39 . 1989): ___________________________________________________________________________________ Prof. Para se obter os coeficientes que multiplicam cada média que compõem os contrastes estabelecidos.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 3.2. aplica-se o passo 1. 3. 3 e 5 tenham 4 repetições.00 σˆ 12 = 10. σˆ 22 = 8.8 – Sejam os dados abaixo relativos aos totais de tratamentos de um experimento realizado com a finalidade de testar 4 meios de cultura no crescimento bacteriano. 3.0 2 – Solo de cerrado + esterco (SC+E) 27.40 Fósforo 5 30. Obtenha um grupo de contrastes ortogonais entre médias. σˆ 32 = 5 e σˆ 24 = 5 Pede-se: a) Obtenha um grupo de contrastes ortogonais entre as médias? b) Obtenha as estimativas dos contrastes obtidos? c) Obtenha as estimativas das variâncias dos contrastes obtidos? ___________________________________________________________________________________ 40 .Capítulo 3 – Contrastes _____________________________________________________________________ Tratamentos Totais 1 – Solo de cerrado (SC) 21.6 4 – Solo de cerrado + vermiculita (SC+V) 22.1 3 – Solo de cerrado + esterco + NPK (SC+E+NPK) 26. Meio de cultura à base de: Nº de repetições Total Uréia 5 16.6 Obtenha um grupo de contrastes ortogonais entre as médias.20 Amônio 4 18.1 5 – Solo de cerrado + vermiculita + NPK (SC+V+NPK) 25.00 Nitrato 4 20.7 – Suponha agora para o exemplo 1 que os tratamentos 1 e 4 tenham 3 repetições e os tratamentos 2. 3 e 6 repetições. 3.7 5 3 30.45 . verificar se os contrastes dados abaixo são ortogonais.0 5 2 18. pede-se ˆ .5 6 e os contrastes C1 = m1 – m2 C 2 = m 1 + m 2 – 2m 3 C 3 = m 1 + m 2 + m 3 – 3m 4 Admitindo que os estimadores das médias sejam independentes e que sc2 = 0. e por meio das mesmas.11 – Considere um experimento com 4 tratamentos e as seguintes informações: sc2 = 4. Vˆ C ˆ . homogeneidade de variâncias entre tratamentos e admitindo que m 1 . m 2 e m 3 têm.10 – Supondo independência entre médias.10 r 1 = r 2 =r 3 = 4.9 – Dados Tratamentos î m ri 1 25. respectivamente.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Exercícios complementares 3.C ˆ eC ˆ a) C 1 2 3 ( ) ( ) ( ) ˆ . 5. Carlos Eduardo Magalhães dos Santos 41 . C1 = m1 – m2 C 2 = m 1 + m 2 – 2m 3 3.4 5 4 27. r 4 = 3 C 1 = m 1 + m 2 + m 3 – 3m 4 ___________________________________________________________________________________ Prof. dizer quais são os contrastes ortogonais entre si. e Vˆ C ˆ b) Vˆ C 1 2 3 c) As estimativas das covariâncias entre os estimadores dos contrastes. Capítulo 3 – Contrastes _____________________________________________________________________ C 2 = m 1 .13 – Com os dados abaixo. ( ) ˆ b) Obtenha Vˆ C 1 c) Obtenha V (C1 ) 3. a partir dos contrastes C 1 e C 2 . obter o contraste C 3 ortogonal aos contrastes C 1 e C 2 . 3.12 – Num experimento com 4 tratamentos e 5 repetições.2m 2 + m 3 Pede-se: a) Forme um grupo de contrastes ortogonais. são dados os seguintes contrastes ortogonais: C1 = m2 – m4 C 2 = -2m 1 + m 2 + m 4 Determinar um contraste C 3 que seja ortogonal a C 1 e C 2 . C1 = m1 – m2 C 2 = 4m 1 + 5m 2 – 9m 4 r1 = r3 = 4 r2 = r4 = 5 ___________________________________________________________________________________ 42 . os níveis dos fatores podem ser combinados de maneiras diferentes.1– Introdução A experimentação tem por objetivo o estudo dos experimentos. d) Esquema: quando em um mesmo experimento são avaliados dois ou mais fatores. Exemplos: Delineamento Inteiramente Casualizado. b) Tratamento ou fator: é o método. No planejamento deve ter uma discussão para definição da parcela entre o experimentador e o estatístico. O esquema é justamente a maneira utilizada pelo pesquisador ao combinar os níveis ___________________________________________________________________________________ 43 . que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos. seu planejamento. Exemplos: i) uma fileira de plantas com 3 metros de comprimento no campo. Exemplos: i) variedades de milho.0 – INTRODUÇÃO À EXPERIMENTAÇÃO 4. ii) níveis de proteína na ração e iii) diferentes temperaturas de pasteurização do leite. as parcelas devem ser o mais uniforme possível. execução. para que. De um modo geral. seus efeitos sejam detectados. b) Unidade experimental: é a unidade que vai receber o tratamento e fornecer os dados que deverão refletir o seu efeito.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 4. ao serem submetidas a tratamentos diferentes. análise dos dados obtidos e interpretação dos resultados. isto é. c) Delineamento experimental: é a maneira como os tratamentos são designados as unidades experimentais. a escolha da parcela deve ser orientada de forma a minimizar o erro experimental. 4. Delineamento em Blocos Casualizados e Delineamento em Quadrado Latino.2 – Alguns conceitos básicos a) Experimento ou ensaio: é um trabalho previamente planejado. elemento ou material cujo efeito desejamos medir ou comparar em um experimento. isto é. ii) um leitão e iii) um litro de leite. É claro que o procedimento para realizar um experimento varia de acordo com a área para a qual está se fazendo uma pesquisa. Carlos Eduardo Magalhães dos Santos 44 . f) Erro experimental: é o efeito de fatores que atuam de forma aleatória e que não são passíveis de controle pelo experimentador.Capítulo 4 – Introdução à Experimentação _____________________________________________________________________ dos fatores para se obter os tratamentos. Quanto maior é o número de repetições. o uso do princípio da repetição tem por finalidade obter uma estimativa do erro experimental. Porém. sugere-se que os experimentos tenham pelo menos 20 unidades experimentais e 10 graus de liberdade para o resíduo.3. A pesquisa científica está constantemente se utilizando de experimentos para provar suas hipóteses. 4. Em termos estatísticos. 4. para que as conclusões sejam válidas. casualização e controle local. todo experimento deve seguir alguns princípios básicos.1 – Princípio da Repetição A repetição consiste em aplicar o mesmo tratamento a várias unidades experimentais. e) Variável resposta: é a variável mensurada usada para avaliar o efeito de tratamentos. Como regra prática. espera-se que seja maior a precisão do experimento. ou seja. Isto depende do conhecimento do pesquisador sobre o assunto e do conjunto de condições em que será realizado o experimento. Não existe uma regra dizendo qual deve ser o número mínimo de repetições.3 – Princípios Básicos da Experimentação São três os princípios básicos da experimentação: repetição. A Princípio da A A A A A A B repetição B B B B B B ___________________________________________________________________________________ Prof. Exemplos: Esquema Fatorial e Esquema em Parcelas Subdivididas. consiste na reprodução do experimento básico. REGRA GERAL: Todo experimento deve conter no mínimo os princípios básicos da repetição e da casualização. as variações que contribuem para o erro experimental são convertidas em variáveis aleatórias.3.3 – Princípio do controle da casualização O uso do princípio do controle da casualização só é recomendado quando as unidades experimentais não são ou não estão sob condições homogêneas devido a influência de um ou mais fatores.2 – Princípio da Casualização O princípio da casualização consiste em distribuir ao acaso os tratamentos às unidades experimentais. A Princípio da repetição + A A B B B A B casualização B A A B A B 4. visando evitar que algum dos tratamentos seja sistematicamente favorecido ou desfavorecido por atores fora de controle do pesquisador. Sendo assim com o uso do princípio da casualização. a mesma chance de ser designados a qualquer uma das unidades experimentais.3. A distribuição dos tratamentos as unidades é feita então dentro de cada bloco. é necessário inicialmente dividir as unidades experimentais em blocos de unidades de tal forma que dentro de cada bloco haja homogeneidade e um número de unidades igual ao número de tratamentos do experimento. do uso do princípio do controle na casualização. pois os erros experimentais atuam de forma independente nas diversas unidades experimentais. Do ponto de vista estatístico. Daí o nome do princípio controle na casualização. é reduzir o efeito do erro experimental através do controle da variação existente entre as unidades ___________________________________________________________________________________ 45 . a todos os tratamentos. Para utilizar este princípio. Este princípio tem por finalidade propiciar.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 4. b) Fica garantido o uso de testes de significância. A finalidade. com o uso do princípio da casualização em um experimento: a) Obtém-se uma estimativa válida do erro experimental. Entretanto. etc. Por exemplo: tratamentos. utilizando tipos de materiais experimentais que realmente serão usados na prática.4 – Fontes de variação de um experimento Em um experimento podem ocorrer as seguintes fontes de variação: Premeditada – é aquela introduzida pelo pesquisador com a finalidade de fazer comparações. Podem ser controladas pelo pesquisador. cuidadosamente selecionado. São devidas a duas fontes: variação no material experimental e falta de uniformidade nas condições experimentais. não podendo ser controladas. 4. ___________________________________________________________________________________ Prof. mas de natureza conhecida.5 – Métodos para aumentar a precisão dos experimentos A precisão se refere à ordem de grandeza da diferença entre dois tratamentos. tamanho de semente. passível de ser detectada em um experimento. Espera-se que com o controle na casualização a estimativa obtida para o erro experimental seja menor.Capítulo 4 – Introdução à Experimentação _____________________________________________________________________ experimentais. O experimentador deve planejar o experimento de tal forma que consiga isolar os efeitos de todos os fatores que podem ser controlados. Por exemplo: heterogeneidade do solo. 4.5. B1 B2 B3 B4 B5 B6 A Princípio da repetição + A A B B B A B casualização + controle B A A B A B 4. Carlos Eduardo Magalhães dos Santos 46 . Variação inerente ao material experimental. Sistemática – Variações não intencionais. Nem sempre é possível distinguir claramente este tipo de variação da anterior. devemos sempre ter em mente a população a qual desejamos informações. Constituem o erro experimental. Aleatória – São variações de origem desconhecida.1 – Escolha do material experimental Para certos tipos de trabalhos é desejável um material uniforme. 6. as parcelas retangulares são mais eficientes na superação da heterogeneidade do solo quando seu eixo maior está na direção da maior variação do solo.5. c) prevenir erros grosseiros.2 – Escolha da unidade experimental Em experimentação de campo. para obtenção de uma precisão razoável em experimentos de campo com culturas. são necessárias de quatro a oito repetições.6 – Exercícios 4. 4.4 – Aumento do número de repetições A precisão de um experimento sempre pode ser aumentada pelo uso de repetições adicionais. pode proporcionar considerável aumento na precisão. De modo geral. mas também para aumentar a precisão do experimento. nos quais dois ou mais fatores são testados simultaneamente. e d) controlar influências externas de forma que todos os tratamentos sejam afetados igualmente.5. mas o nível de melhoria nessa precisão diminui com o aumento do número de repetições. 4. 4.5.3 – Escolha dos tratamentos Cuidadosa seleção dos tratamentos é importante não apenas na obtenção dos objetivos do experimentador. O uso de experimentos fatoriais. b) proporcionar medidas adequadas e não viciadas dos efeitos dos tratamentos. 4. A técnica comumente utilizada é a de análise de covariância.5 – Técnicas mais refinadas Uma técnica adequada tem por objetivos: a) aplicação uniforme dos tratamentos.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 4.5.1 – Um experimento deve conter no mínimo o(s) seguinte(s) princípio(s) básico(s) da experimentação: a) repetição b) casualização c) controle local d) repetição e controle local ___________________________________________________________________________________ 47 . Estes 10 animais visivelmente não eram homogêneos entre si. • Ao final de sua pesquisa. porque foram oriundos de diferentes cruzamentos raciais e apresentavam idades diferentes. desejando comparar 10 rações para ganho de peso em animais.6. procedeu da seguinte forma: • Tomou 10 animais de uma propriedade rural.2 – A repetição tem a função de: a) fornecer uma estimativa do erro experimental b) validar a estimativa do erro experimental c) controlar a heterogeneidade das unidades experimentais d) nenhuma das anteriores 4. e as rações que o extensionista julgou ser as piores foram designadas aos piores animais. de tal forma que cada animal recebeu uma única ração. • As rações que o extensionista julgou ser as melhores foram designadas aos melhores animais.3 – A casualização tem a função de: a) fornecer uma estimativa do erro experimental b) validar a estimativa do erro experimental c) controlar a heterogeneidade das unidades experimentais d) nenhuma das anteriores Exercícios Suplementares 4. pergunta-se: ___________________________________________________________________________________ Prof.Capítulo 4 – Introdução à Experimentação _____________________________________________________________________ e) repetição e casualização f) casualização e controle local g) nenhuma das respostas anteriores 4.6. Carlos Eduardo Magalhães dos Santos 48 . Baseado nestas informações.1 – Um extensionista. o extensionista recomendou a ração que proporcionou maior ganho de peso nos animais. E3 foi destinada às amostras genômicas C7. C7. C13. 4. C8. 4. realizou o seguinte ensaio:  Selecionou um conjunto de 15 cobaias (sistematicamente identificadas como 1.5 – A conclusão dada pelo extensionista ao final da pesquisa. 8. 11. E2. denominada de amostra composta. C4. 4. E3. Procedeu posteriormente a um mistura das amostras coletadas dos três membros.1.2 – Um bioquímico desejando verificar qual entre 5 enzimas (identificadas como E1.1. mediano e inferior. 3. a amostra genômica identificada como C2. E2.1. a amostra genômica identificada como C1. C10. C9. C12. conteve DNA extraído da cobaia 2. é estatisticamente aceitável? Justifique a sua resposta. 10. C2 e C3. 7. C11. C14 e C15. 5. 6. C2. 4.2 – Qual foi a constituição de cada unidade experimental nesta pesquisa? Justifique sua resposta. E4 e E5) produz maiores fragmentos de DNA de células epiteliais de cobaias. Ao final obteve-se as amostras genômicas C1.1 – Quantos e quais foram os tratamentos em teste nesta pesquisa? Justifique sua resposta. A distribuição das enzimas às amostras foi feita da seguinte forma sistemática: E1 foi destinada às amostras genômicas C1. 13. C3. 14 e 15) que eram supostamente homogêneas para as características essenciais. 4. 9. C5 e C6.1.4 – É possível estimar o erro experimental nesta pesquisa? Justifique sua resposta. C5. C6. ou seja. e assim por diante. 12. As amostras genômicas foram identificadas de acordo com o número da cobaia que a originou.3 – Qual(is) foi(ram) o(s) princípio(s) básico(s) da experimentação utilizados nesta pesquisa? Justifique sua resposta. 2.  Cada amostra composta foi convenientemente tratada para extração do DNA.1.  De cada uma das 15 cobaias.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 4. tomou uma amostra de tecido epitelial de cada um dos seguintes membros. contenve DNA extraído da cobaia 1. ___________________________________________________________________________________ 49 .  Cada uma das amostras genômicas foi tratada com um tipo de enzima. foi destinada às amostras genômicas C4. A amostra obtida contendo apenas o DNA foi denominada amostra genômica. superior. 4. C14 e C15.2.2. C11 e C12.6 – O princípio do controle local foi utilizado nesta pesquisa? Justifique sua resposta.1 – Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta. explique porque diferentes observações obtidas para um mesmo tratamento não são iguais. premeditada ou sistemática? Justifique sua resposta. E2.2. O tempo.  Uma amostra de 1 ml de cada substrato químico dos fragmentos de DNA foi colocado para correr em um gel. 4. Carlos Eduardo Magalhães dos Santos 50 . 4.2. e E5 foi destinada às amostras genômicas C13. 4. pergunta-se: 4.5 – O princípio da casualização foi utilizado nesta pesquisa? Justifique sua resposta. 4. E4 e E5.7 – É possível estimar o erro experimental nesta pesquisa? Justifique sua resposta.2 – Neste experimento os tratamentos surgiram de uma forma aleatória. Em caso negativo. a estimativa do erro experimental é válida? Justifique ___________________________________________________________________________________ Prof.Capítulo 4 – Introdução à Experimentação _____________________________________________________________________ C8 e C9.2.2. gasto por cada uma das 15 amostras para percorrer a distância de 25 cm foi registrado para comparar o efeito das enzimas E1. Em caso afirmativo. quando que o princípio do controle local deve ser utilizado em um experimento? 4. 4. faça uma análise crítica quanto à necessidade do uso de repetições num experimento. E4 foi designada às amostras genômicas C10. Em termos gerais. Com base nas informações fornecidas deste ensaio e das explicações fornecidas em sala de aula.3 – Qual foi a unidade experimental nesta pesquisa? Justifique sua resposta. em minutos.4 – O princípio da repetição foi utilizado nesta pesquisa? Justifique sua resposta. Em caso afirmativo. E3.2. o pesquisador sabia que. Cada uma das 64 partes. Visando controlar esta fonte de variação. havia variação entre os lotes de substrato de preparos de maionese. esse pesquisador procedeu da seguinte forma: • para a avaliação do teor de gordura total. • foi então realizada um distribuição ao acaso dos 8 tipos de óleo às amostras básicas. tendo as seguintes restrições na casualização: 1ª) cada tipo de óleo deveria se aplicado em uma única amostra básica de cada um dos 8 lotes de substrato. 4. o pesquisador decidiu que cada um dos 8 bioquímicos deveria fazer a medição do teor de gordura dos preparos de maionese produzidos utilizando os 8 tipos de óleo. Devido à falta de experiência dos bioquímicos. deveriam ser avaliadas por cada um dos 8 bioquímicos.2. Em caso negativo.8 – Neste ensaio. • baseado em experimentos anteriores.3 – Um pesquisador desejava comparar os efeitos que 8 tipos de óleo têm sobre o teor de gordura total em preparos de maionese. ___________________________________________________________________________________ 51 . 4. seria denominada de amostra básica. qual foi a variável resposta utilizada para comparar os efeitos de tratamentos? Justifique sua resposta. apesar do controle de qualidade. o pesquisador temia que a medição dos mesmos pudesse interferir na comparação dos tipos de óleo. o pesquisador tinha à sua disposição 8 bioquímicos. exceto o óleo. 2ª) os 8 tipos de preparo de maionese obtidos misturando cada uma das amostras básicas com cada um dos 8 tipos de óleo. Como um lote de substrato não seria suficiente para testar os 8 tipos de óleo em todas as repetições desejadas. O substrato de preparo da maionese é o composto que tem todos os ingredientes do preparo da maionese. Justifique sua resposta. o pesquisador decidiu que prepararia 8 lotes de substrato e dividiria cada lote em 8 partes iguais. indique o que deveria ser feito de diferente neste ensaio para ser possível estimar o erro experimental. Com esta finalidade.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ sua resposta. assim obtidas. 4. Com esta finalidade. as seguintes perguntas: 4.3 – Qual foi a unidade experimental utilizada nesta pesquisa? Justifique sua resposta. 4. 4. responda se o procedimento do pesquisador está correto.2 – Como você classificaria a fonte de variação contaminação por fungo.3. Se a sua resposta for negativa. Justifique sua resposta.7 – Qual foi a característica utilizada pelo pesquisador para avaliar o efeito de tratamentos neste experimento.4 – O princípio da repetição foi utilizado nesta pesquisa? Se sua resposta for afirmativa. 4. procedeu da seguinte forma: ___________________________________________________________________________________ Prof.3.1 – Quais foram os tratamentos em teste? Justifique sua resposta.6 – O princípio do controle local foi utilizado nesta pesquisa? Se sua resposta for afirmativa. Se sua resposta for negativa. 4. usando do seu conhecimento técnico na área.3.3. explique como este princípio foi utilizado. Carlos Eduardo Magalhães dos Santos 52 . 4.Capítulo 4 – Introdução à Experimentação _____________________________________________________________________ No local que foi conduzido o experimento. observada nesse experimento? Justifique sua resposta.4 – Um fabricante de móveis realizou um experimento para verificar qual dentre cinco marcas de verniz proporciona maior brilho.3. Baseando-se nestas informações. houve uma pequena contaminação por fungo em algumas unidades experimentais. O pesquisador. 4.3. responda qual foi o número de repetições utilizado. o pesquisador constatou que. julgou que a contaminação não comprometeria os resultados obtidos no experimento. responda com objetividade e clareza.3. explique por que não houve a necessidade da utilização deste princípio.5 – O princípio da casualização foi utilizado nesta pesquisa? Justifique sua resposta. após certo tempo do experimento ter sido instalado. 1 – Qual foi a unidade experimental utilizada neste experimento? Justifique sua resposta. cinco tábuas de Cerejeira. Goiabão e Castanheira).4. 4.4.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ • Em sua fábrica identificou amostras de madeira que estariam disponíveis para a realização deste experimento. Cerejeira. 4.4 – É possível estimar o erro experimental neste experimento? Justifique sua resposta.2 . Baseado nas informações deste experimento. • Resolveu então distribuir ao acaso as cinco marcas de verniz às tábuas de madeira. de tal forma que cada tipo de madeira fosse testada com todas as marcas de verniz. 4.5 – O que faz surgir o erro experimental num experimento? É possível eliminar totalmente o efeito do erro experimental em um experimento? Justifique sua resposta. cinco tábuas de Goiabão e cinco tábuas de castanheira. pergunta-se: 4. Constatou também que as cinco tábuas de cada tipo de madeira eram homogêneas para as características essenciais e que havia uma grande variedade de cores entre os cinco tipos de madeira (Jatobá.4.Quais foram os tratamentos comparados neste experimento? Justifique sua resposta. a estimativa do erro é válida? Justifique. • O brilho foi medido por meio de um aparelho que mede a refletância da luz branca projetado sobre a tábua de madeira envernizada.4. explique o que deveria ser feito para obter uma estimativa válida para o erro experimental. ___________________________________________________________________________________ 53 . cinco tábuas de Mogno. Se a resposta for negativa.4. Se a resposta for afirmativa. Verificou que possuía cinco tábuas de Jatobá. Mogno. Sabe-se que a cor da madeira pode influenciar muito o brilho da mesma quando envernizada. 4.3 – Quais foram os princípios básicos da experimentação utilizados neste experimento? Justifique sua resposta. 4.5 – Um pesquisador de uma indústria de alimentos desejava verificar se seis sabores de sorvete apresentavam o mesmo teor de glicose. Com esta finalidade. Baseando-se nestas informações.5. o pesquisador planejou o experimento da seguinte maneira: • Preparar 6 lotes de 100 ml de cada sabor. com a restrição de que cada equipamento avaliasse cada um dos seis sabores uma única vez. e armazenado em cada um dos seis tipos de recipientes disponíveis.5. • Os lotes de sorvetes deveriam ser distribuídos ao acaso aos recipientes. Para controlar estas duas fontes de variação o pesquisador decidiu que cada sabor deveria ser avaliado em cada um dos seis equipamentos disponíveis. sabia que duas fontes de variação indesejáveis poderiam influenciar o valor mensurado do teor de glicose: o tipo de recipiente utilizado para armazenagem do sorvete e o equipamento utilizado para mensuração do teor de glicose. com a restrição de que cada tipo de recipiente recebesse todos os 6 sabores uma única vez. 4. Se a resposta for afirmativa. O total de lotes a serem preparados seria de 36 lotes.4. 4.Capítulo 4 – Introdução à Experimentação _____________________________________________________________________ 4. • Os lotes de sorvetes seriam designados ao acaso aos equipamentos para análise do teor de glicose. discuta sobre a necessidade do mesmo ser utilizado neste experimento. baseado em experimentos anteriores. pergunta-se: 4. O pesquisador.5.2 – O princípio da repetição foi utilizado neste experimento? Justifique sua resposta. ___________________________________________________________________________________ Prof.1 – Quais foram os tratamentos em teste neste experimento? Justifique sua resposta. quantas vezes o mesmo foi utilizado? Se a resposta for negativa.6 – O procedimento adotado pelo pesquisador de distribuir as marcas de verniz ao acaso dentro de cada tipo de madeira foi realmente necessário? Justifique sua resposta.3 – O princípio do controle local foi utilizado neste experimento? Justifique sua resposta. Carlos Eduardo Magalhães dos Santos 54 . Os outros delineamentos experimentais. por meio de um sorteio. b) pode conduzir a uma estimativa de variância residual bastante alta. embora ideal seja que eles se apresentem igualmente repetidos. c) a análise estatística é simples. para que cada ___________________________________________________________________________________ 55 . estufas e casas de vegetação. Neste delineamento. as parcelas que receberão cada um dos tratamentos são determinadas de forma inteiramente casual. este apresenta as seguintes desvantagens: a) exige homogeneidade total das condições experimentais. mesmo quando o número de repetições por tratamento é variável. Em relação aos outros delineamentos experimentais. por exemplo: blocos casualizados e quadrado latino.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 5. uma vez. o uso do DIC pressupõe que as unidades experimentais estão sob condições homogêneas. as seguintes vantagens: a) é um delineamento bastante flexível. se originam do DIC pelo uso de restrição na casualização. são consideradas como variação do acaso. d) o número de graus de liberdade para o resíduo é o maior possível.1– Introdução No Delineamento Inteiramente Casualizado (DIC) a distribuição dos tratamentos às unidades experimentais é feita inteiramente ao acaso. Como não faz restrições na casualização. que não se utilizando do princípio do controle local. exceto as devidas a tratamentos. em relação aos outros delineamentos. O delineamento inteiramente casualizado apresenta. b) o número de repetições pode ser diferente de um tratamento para outro. visto que o número de tratamentos e de repetições depende apenas do número de parcelas disponíveis. O DIC utiliza apenas os princípios básicos da repetição e da casualização.0 – DELINEAMENTO INTEIRAMENTE CASUALIZADO 5. todas as variações. Estas condições homogêneas geralmente são obtidas em locais com ambientes controlados tais como laboratórios. TI Deste quadro pode-se retirar algumas informações de interesse:  nº de unidades experimentais: N = I x J  Total geral: G = I... Y I1 2 Y 12 Y 22 . considere um experimento instalado no DIC com I tratamentos e J repetições. .. j=1 ˆ i = Ti  Média para o tratamento i: m J ˆ =G  Média geral do experimento: m IJ 5..3 – Modelo estatístico Existe um modelo estatístico específico para cada tipo de delineamento....2 – Quadro de tabulação dos dados A título de exemplo.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ unidade experimental tenha a mesma probabilidade de receber qualquer um dos tratamentos estudados..... ___________________________________________________________________________________ Prof. . i=1. j=1 ij i=1 i J  Total para o tratamento i: Ti = ∑ Yij = Yi. sem nenhuma restrição na casualização... 5.... I 1 Y 11 Y 21 . J Y 1J Y 2J .... ... num quadro do tipo a seguir: Tratamentos Repetições 1 2 . A coleta de dados da pesquisa pode ser resumida. . Carlos Eduardo Magalhães dos Santos 56 . Y IJ Totais T1 T2 . Y I2 . O modelo estatístico identifica quais são as fontes de variação dos valores de uma variável resposta em estudo.J I ∑ Y = ∑ T = Y. para que esta técnica seja empregada é necessário que sejam satisfeitas as seguintes pressuposições: 1ª) os efeitos do modelo estatístico devem ser aditivos. No entanto. na variação devido ao acaso. t i – é o efeito do tratamento i no valor observado Y ij . Com relativa freqüência. m – média de todos os valores possíveis da variável resposta. com média zero e com variância comum. t i = m i –m e ij – é o erro experimental associado ao valor observado Y ij . e. 2ª) os erros experimentais devem ser normalmente distribuídos. então. o seguinte modelo estatístico deve ser utilizado nas análises estatísticas: Yij = m + t i + eij em que. Este erro é o responsável pela variação observada entre as observações obtidas nas repetições para cada tratamento. ___________________________________________________________________________________ 57 . a variação existente entre todas as observações. Y ij .4 – Análise de Variância É uma técnica de análise estatística que permite decompor a variação total. independentes. de tal forma que as suposições básicas sejam satisfeitas. porque não é possível controlar o efeito de fontes de variações que ocorrem de forma aleatória e desconhecida. que também é denominada de erro experimental ou resíduo. os dados experimentais devem ser transformados. antes de se proceder à análise de variância. constata-se que uma ou mais dessas hipóteses básicas não se verifica.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Para os dados oriundos de um experimento instalado segundo o DIC. e ij = Y ij – m i O erro experimental ocorre em todos os experimentos. ou seja. 5.é o valor observado para a variável resposta obtido para o i-ésimo tratamento em sua j-ésima repetição. a relação m transformados de forma que passem a ter uma distribuição aproximadamente normal e as médias e variâncias se tornem independentes. frequentemente. dentre outras.5 ou x + 1. 2 – Heterogeneidade regular: ocorre devido à falta de normalidade dos dados experimentais. nos quais é considerado um grupo de parcelas não tratadas (testemunha). na qual a média é igual à variância. As transformações mais utilizadas são: a) Transformação de raiz quadrada - x : frequentemente utilizada para dados de contagens. devemos buscar uma transformação tal que os dados passem a apresentar uma distribuição aproximadamente normal. torna-se desnecessária a transformação. ou seja.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ Um dos casos mais freqüentes de não satisfação das hipóteses básicas é aquele em que não existe homogeneidade de variâncias. Devem ser transformados os dados de porcentagem provenientes ___________________________________________________________________________________ Prof. as transformações recomendadas são x + 0. existindo. as variâncias não são de mesma ordem de grandeza nos diferentes tratamentos. Se a distribuição de probabilidade dos dados for ˆ /s 2 dos tratamentos também o será. que geralmente seguem distribuição de Poisson.0 . Exemplos: número de plantas daninhas por parcela. Se a heterogeneidade for regular. verificamos que os números de insetos vivos nas parcelas tratadas são menores e mais homogêneos que os da testemunha. e os dados poderão ser conhecida. como nos experimentos com inseticidas. Carlos Eduardo Magalhães dos Santos 58 . número de insetos capturados em armadilhas luminosas. que geralmente seguem distribuição binomial. que apresentam maior variabilidade. e podemos analisar diretamente os dados originais. b) Transformação angular – arc sen x 100 : recomendável para dados expressos em porcentagens. permitindo estruturar a análise de variância. De um modo geral. Isso caracteriza o que denominamos heterogeneidade dos erros. Se as porcentagens estiverem todas na faixa de 30% a 70%. Quando ocorrem zeros ou valores baixos (menores que 10 ou 15). que pode ser de dois tipos: 1 – Heterogeneidade irregular: ocorre quando certos tratamentos apresentam maior variabilidade que outros. número de pulgões ou ácaros por folha. certa relação entre a média e a variância dos diversos tratamentos testados. entre 5 e 100 insetos). Consideramos. Observação: Verificada a necessidade de transformação. como demonstrado a seguir: Considere o modelo estatístico para um experimento instalado segundo o DIC: ___________________________________________________________________________________ 59 . na qual. Por exemplo. Se a heterogeneidade dor irregular.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ de dados discretos num total de casos. Se houver interesse em ilustrar com as médias não transformadas. e toda análise estatística (análise de variância. testes de comparação de médias e desdobramentos de graus de liberdade de tratamentos) deverá ser feita com os dados transformados. porcentagem de plantas doentes (número de plantas doentes/número de plantas consideradas). e sim aplicando à médias dos dados transformados a operação inversa da transformação. com resíduos apropriados a cada grupo. c) Transformação logarítmica – log x ou ln x: utilizada quando constatada certa proporcionalidade entre as médias e os desvios padrões dos diversos tratamentos. porcentagem de germinação (número de sementes germinadas/número total de sementes). ao passo que para os outros tratamentos que controlam melhor a praga. por exemplo. para eliminá-la. se isso não for possível ou recomendável. devemos subdividi-los em grupos e testá-los separadamente. pode-se decompor a variação entre os valores observados nas diferentes causas de variabilidade. a amplitude de variação será baixa (por exemplo. podemos simplesmente eliminar os tratamentos discrepantes ou. por exemplo. se torna C = 1. se a transformação foi de x + 0. Partindo do modelo estatístico. os dados devem ser transformados para log (x + C).5 . Quando ocorrerem zeros.5. o caso de contagens de insetos: se a população é numerosa. como. a média não transformada será calculada elevando-se a média transformada ao quadrado e subtraindo-se 0. A transformação logarítmica é aconselhável nesses casos. as mesmas não deverão ser calculada a partir dos dados originais. as contagens serão altas tanto para a testemunha como para os tratamentos não eficientes (por exemplo variação de 1000 a 10000 insetos). geralmente. os dados serão transformados. 2 2 ij i ij i aplicando somatório ∑ (Y − mˆ ) I.J = i=1. desenvolvendo o quadrado perfeito. j=1 ___________________________________________________________________________________ Prof.J 2 i=1.J ∑ I. tem-se: Y ij – m = (m i – m) + (Y ij – m i ). Fórmulas de mais fácil aplicação podem ser obtidas.J + ∑ duplos produtos i=1. j=1 2 ij = ∑ (mˆ − mˆ ) 2 i=1. j=1 I.J i ij ∑ (Y − mˆ ) I. i=1.J ˆ ∑ Yij + IJm ˆ2 Yij2 − 2m i=1. j=1 2 ij i=1. Inicialmente trabalharemos com a fórmula da SQTotal. j=1 I.J = ∑ [(mˆ − mˆ ) + (Y − mˆ )] I. j=1 2 i i=1. Yij − m elevando ambos os membros ao quadrado (Y − mˆ ) = [(mˆ − mˆ ) + (Y − mˆ )] . ∑ (Y − mˆ ) I. j=1 ij . j=1 2 ij ∑ i=1. j=1 ij ∑ (Y I.J I. j=1 2 ij ˆ Yij + m ˆ2 − 2m ) aplicando-se as propriedades de somatório.J 2 i=1. j=1 i i I.J i=1. j=1 i=1.J 2 ij i=1.J ∑ mˆ 2 i=1.J ˆ ∑ Yij + Yij2 − 2m i=1.J Pode-se verificar que: ∑ duplos produtos = 0 . No entanto. j=1 ∑ (Y − mˆ ) I. j=1 I.J i=1. pode-se obter os valores para as respectivas somas de quadrados. conforme é mostrado a seguir. j=1 Escrevendo de uma forma mais simplificada a igualdade anterior temos: SQTotal = SQTrat + SQRes Por meio das fórmulas obtidas anteriormente.J + 2 ij i=1. Tem-se que: SQTotal = ∑ (Y − mˆ ) I. Substituindo m. temos: ∑ (Y − mˆ ) I.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ Y ij = m + t i + e ij Fazendo t i = m i – m e e ij = Y ij – m i . j=1 ∑ (Y − mˆ ) I. j=1 I. essas fórmulas demandam muitos cálculos. Carlos Eduardo Magalhães dos Santos 60 . m i e e ij por seus estimadores tem-se: ˆ = (m ˆ i −m ˆ ) + (Yij − m ˆ i ).J = = I. ∑ (mˆ − mˆ ) I.J Y Y   ∑ ∑ ij ij I.J I.J 2  i=1.J   ∑ Yij    I. j=1 I.J = i=1. j=1 ___________________________________________________________________________________ 61 .j=1  +  i=1. j=1 2 i ˆ ⋅m ˆ i +m ˆ2 − 2m ) aplicando-se as propriedades de somatório.J I. j=1 i=1.J   ∑ Yij   ∑ Yij      I. j=1 2 ij −C que é a fórmula mais prática para se calcular a SQTotal.j=1 IJ  i=1. j=1  Como a expressão  é denominada de correção.J I. tem-se: IJ ∑ (Y − mˆ ) I.J I.J   ∑ Yij    i=1. j=1     I.J ∑ i=1.J   I. j=1 2 2  I. j=1 i=1.J ˆ i2 − 2m ˆ ∑m î+ m i=1. temos: ∑ (mˆ − mˆ ) I.J i=1. j=1 i ∑ (m I.J SQTotal = 2 i=1.J ˆ = A média geral pode ser escrita como: m ∑Y i=1. j=1 ij .J ∑ mˆ 2 i=1. j=1 2 finalmente temos:  I. Para a SQTratamentos tem-se: ∑ (mˆ − mˆ ) I.J 2 i=1. j=1 i=1. j=1 2 i = I. j=1 i=1. j=1   2 (Yij − mˆ ) = ∑ Yij − 2 Yij + IJ ∑ ∑ IJ i=1.J 2 i=1.J 2 i=1. j=1 i desenvolvendo o quadrado perfeito.J SQTotal = 2 ij i=1. j=1 I. j=1 I. assim IJ   I. 2  I.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ I.J 2 simplificando tem-se.J = ∑Y i=1.j=1  2 ˆ ( ) − = − Y m Y 2 ∑ ij ∑ ij IJ IJ i=1. j=1  2  ˆ SQTotal = ∑ (Yij − m) = ∑ Yij − IJ i=1. então j=1   I.J I. 2  I.J ˆ = m ∑Y i=1.J I T 2 i 1.j=1  ou SQTrat = ∑ (m IJ i=1.J 2 J sabe-se que Ti = ∑ Yij . tem-se. j=1 i=1 J i=1 J     I. j=1 IJ ij ˆ i = Ti em J substituindo na expressão anterior. No caso em que o número de repetições varia de acordo com o tratamento a fórmula apropriada é  I.J I I T T 2 = = = = i 1.j=1 + IJ i=1.J   I.J I (mˆ i − mˆ )2 = J∑ Ti2 − 2 i=1.J   ∑ Yij    2 I. j 1 i 1.J 2 simplificando.ri   ∑ Yij  I Ti2  i=1. j=1 i=1 J     I. j=1 2 i I I i=1 i=1 ˆ i2 − 2m ˆ J∑ m ˆ i + IJm ˆ2 = J∑ m A média geral e a média para tratamentos podem ser escritas respectivamente como: I. j 1   (mˆ i − mˆ ) = J∑ i2 − 2 J∑ i + IJ ∑ IJ IJ  i=1.J Y Y  ∑ Yij  ∑ ∑ ij ij 2 I. j=1 i=1 J Ti2 −C ∑ i=1 J I A fórmula anterior é utilizada quando o número de repetições é igual para todos os tratamentos. j=1  = =    i ˆ ˆ −2 + ∑ (mi − m) = ∑ IJ IJ i=1.j=1  − SQTrat = ∑ N i=1 ri 2 ___________________________________________________________________________________ Prof.J i=1.J Y Y   ∑ ∑ ij ij 2 I.j=1  ∑ IJ J IJ i=1. j 1 i=1.J I T 2 ˆ i −m ˆ ) =∑ i −  i=1. Carlos Eduardo Magalhães dos Santos 62 .j=1 J i=1. j=1 i=1 J 2 finalmente tem-se: 2  I.J   ∑ Yij   ∑ Yij      2 I.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ ∑ (mˆ − mˆ ) I. tem-se:   I. I(J – 1)] Resíduo I(J – 1) SQRes SQRes I(J − 1) IJ – 1 SQTotal Total A partir das SQTrat e SQRes. Este valor de F calculado deve ser comparado com o valor de F tabelado. de acordo com o nível de significância do teste. SQRes = SQTotal – SQTrat O quadro de análise de variância. o que equivale a dizer que todos os possíveis contrastes entre as médias dos tratamentos. ___________________________________________________________________________________ 63 . geralmente denotada por ANOVA (ANalysis Of VAriance) para a análise de um experimento instalado segundo o DIC.. que é obtido pelo quociente do QMTrat com o QMRes. calcula-se o valor de F.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ em que. α Tratamentos (I – 1) SQTrat SQTrat I −1 QMTrat QMRes [(I -1). por meio do quociente entre a soma de quadrados com o respectivo número de graus de liberdade. graus de liberdade para tratamentos e graus de liberdade para resíduo. I N – é o número de unidades experimentais = ∑ ri i=1 r i – é o número de unidades experimentais do tratamento i.. ao nível de probabilidade que foi executado o teste. As hipóteses para o teste F da análise de variância para tratamentos são as seguintes: H 0 : m 1 = m 2 = . = m i = m. A Soma de Quadrados do Resíduo (SQRes) é obtida por diferença. Para se concluir se existe diferença entre tratamentos. o qual é obtido na tabela de distribuição da variável aleatória F. são estatisticamente nulos. obtém-se os respectivos quadrados médios. com igual número de repetições para todos os tratamentos é do seguinte tipo: FV GL SQ QM F F tab. A título de classificação geral pode-se utilizar a seguinte tabela C. ao nível de probabilidade que foi realizado o teste. experimentos realizados em locais com ambiente controlado geralmente são mais precisos e podem apresentar CV menores que 5%.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ Ha: não H 0 . então rejeitase H 0 e conclui-se que os tratamentos tem efeito diferenciado ao nível de significância em que foi realizado o teste. ___________________________________________________________________________________ Prof. pois existe uma variabilidade inerente a cada área de pesquisa.V. Quanto menor o CV mais preciso tende a ser o experimento. estatisticamente diferentes de zero. 5. Avaliação Precisão < 10% Baixo Alta 11 – 20% Médio Média 21 – 30% Alto Baixa > 31% Muito Alto Muito Baixa Porém o valor do CV não tem nada de absoluto. o que equivale a dizer que existe pelo menos um contraste entre as médias dos tratamentos. Carlos Eduardo Magalhães dos Santos 64 . então não rejeitase H 0 e conclui-se que os tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste. Por exemplo. A regra decisória para o teste F é a seguinte: • se o valor de f calculado for maior ou igual ao valor de F tabelado.5 – Coeficiente de variação O coeficiente de variação é calculado da seguinte maneira: CV = QMRes ⋅ 100 ˆ m O CV é utilizado para avaliação da precisão de experimentos. • se o valor de F calculado for menor que o valor do F tabelado. Tratamentos A – CD 216 B – M-Soy 8001 C – UFVS – 2005 D – CD 219 RR E – M-Soy 8008 RR 1 3.78 Repetições 2 3 4 2.47 (B 1 ) 2.78 4. Quadro 4.62 (D 4 ) 3.29 24.23 (B 5 ) 2.81 (B 2 ) 2.17 3.64 Totais 13.62 3.93 (E 4 ) 50.6 – Produtividades dos cultivares de soja.58 2. realizado numa área perfeitamente homogênea quanto às condições experimentais.23 2.05 5 2.93 2.23 (C 5 ) 2.69 4.78 (C 2 ) 2.89 (D 1 ) 3.03 2.62 4.09 (D 3 ) 4.6 – Exemplo Num experimento inteiramente casualizado.32 4.72 85.01 20.69 (E 3 ) 4.90 O primeiro passo para a obtenção da análise do experimento consiste na organização do quadro que mostra a produtividade de cada tratamento em suas diferentes repetições.90 4.17 (C 1 ) 2. Os cultivares utilizados foram: A – CD 216 B – M-Soy 8001 C – UFVS – 2005 D – CD 219 RR E – M-Soy 8008 RR A designação dos tratamentos às parcelas no campo.58 (A 5 ) 2.47 5.96 13.81 3. são apresentados abaixo: (A 3 ) 2.5 (B 3 ) 3. em t/ha.70 (E 3 ) 5.78 (D 2 ) 4.1 – Obtenção da análise de variância do experimento ___________________________________________________________________________________ 65 .09 2.23 4.83 (E 2 ) 4.83 2.32 (A 2 ) 2.4 2.64 (E 1 ) 4.03 5. de competição de cultivares de soja.6.57 2.87 2.70 2.87 4.54 (D 5 ) 4. juntamente com as produtividades.03 (B 4 ) 2.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 5.64 13. transcrevendo os dados anteriores para o próximo quadro.57 (C 3 ) 2. em t/ha.87 (A 1 ) 3. foram utilizados 5 cultivares e 5 repetições.89 2.03 (A 4 ) 2.87 (C 4 ) 2. necessitamos calcular as somas de quadrados de cada uma das causas da variação.) 5.Tratam entos = ( ) 1 13.Q. Do quadro 4.V) Tratamentos Resíduo Total Graus de liberdade (G.62 i=1 j=1 e a correção C é calculada por: G2 85.Resíduo = 25.231 IJ 5⋅5 I J ∑∑ X e i=1 j=1 2 ij = 3.186 F 28.Q. obtemos: I J G = ∑∑ Xij = 85. Carlos Eduardo Magalhães dos Santos 66 .094 i=1 j=1 Já demonstramos que S.094 – 21. Para testar essas hipóteses montamos a análise de variância .M.735 25.64 2 = 318. Fonte de Variação (F.96 2 + 13.64 2 +  + 24.Q.Q.Tratamentos Logo: S.359 5 Também já foi demonstrado que: S.735 As hipóteses que desejamos testar para tratamentos são: H 0 : os cultivares testados possuem efeitos semelhantes sobre a produtividade de soja.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ Para a obtenção da análise de variância do experimento.) (5-1) = 4 (5 .Q.359 3.) 21.Total = ∑∑ Xij2 − C = 25.Total – S.Tratam entos = 1 I 2 ∑ Ti − C J i=1 Portanto.1) x 5 = 20 (5 x 5) -1 = 24 Soma de quadrados (S.70** ___________________________________________________________________________________ Prof.359 = 3.62 2 C= = = 293.326 I J Logo: S.89 2 + 2.6.Q.Q.54 2 +  + 5.094 Quadrado médio (Q.Resíduo = S.72 2 − C = 21. H 1 : os cultivares testados possuem efeitos diferentes sobre a produtividade de soja.L.339 0.Q. S. buscamos os valores críticos da tabela nos níveis de 5% e 1% de probabilidade. um agrônomo tomou vinte parcelas similares e distribuiu. é possível concluir que existe diferença significativa entre as variedades com relação a produtividade.186 = 0.431 t/ha 100 s C. = 100 ⋅ 0.01).V.: {5% . = ˆ m Logo: ˆ = G = 85.60% 3.42 5.43} Como o valor da estatística F (28.43). obtendo: Valores de F da tabela 4 x 20 g. 4.4.7 – Exercícios 5. = 0. m IJ 25 C. A partir dos dados experimentais fornecidos abaixo. inteiramente ao acaso.V.42 t/ha. O grau de confiança é superior a 99% de probabilidade. utilizando o nível de significância de 5%? Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 ___________________________________________________________________________________ 67 . ele é significativo nesse nível (P<0. o que indicamos colocando sobre seu valor os 2 asteriscos e podemos chegar à seguinte conclusão: O teste foi significativo no nível de 1% de probabilidade (P<0.7.1 – Para comparar a produtividade de quatro variedades de milho. cada uma das 4 variedades em 5 parcelas experimentais.6.Res.01).62 = 3. Concluímos que os cultivares testados (pelo menos dois) possuem efeitos diferentes sobre a produtividade de soja.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Obtido o valor da estatística F.M. s = q.70) supera o valor crítico no nível de 1% de probabilidade (4.431 = 12. Rejeitamos a hipótese H 0 .l.87 1% .2 – Cálculo do coeficiente de variação do experimento O coeficiente de variação do experimento é calculado por.2. 7. Os resultados obtidos. as quais se diferenciavam pelo tipo de aditivo que era acrescentado à mesma durante o seu ___________________________________________________________________________________ Prof.2 – Um treinador de corrida rústica. A designação das técnicas de preparação aos atletas foi feita totalmente ao acaso e de tal forma que o número de atletas avaliados em cada uma das técnicas fosse o mesmo. após um determinado período de tempo de aprendizado da técnica pelos atletas. testou três novas técnicas de preparação.7. Carlos Eduardo Magalhães dos Santos 68 . a) Quais foram os Princípios básicos da Experimentação utilizados pelo pesquisador neste experimento? b) Qual foi a unidade experimental nesta pesquisa? c) É possível concluir que existe diferença entre as técnicas de preparação com relação ao tempo médio gasto para percorrer a distância de 25 Km? ( α = 1%) d) Qual seria a técnica a ser recomendada? 5. foram os seguintes (minutos/25 Km): Técnicas de preparação Repetições 1 2 3 1 130 125 135 2 129 131 129 3 128 130 131 4 126 129 128 5 130 127 130 Totais 643 642 653 De acordo com os resultados obtidos.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ 23 27 25 34 21 24 29 28 Totais 115 135 130 155 Médias 23 27 26 31 5. Para tanto trabalhou com um grupo de 15 atletas completamente homogêneos para as características essenciais. pede-se. objetivando melhorar o desempenho de seus atletas.3 – Com o objetivo de diminuir o consumo dos motores à gasolina. uma determinada indústria petroquímica testou 4 novas formulações de gasolina. 0 105.5 85.0 90.5 Pseudoparotidectimizado 90. 5. d) Estabeleça um contraste para comparar aditivos de formulação básica.7. segundo o grupo.0 89. os resultados obtidos foram (Km/l): Aditivo a base de Ácido forte Ácido fraco Base forte Base fraca Médias 14. testar a hip ótese de que as mé dias relativas aos três grupos são iguais.0 86. Os dados referentes as taxas de glicose.0 120.5 87.5 – O resultado das vendas efetuadas por 3 vendedores de uma indústria de pesticidas durante certo período é dado a seguir.0 Usando α = 5%.0 Normal 85.0 92. Para efetuar o teste. e concluir.7. 5.09 10 10 10 10 Nº de carros SQResíduo = 6. A designação das formulações aos carros foi feita inteiramente ao acaso. c) Estabeleça um contraste para comparar aditivos de formulação ácida.0 95.0 108. Obtenha a estimativa para este contraste. um experimento no DIC foi realizado. Ao nível de 5% de probabilidade e ___________________________________________________________________________________ 69 .0 95.0 110.0 100.0 87. Obtenha a estimativa para este contraste.5 97.81 6.4 – Com o objetivo de verificar se a parótida tem influência na taxa de glicose no sangue.0 88. em ratos machos com 60 dias de idade são dados abaixo: Paratidectomizado 96.06 10. Obtenha a estimativa para este contraste.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ processo de fabricação.0 95. pede-se: a) Existe diferença entre os 4 tipos de formulações? (α = 5%) b) Estabeleça um contraste entre o grupo à base de formulações ácida contra o grupo à base de formulação básica.0 105.0264 Com base nos resultados acima. a indústria petroquímica utilizou carros completamente homogêneos para todas as características.0 93. em miligramas por 100 ml de sangue. Após os testes de rodagem. em ratos.0 92. Vinte e quatro ratos machos da raça W foram escolhidos aleatoriamente e separados em três grupos.56 10.0 100. 6 m ˆ 3 = 130. Carlos Eduardo Magalhães dos Santos 70 . Vendedores A B C 29 27 30 27 27 30 31 30 31 29 28 27 32 29 30 Totais 178 112 147 5. pergunta-se: Qual(is) tratamento(s) deve(m) ser recomendados(s)? Justifique a sua reposta.7.0 5.1 8.40 14 78.6 – Baseado nas informações fornecidas abaixo e supondo que os tratamentos que possuem as maiores médias são os desejados.C.7 – Os seguintes dados referem-se a ganhos de peso.6 m ˆ 2 = 128.4 m 5.0 C 6.9 6. de animais durante um período experimental.8 4.0 7.40 Tratamentos F Resíduo Total Médias de tratamentos: ˆ 1 = 128..I.7.0 ___________________________________________________________________________________ Prof.0 B 6. FV GL SQ QM 2 14. em kg.9 6.1 3.0 9.9 24. Use o nível de 1% de significância.80 7.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ considerando os vendedores como tratamentos de um D.2 8. verifique se há diferença de eficiência entre os vendedores.0 29.1 26. Repetições Rações 1 2 3 4 Totais A 7. CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ D 11.1 10.0 11. concluir e calcular o coeficiente de determinação R2.Para avaliar o efeito de altos níveis de cobre na alimentação de pintinhos. Obtenha a estimativa para este contraste.0 11. pode-se concluir que existe efeito significativo de rações com relação ao ganho de peso médio proporcionado pelas mesmas? c) Proponha um contraste que compare as rações B e C juntas contra as rações D e E. seis pintinhos foram alimentados com uma dieta basal padrão às quais foram adicionadas três níveis de cobre (0.2 11.7 40.0 163.Q. montar o quadro de análise de variância.0 Tais dados são descritos segundo o modelo estatístico: Y ij = m + t i + e ij .Q. 400.08 S. 5. Total = 57.9 .Num experimento inteiramente casualizado com 5 tratamentos e 4 repetições.3 10. pede-se: a) Proceda a análise de variância dos dados (use α = 5%) b) De acordo com o resultado do teste F. Os dados abaixo mostram a razão da eficiência da dieta (g dieta/g ganho de peso) ao final de 3 semanas: ___________________________________________________________________________________ 71 .0 E 7. Baseando nas informações fornecidas. 5. d) Calcule o coeficiente de variação e interprete-o. Analisando-se o número de carrapatos que cairam por animal.9 44.46 Estabelecer as hipóteses estatísticas H 0 e H a . obtiveram-se as seguintes somas de quadrados: S. Tratamentos = 41.7. e 800 ppm). estudou-se o efeito de 5 carrapaticidas (tratamentos) no controle de carrapatos em bovinos.8 .8 10.7. d) Calcular o coeficiente de variação do experimento (CV). Carlos Eduardo Magalhães dos Santos 72 . c) Calcular as médias dos tratamentos. ___________________________________________________________________________________ Prof.Capítulo 5 – Delineamento Inteiramente Casualizado _____________________________________________________________________ a) Estabelecer as hipóteses estatísticas H 0 e H a e as suposições básicas para se testar estas hipóteses. b) Montar o quadro da análise de variância e testar as hipóteses a 1% de probabilidade e concluir. proceder às comparações entre as médias dos níveis do fator usando algum dos procedimentos para comparações múltiplas descritos neste capítulo.1– Introdução O fator ou fatores em avaliação em um experimento podem ser classificados como qualitativo ou quantitativo. umidade. tipos de defensivos. ou seja a hipótese de nulidade for rejeitada. assunto que será abordado no Capítulo sobre Regressão. Por outro lado se o teste F for significativo. Como exemplos tem-se temperatura. um fator qualitativo é aquele onde os níveis diferem por algum atributo qualitativo. níveis de insumo. serve para verificar se existe alguma diferença significativa entre as médias dos níveis de um fator a um determinado nível de significância. ou seja. Se o teste F para a fonte de variação que representa o fator em estudo for não-significativa. A análise de variância. dentre outros. concentração de um princípio ativo.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 6. Os procedimentos de comparações múltiplas a serem vistos neste capítulo. Neste caso. métodos de conduzir uma determinada tarefa. Para estudar o efeito deste tipo de fator. se for conveniente. visam identificar qual(is) é(são) esse(s) contraste(s). = mI) não for rejeitada... Por outro lado. implica que existe pelo menos um contraste entre médias estatisticamente diferente de zero. a hipótese de nulidade (H 0 : m 1 = m 2 = . todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos. Um fator quantitativo é aquele onde cada nível é descrito por uma quantidade numérica em uma escala. conforme visto no capítulo anterior. Como exemplos têm-se variedades. etc. doses de fertilizantes. deve-se proceder à análise de variância dos dados e. Para estudar o efeito deste tipo de fator recomenda-se realizar uma análise de regressão. não é necessário a aplicação de nenhum procedimento de comparações múltiplas. pH. ___________________________________________________________________________________ 73 . para podermos por conseqüência identificarmos qual(is) é(são) o(s) nível(is) do fator em estudo que apresentou(ram) maior(es) média(s).0 – PROCEDIMENTOS PARA COMPARAÇÕES MÚLTIPLAS 6. a dms representa qual é o menor valor que tem que ser detectado entre as suas estimativas para que se possa concluir que os dois tratamentos produzam efeitos significativamente diferentes. A conclusão a respeito da significância do contraste pode variar de um procedimento para outro. para um contraste entre duas médias. A princípio um determinado contraste. pois ele tende a “conservar” a hipótese de igualdade entre médias como verdadeira. entre duas médias poderia ser testado por cada um dos procedimentos aqui apresentados. nós podemos dizer que um teste é mais conservador (ou rigoroso) que os outros. então ele deve ___________________________________________________________________________________ Prof. Estes testes podem ser divididos em duas categorias principais de acordo com os tipos de contrastes que podem ser testados: 1a) Procedimentos para testar todos os possíveis contrastes entre duas médias dos níveis do fator em estudo a) Teste de Tukey b) Teste de Duncan 2a) Procedimentos para testar todos os possíveis contrastes entre médias dos níveis do fator em estudo a) Teste t de Student b) Teste de Scheffé Todos os procedimentos se baseiam no cálculo de uma diferença mínima significativa (dms). pois o valor da dms varia de um teste para outro.Capítulo 6 – Comparações Múltiplas _____________________________________________________________________ Dentre os diversos testes existentes na literatura. Se por exemplo. Carlos Eduardo Magalhães dos Santos 74 . Isto porque quanto maior a dms mais difícil se torna rejeitar a hipótese de nulidade. por experiência própria o pesquisador sabe que as diferenças entre os efeitos dos níveis do fator em teste são pequenas e ele deseja detectar estas pequenas diferenças. Por exemplo. pois cada um se baseia numa distribuição de probabilidades específica. Devido a esta possibilidade na diferença de conclusões a respeito da significância do contraste. por exemplo. A dms representa o menor valor que a estimativa de um contraste deve apresentar para que se possa considerá-lo como significativo. Na estatística dizemos que um teste é mais conservador que o outro quando a dms dele é maior. Este maior ou menor conservadorismo de um teste pode ajudar o pesquisador a escolher um procedimento de comparação múltipla. serão vistos os quatro testes mais comumente utilizados. m. ou seja. para 1 ≤ i < u ≤ I. para os I(I−1)/2 contrastes do tipo C=m i – m u . Se por outro lado. Considere para tanto. em que I é o número de níveis do fator em estudo. e que o número de graus de liberdade para o fator em estudo foi igual a n 1 e para o resíduo foi igual a n 2 . teste de Duncan. q = q α (I. então ele deve usar um teste mais conservador. G. F. serão apresentados quatro: teste de Tukey. Este teste baseia-se na diferença mínima significativa (d.n 2 ) é o valor tabelado da amplitude total estudentizada.s. ou seja. ele quer concluir que os níveis do fator têm efeitos diferentes somente quando a diferença nos seus efeitos for realmente grande.M. teste t de Student e teste de Scheffé. ou seja. número de níveis do fator em estudo (I) e número de graus de liberdade do resíduo (n 2 ) da análise de variância.V. pode ser utilizado para comparar a totalidade dos contrastes entre duas médias. Vamos ver a partir de agora cada procedimento com mais detalhe.1 – Teste de Tukey O teste de Tukey. com maior dms. para o qual o teste F para fator foi significativo. S.2.2 – Alguns procedimentos para comparações múltiplas Dentre vários procedimentos existentes para comparações múltiplas. F Fator I–1 SQFator QMTrat Significativo Resíduo I (J – 1) SQRes QMRes Total IJ . ou seja.Q. que é obtido em função do nível α de significância do teste. que estamos interessados em comparar as médias dos I níveis de um fator qualitativo. Q.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ usar um procedimento menos conservador.L.1 SQTotal 6.) representada por Δ e dada por: em que. as quais foram obtidas a partir da realização de um experimento no delineamento inteiramente casualizado com J repetições. que apresenta uma menor dms. ___________________________________________________________________________________ 75 . 6. O teste de Tukey é válido para a totalidade dos contrastes de duas médias. é necessário: 1.Capítulo 6 – Comparações Múltiplas _____________________________________________________________________ No caso em que todos os tratamentos apresentaram o mesmo número de repetições. Considerações: 1. O teste de Tukey exige. em que C = m i – m u . no caso dos tratamentos apresentarem números de repetições diferentes. Exemplo: Foi montado um experimento no DIC com o objetivo de verificar qual o meio de cultura (ABCD) propicia maior crescimento de colônias bacterianas. o resultado obtido por este teste é apenas uma aproximação. 3. usando a ˆ ≥ Δ . seguidas por uma mesma letra. com base nos valores 2. Mas. ou seja. o valor de Δ é simplificado com a seguinte expressão Para a realização do teste Tukey. Carlos Eduardo Magalhães dos Santos 76 . balanceamento. obtenção das estimativas dos contrastes. 3. indicar as médias iguais. ˆ =m ˆ i −m ˆ u . O número de colônias bacterianas 48 horas após a inoculação é dado abaixo: Tratamentos Rep 1 Rep 2 Rep 3 Rep 4 Rep 5 Totais A - 19 31 15 30 95 B 40 35 46 41 33 195 C 39 24 20 29 45 160 D 27 12 13 28 30 110 ___________________________________________________________________________________ Prof. C amostrais. enunciar as hipóteses: H 0 : C = 0 vs Ha: C ≠ 0. caso contrário. 2. Neste seguinte relação: se C caso. 4. nos demais casos é conservador. rejeita-se H 0 . para i ≠ u. a um nível de significância α. em princípio. não se rejeita H 0 . O teste de Tukey é exato para testar a maior diferença. r i = r u = K. concluir a respeito da significância dos I(I−1)/2 contrastes em teste. cálculo do Δ. obter o valor da estimativa do contraste entre a maior e a menor média. 5.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Considerando α = 5%. z i = z α (n. que é obtido em função do nível α de probabilidade.2. para i ≠ u. 2. Neste primeiro passo i = I.Teste de Duncan Tal como o teste de Tukey. n 1 varia seu valor durante a aplicação do teste.2 .l. número de médias ordenadas abrangidas pelo contraste entre os níveis do fator em estudo (i) e número de g. O teste de Duncan necessita a prévia ordenação das médias. em que C = m i – m u . com base no número de médias ordenadas abrangidas pelo contraste. dos níveis do fator em estudo. com base nos valores amostrais. n 2 ) = é o valor tabelado da amplitude total estudentizada. do resíduo da ANOVA (n 2 ). ou seja. 3. r i = r u = K. o teste de Duncan é um procedimento seqüencial. usando o seguinte critério: ___________________________________________________________________________________ 77 . válido para a totalidade dos contrastes de duas médias do tipo C = m i – m u . pede-se: a) Fazer ANOVA? b) Comparar as médias pelo teste de Tukey? 6. enunciar as hipóteses: H 0 : C = 0 vs Ha: C≠ 0. Como se trata de um processo seqüencial. concluir a respeito da significância do contraste em teste. No caso em que todos os tratamentos apresentaram o mesmo número de repetições. o valor de D i é simplificado com a seguinte expressão Para a realização do teste Duncan a um nível de significância α é necessário: 1. Este teste baseia-se na amplitude total mínima significativa (D i ) dada por: em que. calcular o valor de D i . ordenar as médias do fator em estudo em ordem crescente ou decrescente. 4. mas então é apenas aproximado. as comparações a serem realizadas sejam escolhidas a priori. ou seja. Calcula-se o novo valor de D i e. ___________________________________________________________________________________ Prof.Capítulo 6 – Comparações Múltiplas _____________________________________________________________________ a) Se o valor de D i for maior do que o módulo da estimativa do contraste. entre as médias intermediárias. 2. Porém este teste exige que: 1. antes de serem examinados os dados. b) Caso contrário. O teste Duncan é um procedimento seqüencial válido para a totalidade dos contrastes de duas médias. Proceder ao item 3 e seguintes até que i = 2. para todos os pares de médias que não estejam ligadas por um mesmo traço e que envolvem n 1 médias. reduzir de uma unidade o valor de n 1 . não rejeita-se H 0 e as médias são ligadas por um traço. 6. o fato das médias ordenadas não serem independentes e o valor de z i em conseqüência. Tal como o teste de Tukey. Este teste tem como inconveniente. Exemplo: Aproveitando os dados do exemplo anterior para o teste de comparação de Tukey. o teste de Duncan exige.3 . 2. tantos contrastes quantos são os graus de liberdade para tratamentos. Mas. proceder a comparação das médias pelo teste de Duncan? 6. além de ser um teste trabalhoso. podem-se testar no máximo. Quando a maior média não diferir significativamente da menor. Considerações: 1. balanceamento. indicando que não há diferença entre elas. e estes contrastes devem ser ortogonais. não se admitirá diferença significativa. em princípio. 3.2. no caso de serem diferentes os números de repetições este teste pode ainda ser usado. Carlos Eduardo Magalhães dos Santos 78 .Teste t de Student O teste t pode ser utilizado para testar contrastes envolvendo duas ou mais médias. repetir o procedimento que consta no item 3 e nos seguintes. não ser exato. Caso contrário não se rejeita H 0 . O nível de significância α é válido para um único contraste. sendo n 2 o número de graus de liberdade do resíduo e QMResíduo o quadrado médio residual da análise de variância. + a I m I do qual obtemos a estimativa por meio do estimador ˆ =am ˆ ˆ ˆ C 1 1 + a 2m 2 +  + aImI que pode ser testada pelo teste t. e não para uma série deles.=r I =K.. ___________________________________________________________________________________ 79 . C. então a fórmula para a aplicação do teste t é Quando aplicamos o teste t a um contraste. geralmente o interesse é testar as hipóteses: H 0 : C = 0 vs Ha: C ≠ 0. neste caso..CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ A ortogonalidade entre os contrastes indica independência linear na comparação estabelecida por um contraste com a comparação estabelecida pelos outros contrastes. A regra de decisão. entre os níveis de um fator.. que tem distribuição t de Student com n 2 graus de liberdade. dada por. O valor tabelado de t é obtido por ttab=t α (n2).. Caso o número de repetições seja o mesmo para todos os tratamentos. Considerações: 1. Consideremos um contraste de médias. ou seja r 1 =r 2 =. Entre I médias de um fator. podem ser obtidos I – 1 contrastes ortogonais. é a seguinte: Se |t| ≥ t tab ⇒ rejeita-se H 0 . em sua forma geral: C = a 1 m 1 + a 2 m 2 + . calculando-se a estatística t. pode ficar caracterizado uma estatística de ordem ao querer comparar a maior com a menor média. o que acarretaria certa dependência entre as médias. A estatística do teste.Capítulo 6 – Comparações Múltiplas _____________________________________________________________________ 2. denotada por S.64 ˆ m 21.44 28. Carlos Eduardo Magalhães dos Santos 80 . e sua utilização não se justifica. ___________________________________________________________________________________ Prof. pois. É um teste mais conservador que o teste t.4 . O nível de significância α é válido somente se o contraste for estabelecido a priori e não sugerido pelos dados. I = é o número de níveis do fator em estudo (ou número de tratamentos do experimento). é calculada por: em que. mesmo quando sugerido pelos dados.76 24.Teste de Scheffé Este teste pode ser aplicado para testar todo e qualquer contraste entre médias. nenhum contraste poderá ser significativo pelo teste de Scheffé.57 27.30 Verificar pelo teste t se os fertilizantes nitrogenados possuem efeito na produção do abacaxizeiro? 6.2. Exemplo: Num experimento de competição de fertilizantes nitrogenados para o abacaxizeiro foram utilizados 6 tratamentos (5 fertilizantes e 1 testemunha) e 4 repetições no DIC.85 28. É freqüentemente utilizado para testar contrastes que envolvam grupos de médias. Tratamentos Testemunha Sulfato de amônio Salitre do Chile Uréia Nitrocálcio de Cubatão Nitrocálcio de Cubatão + S σˆ 2 = QMR = 0. porém não exige que os contrastes a serem testados sejam ortogonais e nem que estes contrastes sejam estabelecidos antes de se examinar os dados. Se o valor de F obtido não for significativo.58 28. Para testar um único contraste.64 6. indicando que os grupos de médias confrontados no contraste diferem entre si a esse nível de probabilidade. ˆ =am ˆ ˆ ˆ C 1 1 + a 2m 2 +  + aImI ˆ ≥ S . O procedimento de Duncan também é sensitivo. calcular a estimativa do contraste C. e número de graus de liberdade do resíduo. Caso o número de repetições seja o mesmo para todos os tratamentos.1.3. Vantagens e Desvantagens dos Procedimentos Para Comparações Múltiplas O teste t não é recomenda do para testar todas as possíveis comparações entre médias de um experimento.. verificar pelo teste de Scheffé se existe diferença ao nível de 5% de probabilidade.=r I =K. ou seja I .n 2 ) é o valor tabelado de F. ou seja n 2 . 2. ou seja. número de graus de liberdade do fator em estudo. pois este teste aponta pequenas diferenças como significativas. Para estes dois testes. ou seja. o nível de ___________________________________________________________________________________ 81 . Exemplo: Considerando os dados dos fertilizantes nitrogenados para o abacaxizeiro em que o teste F para tratamento é significativo. Considerações: 1. entre o Nitrocálcio de Cubatão (com e sem enxofre) e os demais fertilizantes nitrogenados? QMRes = 0.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ F tab = F α (I-1. obtido em função do nível α de probabilidade. então a fórmula para a aplicação do teste Schheffé é Deve-se então. o teste de Scheffé é bastante rigoroso.. r 1 =r 2 =. Duncan e t. no sentido de declarar pequenas diferenças como significativas. O teste de Scheffé é válido para a totalidade dos contrastes. dizemos que o contraste é significativamente Se verificarmos que C diferente de zero ao nível α de probabilidade. ou para testar um número pequeno deles. estes testes podem apontar como significativos contrastes. Neste acaso o erro tipo I tende a ocorrer mais frequentemente do que o estabelecido pelo nível de significância do teste. Carlos Eduardo Magalhães dos Santos 82 . aos exemplos dados do Capítulo 5 de Delineamento Inteiramente Casualizado.Capítulo 6 – Comparações Múltiplas _____________________________________________________________________ significância conjunto para um grande número de comparações é elevado.2 . quando na verdade estes contrastes são não-significativos. Para a comparação de um número grande de médias. Este teste é útil quando se deseja informações preliminares a respeito das diferenças entre os efeitos dos níveis de um fator. Resumindo: Previamente escolhido Ortogonais Teste t Sugerido pelos dados Não usar Teste t Contrastes Mais de duas médias Teste de Scheffé 2 médias entre si Tukey Duncan Não-ortogonais 6. O procedimento de Scheffé é ainda mais rigoroso que o Tukey para comparar pares de médias. Testes como Tukey ou Scheffé. tornam-se extremamente rigorosos.1 .2 D 4 = 28. ___________________________________________________________________________________ Prof.4.4. pois o nível de significância conjunto para a maioria dos contrastes é muito menor do que o estabelecido.7 D3 = 26 D2 = 24. O inverso ocorre com o teste t e Duncan.3 . O teste de Tukey é bastante rigoroso no sentido de apontar diferenças significativas. ˆ 1 = 370 m ˆ 2 = 338 m ˆ 3 = 380 m ˆ 4 = 320 m ˆ 5 = 325 m ˆ 6 = 367 m D6 = 31 D5 = 30.4.Aplique os testes Tukey e Duncan.4.6 ∆ = 33 6.Aplicar o teste de Duncan às comparações múltiplas obtidas com as médias dos tratamentos instalados em um experimento segundo o Delineamento Inteiramente Casualizado (DIC). Exercícios 6. 6. Quando são utilizados para esta finalidade. conclua pelo teste Duncan e Tukey (α = 5%). Concluir para α = 5% de probabilidade. não há um procedimento ideal.Para os dados fornecidos a seguir. entre 5 marcas de carro de mesma categoria.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ T 1 = 452. 4 carros de cada marca foram escolhidos inteiramente ao acaso da linha de produção de cada marca e avaliados em uma pista de provas apropriada.56 T 4 = 469.48 T 6 = 461.Com o objetivo de verificar se existe diferença. Os resultados obtidos.2 2 44. Foram obtidos os seguintes resultados parciais: Tratamentos Totais 1 37.16 T 2 = 481. (Use o teste de Tukey. se necessário) 6.52 T 5 = 439.8677 SQTotal = 783. no tempo médio gasto para ir de 0-100 km/h.82 Complete o quadro da ANOVA e. responda qual(is) o(s) melhor(es) tipo(s) de aleitamento. considerando-se α = 1%.Um experimento para avaliar a influência de 4 tipos de aleitamento no ganho de peso de leitões foi conduzido utilizando-se o delineamento inteiramente casualizado com 4 repetições.4.8 F.4964 r=4 6.8 3 31.5 .4 .6 4 32. em segundos.76 Resíduo Total 33.V.4.80 T 3 = 442. pelo teste de Tukey? ___________________________________________________________________________________ 83 . foram: A 12 11 11 13 B 12 10 10 11 Marcas C 8 7 8 6 D 12 12 10 11 E 13 14 15 13 Usando o nível de 5% de probabilidade a) Existe de diferença significativa entre as marcas de carro quanto ao tempo médio gasto para ir de 0-100 km/h? b) Qual(is) é (são) a(s) marca(s) mais lenta(s) para ir de 0-100 km/h. pelo teste de Duncan? c) Qual(is) é(são) a(s) marca(s) mais rápida(s) para ir de 0-100 km/h. GL SQ QM F Tratamento 26.60 SQTratamento = 331. e 4) os carros de custo baixo.Capítulo 6 – Comparações Múltiplas _____________________________________________________________________ d) Suponha que em termos de custo final ao consumidor pode-se classificar os carros produzidos pela marca 1 como de custo alto. ___________________________________________________________________________________ Prof. 3) os carros de custo médio. Carlos Eduardo Magalhães dos Santos 84 . os produzidos pelas marcas 2 e 3 de custo médio e aqueles produzidos pelas marcas 4 e 5 como de custo alto. Suponha também que este experimento tinha como objetivos verificar se existe diferença no tempo médio para ir de 0-100 km/h entre: 1) os carros de custo alto e os demais carros. Utilize os testes de Scheffé e de t para verificar se estas comparações são significativas. 2) entre os carros de custo médio e os de custo alto. todos os procedimentos de comparação múltipla tem como base para o cálculo do valor da diferença mínima significativa a estimativa da variabilidade associada ao efeito do erro experimental. ___________________________________________________________________________________ 85 . concluímos que existe diferença significativa nos efeitos dos níveis do fator. Tal como o teste F. Por outro lado. Se o teste F for nãosignificativo. O delineamento inteiramente casualizado pressupõe para ser utilizado que. apontar diferenças significativas entre os efeitos de níveis do fator. ele deve planejar e executar o seu experimento de tal forma que a influência do erro experimental seja a menor possível. concluímos que os efeitos são estatisticamente iguais e nada mais precisa ser feito.1– Introdução O principal objetivo do planejamento e execução de um experimento é apontar diferenças significativas entre os efeitos os níveis de um fator em avaliação. Se o pesquisador achar que a idade da cobaia pode influenciar na avaliação dos analgésicos. Entenda-se aqui fator perturbador como uma fonte de variação indesejável entre as unidades experimentais ou nas condições ambientais. ele deve controlar o efeito do fator perturbador idade. as unidades experimentais sejam e estejam durante todo o experimento em condições ambientais completamente homogêneas.0 – DELINEAMENTO EM BLOCOS CASUALIZADOS 7. para o pesquisador conseguir atingir o seu objetivo. a qual é conhecida como Quadrado Médio do Resíduo (QMRes). Caso o pesquisador perceba que algum fator perturbe a homogeneidade das unidades experimentais ou nas condições ambientais que as mesmas vão estar sujeitas durante o experimento. Sendo assim fica fácil entender que. No entanto as cobaias não são de mesma idade. é necessário que o pesquisador controle o efeito deste fator perturbador. Inicialmente isto é realizado mediante o teste F para o fator. O passo seguinte seria o uso de um procedimento de comparações múltiplas para identificar quais níveis dos fatores proporcionam efeitos significativamente diferentes entre si do ponto de vista estatístico. Um exemplo seria a situação em que um pesquisador deseja comparar o efeito de analgésicos em cobaias. se o teste F for significativo.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 7. Portanto o DBC faz uso dos três princípios básicos da experimentação: repetição. quando de fato uma ou mais diferenças possam existir. blocos de unidades experimentais homogêneas e fazendo com que todos os níveis do fator em estudo sejam avaliados em cada nível do fator pertubador. uma vez que os níveis do fator em estudo são distribuídos inteiramente ao acaso em relação a todas unidades experimentais. devido suas características. o que pode acarretar em não identificar nenhuma diferença nos efeitos dos tratamentos. ou seja. pois quando se instala um experimento no DBC com J blocos. No entanto. Se um pesquisador instala o seu experimento segundo o DBC. Caso o pesquisador não controle o efeito do fator perturbador por meio da formação de blocos de unidades experimentais homogêneas e controle na casualização. O delineamento em blocos casualizados. quando na verdade o DIC seria suficiente. a instalação de um experimento no DBC quando o mesmo não é necessário. a distribuição ao acaso dos níveis do fator em estudo às unidades experimentais. não existe nenhuma restrição na casualização. em cada bloco de unidades homogêneas. o efeito do fator perturbador é absorvido pelo erro experimental. No delineamento em blocos casualizados (DBC). Portanto maior deverá ser a diferença entre os efeitos dos níveis do fator para que tais diferenças atinjam significância estatística. são perdidos (J-1) graus de liberdade para o resíduo. Vale lembrar que no delineamento inteiramente casualizado (DIC). ou seja. pode implicar na perda de eficiência do experimento. ___________________________________________________________________________________ Prof. Carlos Eduardo Magalhães dos Santos 86 .Capítulo 7 – Delineamento em blocos casualizados _____________________________________________________________________ O controle do efeito do fator pertubador é feito pela formação de grupos. Em experimentos instalados segundo o DBC. sofre a restrição de ser feita dentro de cada bloco. o efeito do fator perturbador é controlado sendo portanto possível quantificar o seu efeito e eliminar tal efeito na análise estatística dos dados experimentais. No DBC o nº de graus de liberdade para o resíduo é menor. casualização e controle na casualização. espera-se que as condições experimentais de um bloco sejam diferentes das condições experimentais do outro bloco e que haja homogeneidade das condições experimentais dentro de cada bloco. Tal absorção tende a provocar um aumento no valor do QMRes. desta forma o número de unidades experimentais por bloco é igual ao número de tratamentos. Conseqüente o F tabelado é maior. é o mais utilizado na experimentação agrícola. resultando nos delineamentos denominados blocos incompletos (balanceados. considere um experimento instalado no DBC com I tratamentos e J repetições (blocos). torna-se.Total para o bloco j: .2. muitas vezes. os quais são menores (mas homogêneos) e contêm parte dos tratamentos.Total geral: . blocos incompletos. não-balanceados).nº de unidades experimentais: N = I x J. Quadro de tabulação dos dados A título de exemplo.média para o tratamento i: .média para o bloco j: ___________________________________________________________________________________ 87 .Total para o tratamento i: . A coleta de dados da pesquisa pode ser resumida. parcialmente balanceados. impossível organizar blocos com unidades experimentais uniformes. .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Quando o número de tratamentos é muito grande. 7. nesses casos. num quadro do tipo a seguir: Blocos 1 2  J Totais 1 Y 11 Y 12  Y 1J T1 Tratamentos 2  Y 21  Y 22    Y 2J  T2  I Y I1 Y I2  Y IJ Ti Totais B1 B2  BJ G Deste quadro pode-se retirar algumas informações de interesse: . Usamos. Modelo Estatístico Para o DBC o modelo estatístico é: Y ij = m + t i + b j + e ij em que. as pressuposições: a) Os efeitos (m.m e ij é o erro associado a observação Y ij : e ij = Y ij + m − m i − m j Admitimos. a decomposição é feita da seguinte forma: SQTotal = SQTratamentos + SQBlocos + SQResíduo conforme é demonstrado a seguir.média geral do experimento: 7. Y ij é o valor observado para a variável em estudo referente ao tratamento i no bloco j. Considere o modelo estatístico para um experimento instalado segundo o DBC: Y ij = m + t i + b j + e ij fazendo t i = m i – m e b j = m j .Capítulo 7 – Delineamento em blocos casualizados _____________________________________________________________________ .3. b) Os erros e ij são conjuntamente independentes. t i . m = média de todas as unidades experimentais para a variável em estudo. Neste tipo de delineamento. t i é o efeito do particular tratamento i no valor observado Y ij : t i = m i -m b j é o efeito do bloco j no valor observado Y ij : bj = mj . Análise de Variância Para realizar a análise dos dados obtidos de um experimento instalado segundo o DBC. média zero e variância comum σ 2 . ainda. deve-se decompor a variação total que existe entre todas as observações nas partes que a compõe. b j e e ij ) são aditivos e independentes entre e dentre si.m. c) Os erros e ij têm distribuição normal.4. Carlos Eduardo Magalhães dos Santos 88 . tem-se: ___________________________________________________________________________________ Prof. 7. No entanto.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Y ij − m = (m i – m) + (m j – m) + e ij . São fornecidas a seguir. substituindo m. obtidas no desenvolvimento anterior. mediante o desenvolvimento do quadrado do ___________________________________________________________________________________ 89 . essas fórmulas são muito trabalhosas para se obter tais valores. pode-se obter os valores para as respectivas somas de quadrados. SQResíduo = SQTotal – SQTratamentos . fórmulas mais práticas para se obter as somas de quadrados. m i . m j e e ij por seus estimadores tem-se: elevando ambos os membros ao quadrado aplicando somatório Ou seja: pode-se verificar que: Por meio das fórmulas obtidas no desenvolvimento anterior.SQBlocos Estas fórmulas práticas são deduzidas a partir das somas de quadrados. pois ao instalar o experimento no DBC. SQTrat I −1 SQRes (I − 1)(J − 1) F QMTrat QMRes - Geralmente. As hipóteses para o teste F da análise de variância para tratamentos são as seguintes: H 0 : m 1 = m 2 = . = m I = m. Nos casos em que a variação entre blocos é duvidosa..M. SQBlocos Tratamentos (I – 1) SQTratamentos Resíduo (I – 1) (J – 1) SQResíduo Total IJ – 1 SQTotal Q. comparação entre blocos. o que equivale a dizer que todos os possíveis contrastes entre médias de tratamentos. para servir como orientação para a instalação de futuros experimentos. o pesquisador pode realizar o teste F para blocos.V. o pesquisador utilizou os blocos para controlar uma causa de variação conhecida. são estatisticamente nulos. o que equivale a dizer que existe pelo menos um contraste entre médias. ou seja. ___________________________________________________________________________________ Prof. é avaliar se existe diferença entre os tratamentos. ao nível de probabilidade que foi realizado o teste.Capítulo 7 – Delineamento em blocos casualizados _____________________________________________________________________ binômio. o que pode ser verificado por meio do teste F para tratamentos. geralmente é desnecessária. Carlos Eduardo Magalhães dos Santos 90 . Ha: não H 0 . O teste F para blocos.Q. ao nível de probabilidade que foi executado o teste. Blocos G.L. (J – 1) S.. aplicação dos somatórios a todos os termos e substituição de cada uma das médias pelo quociente do total pelo nº de observações que origina cada total. As deduções são semelhantes àquelas apresentadas no capítulo de Delineamento Inteiramente Casualizado. o que interessa na análise de um experimento. estatisticamente diferente de zero. O quadro da ANOVA para a análise de um experimento instalado segundo o DBC é do seguinte tipo: F. em que os tratamentos.5. Exercícios 7. usando o nível de 5% de probabilidade. expressos em unidade de medida de lã por animal: Com base nas informações anteriores. os 4 Tipos de Alimentação (TA) às ovelhas do grupo. foram os seguintes: Pede-se proceder a ANOVA e aplicar o teste Tukey e Duncan. Como as ovelhas eram de idades diferentes. sendo que dentro de cada um destes grupos havia 4 ovelhas de mesma idade e homogeneidade para as demais características. expressos em ppm de micronutriente/ml de sangue. 5 produtos comerciais para suprir deficiência de micronutriente em caprinos.2 .Com a finalidade de aumentar a produção de lã de suas ovelhas. se referem a um experimento instalado segundo o DBC.Os dados abaixo. O experimento se iniciou logo após as ovelhas terem sido submetidas a uma tosquia e se encerrou quando já era o momento de se realizar uma nova tosquia da qual foram obtidos os seguintes resultados. Dentro de cada grupo foi realizado um sorteio para distribuir ao acaso. dividiu-as em 7 grupos. pede-se (α = 1%): ___________________________________________________________________________________ 91 . 7. por meio de uma alimentação mais apropriada um criador separou 28 ovelhas de sua criação. Os resultados obtidos.1 . foram fornecidos aos animais os quais foram separados em 3 grupos segundo a idade.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 7. qual(is) seria(m) o(s) tipo(s) de alimentação a ser(em) recomendada(s) às ovelhas? ___________________________________________________________________________________ Prof.Capítulo 7 – Delineamento em blocos casualizados _____________________________________________________________________ a) Qual o tipo de delineamento experimental que o criador utilizou? Justifique sua resposta. Carlos Eduardo Magalhães dos Santos 92 . b) Existe diferença entre os tipos de alimentação fornecidos às ovelhas com relação à produção de lã? c) Com base no teste Tukey. 1– Introdução No Delineamento em Quadrado Latino (DQL). é feita uma análise a cada hora.Num laboratório devem ser comparados 5 métodos de análise (A. é necessário dividir as unidades experimentais em blocos homogêneos de unidades experimentais em relação a cada fator perturbador. D e E). Alguns exemplos ilustrativos Exemplo 1 . se no experimento estão sendo avaliados I tratamentos. C. distribui-se os tratamentos ao acaso com a restrição que cada tratamento seja designado uma única vez em cada um dos blocos dos dois fatores perturbadores. ___________________________________________________________________________________ 93 . Por exemplo.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 8. B. programados em 5 dias úteis e. Cada uma destas I2 unidades experimentais é classificada segundo cada um dos dois fatores perturbadores. Ao final são necessários I2 unidades experimentais. Geralmente. além dos princípios da repetição e da casualização. é utilizado também duas vezes o princípio do controle na casualização para controlar o efeito de dois fatores perturbadores que causam variabilidade entre as unidades experimentais.0 – DELINEAMENTO EM QUADRADO LATINO 8. deve ser formado para cada fator perturbador I blocos e cada um destes blocos deve conter I unidades experimentais. na configuração de um experimento instalado segundo o DQL. uma vez em cada período e em cada dia. O número de blocos para cada fator perturbador deve ser igual ao número de tratamentos. O quadrado latino assegura que todos os métodos sejam processados. Uma vez formados os blocos. num período de 5 horas. Para controlar esta variabilidade. em cada dia. os níveis de um fator perturbador são identificados por linhas em uma tabela de dupla entrada e os níveis do outro fator perturbador são identificados por colunas na tabela. O croqui abaixo ilustra a configuração a ser adotada. ___________________________________________________________________________________ Prof.Num experimento com suínos pretende-se testar 4 tipos de ração (A. Carlos Eduardo Magalhães dos Santos 94 . Mas. sendo I o número de tratamentos. b) Cada tratamento é representado uma única vez e ao acaso em cada linha e em cada coluna.B.D).C. F) nas parcelas. Mais utilizados são 5 x 5 e 8 x 8. 8. D. procedemos a um duplo controle local. em 4 raças e 4 idades de animais.2.Um experimento de competição de 6 variedades de cana-de-açúcar em que a área experimental apresenta gradiente de fertilidade do solo em duas direções. Características do DQL a) O número total de unidades experimentais necessárias para um experimento nesse delineamento é igual a I2. para 3 e 4 tratamentos. c) O número de tratamentos é igual ao número de repetições. toma-se a raça e a idade como blocos. somente quando se puder repetir o experimento em vários quadrados latinos. B. Exemplo 2 . ou seja. C. ou seja: Exemplo 3 . O croqui seguinte ilustra a distribuição das variedades (A. Sendo interesse fundamental o comportamento dos 4 tipos de ração. O quadrado latino possibilita a formação de blocos nas duas direções. d) Este delineamento é aconselhável quando o número de tratamentos oscila entre 3 e 10.Capítulo 8 – Delineamento em Quadrado Latino _____________________________________________________________________ Note que os níveis de uma fonte formam as linhas e os níveis da outra fonte formam as colunas. E. em cada linha e em cada coluna. 2º) Em seguida distribui-se ao acaso as linhas entre si. é só uma. 3) → Casualizando as colunas (3. A característica principal deste delineamento e que um tratamento aparece uma vez. E. Casualização no delineamento em quadrado latino Consideremos 5 tratamentos: A. 4. C. 5. podendo-se obter um quadrado final semelhante ao apresentado abaixo. 5. B. 4.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ e) É recomendável quando as unidades experimentais puderem ser agrupadas de acordo com os níveis de duas fontes de variação. e depois as colunas. 8. 1. 1. D. 1º) Faz-se a distribuição sistemática dos tratamentos dentro das linhas. de maneira que cada coluna contenha também todos os tratamentos.3. → Casualizando as linhas (2. 2) ___________________________________________________________________________________ 95 . OBS: Dentro das linhas e centro das colunas deve se ter a maior uniformidade possível. l i é o efeito da linha i.4 . conseqüentemente I linhas e I colunas. c j é o efeito da coluna j.Modelo estatístico O delineamento em quadrado latino apresenta o seguinte modelo estatístico: Yij(k) = m + l i + c j + t k + e ij(k) em que.V. G = total geral.Capítulo 8 – Delineamento em Quadrado Latino _____________________________________________________________________ 8. as somas de quadrados são dadas por: ___________________________________________________________________________________ Prof. T k = Total do tratamento k. t k é o efeito do tratamento k. Exemplo 1 Exemplo 2 Exemplo 3 Linhas I-1 4 3 5 Colunas I–1 4 3 5 Tratamentos I–1 4 3 5 Resíduo (I – 1)(I – 2) 12 6 20 2 Total I -1 24 15 35 Considerando L i = Total da linha i. Admitindo-se I tratamentos.L. m é média de todas as unidades experimentais para a variável em estudo. na i-ésima linha e na j-ésima coluna. o esquema da análise de variância fica: F. Carlos Eduardo Magalhães dos Santos 96 . Y ij(k) é o valor observado para a variável em estudo referente ao k-ésimo tratamento. e ij(k) é o erro experimental. G. C j = Total da coluna j. 2.1. pelo teste F.: Utilize α = 5% e o Teste de Duncan (se necessário) ___________________________________________________________________________________ 97 . de uma certa cultura (em g/parcela)? Obs. dispostas em um quadrado latino 5x5. b. 8. O controle feito através de blocos horizontais e verticais teve por objetivo eliminar influências devidas a diferenças de fertilidade em duas direções. são dados: a. Qual a variedade a ser recomendada? Utilize teste de Tukey. em kg/parcela. durante a colheita. B=CO294.Em um experimento no delineamento em quadrado latino com 5 tratamentos. C=CO297. Qual o tratamento deve ser recomendado nos seguintes casos: b.Num experimento de competição de variedades de cana forrageira foram usadas 5 variedades: A=CO290. pede-se: a.2 .5. Verificar se existe efeito significativo de tratamentos. Análise de Variância b.1 .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 8. se necessário. Se estivéssemos avaliando a produção de uma certa cultura (em kg/ha)? b. D=CO299 e E=CO295. foram às seguintes: Considerando α = 5% .5. Se estivéssemos avaliando a perda de grãos. As produções.5 – Exercícios 8. e concluir para α = 5% . 1– Introdução Experimentos fatoriais são aqueles em que se estudam simultaneamente dois ou mais fatores. uma das maneiras de organizar os tratamentos e não um tipo de delineamento. b) O nº de grau de liberdade associado ao resíduo é alto quando comparado com os experimentos simples dos mesmos fatores.0 – EXPERIMENTOS FATORIAIS 9. que representa a maneira pela qual os tratamentos são distribuídos às unidades experimentais. o que contribui para diminuir a variância residual. os experimentos fatoriais são montados segundo um tipo de delineamento experimental. Na verdade. ___________________________________________________________________________________ 98 . o segundo 4 níveis e o terceiro 6 níveis. Nos experimentos fatoriais. aumentando a precisão do experimento. os tratamentos são obtidos pelas combinações dos níveis dos fatores. O primeiro possui 2 níveis. Desvantagem a) Requer maior nº de unidades experimentais em relação ao experimento simples.Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ 9. Por exemplo: Experimento Fatorial 2 x 4 x 6. pode-se utilizar a seguinte simbologia: nF. cada um deles com dois ou mais níveis. Num experimento fatorial completo. Quando o número de níveis é igual para todos os fatores. ou seja. A simbologia comumente utilizada. em que F é o número de fatores n é o número de níveis de cada fator. cada nível de um fator combina com todos os níveis dos outros fatores. O fatorial é um tipo de esquema. A potência 43 informa que o experimento tem 3 fatores com 4 níveis cada um. Por exemplo: Experimento Fatorial 43. A principal aplicação de experimentos fatoriais é quando se quer saber sobre o efeito de diversos fatores que influenciam na variável em estudo e o relacionamento entre eles. 9.2 – Vantagens e Desvantagens Vantagens a) Permite o estudo dos efeitos principais e o efeito da interação entre os fatores. como por exemplo: o DIC e o DBC. O produto 2 x 4 x 6 informa que no experimento foram testados simultaneamente 3 fatores. para experimentos fatoriais é indicar o produto dos níveis dos fatores em teste. Efeito Principal: é o efeito de cada fator. deste experimento. independente do efeito dos outros fatores.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 9. nas seguintes situações: 1) Não há interação Quando não há interação as diferenças entre os resultados dos níveis de um fator são estatisticamente iguais para todos os níveis do outro fator. . podem ser estudados os seguintes efeitos: . Para ilustrar o efeito da interação. ] ___________________________________________________________________________________ Prof. Dizemos que ocorre interação entre os fatores quando os efeitos dos níveis de um fator são modificados pelos níveis do outro fator. para a variável altura de plantas (cm). em que os fatores em testes são Variedade (V) e Espaçamento (E).Efeito de Interação: é o efeito simultâneo dos fatores sobre a variável em estudo. Os tratamentos para este experimento são os seguintes: V1E1 V2E1 V3E1 V1E2 V2E2 V3E2 Suponha os seguintes resultados fictícios. Carlos Eduardo Magalhães dos Santos 99 . considere um experimento fatorial 3x2. O efeito da interação pode ser mais facilmente compreendido por meio de gráficos.Tipos de efeitos avaliados em um experimento fatorial Nos experimentos fatoriais.3 . com K repetições.Quadro de tabulação de dados Uma maneira de tabular os dados de um experimento fatorial. com dois fatores A e B. respectivamente. 9.4 . é fornecida a seguir: Deste quadro. com I e J níveis. pode-se tirar algumas informações que posteriormente serão úteis na análise de variância: ___________________________________________________________________________________ 100 . instalados segundo o DIC.Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ 2) Há interação Quando há interação as diferenças entre os níveis de um fator dependem dos níveis do outro fator. Carlos Eduardo Magalhães dos Santos 101 . O modelo estatístico para um experimento como este é: Y ijk = m + α i + β j + (αβ) ij + e ijk em que.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Pode-se montar um quadro auxiliar contendo os totais de tratamentos. α i é o efeito do i-ésimo nível do fator A no valor observado Y ijk . m é a média de todas as unidades experimentais para a variável em estudo. com K repetições. ___________________________________________________________________________________ Prof. com dois fatores: o fator A com I níveis e o fator B com J níveis.5 . Para a situação citada. instalados segundo o DIC. o quadro de totais de tratamentos é do seguinte tipo: 9. Este quadro facilita o cálculo das somas de quadrados devido aos fatores A e B. Y ijk é o valor observado para a variável em estudo referente a k-ésima repetição da combinação do i-ésimo nível do fator A com o j-ésimo nível do fator B.Modelo estatístico Considere um experimento fatorial. e da interação entre eles. cujos valores são obtidos pela soma de todas as repetições para o tratamento em questão. o modelo estatístico seria: Y ijk = m + α i + β j + (αβ) ij + ω k + e ijk em que. Para um experimento fatorial instalado segundo o DBC. As fórmulas para a obtenção das somas de quadrados são as seguintes: ___________________________________________________________________________________ 102 .Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ β j é o efeito do j-ésimo nível do fator B no valor observado Y ijk . O quadro a seguir apresenta como seria a análise de um experimento fatorial. com I e J níveis. respectivamente. 9. (αβ) ij é o efeito da interação do i-ésimo nível do fator A com o j-ésimo nível do fator B.Análise de Variância A análise de variância de um experimento fatorial é feita desdobrando-se a soma de quadrados de tratamentos nas partes devido aos efeitos principais de cada fator e na parte devido à interação entre os fatores. e ijk é o erro associado a observação Y ijk . com K blocos.6 . instalado segundo o DIC. com 2 fatores A e B. e K repetições. ω k é o efeito do k-ésimo bloco na observação Y ijk . Conforme apresentado nas duas tabelas anteriores. As hipóteses para o teste F da interação são: H 0 : Os fatores A e B atuam independentemente sobre a variável resposta em estudo (Devem se estudar os fatores isoladamente). deve-se inicialmente proceder ao teste F para a interação entre os fatores. com 2 fatores A e B. Carlos Eduardo Magalhães dos Santos 103 . Nesta situação. para os dois tipos de delineamentos. na análise dos dados oriundos de um experimento fatorial. instalado segundo o DBC. com I e J níveis. em que. respectivamente.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ O quadro abaixo apresenta como seria a análise de um experimento fatorial. e K repetições (ou blocos). ___________________________________________________________________________________ Prof. ao nível de probabilidade em que foi executado o teste. independente dos níveis outro fator.Interação não-significativa Este caso ocorre quando a hipótese H 0 para a interação entre os fatores não é rejeitada. As hipóteses para realizar o teste F para os efeitos principais são Fator A H 0 : m A1 = m A2 = . são estatisticamente nulos.. = m AI ou seja. O resultado deste teste F para a interação indica como as comparações dos níveis de um fator devem ser realizadas. O passo seguinte na análise estatística dos dados experimentais é proceder ao teste F para cada fator como ilustrado na tabela apresentada a seguir para o caso do DBC. ___________________________________________________________________________________ 104 .Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ H a : Os fatores A e B não atuam independentemente sobre a variável resposta em estudo (Deve-se proceder ao desdobramento. ou seja. 9. estudando por um teste de média o fator dentro de um nível do outro fator).6. Portanto recomenda-se que as comparações dos níveis de um fator sejam feitas de forma geral em relação ao outro fator. todos os possíveis contrastes entre as médias dos níveis do fator A. Este resultado implica que os efeitos dos fatores atuam de forma independente. Temos dois resultados possíveis para o teste F da interação os quais serão apresentados a seguir..1 . = m BJ ou seja. Fator B H 0 : m B1 = m B2 = ... Se os fatores A e B forem qualitativos. que é estatisticamente diferente de zero. existe pelo menos um contraste entre as médias dos níveis do fator B. ao nível de probabilidade em que foi executado o teste. As estimativas das médias dos níveis dos fatores são obtidas por Para realizar o teste de Tukey para comparar as medias dos níveis dos fatores em teste temos que usar Para o teste de Duncan temos que usar ___________________________________________________________________________________ Prof. aplica-se um teste de médias para comparar os níveis do fator. e o teste F para A e/ou B. que é estatisticamente diferente de zero. Carlos Eduardo Magalhães dos Santos 105 . para A e/ou B. existe pelo menos um contraste entre as médias dos níveis do fator A. ao nível de probabilidade em que foi executado o teste. ao nível de probabilidade em que foi executado o teste. for não significativo. a aplicação do teste de médias é desnecessária. H a : não H 0 ou seja. Se o teste F for significativo. todos os possíveis contrastes entre as médias dos níveis do fator B. são estatisticamente nulos.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ H a : não H 0 ou seja. .. + b I m BJ Para a aplicação do teste Scheffé para testar os contrastes Y A e Y B temos que usar As hipóteses para os testes de Scheffé e t para testar os contrastes são Fator A → H 0 : C A = 0 versus H a : C A ≠ 0 Fator B → H 0 : C B = 0 versus H a : C B ≠ 0 ___________________________________________________________________________________ 106 .. . J Para a aplicação do teste t temos que usar Em que C A = a 1 m A1 + a 2 m A2 + ... 2. 3. .. As hipóteses para os testes Tukey e Duncan para comparar as médias dos níveis dos fatores são Fator A → H 0 : m Ai = m Au versus H a : m Ai ≠ m Au para i ≠ u = 1. I Fator B → H 0 : m Bj = m Bu versus H a : m Bj ≠ m Bu para j ≠ u = 1. 3. . 2.. ..Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ Em que n A e n B são os números de médias ordenadas abrangidas pelo contraste sendo testados. + a I m AI e C B = b 1 m B1 + b 2 m B2 + . CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Exemplo: Analizar os dados do fatorial 2 x 3. F.8 Caso seja necessário. B A A1 A2 Totais de B j ∑ yijk2 = 814. aplicar teste de Duncan se for necessário para α = 1%.6. Q.4 27.1 25.278 R 1 2 3 Totais de tratamentos E 1 2 3 25.M. resumidos no quadro de interações e ANOVA.8 29.5 Totais de A i 62.V.9 (36) Analizar os dados do fatorial 3 x 4.6 26. proceder a comparação de médias pelo teste de Tukey ao nível de 5% de probabilidade.Interação significativa Este caso ocorre quando a hipótese H 0 para a interação entre os fatores é rejeitada.7 (12) B2 21.3 (18) 141.4 22.5 22.0 27.6 56.8 24.2 20.3 43.2 .56 B1 20.6 23. com 3 repetições resumidos no quadro de ANOVA. 9.4 (6) 41. Carlos Eduardo Magalhães dos Santos 107 .7 B3 20.9 35.3 (6) 21. F 36.Q. Neste caso as comparações entre os níveis de um fator levam em ___________________________________________________________________________________ Prof. ANOVA S.8 4 31. Fator R Fator E Interação R x E Tratamento Bloco Resíduo Total ∑ yijk = 314 G. decorrente de 6 repetições . Este resultado implica que os efeitos dos fatores atuam de forma dependente.4 29.L.6 (18) 79. O procedimento recomendado é realizar o desdobramento do efeito da interação. J. Para realizar este desdobramento deve-se fazer uma nova análise de variância em que os níveis de um fator são comparados dentro de cada nível do outro fator. ... pois o resultado significativo para a interação indica que o efeito de um fator depende do nível do outro fator.. não é recomendado realizar o teste F para cada fator isoladamente tal como foi apresentado para o caso da interação não-significativa. = m AI/Bj H a : não H 0 Desdobramento para comparar os níveis de B dentro de cada nível de A. Portanto. ou seja. são H 0 : m A1/Bj = m A2/Bj = . para j=1.. 3. ou seja estudar B/A ___________________________________________________________________________________ 108 . Desdobramento para comparar os níveis de A dentro de cada nível de B. 2. estudar A/B As hipóteses para testar as fontes de variação da tabela acima. tal como apresentado nas tabelas a seguir..Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ consideração o nível do outro fator. procede-se ao teste F para cada fonte de variação do desdobramento. . I. Carlos Eduardo Magalhães dos Santos 109 . = m BJ/Ai H a : não H 0 Em que as SQA/Bj e SQB/Ai podem ser obtidas usando a fórmula geral para a soma de quadrados dada por Se os fatores forem qualitativos. As estimativas das médias dos níveis dos fatores são obtidas por Para realizar o teste de Tukey para comparar as médias dos níveis dos fatores em teste temos que usar ___________________________________________________________________________________ Prof.. 3... são H 0 : m B1/Ai = m B2/Ai = .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ As hipóteses para testar as fontes de variação da tabela acima.. 2. para i=1. Nas fontes de variação em que o teste F foi significativo e o fator tem mais de dois níveis.. recomenda-se a aplicação de um teste de médias. J Fator B → H 0 : m Bj/Ai = m Bu/Ai versus H a : m Bj/Ai ≠ m Bu/Ai para j ≠ u = 1. + b J m BJ/Ai para i = 1. As hipóteses para os testes Tukey e Duncan para comparar as médias dos níveis dos fatores são Fator A → H 0 : m Ai/Bj = m Au/Bj versus H a : m Ai/Bj ≠ m Au/Bj para i ≠ u = 1.. 2. I Para a aplicação do teste t temos que usar Em que C A = a 1 m A1/Bj + a 2 m A2/Bj + .. 2. 2. ... . J e i = 1.. . + a I m AI/Bj para j = 1.. . I e j = 1... .... 2.... 2. 3. 2. ... I ___________________________________________________________________________________ 110 ... J e C B = b 1 m B1/Ai + b 2 m B2/Ai + . 3.Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ Para o teste de Duncan temos que usar Em que nA e nB são os números de médias ordenadas abrangidas pelo contraste sendo testados.. . . . e compare os níveis de cada fator dentro do outro fator por um teste de comparação de médias? ___________________________________________________________________________________ Prof.2 Q. para testar os efeitos de 3 recipientes (R 1 .6 101. aos 80 dias de idade são apresentados no quadro.79 Caso seja necessário. no esquema fatorial 3 x 2.3 85. Espécies E1 E2 Totais de R j F. proceda ao desdobramento da interação. As espécies de eucalipto testadas foram: Eucalyptus citriodora (E 1 ) e Eucalyptus grandis (E 2 ).CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Para a aplicação do teste Scheffé para testar os contrastes C A e C B temos que usar As hipóteses para os testes de Scheffé e t para testar os contrastes são Fator A → H 0 : C A = 0 versus H a : C A ≠ 0 Fator B → H 0 : C B = 0 versus H a : C B ≠ 0 Exemplo: Vamos considerar os dados de um experimento inteiramente casualizado.M. Carlos Eduardo Magalhães dos Santos 111 . Recipientes (R) Espécies (E) Interação R x E Tratamento Resíduo Total G. Os totais de altura das mudas.9 Recipientes R2 R3 103. F 23.L.5 80. R 2 e R 3 ) para produção de mudas de 2 espécies de eucaliptos (E 1 e E 2 ). R1 102.09 198.2 78.V. Os recipientes foram: saco plástico pequeno (R 1 ).3 181. Totais de E i 286. com 4 repetições.8 165.3 264. em cm.3 203.9 551. saco plástico grande (R 2 ) e laminado (R 3 ). quanto ao desenvolvimento das mudas.5 ANOVA S.Q. 7. Use α = 5%. Exercícios 9. cada um deles com dois níveis: presença (A 1 e B 1 ) ausência (A 0 e B 0 ).7.3 .Em um experimento fatorial no DIC em que foram combinadas duas doses de N e duas doses de fósforo. com dois fatores: Irrigação (A) e Calagem (B).Seja um experimento fatorial instalado no DIC. escolhidas aleatoriamente. Pede-se realizar a ANOVA e obter as conclusões sobre os fatores. ___________________________________________________________________________________ 112 . Ao final da avaliação foram obtidos os seguintes resultados (ovos/poedeira): Ao nível de 1% de probabilidade e admitindo que se trata de um experimento instalado segundo o DIC.7. Para tanto foram utilizadas 24 poedeiras similares. concluir sobre os efeitos dos fatores. com 5 repetições.Capítulo 9 – Experimentos Fatoriais _____________________________________________________________________ 9.1 . Os dados obtidos (kg de planta/parcela) para cada tratamento são fornecidos abaixo.Foi realizada uma pesquisa para testar dois tipos de ambiente (com luz artificial e sem luz artificial no período da noite) e dois tipos de ração (com cálcio e sem cálcio). 9.2 . c) Qual seria o tipo de Ambiente recomendado? (Use o teste Tukey se necessário). pede-se: a) Pode-se afirmar que o tipo de Ração e o tipo de Ambiente atuam independentemente na produção de ovos? b) Qual seria o tipo de Ração recomendada? (Use o teste Tukey se necessário). 9. são dados: Considerando o nível de significância de 5%.7. o modelo estatístico é: ___________________________________________________________________________________ 113 .como é o caso da irrigação e de processos industriais.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 10. Nos experimentos em parcelas subdivididas. DBC. 2 .o pesquisador quer comparar níveis de um fator secundário com maior precisão. estuda-se simultaneamente dois tipos de fatores os quais são geralmente denominados de fatores primários e fatores secundários. deve-se escolher como fator secundário. o pesquisador pode se basear nos seguintes critérios (VIEIRA. 10. as unidades experimentais são agrupadas em parcelas as quais devem conter um número de unidades experimentais (subparcelas) igual ao número de níveis do fator secundário.a parcela é uma unidade "física" (um vaso.2. 1989): 1 . ou seja. ou para o qual deseja-se maior precisão. Posteriormente os níveis do fator secundário são distribuídos ao acaso as subparcerlas de cada parcela.o fator principal exige "grandes parcelas" . a maneira pela qual os tratamentos são organizados. Assim. o termo parcelas subdivididas não se refere a um tipo de delineamento e sim ao esquema do experimento. Em um experimento em parcelas subdivididas (“split-plot”). etc. uma pessoa) que pode receber vários níveis de um fator secundário. para um experimento em parcelas subdivididas. em que o fator A é o fator primário e o fator B é o fator secundário.0 – EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS 10. Na instalação os níveis do fator primário são distribuídos às parcelas segundo um tipo de delineamento experimental (DIC. em geral. 3 .1– Introdução Tal como no caso de fatorial. Modelo estatístico O modelo estatístico. o fator que se espera apresentar menor diferenças.. Como a variação residual entre subparcelas é esperada ser menor do que entre parcelas. varia de acordo com o tipo de delineamento utilizado. para um experimento instalado segundo o DIC..). Às vezes o pesquisador pode optar entre um experimento com parcelas subdivididas e um experimento fatorial. Para a escolha do esquema em parcelas subdivididas. um animal. Quadro de tabulação de dados O quadro de tabulação de dados de um experimento em parcelas subdivididas é similar ao usado para tabular os dados de um experimento em fatorial. ω k é o efeito do k-ésimo bloco na observação Y ijk . Carlos Eduardo Magalhães dos Santos 114 .3. caracterizado como componente do erro (b). O quadro a seguir.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ Y IJK = m + α I + δ IK + β J + (αβ) IJ + e IJK em que. e o fator secundário representado pelo fator B com J níveis: Deste quadro. ilustra a tabulação de dados de um experimento em parcelas subdivididas. δ ik é o efeito residual das parcelas. e ijk é o efeito residual das subparcelas. no qual o fator primário é representado pelo fator A com I níveis. com K blocos. Y ijk é o valor observado para a variável em estudo referente a k-ésima repetição da combinação do i-ésimo nível do fator A com o j-ésimo nível do fator B. Para um experimento em parcelas subdivididas instalado segundo o DBC. α i é o efeito do i-ésimo nível do fator A no valor observado Y ijk . β j é o efeito do j-ésimo nível do fator B no valor observado Y ijk . (αβ) ij é o efeito da interação do i-ésimo nível do fator A com o j-ésimo nível do fator B. o modelo estatístico seria: Y ijk =m + α i + δ ik + β j + (αβ) ij + ω k + e ijk em que. pode-se tirar algumas informações que posteriormente serão úteis na análise de variância: ___________________________________________________________________________________ Prof. caracterizado como componente do erro (a). 10. m é a média de todas as unidades experimentais para a variável em estudo. Para a situação acima. cujos valores são obtidos pela soma de todas as repetições para o tratamento em questão. Para a situação citada. o quadro de totais de tratamentos é do seguinte tipo: O segundo quadro se refere ao quadro de totais de parcelas.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Para experimentos em parcelas subdivididas. pode-se montar dois quadros auxiliares. Este quadro facilita o cálculo das somas de quadrados de parcelas. O primeiro deles é idêntico ao visto para experimentos fatoriais que é o quadro de totais de tratamentos. o quadro de totais de parcelas é do seguinte tipo: ___________________________________________________________________________________ 115 . O quadro a seguir apresenta como seria a análise de um experimento instalado segundo o DBC com K repetições no esquema em parcelas subdivididas. Carlos Eduardo Magalhães dos Santos 116 .4. Para cada um destes desdobramentos. em que o fator A com I níveis foi designado às parcelas e o fator B com J níveis foi designado às subparcelas em que: ___________________________________________________________________________________ Prof. existe um resíduo.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ 10. Análise de variância A análise de variância de um experimento em parcelas subdivididas é feita desdobrando os efeitos das parcelas e das subparcelas nas partes que as compõem. o qual é utilizado para testar o efeito das fontes de variação pertinentes. Temos dois resultados possíveis para o teste F da interação os quais serão apresentados a seguir. na análise dos dados oriundos de um experimento em parcelas subdivididas deve-se inicialmente proceder ao teste F para a interação entre os fatores. Este resultado implica que os efeitos dos fatores atuam de forma independente. 10. independente dos níveis outro fator. O resultado deste teste F para a interação indica como as comparações dos níveis de um fator devem ser realizadas.4. H a : Os fatores A e B não atuam independentemente sobre a variável resposta em estudo.1 Interação não-significativa Este caso ocorre quando a hipótese H 0 para a interação entre os fatores não é rejeitada. Portanto recomenda-se que as comparações dos níveis de um fator sejam feitas de forma geral em relação ao outro fator. ___________________________________________________________________________________ 117 . ou seja. As hipóteses para o teste F da interação são: H 0 : Os fatores A e B atuam independentemente sobre a variável resposta em estudo.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Tal como no esquema fatorial. existe pelo menos um contraste entre as médias dos níveis do fator A.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ O passo seguinte na análise estatística dos dados experimentais é proceder ao teste F para cada fator como ilustrado na tabela apresentada a seguir para o caso do DBC. ao nível de probabilidade em que foi executado o teste. Carlos Eduardo Magalhães dos Santos 118 . ao nível de probabilidade em que foi executado o teste. Se o teste F for ___________________________________________________________________________________ Prof. = m AI ou seja.. e o teste F para A e/ou B. Se os fatores A e B forem qualitativos. for não significativo. ao nível de probabilidade em que foi executado o teste. existe pelo menos um contraste entre as médias dos níveis do fator B. = m BJ ou seja.. que é estatisticamente diferente de zero. todos os possíveis contrastes entre as médias dos níveis do fator B.. H a : não H 0 ou seja. Fator B H 0 : m B1 = m B2 = . As hipóteses para realizar o teste F para os efeitos principais são Fator A H 0 : m A1 = m A2 = . a aplicação do teste de médias é desnecessária. que é estatisticamente diferente de zero. são estatisticamente nulos.. todos os possíveis contrastes entre as médias dos níveis do fator A. ao nível de probabilidade em que foi executado o teste. H a : não H 0 ou seja. são estatisticamente nulos. As hipóteses para os testes Tukey e Duncan para comparar as médias dos níveis dos fatores são Fator A → H 0 : m Ai = m Au versus H a : m Ai ≠ m Au para i ≠ u = 1. .CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ significativo. 2.. 2. .. . I Fator B → H 0 : m Bj = m Bu versus H a : m Bj ≠ m Bu para j ≠ u = 1. 3. 3. .. aplica-se um teste de médias para comparar os níveis do fator. As estimativas das médias dos níveis dos fatores são obtidas por Para realizar o teste de Tukey para comparar as medias dos níveis dos fatores em teste temos que usar Para o teste de Duncan temos que usar Em que n A e n B são os números de médias ordenadas abrangidas pelo contraste sendo testados.. para A e/ou B. J Para a aplicação do teste t temos que usar ___________________________________________________________________________________ 119 . + a I m AI e C B = b 1 m B1 + b 2 m B2 + .5.. tal como apresentado nas tabelas a seguir. A estimativa do quadrado médio deste resíduo combinado é obtida por ___________________________________________________________________________________ Prof. pois o resultado significativo para a interação indica que o efeito de um fator depende do nível do outro fator. + b I m BJ Para a aplicação do teste Scheffé para testar os contrastes Y A e Y B temos que usar As hipóteses para os testes de Scheffé e t para testar os contrastes são Fator A → H 0 : C A = 0 versus H a : C A ≠ 0 Fator B → H 0 : C B = 0 versus H a : C B ≠ 0 10.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ Em que C A = a 1 m A1 + a 2 m A2 + . não é recomendado realizar o teste F para cada fator isoladamente tal como foi apresentado para o caso da interação não-significativa. Para realizar este desdobramento deve-se fazer uma nova análise de variância em que os níveis de um fator são comparados dentro de cada nível do outro fator. Para comparar os níveis de um fator principal em cada nível do fator secundário. Neste caso as comparações entre os níveis de um fator levem em consideração o nível do outro fator. Este resultado implica que os efeitos dos fatores atuam de forma dependente.. Portanto. é necessário fazer uma combinação das duas estimativas obtidas para o erro experimental bem como do número de graus de liberdade associado as mesmas. Esta combinação é denominada de resíduo combinado (ResComb)...2 Interação significativa Este caso ocorre quando a hipótese H 0 para a interação entre os fatores é rejeitada. O procedimento recomendado é realizar o desdobramento do efeito da interação. Carlos Eduardo Magalhães dos Santos 120 . ....CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ O número de graus de liberdade associado a esta estimativa é obtido pela fórmula dos graus de liberdade de Satterhwaitte (n*) dada por Desdobramento para comparar os níveis de A dentro de cada nível de B.. para j = 1. ou seja estudar B/A ___________________________________________________________________________________ 121 . J. 2. são H 0 : m A1/Bj = m A2/Bj = . = m AI/Bj H a : não H 0 Desdobramento para comparar os níveis de B dentro de cada nível de A. ou seja estudar A/B As hipóteses para testar as fontes de variação da tabela acima. 3.. são H 0 : m B1/Ai = m B2/Ai = . Carlos Eduardo Magalhães dos Santos 122 ..Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ As hipóteses para testar as fontes de variação da tabela acima. para i = 1. = m BJ/Ai H a : não H 0 Em que as SQA/Bj e SQB/Ai podem ser obtidas usando a fórmula geral para a soma de quadrados dada por Se os fatores forem qualitativos. recomenda-se a aplicação de um teste de médias. procede-se ao teste F para cada fonte de variação do desdobramento.. 2. Nas fontes de variação em que o teste F foi significativo e o fator tem mais de dois níveis.. I. 3.. As estimativas das médias dos níveis dos fatores são obtidas por Para realizar o teste de Tukey para comparar as médias dos níveis dos fatores em teste temos que usar ___________________________________________________________________________________ Prof. .. .. 2. 3... 2... . .. 3. . .. . J Fator B: H 0 : m Bj/Ai = m Bu/Ai vs H a : m Bj/Ai ≠ m Bu/Ai para j ≠ u = 1. 2. J e C B = b 1 m B1/Ai + b 2 m B2/Ai + . 2. .. 2. . . . I Para a aplicação do teste Scheffé para testar os contrastes C A e C B temos que usar ___________________________________________________________________________________ 123 .. I Para a aplicação do teste t temos que usar Em que C A = a 1 m A1/Bj + a 2 m A2/Bj + .. 2.... + b j m BJ/Ai para i = 1. I e j = 1. . .. As hipóteses para os testes Tukey e Duncan para comparar as médias dos níveis dos fatores são Fator A: H 0 : m Ai/Bj = m Au/Bj vs H a : m Ai/Bj ≠ m Au/Bj para i ≠ u = 1.. + a I m AI/Bj para j = 1.. J e i = 1.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Para o teste de Duncan temos que usar Em que n A e n B são os números de médias ordenadas abrangidas pelo contraste sendo testados. Este desdobramento da variância residual faz com que o número de graus de liberdade ___________________________________________________________________________________ Prof. 142) Considerar os dados de um experimento sobre fertilização nitrogenada em milho. no qual foram comparados: 4 fertilizantes (Tratamentos Principais) e 3 doses (Tratamentos Secundários) em 4 blocos. experimentos em parcelas subdivididas são mais fáceis de instalar. Fertilizantes Doses A1 A1 A1 A2 A2 A2 A3 A3 A3 A4 A4 A4 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 Totais Blocos 1 2747 2889 3578 3164 3831 4107 1902 2547 3364 2978 3451 3742 38300 2 2702 2731 3387 2658 3049 3031 1773 2642 2427 2769 2258 2498 31925 3 2671 2633 3858 3600 4182 3791 3440 3347 4053 2640 2478 3458 40151 4 2547 2756 4284 2760 3102 3547 2347 2924 3111 2542 2562 3076 35558 Totais 10667 11009 15107 12182 14164 14476 9462 11460 12955 10929 10749 12774 145934 10. Vantagens e desvantagens Em comparação com experimentos fatoriais.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ As hipóteses para os testes de Scheffé e t para testar os contrastes são Fator A → H 0 : C A = 0 versus H a : C A ≠ 0 Fator B → H 0 : C B = 0 versus H a : C B ≠ 0 Exemplo (Livro Banzatto & Kronka. pag. em parcelas subdivididas. No entanto.5. Carlos Eduardo Magalhães dos Santos 124 . existe duas estimativas de variância residual: uma associada às parcelas e outra associada às subparcelas. Considere um experimento instalado segundo o DBC e no esquema em parcelas subdivididas no qual são comparadas 4 variedades de aveia e 4 tratamentos de sementes (3 produtos químicos + testemunha não tratada) quanto aos efeitos de produção. Por isso. todos os efeitos são avaliados com menor precisão que nos experimentos fatoriais correspondentes. Com base nos resultados fornecidos a seguir. sempre que possível.1. pede-se. as 4 variedades foram distribuídas ao acaso nas parcelas de cada um dos 4 blocos do experimento e os tratamentos de sementes foram distribuídos ao acaso nas 4 subparcelas de cada parcela (BANZATTO & KRONKA. proceder a análise de variância e aplicar o teste Tukey. Conseqüentemente. Na instalação do experimento. é preferível utilizar experimentos fatoriais em lugar dos experimentos em parcelas subdivididas.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ associado a cada um dos resíduos seja menor do o associado ao resíduo se o experimento tivesse sido instalado segundo o esquema fatorial. em experimentos com parcelas subdivididas. há uma tendência de se obter maior valor para a estimativa do erro experimental. 10.6. usando o nível de 5% de probabilidade. Exercícios 10. 1989). quando necessário: ___________________________________________________________________________________ 125 . Portanto.6. 2.6. cada um deles de um ponto cardeal.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ 10. um pesquisador procedeu a coleta de 4 frutos. em cada um dos 3 exemplares de cada uma das 5 variedades em teste. Para se estudar o ºbrix de mangas de acordo com a variedade e a posição dos frutos em relação aos pontos cardeais. pede-se usando o nível de 5% de probabilidade. ___________________________________________________________________________________ Prof. Com base nos resultados (ºbrix) fornecidos a seguir (GOMES. 1987). proceder a análise de variância e o teste Duncan quando necessário. Carlos Eduardo Magalhães dos Santos 126 . 4. 1991). referentes a produção de milho (kg/ha). pede-se ao nível de 5% de probabilidade.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 10. 10.6. foram obtidos os seguintes resultados: ___________________________________________________________________________________ 127 . Suponha que para um experimento instalado segundo o delineamento inteiramente casualizado e no esquema de parcelas subdivididas com 3 repetições. instalou um experimento no qual cada uma as doses de adubação fosfatada constituíram as parcelas as quais foram distribuídas segundo o DBC e o tipo de aplicação as subparcelas. Um pesquisador. com o objetivo de verificar o efeito da dose de adubação fosfatada e o seu tipo de aplicação na cultura do milho. proceder a análise de variância e ao teste Tukey quando necessário (FERREIRA.6.3. Com base nos resultados fornecidos abaixo. 4. Se o objetivo é obter menores médias.6.4. 10.6. se necessário).3.6.1. qual(is) o(s) nível(is) de B que devem ser recomendados? (Use o teste de Duncan. pede-se: 10.Capítulo 10 – Experimentos em Parcelas Subdivididas _____________________________________________________________________ Usando o nível de 5% de significância quando necessário. Os fatores A e B atuam independentemente? Justifique sua resposta.4. Carlos Eduardo Magalhães dos Santos 128 . ___________________________________________________________________________________ Prof.2. Existe diferença entre os níveis de B pelo teste F da análise de variância? 10. Como exemplos têm-se variedades. Para o caso de um fator quantitativo. A análise de regressão consiste na realização de uma análise estatística com o objetivo de verificar se a relação funcional estabelecida entre um fator quantitativo e uma variável resposta é significativa. Por outro lado. pode-se plotar um diagrama de dispersão para verificar como se comportam os valores da variável resposta (Y) em função da variação dos níveis do fator quantitativo (X). pode se apresentar de diversas maneiras: linear. quadrático. um fator quantitativo é aquele onde os níveis se diferem com relação a quantidade do fator. Para se estabelecer o modelo para explicar o fenômeno. pode-se verificar que os pontos do diagrama de dispersão. concentração de um princípio ativo. etc. Escolha do modelo para equacionar o fenômeno em estudo Para tentar estabelecer uma equação que representa o fenômeno em estudo. pH. métodos de conduzir uma determinada tarefa. Um fator qualitativo é aquele onde os seus níveis diferem por algum atributo qualitativo. níveis de insumo.0 – REGRESSÃO 11. quando o F for significativo. cúbico. 11. exponencial.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ 11. não vão se ajustar perfeitamente à curva do modelo matemático proposto. Em outras palavras.1– Introdução Um fator em estudo num experimento pode ser classificado como qualitativo ou quantitativo. dentre outros. deve-se proceder à análise de variância dos dados e às comparações entre médias dos níveis do fator usando algum dos procedimentos para comparações múltiplas. tipos de defensivos. O comportamento de Y em relação a X. logarítmico. etc. A técnica indicada neste caso é a análise de regressão. deve-se estudar o efeito do fator quantitativo por meio de uma relação funcional entre o mesmo e a variável resposta. Haverá na maioria dos ___________________________________________________________________________________ 129 . Quando o fator é qualitativo. consiste na obtenção de uma equação que tenta explicar a variação significativa de uma variável resposta em função da variação dos níveis de um ou mais fatores quantitativos. Contudo. Como exemplos têm-se temperatura.2. deve-se verificar qual tipo de curva e equação de um modelo matemático que mais se aproxime dos pontos plotados no diagrama de dispersão. umidade. 3. os pontos do diagrama de dispersão ficam um pouco distantes da curva do modelo matemático escolhido. com um mínimo de erro possível. desta forma. .Capítulo 11 – Regressão _____________________________________________________________________ pontos.3.1. uma relação funcional entre X e Y. Método para obter a equação estimada Como foi dito anteriormente. 11. obtendo-se. Este método é denominado de Método dos Mínimos Quadrados (MMQ). Carlos Eduardo Magalhães dos Santos 130 . se baseia na obtenção de uma equação estimada de tal forma que as distâncias entre os pontos do diagrama e os pontos da curva do modelo matemático. Assim. o fenômeno em estudo. não ser um fenômeno matemático e sim um fenômeno que está sujeito a influências de inúmeros fatores. uma distância entre os pontos do diagrama e aqueles obtidos quando a curva do modelo proposto é traçada. Em resumo por este método a soma de quadrados das distâncias entre os pontos do diagrama e os respectivos pontos na curva da equação estimada é minimizada. devido ao fato do fenômeno que está em estudo. ___________________________________________________________________________________ Prof.Modelo deve conter apenas as variáveis que são relevantes para explicar o fenômeno.Modelo selecionado deve ser coerente para representar em termos práticos. no todo. O modelo matemático que irá ser ajustado deve satisfazer as seguintes condições: . 11. Modelo linear de 1º grau O modelo estatístico para esta situação seria: em que Y i é o valor observado para a variável dependente Y no i-ésimo nível da variável independente X. para o modelo escolhido. Isto acontece. Um dos métodos que se pode utilizar para obter a relação funcional. sejam as menores possíveis. o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos valores observados de Y em função da variação dos níveis da variável X. que minimizem o valor obtido na expressão anterior. e e i é o erro que está associado à distância entre o valor observado Y i e o correspondente ponto na curva. Representa o intercepto da reta com o eixo dos Y. vamos utilizar o MMQ. Assim. é possível alcançar a minimização da soma de quadrados dos erros. 2. tem-se que: elevando ambos os membros da equação ao quadrado. do modelo proposto. Para se obter a equação estimada. n). aplicando o somatório. Representa a variação de Y em função da variação de uma unidade da variável X. visando a minimização dos erros. X i é o i-ésimo nível da variável independente X (i = 1. para o mesmo nível i de X. Portanto.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ β 0 é a constante de regressão. β 1 é o coeficiente de regressão. derivando a expressão (1) em relação a β 0 e β 1 e igualando-as a zero. (1) Por meio da obtenção de estimadores de β 0 e β 1 . Sabemos do Cálculo que para se encontrar o mínimo de uma equação deve-se derivar a equação em relação à variável de interesse. obtém-se: ___________________________________________________________________________________ 131 . e igualar a derivada resultante ao valor zero. K. Uma vez obtidas estas estimativas. 2. elevado ao quadrado.3. Modelo linear de 2º grau O modelo estatístico para esta situação seria: em que. β 1 é o coeficiente de regressão. que minimizam a soma de quadrados dos erros. Carlos Eduardo Magalhães dos Santos 132 . n). ___________________________________________________________________________________ Prof. X i é o i-ésimo nível da variável independente X (i = 1. β 2 é o coeficiente de regressão. Y i é o valor observado para a variável dependente Y no i-ésimo nível da variável independente X.Capítulo 11 – Regressão _____________________________________________________________________ Este é o sistema de equações normais. e i é o erro que está associado à distância entre o valor observado Yi e o correspondente ponto na curva para o mesmo nível i de X. que permite a obtenção de estimativas de β 0 e β 1 . Xi2 é o i-ésimo nível da variável independente X.2. podemos escrever a equação estimada: 11. β 0 é a constante de regressão. K. 1. Apenas um único valor observado para cada nível da variável independente Nesta situação não existe repetição. Um teste que pode ser realizado para verificar tal fato é o teste F da análise de variância. β 1 e β 2 : Uma vez obtidas estas estimativas. Portanto.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ Utilizando o MMQ. 11. no modelo de 2º grau. Para se responder a esta pergunta. Análise de variância da regressão A equação estimada obtida. a estratégia da análise de variância depende se houve ou não repetições no experimento. Contudo. Portanto a simples obtenção da equação estimada não responde ao pesquisador se a variação da variável independente influencia significativamente na variação da variável dependente. apenas estabelece uma relação funcional. em função do modelo proposto. entre a variável dependente e a variável independente. para representar o fenômeno em estudo. podemos escrever a equação estimada: 11.4. é necessário realizar um teste estatístico para as estimativas dos coeficientes da equação de regressão estimada. chegar-se-á ao seguinte sistema de equações normais. O quadro para a análise de variância para a regressão para esta situação é do seguinte tipo: ___________________________________________________________________________________ 133 .4. para se obter as estimativas de β 0 . A única estimativa da variância residual é aquela dada pela falta de ajuste dos valores observados ao modelo ajustado. é necessário realizar uma análise de variância dos dados observados. Capítulo 11 – Regressão _____________________________________________________________________ em que. o que significa dizer que pelo menos uma das p variáveis independentes exerce influência na variável dependente. tanto para o modelo linear de 1o grau quanto para o de 2o grau. segundo o modelo proposto. p = no de coeficientes de regressão (não inclui o β 0 ) n = no de observações. = β p = 0. As fórmulas para a obtenção das somas de quadrados total e da soma de quadrados do independente da regressão são as mesmas. ___________________________________________________________________________________ Prof. As hipóteses estatísticas para o teste F são as seguintes: H0: β1 = β2 = . H a : β i ≠ 0... o que significa dizer que as p variáveis independentes não exercem influência na variável dependente. segundo o modelo proposto. as quais são dadas a seguir: SQInd = SQTotal .SQRegressão Já a soma de quadrados para a regressão varia de acordo com o modelo em teste. para pelo menos um i. Carlos Eduardo Magalhães dos Santos 134 . Se F calc ≥ F tab ⇒ Rejeita-se H 0 ao nível de significância que foi realizado o teste.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ O valor de F da análise de variância. Posteriormente. A escolha do modelo de regressão a ser ajustado é aquele que mais se aproxima dos pontos médios observados para cada nível da variável independente. 11.2.Se F calc < F tab ⇒ Não rejeita-se H 0 ao nível de significância que foi realizado o Pode-se inferir que a variável independente não influência significativamente a variável dependente Y. com o valor de F tabelado (F tab ).4. ou seja: A regra decisória para o teste F é: . para uma situação geral em que se está testando I níveis da variável independente em um experimento instalado segundo o delineamento inteiramente casualizado com K repetições. Assim é possível obter uma estimativa da variância residual tal como aquela obtida em modelos de delineamento. Isto é realizado para que se quantifique a variância residual. o efeito de tratamentos é desdobrado nos efeitos associado a um ajuste de um modelo de regressão e também a falta de ajuste deste modelo. . Pode-se inferir que a variável independente influência significativamente a variável dependente Y. o que não é possível quando se tem uma única observação para cada nível da variável independente. ___________________________________________________________________________________ 135 . e o número de graus de liberdade para a regressão e independente da regressão. existe mais de um valor observado para cada nível da variável independente. Normalmente o que se faz numa situação como esta é inicialmente proceder a uma análise de variância usual considerando o efeito do fator quantitativo como se fosse a fonte de variação tratamentos numa análise de variância usual. deve ser comparado. o qual se obtém na tabela da distribuição F de acordo com o nível de significância do teste. Pressupõe-se também que se está testando um modelo de regressão com p coeficientes de regressão. O total de observações neste experimento é igual a N = IK. teste. O quadro abaixo resume o que acabou de ser descrito. Mais de um valor observado para cada nível da variável independente Nesta situação. As hipóteses para a falta de ajustamento são: H 0 : a falta de ajustamento não é significativa H a : a falta de ajustamento é significativa O valor tabelado de F para a falta de ajustamento é encontrado usando A regra decisória para o teste F para a falta de ajustamento é: Se F calc ≥ F tab ⇒ Rejeita-se H 0 ao nível de significância que foi realizado o teste. O modelo adotado não se ajusta bem aos dados. Se por outro lado. Conseqüentemente faz sentido analisar o teste F para a fonte de variação regressão para saber se a variável independente tem influência significativa sobre a variável dependente. No caso de falta de ajustamento significativa não faz sentido realizar o teste para a regressão. ___________________________________________________________________________________ Prof. Não há necessidade de se testar um novo modelo. Procede-se ao teste F para regressão. Se F calc < F tab ⇒ Não rejeita-se H 0 ao nível de significância que foi realizado o teste. Se o teste F para a falta de ajustamento for significativo. Carlos Eduardo Magalhães dos Santos 136 . a falta de ajustamento for não-significativa indica que o modelo adotado se ajusta bem aos dados. pois o modelo de regressão não se ajustou significativamente aos dados.Capítulo 11 – Regressão _____________________________________________________________________ O teste F para a falta de ajustamento é realizado para verificar se o modelo adotado está se ajustando bem aos dados. indica que o modelo ajustado não é apropriado e um novo modelo que se ajuste melhor aos dados deve ser testado. O modelo adotado se ajusta bem aos dados. Um novo modelo deve ser testado. Valores próximos de 1 indicam que o modelo proposto é adequado para descrever o fenômeno. ou seja. se a temperatura tem influência significativa sobre o comprimento de uma barra de aço. para verificar se o modelo proposto é adequado ou não para descrever o fenômeno. 11.6. o R2 é obtido por: Já para o caso em que se tem mais de um valor observado para cada nível da variável independente. com apenas uma observação para cada nível da variável independente. 11. 11. Utilize o modelo linear de 1º grau e o nível de 5% de significância. Para o caso em que se tem uma única observação para cada nível da variável independente. qual seria a conclusão do pesquisador? Qual seria a equação estimada? ___________________________________________________________________________________ 137 . obtendo-se os seguintes valores amostrais: Ao nível de 5% de probabilidade.2. Para verificar se existe uma relação linear de 1º grau entre Umidade Relativa (UR) do ar da secagem de sementes e a germinação das mesmas.6.1. um pesquisador realizou um teste com 4 diferentes valores para a % de UR do ar que atravessava as sementes armazenadas.5. utilizando os dados amostrais fornecidos abaixo. Exercícios 11. Verificar.CRP 194 – Estatística Experimental – 2011/II _____________________________________________________________________________ O teste F para a regressão é idêntico ao caso anterior. Coeficiente de determinação (R2) O coeficiente de determinação fornece uma informação auxiliar ao resultado da análise de variância da regressão. o valor de R2 é obtido por: O valor de R2 varia no intervalo de 0 a 1.6. se a relação entre as variáveis X (independente) e Y (dependente) é significativa.3. verifique.4. Para o seguinte conjunto de valores de X (variável independente) e Y (variável dependente).6. Use o nível de significância de 5%. Carlos Eduardo Magalhães dos Santos 138 . 11. ___________________________________________________________________________________ Prof.6. usando o nível de 5% de probabilidade e o modelo linear de 2º grau. faça a análise de regressão segundo o modelo linear de 1º grau e obtenha a equação de regressão estimada. De acordo com os dados fornecidos abaixo para a variável X (dose do micronutriente Zn em ppm) e a variável Y (matéria seca em g/planta).Capítulo 11 – Regressão _____________________________________________________________________ 11.

ApostiladeCRP194EstatisticaExperimental (3)

Comments

Description