Dr Cláudio S.Sartori Bioestatística Inferência Estatística: Introdução: FATEC 1 compreendida entre 5,25 e 5,31 m, apresentamos uma estimativa por intervalo. A declaração do erro ou precisão de uma estimativa é denominada de sua fidedignidade. Distribuições amostrais: Considerem-se todas as amostras possíveis de tamanho N que podem ser tiradas de uma população dada (com ou sem reposição). Para cada amostra pode-se tirar uma grandeza estatística como uma média ou desvio padrão, que varia de amostra para amostra. Desse modo obtém-se uma distribuição da grandeza que é denominada distribuição amostral. Se a grandeza estatística adotada for a média da amostra, a distribuição é denominada amostral das médias. Distribuição amostral das médias. Admitindo-se amostras possíveis de tamanho N são retiradas sem reposição de uma população finita de tamanho Np > N. Se a média e o desvio padrão da distribuição amostral das médias forem designadas por µ X e σ X , e os Inferência estatística é o processo de estimativas de uma população a partir de propriedades de uma amostra da população. Há dois tipos de inferência estatística que discutiremos a seguir. Do ponto de vista prático, é extremamente mais importante poder deduzir informações relativas a uma população mediante informações de amostras dela extraídas. Um problema importante na inferência estatística é a extimação dos parâmetros populacionais ou abreviadamente parâmetro, deduzidos da estatística amostral. • Estimativas: Envolve aproximadamente o valor de um parâmetro desconhecido. Esse parâmetro é um número descrevendo alguma propriedade numérica de uma população. Como exemplo, pode-se estar interessado em obter uma estimativa do valor médio de todas as casas de uma determinada cidade. Estimativas imparciais: Se a média de uma distribuição amostral de uma estatística for igual ao parâmetro populacional correspondente, a estatística será denominada de estimador imparcial do parâmetro; se isso não ocorrer, chamamos de estimador parcial. Tais valores correspondentes desta estatística são denominados estimadores imparciais ou parciais, respectivamente. Exemplo 1 - A média da distribuição amostral das médias, µ X é igual a µ, isto é, a média populacional. Por isso a estatística amostral X é uma estimativa imparcial da populacional µ. Estimativas Fidedignidade. por pontos e intervalos. valores correspondentes da população forem µ e σ. Então: µx = µ N σx = σ NP − N N p −1 Se a população for finita, ou se a amostragem for tomada com reposição, os resultados acima tornam-se: µx = µ σx = σ N Quando estimamos um parâmtro populacional por um número, denominamos de etimativa de ponto; quando estimamos por dois números entre os quais pode-se dizer que ele esteja situado, denominamos de estimativa por intervalo. Tais estimativas indicam sua precisão ou exatidão e são preferíveis às estimativas por pontos. Exemplo 2 - Se dissermos que uma certa distância mede 5,28 ± 0,03 m , isto é, ela está Para grandes valores de N (N ≥ 30) a distribuição amostral das médias é aproximadamente normal, com a média µ X e o desvio padrão σ X ,independentemente da população. Tal resultado é fruto do teorema do limite central: Teorema do Limite Central: À medida que se aproxima o tamanho da amostra, a distribuição de amostragem média se aproxima da forma da distribuição normal, qualquer que seja a forma da distribuição de população. Na 1 Dr Cláudio S. Sartori Bioestatística FATEC 2 prática a distribuição de amostragem da média pode ser considerada como aproximadamente normal sempre que o tamanho da amostra for N > 30. Erros padrões: O desvio padrão de uma distribuição amostral de uma grandeza estatística é frequentemente denominado de seu erro padrão. Lembremos que , tendo N conjunto de dados xi, calculamos a média µ e o desvio padrão σ da forma: A tabela ilustra os valores da área da curva normal padrão. z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 0 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2258 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 1 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2612 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 2 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 3 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 4 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2996 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 5 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 µ= ∑ xi i =1 N N σ= ∑ (xi − µ ) i =1 N 2 N Se os dados xi forem distribuídos em frequência fi: µ= ∑ xi f i i =1 N N ∑ fi i =1 N 2 σ= ∑ f i ( xi − µ ) i =1 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 ∑ fi i =1 N 2 Dr Cláudio S. Sartori Bioestatística FATEC 3 z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 6 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,33151 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 7 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 8 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2518 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 9 0,0359 0,0754 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,4999 0,5000 − 1 Yi = e σ 2π ( xi − µ ) 2 2σ 2 Se tratamos os dados na variável reduzida z: z= x−µ σ i 1 −2 Yi = e 2π z2 Para a distribuição amostral das médias µX Xi ( supondo distribuição normal) com média e desvio padrão σ X teremos a relação: X − µX zi = i σX Ou, explicitando o valor Xi : X i = µ X + σ X zi Exercícios: 1 - Uma população consiste de 5 números: 2,3,6,8 e 11. Considerem todas as amostras possíveis de 2 elementos que dela podem ser retiradas com reposição. Determinar: a) A média da população. b) O desvio padrão da população. c) A média da distribuição amostral das médias. d) O desvio padrão da distribuição amostral das médias, isto é, o erro padrão das médias. 2. Resolver o problema anterior no caso de amostragem sem repetição. 3. Admite-se que a altura de 3000 estudantes do sexo masculino de uma universidade são normalmente distribuídas, com a média 172,72 cm e o desvio padrão7,62 cm. Se forem obtidas 80 amostras de 25 estudantes cada uma, quais serão a média e o desvio padrão esperados na distribuição amostral das médias resultantes se a amostragem for feita: a) Com reposição. b) Sem reposição. 4. Em quantas amostras do problema anterior pode-se esperar que a média se encontre: a) Entre 169,27 cm e 173,48 cm. b) Abaixo de 169,65 cm? 5. Quinhentos rolamentos de esferas têm um peso médio de 5,02 onças (1 onça = 0,028349 kg). e um desvio padrão de 0,3 onça. Determinar a probabilidade de uma amostra de Lembramos que para uma distribuição normal ou gaussiana de dados (xi ,Yi ) e desvio padrão σ e média µ dados por : 3 Dr Cláudio S. Sartori Bioestatística FATEC 4 100 rolamentos de esferas, escolhidos ao acaso nesse grupo, ter um peso total de: a) Entre 496 e 500 onças. b) Mais de 500 onças. 6. Suponha que a média de uma população bastante grande seja µ = 50,0 e o desvio padrão σ = 12,0. Determine o desvio padrão para a distribuição de amostragem das médias. 7. Sabe-se que a vida útil de operação de um tubo de imagem de TV de certa marca é, em média, µ = 9000 horas com um desvio padrão σ = 500 horas. Determinar o valor esperado e o desvio padrão para a distribuição de amostragem para a média, sendo o tamanho da amostra n = 25. 8. Um analista financeiro toma uma amostra aleatória de 10% de 300 contas e acha que o saldo médio das contas é R $ 148,50. Sabendo que o desvio padrão da distribuição das médias é R$ 35,75 encontre o desvio padrão da amostra. 9. Dados os valores 3,5,7 e 8 encontre a média da população e seu desvio padrão. 10. Se escolhermos uma população de 2 elementos, sem reposição, encontre a média e o desvio padrão das médias para o problema anterior. 11. Construa as distribuições Gaussiana e Normal padrão para µ = 2 e σ = 0,816, com: (a) 0 ≤ x ≤ 3 (b) -2,5 ≤ x ≤ 4,5 Respostas: (a) Área sob a Curva Gaussiana (b) Área sob a Curva Gaussiana dftr 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 Y (X ) -1,000 -,500 ,000 ,500 1,000 X 1,500 2,000 2,500 3,000 Área sob a curva normal padrão dftr 0,35 0,3 0,25 Y(z) 0,2 0,15 0,1 0,05 -3,5 -3 -2,5 -2 -1,5 z -1 -0,5 0 0,5 1 dftr 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 Y(X) ,000 ,500 1,000 1,500 X 2,000 2,500 3,000 Área sob a curva normal padrão dftr 0,35 0,3 0,25 Y(z) 0,2 0,15 0,1 0,05 -2 -1,5 -1 -0,5 z 0 0,5 1 4 de modo que. µS + 2σS ) (µS .Dr Cláudio S.96σ X e X ± 2.00 1. para se obterem os limites de confiança acima emprega-se a estimativa da amostra s.6745 Estimativa do intervalo de confiança das médias: Se temos uma estatística S que é a média amostral X então os limites de confiança de 95% e 99%. Intervalo (µS .645 1. S. Sartori Bioestatística FATEC 5 Estimativas Um problema importante da inferência estatística é a estimação dos parâmetros populacionais. variância.05 2.27%. 3. Os números dos limites de confiança são denominados de coeficientes de confiança ou valores críticos .58 2.45% e 99.27 50 Coeficientes de confiança zc . 5 . denominamos estimador eficiente da média.33 2.73 Limite de Confiança (%) 99. Sejam µs e σs a média e o desvio padrão (erro padrão) da distribuição amostral de uma estatística S.27 95.73 99 98 96 95. Esses intervalos são denominados de intervalos de confiança de 68. µS + σS ) (µS . e representados por zc.45 90 80 68.28 1. para a estimação da média populacional µ.00 2. Essas estimativas por intervalos são preferíveis às estimativas por pontos. A percentagem de confiança é frequentemente denominada de nível de confiança. Isso será satisfatório desde que N ≥ 30. etc da população) deduzidos da estatística amostral correspondente.58σ . Os números extremos desses intervalos são denominados de limites de confiança ou limites fiduciais. ou seja. Estimativas imparciais são aquelas em que a média da distribuição amostral é igual ao parâmetro populacional correspondente. Para N < 30.73%para a avaliação de µS. respectivamente. A estimativa de um valor populacional pode ser dada por pontos ou por dois números. Estimativas de intervalo de confiança dos parâmetros populacionais. são dados por: X ± 1. Então a distribuição amostral de S é aproximadamente Normal (o que se tem verificado para N ≥ 30 ). entre os quais ele pode ser considerado. A tabela a seguir mostra os valores de zC correspondente a diversos níveis de confiança adotados na prática. àquela estatística de menor variância. com os seguintes percentuais: (Entende-se: estar confiante de se encontrar µs nos intervalos dados).95. ou parâmetros (média. pode-se esperar que se encontre uma estatística amostral real.00 0. X ± zC σ N NP − N NP −1 µ ± zC ou σ NP − N N NP −1 (Para amostragem com população finita ou quando a amostragem é retirada sem reposição). a aproximação é insuficiente e deve-se empregar a teoria de pequenas amostras que veremos adiante.σS .45 99. µS + 3σS ) % 68. Caso contrário ela será um estimador parcial. X De um modo geral os limites de confiança são dados por: X ± z C σ X X ± zC Ou σ N σ N µ ± zC (Para amostragem de uma população infinita ou quando a amostragem é retirada com reposição).2σS . por meio de um intervalo. o desvio padrão da população σ é desconhecido.3σS . Caso tenhamos duas estatísticas de distribuições amostrais com a mesma média. enquanto as demais recebem o nome de ineficientes. situada nos seguintes intervalos. Em geral. 5 162. não há diferença entre σ ˆ .0 x= ∑ xi f i ⇔ x = 17170 = 171.37. teremos: 2 ˆ2 = σ N 2 σa N −1 Lembremos que há uma relação entre sa e σa dada por: σ = N − 1s .96 σ . Exemplo1 .00048 5 ˆ d) X ± z σ = X ± z σ = C C Note que.33.35 cm. Para N muito grande.0234 = 6.96 = 6. Determinar as estimativas imparciais e eficientes da: a) Média verdadeira. b) Variância e o desvio padrão da amostra.35 ± 1.Determine os intervalos de confiança de: a) 95% 2 2 b) 99%= 0. σ 2 ou entre σ Exemplo 3 .5 2 925.78 cm ∑ xi i =1 5 N 5 = 6.5 1 492. a) Lembrando que os limites de confiança de 95% são dados por: Exemplo 2 . d) O intervalo de confiânça correspondente a 95%.79 (7. c) A variância e o desvio padrão da população.37 cm.0234 ˆ = σa = 0 = 0.Admita-se que as alturas de 100 estudantes do sexo masculino de uma universidade representam uma amostra aleatória das alturas de X ± 1.35 ± 0.5 186.0 Σxi fi = 17170.36.0 7 161.σ . Sartori Bioestatística FATEC 6 A média da distribuição amostral das variâncias é igual a µ = N − 1σ 2 . Chamando de variância todos os 1546 estudantes dessa universidade.00055 Para a avaliação da altura média dos estudantes da universidade do exemplo anterior.5 Frequência (f) ˆ .70 i =1 ∑ fi i =1 N N 100 Cálculo do 2 desvio padrão: σa = ∑ f i (xi − x ) i =1 N =7. não há a a N muita diferença entre s e σ. onde σ2 é a s2 N variância populacional e N é o tamanho da amostra. 0022 5 ˆ2 = σ amostra: N σ2 N −1 b) Desvio N padrão ⇒ σa = c) ∑ ( xi − x ) i =1 2 N = = 0. 6.78)2 ⇒ σ 99 2 Variância: σ a = 0. ˆ2 = σ 100 ˆ = 62.32 e 6. Adotando x = 171.0209 . a) A estimativa imparcial e eficiente da média verdadeira é a média populacional: x= 5 18 42 27 8 N = Σfi =100 fX 772. como N é grande.00044 A estimativa imparcial e eficiente da variância verdadeira é a variância populacional: N 2 ˆ2 = σ σa = N −1 ∑ ( xi − x ) i =1 N 2 N −1 N N 0.5 178. que é uma estimativa imparcial de modificada σ σ2.70 e N 6 .0 4819. Alturas (cm) 151 159 167 175 183 158 166 174 182 190 Ponto médio (xi) 154. Então a variância amostral s2 é uma estimativa parcial da variância populacional σ2. 6.5 170.4659 = 7. ˆ 2 . Determinar uma estimativa imparcial e eficiente da média verdeira e da variância verdadeira.Dr Cláudio S.00055cm ⇒ σ .A amostra constante de 5 medidas do diâmetro de uma esfera foi registrada por um cientista com os valores de 6. da 0 . 6. 0077 = deve 0.10.(0.042 200 Exemplo 6 .4 quilos.8.8 ⇒ N = 96. Limites de confiança: ˆ a) X ± 1.58 σ ⇒ Erro da estimativa: N σ N 0. Que extensão deve ser tomada para a amostra destinada às medições para que se esteja: a) 95% e b) 99% confiantes de que o erro dessa estimativa não exceda a 0. (0.78 e 0.96 s = N N = 0. X ± 1. Foram determinados os valores: 8.05 segundo o erro será de 2.96 b) A variância populacional.824 ±0 .01 N 2. teremos: 7. então o grau de confiança desejado é: 2. (0. Então os limites de confiança de 95% são: σ NP − N X ± 1.96 1.96)(0.58 ˆ s 042 = 0.74 kg).96 σ = X ± 1.05 população.01 ⇒ N = (2. Sartori Bioestatística FATEC 7 considerando como estimativa de σ . deve-se ajustá-las.824 ± 0.As medidas dos diâmetros de uma amostra aleatória de 200 rolamentos esféricos produzidos por certa máquina. 96 0.042 polegada.9.174 a 173.79 171.6. apresentam a média de 0.200 N 10 200 − 50 = 75 ± 1. Uma amostra de 10 componentes b) 99% possuem limites de confiança: eletrônicos de televisão produzidas por uma 7 .Ao medir o tempo de reação.2910) = 0.96 = 0.01 170.58 = 0. Exercícios 1.70 ± 1.70 ± 1.2 e 9.824 ± 0. (9. num total de 200.23zc = 1 ⇒ zc = 0.58 = X ± 2.824 ± 2.01 segundo? ⇔ 1. 70 ± 2. em comparação com o tamanho da amostra. ou: X ± 2.81. para a estimativa da média dos 200 graus? b) Com que grau de confiança se diria que a média dos 200 graus é 75 ±1? a) Como o tamanho da população não é muito grande. 0058 = 0.824 ± 1.58)(0.824 polegada e o desvio padrão de 0. 01 100 O intervalo de confiança de 99% para a média da população µ é: 169.86 kg).3. 006 b) X ± z cσ = X ± z σ X c N NP − N NP −1 b) X ± 2.79 = 171.79 .58 N N = 171. s ˆ = 7.81 é 0.69 < µ < 173.96 = 171. um psicólogo avaliou que seu desvio padrão era de 0.10.008a 75 ±1 Exemplo 5 .Dr Cláudio S.05 segundos.226 cm. 96 N NP −1 = = 75 ± 1.23 z C 50 200 − 1 valor ser igual = 0Como . N N c) Compare o desvio padrão da Tomando-se s = σ =0.58 σ N = 75 ± z C = X ± 2. 58 7. 70 ± 2. entre z = 0 e z = zc=0. para os pesos de uma amostra.96 10 50 200 − 50 = 75 ± 2. A área subentendida pela curva normal. b) 95% possuem limites de confiança: Determinar aas estimativas para: σ ⇒ Erro da estimativa: σ a) A média populacional. 1.Uma amostra aleatória de 50 graus em matemática.2%.8.04 0.58 0.7.5 kg). 4 200 − 1 = 0. durante uma semana.526 100 Consequentemente.71 Exemplo 4 .05 N Tomando-se s = σ =0.2910. Determinar os limites de confiança de: a) 95% b) 99% Para o diâmetro médio de todos os rolamentos esféricos.58 2.01 ⇒ N = = 9.23 b) Os limites de confiança de 99% são: ˆ σ s X ± 2.17 < µ < 173. respectivamente.824 ±esse 0.582 ou 58.05 segundo o erro será de amostracom sua estimativa para a (1.05) ⇒ N = 167 0. apresenta a média de 75 e desvio padrão de 10.05) 0. o intervalo de confiança de 95% para a média da população µ é de 170. a) Quais os limites de confiança de 95%. 8 .72642 ± 0. 6.Dr Cláudio S. os limites de confiança de 50% e o erro provável para a média dos diâmetros.24 t) 4.276). (0.18 t) b) 99% (11.00058 polegadas.72642 ± 0. Usando um intervalo de 95% de confiança. A média e o desvio padrão das cargas máximas suportadas por 60 cabos são dados por 11.72642 ± 0. 5. Determinar os limites de confiança para a média de todos os cabos produzidos para a companhia de: a) 95%. Um analista de mercados obtém dados de uma amostra de 100 consumidores de um total de 400 que adquiriram uma oferta especial.000060 polegadas).09 t e 0.72642 e 0.72642 ± 0. b) 98 %. A média e o desvio padrão dos diâmetros de uma amostra de 250 rebites fabricados por uma companhia são:0. (0.45 a $25. (0. b) O valor total das compras dos 400 clientes. d) 90 %.73 t . ($9. respectivamente. Sartori Bioestatística FATEC 8 companhia apresentou a vida média de 1200 horas e o desvio padrão de 100 horas. As 100 pessoas gastaram na loja. estimar: a) O valor médio de compras para todos os 400 clientes.380 a $10.09 ± 0. respectivamente.72642 ± 0. Determinar o limite de confiança para todos os rebites fabricados pela companhia de: a) 99 %.09 ± 0. (0.000095 polegadas).60. (1200 h).57 com um desvio padrão de $ 6. (0.69). ($23. Determine. b) O desvio padrão populacional de todos os componentes produzidos pela companhia.000025 e 0. em relação ao problema anterior. uma média de $ 24.4 h). (105.000025 polegadas).000085 polegadas).000072 polegadas). (11. 3. Estimar: a) A média . c) 95 %. Os níveis de significância mais frequentementes utilizados em testes de hipóteses são os de 1% e 5%. sendo que α representa o nível de significância. Uma hipótese nula H0 é o valor suposto do parâmetro o qual é comparado com o resultado da amostra.Estabelecer o valor crítico. Um Erro Tipo II ocorre quando a hipótese nula é aceita sendo a mesma falsa. Pode existir um ou dois desses valores. em uma extremidade da distribuição. Aceitação da hipótese nula Rejeição da hipótese nula Estados possíveis Hipótese nula Hipótese nula falsa verdadeira Aceita corretamente Erro tipo II Erro tipo I Rejeita corretamente exemplo. coleta-se uma amostra aleatória e determina-se o valor da média da amostra. Ele é simbolizado pela letra grega minúscula "alfa" α. Exemplo: para testar um valor hipotético da média populacional. Tais testes denominam-se unilaterais. O valor hipotético é rejeitado somente se o resultado da amostra for claramente improvável de ocorrer quando a hipótese for verdadeira. tal como a média amostral. segundo seja efetuado um teste unilateral ou bilateral.Formular a hipótese nula H0 e a hipótese alternativa H1. ETAPA 2 . a hipótese nula é rejeitada somente se o resultado da amostra é tão diferente do valor suposto que uma diferença igual ou maior ocorreria por acaso com uma Decisões possíveis probabilidade máxima de 0. com o parâmetro suposto. entretanto. Quando manifestamos interesse nos valores extremos da estatística. chamamos esses testes de bilaterais. quando se está testando a hipótese de um teste ser melhor do que o outro.Selecionar a estatística do teste.Dr Cláudio S. Então. pode-se ter interesse em apenas nos valores extremos de um mesmo lado da média. convertida em um valor z. ou uma versão modificada da amostra. aceitamos ou rejeitamos o valor hipotético como sendo correto. ou nos escores z de ambos os lados da média. Tais afirmações são chamadas de hipóteses. ou valores críticos da estatística do teste. A tabela a seguir ilustra as consequências de decisões em testes de hipóteses. Se o valor crítico for estabelecido como um valor z. isto é. A probabilidade do Erro Tipo I é sempre igual ao nível de significância utilizado como padrão para rejeitar a hipótese nula. Observamos que se for utilizado um nível de significância de 5%.Especificar o nível de significância a ser usado. o valor crítico identifica o valor da estatística de teste necessário para rejeitar a hipótese nula. A hipótese alternativa H1 é aceita somente se a hipótese nula é rejeitada. Tendo estabelecido a hipótese nula. ETAPA 5 . O valor observado da estatística da amostra é comparado ETAPA 4 .05. existe uma probabilidade de 5% de rejeitar a hipótese nula sendo a mesma verdadeira. o nível de significância e a estatística a ser usada. agora estabelecemos o valor crítico (ou valores críticos) da estatística de teste. isto é. Poderá ser ou a estatística da amostra. Se é especificado um nível de significância de 5%. Muitas vezes. em ambas as extremidades da distribuição. Num teste de hipótese principiamos com um valor suposto (hipotético) de um parâmetro da população. por 9 . depois de coletar uma amostra aleatória.Determinar o valor real da estatística de teste. Ele é rejeitado somente se o resultado da amostra for improvável sendo a hipótese considerada verdadeira. comparamos a estatística da amostra . Este é o chamado Erro Tipo I. Em ambos os casos. ETAPA 6 .Tomar a decisão. a média da amostra será então. Dividimos em diversas etapas os testes de hipóteses: ETAPA 1 . O nível de significância é o padrão estatístico especificado para rejeitar a hipótese nula. ETAPA 3 . tal como a média populacional hipotética. Sartori Bioestatística FATEC 9 Testes de Hipóteses: Envolve a escolha de duas afirmações de uma dada população. 01 Região de Aceitação 0 230 240 250 260 270 280 290 245. Sendo µ a média da população. ou sobre qual.01 somente 0.00 e H1: µ ≠ $260. Pode-se utilizar a distribuição normal de probabilidade para testar um valo hipotético da média quando N > 30 ou.645 2. os valores críticos da média da amostra.08 e H1: µ ≠ $260.005 0. Para a hipótese nula.05 de $ 260. de duas estratégias de mercado. 0.58 e -2.58 2.81 e -3.96 "benefício da dúvida". para rejeitar a hipótese nula.00 0.05 0. caso N < 30 e a população ser normalmente distribuída e o desvio padrão ser conhecido. ele será transformado para um valor z. Sartori Bioestatística FATEC 2 com o valor crítico da estatística de teste. tais como se se deve ou não manter um padrão de desempenho.Para o teste de hipótese anterior. Dado que se conhece o desvio padrão dos valores das contas a receber: σ = $ 43. As hipóteses nula ee e -2.00. determinar os valores críticos da médiada amostra para testar a hipótese a um nível de significância de 5%.95 =⎨ 36 ⎩$274.Um auditor deseja testar a hipótese de que o valor médio de todas as contas a receber em uma dada firma é de $ 260.95 ou maior do que 274. de modo a poder ser comparado com os valores críticos de z.05 Região de rejeição Portanto. Existem duas regiões de rejeição no caso de um teste bilateral.58 2. então.002 claramente contraditado pela média da amostra.28 ou Valores críticos de z para testes 1.00.96 43 ⎧$245.81 3.00 1. desta 2. Hipóteses: H0: : µ = $ 260. X RC : amostra.88 o -1. suponha que a média seja de X = $240 .04 0. a hipótese alternativa é aceita. Determine se se deve aceitar ou rejeitar a 2 . é dado o valor suposto 1.58 ou -2. ou aceita ou rejeitada. Nível de significância: α = 0.00.95 Região de rejeição 274. deve empregar-se. Quando o valor da média da amostra estiver determinado.645 bilaterais Teste de um valor hipotético da média utilizando a distribuição normal. Se a hipótese nula é rejeitada. A hipótese nula é. Valores críticos da média da X RC = µ ± zσ x = 260 ± 1.00. Ele deseja rejeitar o valor hipotético se tal valor for 0.02 0. A tabela abaixo indica para alguns testes o nível de significância. Esta decisão terá relevância em relação a outras decisões a serem tomadas por administradores. a média da amostra deve ter um valor menor que $245. sendo σ conhecido são: X RC = µ ± zσ x Exemplo 1 .96 σ n = 260 ± 1. A fórmula para essa transformação. A fórmula utilizada para estabelecer os valores críticos da média da amostra é similar à fórmula para determinar os limites de confiança para estimar a média populacional. tomando para uma amostra N = 36 e calculando a média amostral.05.33 ou -2. sendo σ conhecido é: −µ z= X σx Exemplo 2 . Um teste bilateral é utilizado quando estamos interessados em possíveis desvios em ambas as direções a partir do valor hipotético da média.645 ou -2.03 0. -1.645 e Valores críticos de z para testes 1.10 Nível de significância α -1.33 maneira.08 alternativa teste são H 0: µ = $ 260.Dr Cláudio S.05 0.28 unilaterais -1.05 Estatística do teste: X Baseada numa amostra de n = 36 e σ = $ 43.88 ou sendo que.96 para esse 2. 17 Então se rejeita a hipótese nula. isto é.Dr Cláudio S. No exemplo anterior. a) Determinando o valor crítico do valor médio da amostra. onde zc(α=0.00. Sartori Bioestatística FATEC 2 hipótese nula transformando tal média no valor de z crítico correspondente: z= X −µ σX −260 = 240 = −2. Exemplo 3 . o mesmo se encontra na região de rejeição. b) especificando o valor crítico em termos de z. Pode-se ter então as hipóteses: H0: µ ≥ $ 260. Rejeita-se portanto a hipótese nula e aceita-se a hipótese alternativa de que µ < $ 260. Um teste unilateral é apropriado quando estamos interessados em possíveis desvios em apenas uma direção. 0 1 0 3 2 -1.17 0 .79 7 . e tomando para H1: µ < $ 260.00.05) = -1. a partir do valor hipotético da média. para o exemplo acima. 0 2 0 . 0 3 0 .00.00.00. 0 4 0 . A região de rejeição de um teste unilateral encontra-se sempre na cauda que representa apoio à hipótese alternativa. onde H0 : µ ≥ $ 260.00. o teste é um teste de cauda inferior.65 z= X −µ σX −260 = 240 = −2. 0 5 0 . como mostramos em tabela. portanto rejeita-se a hipótese nula e aceita-se a hipótese alternativa. Os valores críticos para testes unilaterais diferem dos bilaterais devido às áreas.00.79 7 .96 3 Região de rejeição Este valor de z encontra-se na região de rejeição da da cauda esquerda. 2 . µ ≠ $260. O valor crítico pode também ser determinado para a média ou em termos de um valor z. o auditor pode não estar interessado em que a verdadeira média de todas as contas a receber supere $ 260. mas sim em que ela possa ser menor que $ 260.Suponha que o auditor comece com a hipótese nula de que o valor médio de todas as contas a receber é no mínimo de X = $260 .65)(7.17) = $248. testar essa hipótese ao nível de significância de 5%.00. Existe apenas uma região de rejeição em um teste unilateral. e.96 Região de rejeição z Região de aceitação 1 0 1 2 1.17 Uma vez que X = $240 . H1: µ < $ 260. Dado que a média da amostra é $ 240. através dos procedimentos: xrc = µ 0 + zσ x = 260 + (−1.00. 93 está na região de aceitação da hipótese nula.000.80 15 z= x −µ σ −15000 = 14000 = −1. uma vez que se supões a população normalmente distribuída e uma vez que σ é conhecido.05) = ±1.Resolver o exemplo 4 utillizando a variável reduzida z como estatística do teste: zcritico (α = 0.04 0. incluído dentro do intervalo da hipótese alternativa.00.93 = 15000 ± 1. Sartori Bioestatística FATEC 2 0. Testar a hipótese nula de que µ = $15. Para uma amostra aleatória de 15 famílias.96 Então: σx = σ N = 2000 = $516. Para uma amostra de N = 30 famílias.000.00 . e suponha também. o que seria o caso típico. 07 Uma vez que a média da amostra X = $14. Exemplo 4 .00 . a renda média familiar foi de $14. pode-se utilizar a distribuição normal.05%. Já a probabilidade de Erro Tipo II (A hipótese nula é aceita sendo a mesma falsa) é indicada pela letra grega "beta" (β) . ao nível de significância de 0.00 e H1: µ ≠ $15. Não se pode rejeitar a informação do representante da comunidade.000 .01 0 -3 -2 -1 0 1 2 3 -1. é possível supor que a renda média familiar tem distribuição aproximadamente normal. e que se pode aceitar o desvio padrão como sendo σ = $ 2. que a população dos valores de renda não esteja normalmente distribuída. o desvio padrão é de s = $ 2. que a renda média familiar na área é de $ 15. não se pode rejeitar a afirmação do representante da comunidade a um nível de significância de 5%.96(516. Observação: Mesmo se a amostra for pequena. estabelecendo os limites críticos da média da amostra.17 Região de Rejeição z 260 Região de aceitação X Os limites críticos de X (α = 0.96 2000 15 A probabilidade do Erro Tipo I (A hipótese nula é rejeitada sendo a mesma verdadeira) é igual ao nível de significância α utilizado no teste de hipótese.02 0.03 0. Suponha que. Logo 516 .000.05 0. A maneira pela qual ela pode ser determinada é relativa a um valor específico. Exemplo 5 . Exemplo 6 . utilizando um nível de significância de 5%.80 z = -1. Testar a hipótese nula de que a renda familiar média na população é. Isso ocorre pois a proporção da área na região de rejeição é igual à proporção dos resultados amostrais que ocorreriam naquela região se a hipótese nula fosse verdadeira. com base em um estudo anterior.80) = ⎨ ⎩ $13987.000.Para o exemplo anterior. H0: µ = $15.00 ⎧$16.00 encontra-se na região de aceitaçãoda hipótese nula.00 .67 248.013. para o tipo de zona em questão.93 .Dr Cláudio S. no mínimo.000.000 e a média da amostra é x = $14.000. 2 .05) são: Erros Tipo I e Tipo II em testes de hipóteses.000. suponha que o desvio padrão da população é desconhecido.O representante de um grupo comunitário informa a uma pessoa que está interessada em estabelecer um centro comercial. X = µ ± zσ X = µ ± σ N = 15000 ± 1. 57 − 25. O fabricante afirma que a vida útil média é.66 sx . Nota: A distribuição normal de probabilidade pode ser usada por dois motivos: pelo Teorema do Limite Central e z pode ser utilizado pois N ≥30. Considere-se a hipótese nula de que não há diferença entre as médias populacionais. Exemplo 8 . ou de que as amostras são retiradas de duas populações que têm médias iguais. Assim: H0: µ ≥ $15.96 z= x −µ sx −15.57 a z= σx 24 . pela informação que recolhe. de 9. retiradas de populações respectivas que têm as médias µ1 e µ2 e desvios padrões σ1 e σ2. nota que 40 horas de operação aleatoriamente selecionadas incluem um total de 7 horas e 30 minutos de manutenção.05Np 1 x = i =N = 450 40 = 11.55 129 . Com base neste reultado amostral.00 z c (α = 0. 46 z c (α = 0. no mínimo.65 σ x = σN = 500 = 129.000 = −2. sendo que o desvio padrão do tempo de manutenção por hora foi de 3.000.025 = +2.00. denominando-a como hipótese nula.000. 60 100 400 −100 400 −1 = 0.96 Logo. isto é. H1 : µ < $15.Com respeito ao exemplo anterior.60.65 N p −N N P −1 x −µ Rejeita-se portanto a hipótese nula ao nível de significância de 1% e aceita-se a hipótese alternativa de que o tempo médio de manutenção para esse equipamento é maior de que 10 minutos por hora de operação. H0: µ = ≥ 9000h. com desvio padrão de $ 6. dos 400 que compraram uma oferta especial. usando o nível de significância do teste de 5%. ao nível de significância de 5%.20 15 Sejam x1 e x 2 as médias obtidas em duas grandes amostras.37 84 .00 z= σx −9000 = 8800 = −1. de tamanhos N1 e N2. o gerente havia afirmado que a média das compras feitas por aqueles que responderam à oferta especial teria sido de. Antes de ver esses resultados da amostra. H1: µ < $ 25.000 = 14.000 horas. no mínimo. 57 = −0. Sartori Bioestatística x −µ FATEC 2 $15. Testar esta informação.33 ∑ xi N Portanto rejeita-se a hipótese nula ao nível de significância de 5%. e. pode-se rejeitar a hipótese de que o equipamento possui as especificações sobre o tempo de manutenção.05) = −1. sx = s N = 2000 30 = $364. µ1 = µ2. O agente de compras visita uma companhia onde está instalado o equipamento.0 minutos.46 35 z= x −µ σx −9000 = 8800 = −2.O desvio padrão da vida útil de um tubo de TV de determinada marca é de σ = 500 horas. mais do que 10 minutos de manutenção para cada hora de operação.00.Dr Cláudio S. Exemplo 9 . As 100 pessoas gastaram uma média de x = $24.05) = −1.Um fabricante interessado na compra de um novo equipamento para produzir ferramentas especificou que o equipamento não deve exigir. H1: µ < 9000h z c (α = 0. Testes de significância que envolvem diferenças amostrais: z c (α = 0.65 σ x = σN = 500 = 84. 47 H0: µ = ≥ $ 25. sendo que a vida útil dos tubos é normalmente distribuídas. H1: µ > 10 min/hora H0: µ = ≥ 9000h. em média. 00 0. Exemplo 9 .000. Podese rejeitar essa afirmação utilizando um nível de significância de 5%? Observação: é necessário o fator de correção finita quando N > 0.01) = +2.00. Testar a afirmação ao nível de significância de 5%.00.Um analista de mercados coleta informações de uma amostra aleatória de 100 clientes. ao nível de significância de 1 %? H0: µ ≤ 10 min/hora.05) = −1. H1: µ < 9000h σx = σ N = = 6. suponha que a informação amostral foi obtida de uma amostra de n = 35 televisores. 20 Logo a hipótese nula não pode ser rejeitada ao nível de significância de 5%.75 Portanto não se pode rejeitar afirmação ao nível de significância de 5%. rejeita-se a hipótese nula ao nível de significância de 5% Exemplo 7 .57 na loja.74 364 . $ 25.47 min N 40 x −µ −10 = 11.25 min sx = z= s = 3 = 0. e dado que a vida média em uma amostra de n = 15 tubos foi de x = 8800h . 2 . A probabilidade de não se obter entre 40 e 60 caras. inclusive. se o número de caras em uma única amostra de 100 lances.9642. é dada por: 1-0.04 Região de Rejeição 0.10 Z2 = (60. adota-se a seguinte decisão: (1) Aceita-se a hipótese.0358. em 100 lances de uma moeda honesta.0358.0. Aceitar-se-á a hipótese.5 .50)/5 = +2.10 A área subebntendida entre a curva normal de z1 a z2 dará a probabilidade: P = 0. O erro cometido ao rejeitar a hipótese. Então a probabilidade da hipótese ser rejeitada quando ela for correta é de 0.10 (60. inclusive. quando ela for realmente correta. (2) Rejeitá-la.Para testar a hipótese de que a moeda é honesta.Dr Cláudio S.0. b) Interprete a regra de decisão e o resultado do item a).5=50 e σ = 100.08 0. inclusive.5 = 5 Considerando a escala contínua.10.58%. caso contrário.10 e 2. em 100 lances. quando deveria ser aceita.10 (39. Passando para variável reduzida: Z1 = (39. é do Tipo I. inclusive.02 Região de aceitação Região de Rejeição -3 -2 z =-2.p)) Lembre-se que a distribuição de Bernoulli é N! p X qN−X p( X ) = CN . com média e desvio padrão dados por: µ = 100. µ x1− x2 = µ1 − µ 2 ⇒ µ x1− x2 = 0 .5 caras. é o mesmo que entre 39. Sartori Bioestatística FATEC 3 Vemos que a distribuição amostral para a diferença das médias é aproximadamente normal.0.06 0. e a probabilidade de cometê-lo é igual a 0.9642 = 0. Exemplo 11 . caso contrário ela será rejeitada e dicidir-se-á que a moeda é viciada.0358=3.5.5 e 60. de acordo com a Distribuição de Bernoulli ou Binomial é dado por: µ = Np : (p:probabilidade de obter-se sucesso em um lançamento) σ = Npq : (q:probabilidade de insucesso em um lançamento (q = 1.Determinar a probabilidade de obter-se entre 40 a 60 caras. o intervalo entre 40 e 60 caras. X p X q N − X = X !( N − X )! dada por (X: número de sucessos) : A probabilidade é dada por: ⎛100 ⎞ 1 40 1 60 ⎛100 ⎞ 1 41 1 59 ⎛100 ⎞ 1 60 1 40 P =⎜ ⎜ 40⎟ ⎟(2) (2) + ⎜ ⎜ 41⎟ ⎟(2) (2) +…+ ⎜ ⎜ 60⎟ ⎟(2) (2) ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ Utilizando o ajustamento da curva normal à distribuição de Bernoulli: a) Determine a probabilidade de rejeitar a hipótese. 0. A média e o desvio padrão dos números de caras. ( µ1 = µ 2 ) σ x1− x2 = σ 12 N1 + 2 σ2 N2 Exemplo 10 . estiver entre 40 e 60.5 .50)/5 = -2.5 caras) -1 1 2 z = 2.5 caras) 3 Se uma única amostra de 100 lances resultar em um escore z entre -2. conforme o item a). 3 . 2 .0. ou seja o indivíduo apresenta P. em face da hipótese alternativa d de µ ≠ 1600 horas. Se µ é a vidamédia de todas as lâmpadas produzidas pela companhia. por exemplo. 0.. de um baralho bem embaralhado de 50 cartas.9.02 -3 -2 -1 1 2 3 Desvio Padrão: σ = Npq ⇒ σ = 3. Exemplo 13 . ao contrário.01 e z(α) = -2.01 Se p é a probabilidade do sujeito declarar a cor da carta corretamente. H1: p > 0.05) = ±1.05 b) 0.5. H1: p < 0.Dr Cláudio S.5 e o sujeito tem faculdades em P.05% b) α = 0.05 b) α = 0.9 = 180 σ = Npq = 200.65 σ Como e o z encontrado encontra-se na região crítica.. em uma sala. Sim.S).S.1 = 4.04 0. nos níveis de significância de: a) 0. Poder-se-ia aceitar a hipótese quando deveria ser rejeitada.06 z = -2.08 0. e esse seria o caso. O sujeito desconhece quantas cartas vermelhas ou pretas há no baralho.0.33 conclui-se que a pretensão não é legítima.96.96) Logo rejeita-se H0 ao bnível de significância de 0.Em uma experiência sobre percepção extra-sensorial (P. Exemplo 12 .0. enão deve-se decidir entre as hipóteses: H0: p = 0.05) = −1.58. Sartori Bioestatística FATEC 2 c) Que conclusões se poderiam tirar do fato de uma amostra de 100 lances apresentar 53 caras? 60 caras? De acordo com a regra de decisão. adotando o nível de significância de: a) α = 0.58)) p: probabilidade de obter-se a cura da alergia. é solicitado a declarar a cor vermelha ou preta de uma carta escolhida. d) Poder-se-ia estar errado nas conclusões do item c? Explicar.A vida média de uma amostra de 100 lâmpadas fluorescentes.23 = 4.01 Agora o intervalo é zc (α = 0.54 z c (α = 0.50 ⇔ Este valor está fora do intervalo (1. se a probabilidade de caras fosse de 0.5 e o sujeito está simplesmente adivinhando.+1.E. com o desvio padrão de 120 horas. O erro cometido ao aceitar a hipótese. rejeita-se H0. é do Tipo II da decisão.98 3.E. deve-se aceitar a hipótese da moeda ser honesta. quando deveria ser rejeitada.180 ) / 4.54 z= x−µ Para x = 32.96 σ x = σ = 120 = 12 h. testar a hipótese de µ = 1600 horas.01 H0: µ = 1600 h.9 ⇒ A pretensão é correta.O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar uma alergia.5) = 25 e H0: p = 0. Se o sujeito identifica corretamente 32 cartas. Escolhe-se um teste unilateral.05) = ± 2.E. Se o nível de significância é α = 0. H1: µ ≠ 1600 h Teste tipo bilateral: a) zc (α = 0. em unidades reduzidas: − 25 = 32 = 1.23 z = (x . µ x = µ N 100 z= x −µ σx = 1570−1600 12 = −2.S. por outro indivíduo colocado na mesma sala.9 ⇒ A pretensão é falsa. produzidas por uma companhia.58 ((-2. Determinar se a pretensão do fabricante é legítima Exemplo 14 . foi calculada em 1570 horas.73 Logo como z < -2.33 µ = Np =200. Escolhemos um teste unilateral pois não há interesse em determinar se a proporção de pessoas curadas pela droga é muito baixa. a droga curou 160 pessoas.+2. em umperíodo de 8 horas. pois não há interesses em obter escores extremamente baixos mas. Em uma amostra de 200 pessoas que tinham a alergia. em ambos os casos. na de obter escores altos: Média: µ = N p = 50 (0.µ) / σ = ( 160 .7 em vez de 0. determinar se os resultados são significativos. um sujeito.33 0. o número médio de carros que passarem pelo local foi de x = 208. As 100 pessoas gastaram uma média de x = $24.00 para uma amostra de 25 estabelecimentos. em média. o novo aumentou a tensão média de ruptura para 310 kg? Considerar que o desvio padrão ainda é 24 kg. O gerente da cadeia de lanchonete adota. Para testar essa declaração. Antes que os dados fossem coletados. ao nível de significância de 0. A tensão de ruptura dos cabos produzidos por um fabricante apresenta a média de 1800 kg e o desvio padrão de 100 kg. sendo que o desvio padrão do tempo de manutenção por hora foi de 3. nota que 40 horas de operação aleatoriamente selecionadas incluem um total de 7 horas e 30 minutos de manutenção. no mínimo. Testar essa afirmação ao nível de significância de: a) 5% b) 1% 9.Dr Cláudio S.0 minutos. durante o último ano de um particular produto. e. Um fabricante interessado na compra de um novo equipamento para produzir ferramentas especificou que o equipamento não deve exigir.00.5 com desvio padrão de 30.7. aceita-se H0 no nível de significância de 0. O agente de compras visita uma companhia onde está instalado o equipamento.01. mais do que 10 minutos de manutenção para cada hora de operação. no mínimo. a tensão média de ruptura pode ser aumentada. Para 20 horas aleatóriamente selecionadas durante tais períodos. o gerente havia afirmado que a média das compras feitas por aqueles que responderam à oferta especial teria sido de. a hipótese nula de que o volume de tráfego não satisfaz a exigência. não era superior a 408. Mediante nova técnica no processo de fabricação. Antes de ver esses resultados da amostra. $ 25. quando. pode-se rejeitar a hipótese de que o equipamento possui as especificações sobre o tempo de manutenção. Um analista de mercados coleta informações de uma amostra aleatória de 100 clientes.50 está dentro do intervalo. pela informação que recolhe. Com base neste reultado amostral. ensaiou-se uma amostra de 50 cabos. dos 400 que compraram uma oferta especial. tendo-se determinado a tensão média de ruptura de 1850 kg. mediante um processo recentemente aperfeiçoado. Pode essa hipótese ser rejeitada a um níveld e significância de 5%? 7. Testar a hipótese ao nível de significância de 5%.0. a) Planejar uma regra de decisão para rejeição do processo anrtigo. Supõe-se que a população estatística seja aproximadamente normal.5 com desvio padrão amostral de 55. de fato. O valor médio das vendas por estabelecimento varejista. Exercícios: 1. foi feita a hipótese de que o número médio de empregados por firma. Pode a hipótese nula ser rejeitada ao nível de significância de 5%? 8. Existem ao todo 380 firmas nesta indústria. ou seja. 4. Com base em dados de vendas em outros produtos similares. o número médio de empregados por firma é de 420.01? 2. Pode-se rejeitar essa afirmação utilizando um nível de significância de 1%? 5. Referente ao exemplo 14. qual é a probabilidade de aceitação do processo antigo.05 b) 0. Suponha que os resultados amostrais do problema anterior sejam baseados em uma amostra de n = 50 horas.500. com desvio padrão de $ 6. Suponha que tenha sido afirmado que o verdadeiro valor das vendas no estabelecimento é no mínimo de $ 3. proclamou-se que a tensão de ruptura pode ter aumentado. se foi resolvido submeter 64 cabos a ensaio. Sartori Bioestatística FATEC 3 Como -2. Uma amostra de 50 firmas tomadas de uma particular indústria. 3 . 6. Pode-se confirmar a declaração no nível de significância de 0.00. supõe-se que a distribuição das vendas seja normal e que o valor do desvio padrão da amostra seja de σ = $ 200. conservadoramente.425.60. Acredita-se que. Uma cadeia de lanchonetes instalará um novo estabelecimento em um local proposto se passarem pelo local.57 na loja. nesta indústria. H0: µ ≤ 200.00. testar a hipótese de µ = 1600 h em face da alternativa µ < 1600 h para o nível de significância de : a) 0.01 3 Uma companhia fabrica cabos cuja tensão de ruptura têm média de 300 kg e desvio padrão de 24 kg. b) De acordo com a regra de decisão adotada em a). foi de x = $3. ao nível de significância de 5 %? Esboce o gráfico da distribiuição normal explicitando as regiões de aceitação e rejeição. 200 carros por hora durante certos períodos do dia.01. 0 ppm. Suponha que o analista do problema anterior ignorasse o uso do fator de correção finita para determinar o valor deo erro padrão da média. Qual teria sido o resultado do teste. em geral. ainda usando o nível de significância de 5%? 11.00 usando um nível de significância de 10%. 4 . não ultrapassam uma velocidade de datilografia de 60 ppm. Sartori Bioestatística FATEC 4 10.50 com um desvio padrão de $ 1. Testar a hipótese nula de que as secretárias.Dr Cláudio S. Uma amostra de aleatória de 30 empregados no nível II de Secretariado foi submetido a um teste de datilografia. 12.00.0 ppm (palavras por minuto) e σ = 5. usando um nível de significância de 1%. Os resultados da amostra são: x = 63. Testar a hipótese nula H0 : µ = $ 8. Supõe-se que os salários da firma sejam normalmente distribuídos. Um analista de departamento de pessoal seleciona aleatoriamente os registros de 16 empregados horistas e acha um salário médio horário de x = $7. d) O desvio padrão da distribuição amostral das médias.5 4.2 2. usando a − expressão: Y = 1 e 2σ 2 e localize a média i σ 2π amostral nesse gráfico. assumindo que há 1000 casas no bairro.1 3. b) Quais são os limites de confiança? 7.3 1. Ano PIB($) (bi) Cresci mento (%) Renda per capita ($) 4526 4500 4407 4555 4752 4883 4949 5029 Cresc iment o (%) 3. Considerar todas as amostras possíveis de 2 elementos. Uma amostra randômica de 40 casas no 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 652 659 655 688 728 758 779 804 -4. Para cada dado. N < 10% N P 2. Construa o intervalo de confiança de 95%.4 minutos e desvio padrão de 7. A média previamente conhecida é de $23500. 7.Revisão 1. faça uma projeção para o PIB e renda per capita para os anos de 1998 e 1999. N se refere ao tamanho da amostra. µ. Determinar: a) A média populacional. b) Determine agora a média e o desvio padrão dos 10 anos. c) A média da distribuição amostral das médias. Um acessor de uma determinada cidade deseja estimar o valor médio de casas em um certo bairro.00 e desvio padrão de $ 6325. 11 e 15.6 -2. a) Encontre um intervalo de confiança para a média de 95%. Sartori Bioestatística FATEC 5 Exercícios . Testes sonoros feitos em 40 veículos indicaram uma média de 65 decibéis e desvio padrão de 6 decibéis. Uma amostra de 50 pacientes mostraram uma média de espera de 23. a) Encontre um intervalo de 90% de confiança para a média. Dados: bairro. usando a − expressão: Y = 1 e 2σ 2 e localize a média i σ 2π amostral nesse gráfico. 4.9 4. mostraram uma média de $29400. Utilize: 5 . assumindo que há 120 casas no bairro.2 -5. Um médico quer estimar o tempo médio que um determinado paciente espera para uma consulta. Faça o gráfico da distribuição gaussiana indicando os valores do intervalo para a média populacional. Encontre o intervalo de confiança de 95% para a média µ 5. Os dados a seguir indicam para alguns dados econômicos para o Brasil. µ. x 125 206 154 309 40 78 σ 16 25 3 50 7 6 N 64 100 81 225 49 144 Intervalo de Confiança (%) 95 99 90 95 99 90 6.9 5.1 minutos.6 a) Utilizando uma média dos últimos 2 anos. que podem ser retiradas com reposição.0 -0.3 1. Considere uma simulação feita em um computador em que em uma amostra de 100 elementos de uma população de média 50 e desvio padrão 5.Dr Cláudio S. b) O desvio padrão da população.5 -0.4 4.3 2. ( xi −µ )2 ( xi −µ )2 µx = µ N σx = σx = σ σ N NP − N N p −1 . b) Encontre um intervalo de confiança para a média de 95%. Uma população consta de 4 números: 3. Faça o gráfico da distribuição gaussiana indicando os valores do intervalo para a média populacional. Utilize a aproximação de que N < 10%Np.00.8 3.8 1.00. O número de elementos da população é muito maior que o da amostra. encontre o intervalo de confiança para a média populacional µ. Ele mediu o tempo de trabalho da máquina para 36 trabalhos: 23 27 28 33 35 37 39 40 40 41 42 42 42 42 43 43 44 44 45 46 46 46 47 47 47 48 49 50 51 52 53 53 56 57 61 62 Use um nível de significância de 5% para decidir se o proprietário utilizará o modelo DW140 para seus trabalhos. usando a aproximação normal para a distribuição binomial. a) Construa o intervalo de confiança.≈ 0. Sartori Bioestatística FATEC 6 µ= ∑ xi i =1 N N σ= ∑ (xi − µ ) i =1 N 2 N c) Construa um histograma para o PIB e a renda per capita. d) Construa a função gaussiana que representa o Pib e a renda per capita. Assumindo desvio padrão de 6 há suficiente evidência para sugerir que a resistência do produto aumentou a 5% de significância ? 11. O proprietário de uma empresa de máquinas de copiar utiliza frequentemente. Para testar a hipótese de que a moeda é honesta.45 kg ). Se o sujeito identifica corretamente 32 cartas. se o número de caras em uma única amostra de 100 lances.S). Ele espera que seu produto não atrase muito nem se adiante muito em relação a 700 horas.01 10.5 dias. caso contrário.05 d) 0. 13. (4) Rejeitá-la. Através dela estime os valores do PIB e renda per capita para os anos de 1998 e 1999. b) Determine o número de caras correspondente. construa o intervalo de confiânça e em seguida faça o teste de hipótese explicitando a hipótese nula e a alternativa. em uma sala. Ele espera que seu resultado seja menor que a média sempre adotada. por outro indivíduo colocado na mesma sala. O proprietário está interessado em decidir nâo utilizar esse modelo caso a média dos trabalhos executados pela máquina exceder 40 min. b) Que conclusões se poderiam tirar do fato de uma amostra de 100 lances apresentar 53 caras? 60 caras? 20 caras? 78 caras? Dados: µ = Np : (p:probabilidade de obter-se sucesso em um lançamento) processo será desenvolvido substituindo o antigo. Um determinado tipo de plástico possui uma resistência de 27 e um desvio padrão de 15 libras por polegada quadrada ( 1 libra . Um pediatra mede um parâmetro de recordação relativo a seus 38 pacientes. Indique na gaussiana a média amostral. Uma experiência sobre percepção extra-sensorial (P.Dr Cláudio S.E. Uma amostra de 40 peças feita com o novo processo dá uma média de 30 libras por polegada quadrada. O sujeito desconhece quantas cartas vermelhas ou pretas há no baralho. Um industrial gostaria que seu produto esteja pronto em pelo menos 700 horas.p)) σ Repita o problema para 99% de confiança. 9. providenciando uma significativa mudança na resistência do plástico. nos níveis de significância de: c) 0. Indique os valores das médias. Os valores de 1999 estão dentro dos limites de confiança? 8. de 6. Os resultados amostrais obtidos são: 8 7 2 6 9 4 5 3 7 8 10 7 7 6 4 10 3 6 8 2 5 4 4 5 3 8 7 4 6 3 7 12 4 3 6 6 9 4 Usando um nível de significância de 5%. Um novo 6 . estiver dentro de um intervalo de confiança de 95%. é solicitado a declarar a cor vermelha ou preta de uma carta escolhida. um sujeito. Um instrutor analisou 38 candidatas a secretária e encontrou os seguintes resultados (palavras por minuto): σ = Npq : z= X −µ (q:probabilidade de insucesso em um lançamento (q = 1. 12. Compare com os valores da tabela. um modelo de máquina denominado DW 140. Um procedimento de treinamento datilográfico padrão baseia-se em 64 palavras datilografadas por minuto. 14. determinar se os resultados são significativos. Faça o teste a 1% de significância. Numa amostra de 48 produtos obteve-se média de 675 h e desvio padrão de 77 h. adota-se a seguinte decisão: (3) Aceita-se a hipótese. de um baralho bem embaralhado de 50 cartas. e) Construa um intervalo de confiança de 95% para a média do PIB e a renda per capita. Utilizando uma significância de 1% verifique se essa média está na região de aceitação ou rejeição e escreva as hipóteses nula e alternativa: 15. 0 3 0 . há evidências suficientes para crer no grupo? H0: µ = 150 min .59 anos e desvio padrão de 2 mm Hg.5 min Como Ha apresenta sinal > o tipo do teste é de "cauda direita". 5 ) 2 Gráfico de: 1 e 2π 7.5 = 150 + 1. atrassando assim seus compromissos.59 anos e desvio padrão de 4 mm Hg. f) Comparada com adultos jovens e desvio padrão de 4 mm Hg. Uma amostra de 40 viagens mostrou uma média de 153 minutos e um desvio padrão de 7.951 1. 15. Essa pressão tende a aumentar com a idade. 2 0 .5 min. e) Exercícios . 0 1 0 1 2 0 0 .951 40 7 . Sartori Bioestatística FATEC 7 56 60 60 70 60 59 41 66 67 33 55 43 61 71 73 60 56 77 43 58 65 67 71 56 48 90 82 46 68 36 27 52 64 54 49 69 46 68 Usando uma significância de 5% pode o instrutor afirmar que a este nível a média seja diferente de 64? 15. 0 2 0 . d) Comparada com homens de 35 . 4 0 .59 anos e desvio padrão de 2 mm Hg.Testes de Hipóteses Uma companhia de ônibus 4. avisa que o tempo de viagem entre duas cidades é de 150 min. − ( x −150 ) 2 2⋅( 7 . c) Comparada com homens de 35 . 0 4 0 . Para homens de 35-59 anos se encontra a 130/84. Há duas medidas de pressão sanguínea utilizadas em exames: a correspondente à sístole. Alguns médicos estudaram a pressão sanguínea para alguns (41) atletas em determinada universidade e encontraram uma pressão média (sístole/diástole) de 123/80 mm Hg). Um grupo de consumidores reclamou que o tempo médio era maior que 150 minutos.645 µ + zC σ N = 150 + 1. 0 5 0 . g) Comparada com homens de 35 .951 = 151.59 anos e desvio padrão de 4 mm Hg. a pressão sístole/diástole vale 120/74 mm de Hg. quando o músculo do coração está relaxado.Ha: µ > 150 min σ = 7.Dr Cláudio S. Usando um nível de significância de 5%. 1 0 .645 7. Para adultos jovens.645 Construção do intervalo de confiança: zα=0.5 0 .05 = 1.2) Para a pressão correspondente à diástole: Comparada com adultos jovens e desvio padrão de 2 mm Hg. quando o músculo do coração está contraindo e `a diástole. h) Comparada com homens de 35 . b) Comparada com adultos jovens e desvio padrão de 4 mm Hg. 3 0 1 3 0 1 4 0 1 5 0 1 6 0 1 7 0 1 8 0 4 2 0 2 4 Região de rejeição a H0 Região de aceitação de H0 Região de rejeição a H0 Região de aceitação de H0 151.1) Para a pressão correspondente à sístole: a) Comparada com adultos jovens e desvio padrão de 2 mm Hg. Podemos também utilizar a variável reduzida: µ + zC σ N = 15 + 1.33 σ 53 = 500 + ( −2. A um nível de 5%.002 0. para um determinado tipo de solo. rejeita-se Ho. têm em geral um nível de depressão maior de 15 (que é a média para estudantes de colégio) ? H0 : µ = 15. rejeita-se H0 a um nível de confiança de 95%. O proprietário de uma empresa perfuradora de poços artesianos suspeita que. aceita-se H0 a um nível de confiança de 5%. Ha: µ < 500 pés Como Ha contém <: Teste unilateral cauda esquerda. 153 − 150 = 2. Uma psicóloga quer confirmar sua crença que crianças maltratadas teriam elevados níveis de depressão. aceita-se Ha de que µ > 15. as crianças abusadas.05 = 1. Perfurações realizadas em 32 regiões diferentes mostraram uma média de 486 pés e um desvio padrão de 53 pés.001 0 300 400 500 600 700 Rejeição a H0 Aceitação a H0 478.1851 Como 2.004 0.33) = 500 − 21.16 µ + zC N 32 0.645.007 0.4 . A um nível de significância de 1 %.16 Gráfico de: 1 e 2π 53 − ( x −500 ) 2 2⋅( 53) 2 Como 486 pertence à região de aceitação. 2.01 = 2. Ha µ > 15 Teste unilateral cauda direita.005 0.006 0. ou seja.Dr Cláudio S. o grupo está certo a um nívelde confiança de 95%.830 = 478.5298 1. pode-se concluir que.7637 = 15. rejeita-se H0. Um determinado tipo de plástico possui uma resistência de 27 e um desvio padrão de 15 libras por polegada quadrada ( 1 libra .645 5.3 > 15. ou seja a média da profundidade de perfuração de poços artesianos é de 500 pés.645 Construção do intervalo de confiança: zα=0. ou seja.3 e um desvio padrão de 5. Ela dá um teste chamado de POMS (Profile of Mood States) parta uma amostra de 50 crianças abusadas. Construção do intervalo de confiança: zα=0. a profundidade média na qual se encontrava água era inferior a 500 pés. é justificada a suspeita do proprietário? H0 µ = 500 pés. 3.≈ 2 . 4.7637 50 z= z= xa − µ σ N ⇒ Decisão: Como 17.003 0.5298 > 1.4 = 15 + 0. Sartori Bioestatística FATEC 2 Como 153 pertence à regiãod e rejeição. Os resultados mostraram um escore de depressão média de 17. 33 σ 15 = 27 + 2. Ha: µ > 27 pés Como Ha contém >: Teste unilateral cauda direita. b) O erro é do Tipo I com 5% de probabilidade.526 µ + zC N 40 Como 30 < 32.01 = 2.01 = 1.265 < 2.526. Uma amostra de 40 peças feita com o novo processo dá uma média de 30 libras por polegada quadrada. Construção do intervalo de confiança: zα=0.33 = 27 + 5.783 48 Como 675 está na região de rejeição. Numa amostra de 48 produtos obteve-se média de 675 h e desvio padrão de 77 h. b) Qual o tipo de erro de se cometer e com que probabilidade? a) H0 µ = 700 h .783 ⇒ 678. Ele espera que seu produto não atrase muito nem se adiante muito em relação a 700 horas. Um novo processo será desenvolvido substituindo o antigo. 5. Ha: µ ≠ 700 h zα=0. Um industrial gostaria que seu produto esteja pronto em pelo menos 700 horas. rejeitase H0 a um nível de significância de 5%. providenciando uma significativa mudança na resistência do plástico.45 kg ).33 está na região de aceitação. aceita-se H0 a 1% de significância. está na região de aceitação.526 = 32. Assumindo desvio padrão de 6 há suficiente evidência para sugerir que a resistência do produto aumentou a 1% de significância ? H0 µ = 27 libras/pol2 . a) Complete o teste a 5% de significância. 2 . Poderíamos resolver também: z= xa − µ σ N = 30 − 27 15 40 = 1.Dr Cláudio S.96 µ ± zC σ N = 700 ± 1.265 Como 1.96 77 = 700 ± 21. não se rejeita H0. Sartori Bioestatística FATEC 2 0.216 < µ I < 721. Sartori Bioestatística FATEC 3 Exercícios de Revisão . 3. Construir um intervalo de confiança para estimar a vida média útil dos tubos de imagem de TV com base em uma amostra n = 15.8 15. Um encarregado de compras em um supermercado toma uma amostra aleatória de 12 latas de ervilha e encontra os seguintes dados: Televisores Frequência observada fo em N = 100 Frequência esperada fe Em N = 100 b) Calcule o valor de χ2 com base na tabela. 6. desvio padrão e média da amostra. um fabricante de televisores vende 40% de aparelhos com tela pequena (menos de 14 polegadas).9 16. São feitos contatos com uma amostra aleatória de 50 empregados.Estatística televisores vendidos eram pequenos. encontre. através de sua definição: (NE:Número de eventos). 20%. usando a distribuição Qui Quadado. 35 de tamanho médio e 10 grandes. ele toma uma amostra aleatória de 100 vendas durante o atual período e encontra que 55 3 .Dr Cláudio S.7 15.0 16. padrão da população: Com ν = N – 1 4. 40%. 2. um intervalo de confiança de 95% para o desvio Total 40 40 Ns χ 2 1− α 2 (ν ) <σ < Ns fo (número observado) fe (número esperado) 10 10 10 χ α2 (ν ) 2 a) Calcule o valor de χ2 com base na tabela. sendo que 10 deles indicam sua intenção de participar. b) Use a distribuição t de Student para construir um intervalo de confiança de 95%.1 16. A tabela a seguir ilustra o número de instalações de um sistema de ar-condicionado de acordo com o tipo de sala usado em uma indústria. Para o conjunto de 12 latas do exemplo anterior. Peso por lata (em 10 gramas) 15. 5. H1: A quantidade de instalações não está igualmente distribuída nas 4 salas Testar a 5% de significância as hipóteses acima.2 Número de latas 1 2 2 3 3 1 χ =∑ 2 i =1 NE ( f e − f o )2 fe c) Verifique as hipóteses a 1 % de significância: H0: A percentagem de todas as compras de televisores das categorias seguem 40%. 40 % de aparelhos com telas médias (de 14 a 20 polegadas) e 20 % de aparelhos com telas grandes ( 21 polegadas ou mais). Um gerente de departamento de pessoal estima que 40% dos empregados de uma grande empresa participará de um novo programa de investimentos em ações. Tela Pequena (< 14) Tela média (14 – 20) Tela Grande (> 21) • Distribuições t de Student e Qui Quadrado 1. Historicamente. A 6 10 Tipos de sala B C D 12 14 8 Determine: a) O peso líquido médio em cada lata desta amostra e o desvio padrão da amostra. respectivamente. b) Dada as hipóteses: H0: A quantidade de instalações está igualmente distribuída entre as 4 salas. Com o fim de estabelecer programas apropriados de produção para o próximo mês. H1: O padrão atual das compras é diferente do padrão histórico apresentado em H0. a) Construa a tabela abaixo. respectivamente iguais a σ = 500 h e µ = 8900 h. Peebles. H0: µ = 500 cal Ha: µ ≠ 500 cal 11. Em um trabalho publicado em 1908.1 6 4. c) Faça o mesmo teste a 1 % de significância. Antes de uma promoção de vendas destinada a destacar as qualidades de refrigeradores de preço alto. aproximadamente). as quantidades vendidas nas categorias de preço baixa. As drogas promoveriam horas adicionais de sono se a média de sono para todos os pacientes possíveis excedesse 0 (µ > 0).15 e 20. Uma companhia de sorvete argumenta que seu produto contém 500 cal por quartil.9 2 0. (1 quartil equivale a 560 ml. b) A um nível de significância de 5%. A um nível de significância de 10 % é razoável supor que mulheres abaixo de 40 anos possuem nível de colesterol abaixo da média 200 ? H0: µ = 200 mg/100ml Ha: µ < 200 mg/100ml 10. respectivamente. 45. Sartori Bioestatística FATEC 4 Espera-se. Cushny e A. Completar a tabela abaixo e testar a hipótese nula de que o atual padrão de vendas não difere do padrão histórico. 30. que 20 funcionários participem do programa.Dr Cláudio S. respectivamente. "intermediária" e "alta" em termos comparatuvos de preços. que estudaram os efeitos de isômeros óticos de hyoscyamine hydrobromide em induzir o sono nas pessoas. Os dados obtidos eram de horas adicionais de sono por 4 . H1: o atual padrão de vendas difere do padrão histórico. Participação do programa Sim Não Total fo fe 20 30 50 b) A uma significância de 5% teste a hipótese inicial de que H0: percentual de participação = 40 % H1: percentual de participação ≠ 40 % Utilize um teste bilateral com a distribuição Qui Quadrado. Construa um intervalo de confiança de 95% utilizando a distribuição t de Student Categoria s Baixa fo (quantidade vendida) fe (quantidade que se espera vender) Interme diária Alta Total 8. Gosset (Student) discutiu alguns .6 10 3.dados obtidos pelos cientistas A. foram analizados 24 potes de 1 quartil.1 5 -0. A associação americana do coração recomenda que um nível de colesterol abaixo de 200 miligramas por 100 mililitros. com o emprego da distribuição normal.4 a) Encontre a média e o desvio padrão das horas adicionais de sono por paciente. Estabeleceu-se as hipóteses: H0: µ = 0 Ha: µ > 0 Paciente Horas adicionais de sono 1 1. 9. que podem ser descritascomo "baixa" . Teste a hipºotese a 2 % de nível de significância utilizando a distribuição t de Student. noite em 10 pacientes tratados com hyoscine e são mostrados na tabela abaixo. 7. utilizando um nível de significância de 5%. 25. Ou seja H0: o atual padrão de vendas segue o padrão histórico. confirme se as drogas promovem o aumento de sono ou não.6 9 4. De uma amostra aleatória de 50 refrigeradores vendidos depois da promoção. Mediu-se o nível de colesterol de mulheres com idade inferior a 40 anos escolhidas randomicamente: 233 197 192 179 174 217 186 221 188 209 196 167 238 179 196 191. as vendas percentuais das três categorias eram. 15.1 4 0.4 7 5. Para comprovar essa hipótese. onde obteve-se uma média de 507 calorias e desvio padrão de 21 calorias. Um fabricante de refrigeradores oferece três linhas de produtos básicos.8 3 1.5 8 1. intermediária e alta foram. a) Monte a tabela abaixo. Dr Cláudio S. Uma indústria de produtos eletrônicos utiliza na montagem de um produto. d) Dada as hipóteses: H0: A quantidade de instalações está igualmente distribuída entre as 4 salas. 13. 3 e 4 são utilizadas uma vez só. John Wiley & Sons. A tabela a seguir ilustra o número de instalações de ventiladores de acordo com o tipo de sala usado em uma indústria. A companhia deseja checar esse processo.1/5 para linha 4) para produtos defeituosos. através de sua definição: (NE:Número de eventos).2. A decisão foi tomada em observar os próximos 100 produtos que retornaram defeituosos e determinar quantos chegam a cada linha de montagem. respectivamente.1/5 para linha 2. 5 . cuja pontuação média para 20 estudantes equivale a 60 pontos com desvio padrão de 7. Warren Chase and Fred Bown.18. Sartori Bioestatística FATEC 5 para o nível médio de ansiedade de estudantes de colégio.3 e 4 são. Os produtos defeituosos que chegam nas linhas 1. 12. Linha de 1 2 3 4 Total produção Frequência observada fo em N = 100 Frequência esperada fe Em N = 100 c) Calcule o valor de χ2 com base na tabela. Inc. desde que todos tenham a mesma razão de produção de instrumentos necessários até o prazo de garantia do produto.. b) Construa a tabela abaixo.1/5 para linha 3. Third edition Distribuições t de Student e Qui Quadrado χ =∑ 2 i =1 NE ( f e − f o )2 fe d) Verifique as hipóteses a 1 % de significância: H0: As linhas de produção seguem as probebilidades encontradas (2/5 para linha 1. H1: O padrão é maior do apresentado em H0.14 e 15. 53. a) A 6 5 Tipos de sala B C D 12 12 10 Total 40 40 fo (número observado) fe (número esperado) c) 15 5 15 Calcule o valor de χ2 com base na tabela. medidos por meio de um questionário. H1: A quantidade de instalações não está igualmente distribuída nas 4 salas Testar a 5% de significância as hipóteses acima. Determine as probabilidades com que ocorrem os produtos defeituosos nas linhas de produção. Adaptados de General Statistics.5 . 4 linhas de manufatura para produzir o mesmo produto. Cada linha de produção é teoricamente equivalente. A linha de montagem 1 é usada 2 vezes por dia enquanto as linhas de montagem 2. html) . pois para grandes valores de N a distribuição t de Student se aproxima com a normal reduzida: O número de graus de liberdade de uma estatística é definido o número N de observações independentes da amostras menos o número k de parâmetros populacionais que devem ser estimados por meio das observações amostrais. definida por: Y= Y0 ⎛ t2 ⎞ 2 ⎜ ⎜1 + N − 1 ⎟ ⎟ ⎝ ⎠ ou N Γ ( x ) = ∫ t x −1e − t dt 0 ∞ Y= Y0 ⎛ t2 ⎞ ⎜ ⎜1 + υ ⎟ ⎟ ⎝ ⎠ (υ +1) 2 Onde ν (letra grega "nu") é denominada de número de graus de liberdade. para alguns valores do grau de liberdade υ e comparadas com a distribuição normal. extraídas de uma população normal (ou aproximadamente normal) de média µ. Então: υ = N − k . denominadas de grandes amostras.Dr Cláudio S. Tal distribuição é dada por: f ( t . o número de observações independentes da amostra é N. a Student t ou t de Student e a qui quadrado serão estudadas.csusb. por meio da média amostral x e do desvio padrão s. 6 1 − t2 Y= e 2π 2 Pequena Bibliografia (http://history. as distribuições eram aproximadamente normais. υ ) = ⎛ υ +1⎞ Γ⎜ ⎟ ⎝ 2 ⎠ ⎡ ⎛ x − µ ⎞2 ⎤ ⎢ ⎜ ⎟ ⎥ s ⎠ ⎥ ⎛υ ⎞ Γ ⎜ ⎟ πυ ⎢1 + ⎝ ⎢ ⎥ υ ⎝2⎠ ⎢ ⎥ ⎣ ⎦ υ +1 2 Definimos a estatística : Ou. e. O parâmetro de normalização pode ser obtido e a distribuição t de student é dada por: f ( x. • A Distribuição de Student t do qual podem ser calculados x e s. Elas são denominadas de pequenas amostras e seu estudo é denominado de teoria de pequenas amostras. pode-se determinar a distribuição amostral de t. No caso da estatística definida por t.edu/Mathematicians/G osset. reduzindo a variável: t= x−µ ˆ/ N s Com ˆ= s N N −1 s Considerando-se amostras com tamanho N. Para amostras com N < 30 essa aproximação não e boa piora com o decréscimo de N. k =1. µ . onde duas distribuições importantes. Γ é a função Gamma. Note que υ = N −1 A forma gráfica da distribuição t de Student está mostrada a seguir. tornando-se a aproximação melhor com o crescimento de N. calcular-se o valor de t. Entretanto.υ ) = ⎛ υ +1⎞ Γ⎜ ⎟ ⎝ 2 ⎠ ⎡ t2 ⎤ ⎛υ ⎞ Γ ⎜ ⎟ πυ ⎢1 + ⎥ ⎝2⎠ ⎣ υ⎦ υ +1 2 Aqui. se para amostra . como µ deve ser avaliado. Sartori Bioestatística FATEC 6 Teoria de Pequenas Amostras Notamos anteriormente que para distribuições de amostras com número N > 30.math. 35 e υ=2 Y0=0.4. υ=1 Y0=0.35 0.5 1 1. e é definido por: 2 ⎧n ⋅ (n − 2) ⋅ (n − 4) ⋅ 5⋅ 3⋅1 se n > 0 ímpar ⎪ n!!= ⎨ n ⋅ (n − 2) ⋅ (n − 4) ⋅ 6 ⋅ 4 ⋅ 2 se n > 0 par.teste para segurar amostras pequenas para o controle de qualidade.15 0.5 0 t 0. onde em Oxford estudou química a matemática.1 É importante salientar as propriedades da função gamma: Γ (n 2)= (n − 2 )!! π ( n −1 ) 2 ⇔ n = 1.ubalt.3 0.2 0.05 -3 -2. de -∞ a tp : Valores dos percentis t p Distribuição t de Student com ν graus de liberdade (Área sombreada =p) tp 7 . Publicou mais tarde três trabalhos importantes que tinha empreendido durante este ano que trabalhou no laboratório de Pearson .5 2 2. Gosset escreveu sob pseudônimo de "estudante" que explica porque seu nome não era divulgado em virtude de resultados estatísticos importantes. William foi educado em Winchester.5 3 William Gosset . 0.Dr Cláudio S. e do coeficiente de correlação. É familiarmente conhecido como "estudante" mas não como Gosset. Inglaterra -16 outubro 1937 em Beaconsfield.3.3 0.5 .35 0. Trabalhou em Dublin onde fez importante trabalho importante em estatística. como Fisher.33 comparadas com a distribuição normal (linha cheia).3. De fato. n !! é chamado de fatorial duplo. Em 1905 contatou Karl Pearson foi à Londres estudar no laboratório de Pearson.15 0.5. Sartori Bioestatística FATEC 7 http://ubmail. A tabela ilustra a área compreendida pela curva da distribuição t de Student.05 -4 -2 0 2 4 Γ(n ) = (n − 1)!⇔ n = 1.4 o 0. Distribuição t de Student: Variável reduzida t N-1= 1 N-1= 2 N-1= 3 N-1= 4 N-1= 5 N-1= 6 0.5 -1 -0.25 y ( t) 0.5 -2 -1.4 . Neste tempo trabalhou no chamado limite de Poisson.1 0. Gosset trabalhou com um grande número de estatísticos.2.edu/~harsham/statdata/opre330. Inventou o t . uma aplicação adiantada do método de Monte-Carlo.htm#rt distributions +1 ) 1 Γ(ν 2 = y Chamamos de ν ) π ⋅ν Γ(ν 2 parâmetro relacionado à normalização de fν (t ) . ⎪ 1se n = −1.25 0. yυ. com a distribuição binomial e de amostragem.1876 em Canterbury. Curvas t de Student para υ=4 . Inglaterra. desvio padrão. 0.2 0. ⎩ Com essas propriedades é possível encontrar o parâmetro de normalização da distribuição. Descobriu o formulário da distribuição de t por uma combinação do trabalho matemático e empírico com os números aleatórios.Y0=0. Neyman e Pearson.0. 126 0.36 1.52 2.686 0.94 1.00 1.856 0.260 0.25 3.04 2.858 0.40 1.47 2.681 0.14 3.47 2.76 2.76 2.540 0.88 2.70 2.863 0.14 2.65 2.33 1.533 0.71 3.128 0.31 1.255 0.860 0.8 1.559 0.37 1.00 2.711 0.978 0.06 2.20 2.271 0.683 0.873 0.31 1.38 1.256 0.679 0.256 0.73 1.700 0.92 2.11 3.674 t 0.54 2.859 0.262 0.549 0.80 1.128 0.536 0.677 0.82 6.36 1.685 0.842 t 0.697 0.10 2.35 1.256 0.128 0.690 0.257 0.08 1.32 1.90 2.866 0.07 2.995 63.856 0.71 1.48 2.06 2.58 2.553 0.70 1.537 0.941 0.58 t 0.685 0.532 0.99 31.706 0.534 0.718 0.32 1.569 0.254 0.855 0.02 2.689 0.50 3.31 1.36 2.46 2.03 3.84 2.31 2.67 1.7 0.98 2.257 0.32 1.75 1.72 2.62 2.42 1.96 t 0.683 0.18 2.81 2.876 0.80 2.77 1.879 0.376 1.33 1.127 0.532 0.36 3.66 1.533 0.42 2.81 1.289 0.82 2.34 1.645 t 0.529 0.530 0.31 1.92 2.30 1.257 0.524 s t 0.53 1.32 1.57 2.260 0.542 0.32 1.60 4.55 0.66 2.857 0.538 0.83 1.527 0.261 0.72 1.851 0.72 1.86 2.9 3.34 1.254 0.531 0.32 1.896 0.127 0.535 0.126 0.130 0.57 2.06 2.33 1.258 0.82 2.128 0.131 0.46 2.78 1.48 1.129 0.546 0.684 0.920 0.127 0.05 2.975 12.532 0.265 0.531 0.6 0.76 1.71 1.259 0.90 1.71 1.543 0.36 3.531 0.18 2.687 0.534 0.78 2.75 3.26 2.127 0.883 0.129 0.34 1.05 2.70 1.07 2.54 3.72 1.28 t 0.71 4.258 0.09 2.692 0.127 0.127 0.126 0.33 t 0.256 0.263 0.129 0.277 0. Unilaterais: t p = t1−α 2 8 .45 2.684 0.868 0.128 0.68 2.727 0.127 0.684 0. Sartori Bioestatística FATEC 8 ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞ t 0.71 1.79 2.727 0.258 0.66 9.889 0.23 2.617 0.061 0.257 0.55 2.127 0.845 0.137 0.70 1.02 1.50 2.741 0.855 0.530 0.06 3.539 0.259 0.000 0.86 1.92 5.688 0.73 1.765 0.854 0.530 0.98 1.04 2.75 1.31 2.13 2.158 0.75 1.132 0.906 0.683 0.256 0.256 0.30 1.01 2.74 1.703 0.76 2.90 2.95 2.858 0.865 0.695 0.77 2.861 0.53 2.257 0.89 1.127 0.694 0.62 2.60 2.854 0.130 0.96 4.526 0.256 0.84 4.64 1.142 0.13 2.256 0.848 0.95 6.44 1.870 0.70 1.32 1.39 2.127 0.134 0.127 0.11 2.80 3.09 2.267 0.83 2.686 0.127 0.08 2.48 2.78 2.128 0.12 2.253 t 0.51 2.29 1.816 0.688 0.49 2.691 0.256 0.17 3.Dr Cláudio S.68 1.862 0.36 2.325 0.531 0.126 Número de graus de liberdade: υ Intervalo de Confiança com um determinado nível de significância α: µ ± t p = N −1 ν Bilaterais: t p = ±t1−α .16 2.127 0.584 0.75 2.35 2. por simetria.5.2 -4 -2 0 2 4 -t1 a) Área sobreada à direita é 0. Determinar os valores de t1 para os quais: a) A área sombreada à direita é igual a 0. 99% e outros para a distribuição t de Student. para os quais 2. Na tabela encontra-se o valor de t0.99=2. t1 c) Se a área não sombreada é 0. e.6 0.995=3.01 é igual a -2. b) A área sombreada total vale 0.50. Em geral.83.01. então a área à esquerda de t1 é 1-0. Exemplo 1 . d) A área sombreada à esquerda vale 0.05.99.5% da área ficam localizados em cada extremidade da distribuição t.01/2=0.005.26.975 s N −1 Com a confiança de 95% (ou probabilidade de 0. enquanto t0. então o intervalo de confiança de 95% para t é: São estendidos aos problemas que envolvem pequenas amostras. Portanto o valor crítico de t. d) Se a área sombreada à esquerda vale 0.975 representa o valor do percentil 97. e) A área à esquerda de t1 = 0.O gráfico da distribuição t de Student está indicado abaixo.82. Testes de Hipótese e Confiança: Como na distribuição normal. t0.975 < Ou seja. pela tabela. Dessa maneira. Portanto a área à esquerda de t1 vale 1-0. t0. a área à direita é 0. por simetria.025. Sartori Bioestatística FATEC 2 Intervalos de Confiança da Distribuição tde Student: confiança desejado e do tamanho da amostra.05. c) A área não sombreada total é 0. a área total sombreada é 1 . verifica-se que a média µ é avaliado para que caia no intervalo: x−µ N − 1 < t 0.975 e t0. com a estatística t de Student.4 0. Na tabela. A única diferença é que tratamos ao escore t.5.95). Também são tirados da tabela anterior.99 = 0.01. b) Se a área total sombreada é 0. t1 representa o percentil 97.025 = 0.82. para o qual a área sombreada à esquerda é 0. t0. para 9 graus de liberdade e Y0 = 1. Na tabela se determina t0. 2 .025 = -t0.90. − t 0.8 0.01. -t0.99. à direita é 0.95 = 1. Por exemplo.975 s − t 0.95 e t1 representa o percentil 950. podem ser definidos intervalos de confiança de 95%.975 representa o do percentil 2.0.975 s N −1 < µ < t 0.975 são os valores de t.Dr Cláudio S.05.25.975. pode-se representar os limites de confiança para as médias populacionais como sendo: µ ± tc s υ Os valores ± tc são chamados críticos ou coeficientes de confiança e dependem do nível de 1 0.975=2.05=0.05. a média da população µ pode ser avaliada dentro dos limites de confiança especificados. com o emprego da tabela anterior.01 e a sombreada à direita é 0. 995 = 3.1 = 9.26.425 polegadas.95 = 0. 38 ± 3. 0452 2 . Exemplo 5 .05 ela não está. quando: a) ν = 9 ? b) ν = 120 ? c) ν = 30 ? d) ν = 60 ? A área total sombreada ( caudas) será de: 1 0.05.975 e t 0. 0650 O intervalo de confiança de 99% será: (4.975 Logo: a) ν = 9 ⇒ t0.003 polegada. Exemplo 6 . H1: µ ≠ 0.995 x ± t0.95 = 1.335 polegadas e 4.995 Pela tabela.26. b) 0.96.975 = ± 2. x ± t0. 38 ± 2.Os coeficientes de confiança de 95% (bilateral) para a distribuição normal são dados por ±1. quando o número de graus de liberdade ν for: a) ν = 16 b) ν = 27 c) ν = 200 Pode-se estar 95% confiante de que a média verdadeira está compreendida entre 4.975.25.025 e o valor crítico correspondente de t é tc = t0. adotando os níveis de significância de: a) 0.90 = 1. Como t = 3.90. t0.05.Uma amostra de 10 medidas de diâmetro de uma esfera apresentou a média de x = 4.445) polegadas.09 c) ν = 30 ⇒ t0.995= 3.70 c) ν = 200 ⇒ t0. 03 10−1 =3 N −1 a) Os limites de confiança de 95% são dados por: s N −1 x ± tc = x ± t 0.995 s N −1 Como N = 10 ⇒ ν = N .053 − 0. então t1 corresponde ao 900 percentil.975.01 Deseja-se decidir entre as hipóteses: H0: µ = 0.995 s s N −1 = 4. Então: t= x−µ s = 0.045 = 4. b) Os limites de confiança de 99 % são: x ± tc s N −1 = x ± t 0. t0.38+0. t0. Sartori Bioestatística FATEC 2 e) Se a área à esquerda de t1 é 0. Logo: polegad x ± t0.05 Aceitamos H0 quando t estiver compreendido entre -t0.95 na tabela achamos: a) ν = 16 ⇒ t0.38 0.25.75 b) ν = 27 ⇒ t0.05.4.975 s N −1 = 4.Antigamente.05 polegadas. rejeita-se H0 ao nível de significância de 0. escolheu-se uma amostra de 10 arruelas cuja espessura média é 0. a) Para α=0. Testar a hipótese de a máquina estar trabalhando adequadamente.975 Ns −1 = 4. Quais serão os coeficientes correspondentes para a distribuição t. Pela tabela. b) Se α=0.05. aceita-se H0 ao nível de 0. 38 ± 0. Então os coeficientes de confiança desejados são ± t0.06 10 −1 as. ν = 9. Os limites de confiança serão: Escolhendo-se t0. ν = 9. Da tabela encontramos t0.995 e t 0.Dr Cláudio S.045 = 4.Um ensaio de tensões de ruptura de 6 cabos produzidos por uma companhia mostrou que a tensão média de ruptura de 7750 kg e o desvio padrão de 145 kg.1 = 9. como t = 3. certa máquina produzia arruelas que tinham a espessura de 0.975 = 2.95 = 1. Para se verificar se a máquina está trabalhando adequadamente.26 b) ν = 120 ⇒ t0.975 s N −1 Como N = 10 ⇒ ν = N .06 polegada. e a máquina está trabalhando adequadamente.25 e o intervalo vai de -3.975 = ± 2.01.26 e o intervalo vai de -2. A área da extremidade direita é 0. x ± t0.95 = 1.645 Exemplo 3 . 38 ± 0.053 polegada e cujo desvio padrão é 0.38 polegadas e o desvio padrão s = 0. Logo. 25 0.26 a 2.05 0.01.Determinar os valores críticos de t para os quais a área da extremidade direita da distribuição t é 0. Exemplo 2 . 26 0.00 Exemplo 4 .975 = ± 2. Tipo de teste: Bilateral.25 a 3.04 d) ν = 60 ⇒ t0.975=2. Determinar os limites de confiança de: a) 95% b) 99% para o diâmetro real. Da tabela encontramos t0.05.315. aceitamos H0 quando t estiver compreendido entre -t0.975 = ± 2.06 10 −1 υ = 4.38. a média amostral é de x = $14000. para oa quais a área da extremidade direita da distribuição será 0. O peso líquido. com s = 0. aos níveis de significância de: a) 0. usando um intervalo de confiança da forma: x ± tc s N −1 2. c) A área à direirata de t1 seja de 0. sempre em unidades de 10 gramas. rejeitase H0.00.85. suponha que você tome uma amostra aleatória de 12 latas de vagens em conserva na Utilize Y0 = 1.95 rejeitamos H0 ao nível de significância de 0.05 b) 0. era de $ 16.15. sempre em unidades de 10 gramas. e a declaração do fabricante é justificada. era de $ 16. 3 . Teste a hipótese nula a um nível de significância de 5%. Caso contrário. Sartori Bioestatística FATEC 3 ao passo que o fabricante declara que aquela tensão média é de 8000 kg. 7. de 4200 horas. A hipótese nula formulada é de que a média da vida útil de lâmpadas de uma determinada marca. Será verdadeira a declaração do fabricante.97 . se o número de graus de liberdade for: a) ν = 4 b) ν = 12 c) ν = 25 d) ν = 60 e) ν = 160 8. em 10 gramas.95. usando a distribuição t de Student. H1: µ < 8000 kg e ela não o é. 3 Um representante de um grupo comunitário informa. encontrado em média por lata foi de x = $15.1 = 5 Aceitamos H0 desde que t seja superior a t0. Testar a hipótese nula ao nível de significância de 5%. é. Supõe-se que o tempo de operação das lâmpadas em geral tenha distribuição aproximadamente normal. Pode essa afirmação ser rejeitada a um nível de significância de 5% ? 6. O peso líquido.1 = 6 .00.01. Estimar a vida média de operação para a população das lâmpadas da qual foi extraída a amostra. suponha que você tome uma amostra aleatória de 12 latas de vagens em conserva na própria fábrica de enlatados. 4. Usando o software Excel da Microsoft. que a renda média familiar na comunidade é no mínimo µ = $ 15000. determine o valor de t1 de modo que: a) A área à direita de t1 seja de 0. Teste tipo unilateral.01. em 10 gramas. para ν = 5 ⇒ t0.15.05.97 .36rejeita-se H0.99 = -3.36 Como t = -3. ou seja. com s = 0. Foi afirmado que o preço médio por lata.01 Deve-se decidir em: H0: µ = 8000 kg. elabore uma planilha para construir os gráficos da distribuição t de Student com os graus de liberdade: a) b) c) d) ν=4 ν=6 ν=8 ν = 16 t= x−µ s = 7750 − 8000 145 6−1 = −3. a um investidor interessado em desenvolver um centro comercial. Determinar os valores críticos de t .00. Supõe-se que os valores de renda na população comunitária sejam normalmente distribuídos. lâmpadas é x = 4000h com o desvio padrão da amostra de s = 200 horas.95 = -2.86 < t0. com desvio padrão amostral de s = 200 horas.00.86 N −1 Como ν = N . e) A área entre -t1 e t1 seja de 0. Para uma distribuição t de Student com 10 graus de liberdade. A vida útil das lâmpadas segue uma distribuição normal. b) Aceitaremos H0 desde que t > t0. d) A soma das áreas à direita de t1 e à esquerda de -t1 seja de 0. Como t = -3. encontrado em média por lata foi de x = $15. ou seja t > -3.86 < -3. Exercícios: A vida média de operação de 10 1.02. no mínimo.01.10.36 . Como agente de compras de um certo supermercado.99 .Dr Cláudio S.95. b) A área à esquerda de t1 seja de 0. a) própria fábrica de enlatados. Pode essa afirmação ser rejeitada a um nível de significância de 10% ? 5. é improvável a declaração do fabricante.00 e o desvio padrão amostral vale s = $ 2000. para ν = 5 ⇒ t0. Como agente de compras de um certo supermercado. Foi afirmado que o preço médio por lata. Para uma amostra aleatória de n = 15 famílias na comunidade. 8.2 0.05 0 0 2 4 6 8 10 χ2 12 14 16 18 20 Tabela: Valores dos percentis Intervalo de confiança para χ2 χ2 p da distribuição de Qui Quadrado com ν graus de liberdade (Área sombreada =p) . Como fizemos para as distribuições normal e t de Student.10) Distribuição Qui-Quadrado 0. com o desvio σ.4 0. pode-se obter uma distribuição amostral desses valores.6.1 0. para alguns valores de ν. As distribuições estão mostradas na figura abaixo. para cada amostra. 0 χ2 p χ2 4 .35 Y N-1= N-1= N-1= N-1= N-1= N-1= 1 2 3 4 5 6 0. Essa distribuição é chamada de qui quadrado. podem ser definidos os limites e intervalos de confiança de 95%. (ν = 2.25 0. Considerando-se amostras de tamanho N retiradas de uma população normal. e é dada por: σ 2 = ∑ ( X i − X )2 i =1 N σ2 Y = Y0 χ υ −2 e − χ2 2 Aqui: ν = N .3 0. for calculado o valor de χ2.1 é o número de graus de liberdade e Y0 é uma constante dependente de ν.55 0.Dr Cláudio S.4. 99% e outros. de modo que a área total subentendida pela curva é igual a 1. Sartori Bioestatística FATEC 4 A distribuição de qui quadrado Definimos a estatística: χ2 = Ns 2 em que χ é a letra grega qui e χ2 é lido como qui quadrado. mediante o emprego da tabela a seguir.5 0. para χ2. e se.45 0.15 0. 4 29.4 112.77 4.1 19.7 18.38 9.1 21.831 1.06 1.34 1.2 19.2 18.6 15.07 3.3 61.64 2.6 107.36 4.0 11.83 3.9 11.90 2.6 43.55 9.1 80.64 9.3 24.0201 0.95 2 χ0 .44 9.3 15.0 19.1 18.6 47.9 19.6 43.1 16.4 23.8 55.18 2.3 21.9 34.10 0.0 33.9 20.5 19.3 95.584 1.1 12.1 15.3 23.5 20.1 13.1 18.3 13.4 37.4 16.8 20.1 28.84 9.2 44.94 4.81 6.96 8.2 88.3 18.9 26.4 69.9 40.7 21.5 13.7 28.0 35.7 38.103 0.3 73.99 7.7 25.3 5 .81 9.072 0.7 23.9 48.33 3.3 15.05 3.7 71.63 7.3 19.30 7.6 90.2 12.3 23.66 5.6 15.91 9.9 39.3 124.58 6.3 41.0 16.9 16.4 83.24 1.3 53.39 6.6 24.4 100.3 13.7 16.5 21.01 0.35 11.5 96.0 27.7 26.3 28.0 41.57 5.1 135.8 14.5 33.0 22.9 17.73 2.1 31.0039 0.78 9.2 16.3 42.6 12.65 2.676 0.7 34.010 0.6 29.1 2 χ0 .8 21.2 37.102 0.8 34.6 50.26 6.23 5.7 18.4 40.4 13.07 4.7 37.0 77.1 χ 2 0 .3 20.35 5.554 0.58 8.9 63.5 17.6 40.5 19.90 9.3 16.0 59.5 61.17 2.3 128.8 28.7 14.2 74.0 17.82 4.25 0.61 6.2 26.41 7.99 χ 2 0 .24 1.0 14.6 56.79 8.01 7.3 32.9 35.1 10.7 12.3 30.1 40.69 2.03 8.1 13.73 8.8 70.60 5.5 16.7 23.6 118.8 20.67 9.3 45.91 7.7 42.5 45.2 11.3 51.8 24.6 33.23 5.3 26.3 2 χ0 .25 3.3 16.02 7.0 104.0 44.3 79.3 20.15 1.9 113.9 30.4 53. 975 2 χ0 .35 7.87 5.6 28.24 10.4 12.4 14.8 13.9 12.3 89.26 9.9 18.0 23.49 4.3 19.2 45.9 43.7 60.67 3.2 14.0 48.3 11.2 51.6 25.3 12.7 26.3 15.7 37.25 7.2 11.14 5.4 32.43 8.21 11.70 3.5 21.2 0.5 34.09 2.6 74.9 2 χ0 .8 32.001 0.1 30.8 31.3 11.0002 0.0 11.3 17.7 16.57 4.31 10.39 2.3 0.3 51.26 6.0 22.8 79.3 82.6 22.5 26.4 35.3 13.9 11.3 29.4 31.455 1.4 13.2 38.45 4.1 41.50 0.5 43.26 7.7 14.4 40.872 1.2 10.5 28.5 16.4 16.57 4.4 32.3 27.6 15.1 98.6 118.63 9.9 13.1 90.6 3.7 23.3 35.34 9.7 66.989 1.3 25.9 52.211 0.8 24.2 11.8 14.8 26.5 13.4 85.32 2.3 140.6 32.84 5.8 18.000 0.4 20.74 7.0 27.73 3.1 39.7 33.6 36.8 14.60 3.3 59.1 27.54 10.3 18.5 32.63 6.01 5.8 30.6 14.6 51.89 10.0 106.59 10.0 17.5 24. 005 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 7.8 12.2 24.297 0.5 48.3 14.1 22.711 1.0 13.2 31.3 71.75 1.6 12.115 0.88 10.3 49.7 37.70 6.9 40.1 124.3 17.1 12.89 6.2 29.484 0.207 0.23 8.8 57.1 10.7 46.34 8.26 8.3 22.40 5.8 67.07 5.8 44.9 23.49 11.8 14.0 20.1 2 χ0 .0 52.05 0.6 14.4 42.8 16.84 7.56 8.8 63.34 10.7 12.0506 0.3 69.7 76.3 99.5 5.8 15.5 101.39 10.216 0.6 46.71 4.04 10.3 39.2 28.2 6.412 0.7 29.0 17.0 33.5 55.1 37.Dr Cláudio S.4 34.3 67.9 11.2 67.17 4.2 35. Sartori Bioestatística FATEC 5 ν 2 χ0 .16 2.6 88.56 3.2 65.2 29.352 0.3 22.2 116.6 109.995 2 χ0 .1 13.8 38.2 36.2 59.5 2 χ0 .57 7.5 11.0 26.8 43.5 12.20 2.92 2.7 47.21 1.6 38.3 29.4 2 χ0 .04 7.5 79.6 12.5 92.1 77.2 34.35 6.2 27.61 2.25 5.11 5.3 49.1 129.3 49.8 45.8 36.90 6.11 4. 025 2 χ0 .30 10.3 24.575 1.3 27.6 41.5 32.5 45.6 30.5 36.7 22.3 64.3 18.37 3.0158 0.8 21. 831 esquerda de c) Se a área sombreada à esquerda é 0. 025 e χ 2 0 .05. tem-se: e normal.025 0 5 10 15 20 Y (χ 2 )= 1 ⎛υ ⎞ 22 Γ ⎜ ⎟ ⎝2⎠ υ χ υ −2 e − χ2 2 Pode-se avaliar.125 0. Se a área sombreada à direita é 0.975 e 2 χ2 e 2 χ0 .8 Similarmente. o desvio padrão populacional σ.025 b) Como a distribuição é assimétrica.61 .50 2 percentil.95 .025 com o grau de confiança de 95%. 1 χ2 p = 2 (z p + 2υ − 1 ) 6 . quando ν ≥ 30. 2 χ0 .025 < Ns 2 0. Percorrendo a tabela por υ = 5 achamos 2 χ0 .075 0. expresso em função do desvio padrão amostral s. 025 = 0.025.10. os valores dos percentis 2. 975 são os valores de χ (denominados valores críticos). então χ 0. para os quais 2. há vários valores críticos para os quais a área total sombreada é igual a 0.05 0. Para grandes valores de ν (ν ≥ 30).2 0.1 = 1.5 percentil.025) respectivamente. é (1 .95 = 11. e χ12 representa o 2.5 e 97.O gráfico da distribuição qui quadrado com 5 graus de liberdade está representado ao lado: 0. 2 χ0 .95 e 2 χ2 é do qual se deduz que σ é estimado para que fique dentro do intervalo : σ 2 2 < χ0 . A área sombreada à direita = 0. 975 =12. Os valores 2 χ0 . É costume escolher as duas áreas de valores iguais. A tabela anterior fornece os valores dos percentis correspondentes aos graus de liberdade ν.0. o intervalo de confiança de 95% é então: 2 χ0 .1 0. χ2 p e zp são percentis de ordem p quadrado 2 χ12 representa o 100 percentil e das distribuições qui respectivamente. se χ12 é 0. Então.975 <σ < s N 2 χ0 .05 A área sombreada total é 0. dentro dos limites do intervalo de confiança.05 A área sombreada à esquerda é 0.025. pode-se utilizar o fato de χ 2 0 2 representa o 97.Dr Cláudio S.975 representam .025.10. a) Se a área sombreada à direita é 2 χ2 Exemplificando. 2 χ0 .05)=0.1 s N 2 χ0 .175 0.15 0. se a área sombreada à 2 χ − 2υ − 1 ter 2 distribuição aproximadamente normal com média 0 e desvio padrão 1. Sartori Bioestatística FATEC 6 A distribuição de Qui-Quadrado pode ser escrita por: Exemplo 1 . Similarmente podemos determinar outros intervalos de confiança. de modo que podem ser usadas as tabelas da distribuição normal.5% da área são localizados em cada extremidade da distribuição. 2 χα < 2 Ns 2 σ α 2 2 < χ2 α 1− 2 χ12 N 2 χ2 ⇔s N χ 2 <σ < s 1− χα 2 2 Determine os valores críticos de χ2 tais que: a) b) c) d) A área sombreada à direita = 0. a situada à esquerda de situada = 0. 0.975 representa o 950 percentil.01. se 2 χ 2 0 .05.5. então a área situada à esquerda de (1-0. 7 c) ν = 50 ⇒ 67.8.005 = 4.14 Os limites de confiança são dados por: s N χ 0. Determinar os limites de confiança de: a) 95% b) 99% Do desvio padrão para todos os estudantes do sexo masculino da escola. 2 χ2 a área à esquerda de 990 percentil e é 0.4 16 <σ < 5.05.26 ⇒ χ 0. Portanto.1 = 16 .4 16 2.005 = 2.24 7 .025 Para N = 16 ⇒ ν = N .025 = 2. χ 0 .14 Limites de confiança de 99%: a) 9 b) 28 c) 40 Na coluna 2 χ0 . escolhidos aleatoriamente em uma escola de 1000 estudantes vale 2.995 Como <σ < ν = 2 0 .10.1 = 15 Observando a tabela.49 cm.Dr Cláudio S. ν for igual a: a) 15 b) 21 c) 50 Na coluna 2 χ0 . os limites de confiança serão: 2 χ0 .68 e 4.99 e 2 χ2 representa o χ 0.025 = 6.26 χ 0. 99 = 15.3 Exemplo 4 O desvio padrão das alturas de 16 estudantes do sexo masculino.73 χ 0. ⇒ 1.68 < σ < 4. 50 encontra-se os valores dos percentis: d) ν = 9 ⇒ 8.49 2.50 2.975 = 5.84 b) Para 99%.4 cm. quando o número de graus de liberdade.50 ⇒ 1. χ = 4.3 f) ν = 40 ⇒ 39.1 . temos: 2 2 χ0 .975 <σ < s N χ 0. Exemplo 2 Determinar os valores críticos de χ2 para os quais a área da extremidade direita da distribuição de χ2 será de 0.83 < σ < 3.4 16 <σ < 5.24 2.975 = 27.5 ⇒ χ 0. pode-se estar 99% confiante em que o desvio padrão populacional está entre 1. 005 s N χ 0.60 χ 0. Sartori Bioestatística FATEC 7 d) Se a área sombreada à direita é 0.975 = 27.005 1 = 15 ⇔ percentis: a) ν = 15 ⇒ 25 b) ν = 21 ⇒ 32.995 = 32. 025 = 6.4 16 2.995 = 5.73 2.5 Exemplo 3 Determinar os valores medianos de χ2 correspondente aos graus de liberdade ν de: 16 χ 2 0 .8 ⇒ χ 0. 995 = 32. 95 s N encontra-se os valores dos χ 0.60 ⇒ χ 0.5.34 e) ν = 28 ⇒ 27. 8 . Quando as freqüências observadas ocupam h linhas e k colunas.05 e 0. respectivamente. frequentemente. . as freqüências esperadas são calculadas com base em uma hipótese H0. ou pelo menos. o problema é resolvido satisfatoriamente como descrevemos anteriormente. Definição de χ2: Uma medida da discrepância existente entre as freqüências observadas e esperadas é proporcionada pela estatística de χ2. Esse processo é denominado teste de qui quadrado da hipótese ou significância. a partir de estatísticas amostrais.…. Essa soma contém kh termos. tais como 2 χ0 . Ek.1 -m Quando as freqüências esperadas somente podem ser calculadas mediante a estimativa de m parâmetros populacionais. saber se as freqüências observadas diferem de modo significativo. etc. A freqüência total de cada linha ou coluna é denominada de freqüência marginal. uma tabela dupla de entrada h x k denominamos de tabelas de contingência.01. E2. a partir de estatísticas amostrais. ou seja. No caso de serem possíveis somente dois eventos E1 e E2. que são os E1 o1 e1 E2 o2 e2 E3 o3 e3 … … … Ek ok ek Deseja-se. para k > 1 e h > 1 é dado por: • υ = (h . por exemplo.Dr Cláudio S.99 . mas é raro obter esses resultados na prática. o3. esperar-se-ia que elas ocorressem com as freqüências e1. de acordo com as regras de probabilidade. concluir-se-á que as freqüências observadas diferem. Testes de significância: Na prática. é denominada de tabela de simples entrada. • υ = k . o2. em uma determinada amostra. Vamos agora considerar o caso geral. e rejeitar-se-á H0 ao nível de significância dado. E1.…. calcula-se a estatística: χ = 2 + 2 + +…+ ( ok −ek ) 2 ek χ2 = ∑ j =1 k (f oj − fe j fe j ) 2 χ =∑ j =1 k (f oj − fe j fe j ) 2 A distribuição amostral de χ2 pode ser aproximada por: Y = Y0 − χ ν −2 e 2 χ2 O número de graus de liberdade ν é dado por: • υ=k-1 Quando as freqüências esperadas puderem ser calculadas. das freqüências esperadas. Suponha-se que. para essa hipótese. sem que se façam estimativas dos parâmetros populacionais. e2. E3.….ok. Sartori Bioestatística FATEC 8 O teste de Qui Quadrado Os resultados obtidos por meio de amostras. denominadas freqüências observadas. parafusos defeituosos ou não. expressa por: ( o1 −e1 ) 2 e1 ( o2 −e2 ) 2 e2 ( o3 −e3 )2 e3 valores críticos nos níveis de significância 0. o valor de χ2 calculado pela equação dada for maior que alguns valores críticos.1) Quando as freqüências esperadas puderem ser calculadas. Exemplificando: teoricamente espera-se obter 50 caras e 50 coroas em 100 lançamentos de uma moeda honesta. nem sempre coincidem com os teóricos esperados. e que. a partir de estatísticas amostrais. denominadas freqüências esperadas ou teóricas. de acordo com as regras de probabilidade. e3. sem que se façam estimativas dos Considera-se a soma de todas as casas da tabela de contingência de ordem j. ocorreram com as freqüências o1. não a rejeitar. A tabela anterior.1)(k . O número de graus de liberdade dessa distribuição qui quadrado. Para verificar a concordância entre as freqüências observadas e esperadas:.. de modo significativo. aceitar-se-á H0. observou-se que um conjunto de eventos possíveis. Encaramos com suspeita quando χ2 próximo de 0. Se.ek.95 e 2 χ0 . pois em geral é raro que as freqüências observadas concordem com as esperadas. A soma de todas as freqüências observadas é igual a soma de todas as freqüências esperadas e vale N. Evento Freqüência observada Freqüência teórica parâmetros populacionais. o que é denominado às vezes de classificação dicotômica ou dicotomia. como. das esperadas. Caso contrário. na quais as freqüências observadas figuram numa linha única. caras e coroas. 5 laranjas.01 As freqüências observadas de caras e coroas são. amarela e verde.81 ⇒ Não χ =∑ 2 j =1 k (o j − ej ) ej 2 =∑ j =1 2 2 (o j − ej ) ej 2 = χ =∑ 2 j =1 = 4. As freqüências esperadas de caras e coroas são 100 e 100 Então: χ =∑ 2 j =1 k (o j − ej ) ej 2 2 =∑ j =1 4 (o 2 j − ej ) ej 2 = 2 χ2 = ( 315−312. (3/16)556=104.33. (1/16)556=34. Adotado o nível de significância 0. 101 enrugadas e amarelas e 32 enrugadas e verdes. Há alguma evidência para se duvidar de sua teoria. De acordo com a teoria de hereditariedade.75 +( 108−104.84 ⇒ Não se pode rejeitar a hipótese no nível de significância de 0.Em 360 lances de um par de dados obtiveram-se 74 “setes” e 24 “onzes”.05 b) O valor crítico 2 χ0 . a aproximação qui-quadrado estaria incorreta. Como 4. retiradas da urna ao acaso. (3/16)556=104. no nível de significância 0. a partir de estatísticas amostrais.75 enrugadas e verdes. b) para ν 2 = 3. Como esses números esperados são menores que 5.1) -m Quando as freqüências esperadas somente podem ser calculadas mediante a estimativa de m parâmetros populacionais. χ 0 .Nas estatísticas de Mendel realizadas com ervilhas.84. nos níveis de significância: χ =∑ 2 j =1 k (o 2 j − ej ) ej 2 =∑ j =1 2 2 (o j − ej ) ej 2 = χ2 = ( 3− 6 ) 6 +( 9−6 ) 6 =3 Para υ= 2 .25) 104.99 para 1 grau de liberdade vale 6.05? O número total de ervilhas é: 315+108+101+32 = 556.1)(k .25 enrugadas e amarelas.50 > 3.05.Dr Cláudio S. os números deveriam estar na proporção 9:3:3:1.25 +( 32−34. rejeitar-se-á a hipótese ser honesta. laranja ou vermelha: a) O valor crítico 2 χ0 .Numa urna há grande número de bolas de gude de quatro cores distintas: vermelha.25 redondas e verdes.3 ⇒ Não se pode rejeitar a teoria no nível de significância 0.84. Um par de dados pode cair de 36 maneiras. Uma amostra de 12 bolas. Testar a hipótese da moeda ser honesta.75) 34.95 para 1 grau de liberdade vale 3.01 ? b) 0.1 = 1 2 ν = 2.Em 200 lances de uma moeda.99 = 11. Exemplo 3 .33.95 = 3.95 = 7. Então: 9 . 4 amarelas e 1 verde. Exemplo 4 .75 redondas e amarelas. Exemplo 1 . Então: ν=k-1=2-1=1 j k (o − ej ) 2 =( 115−100) 100 +( 85−100 ) 100 2 se pode rejeitar a teoria no nível de significância 0. testar a hipótese de o dado ser honesto. χ 0 .47 a) para ν 2 = 3. Exemplo 2 .50 ej O número de classes é k = 2.25 +( 101−104. Assim: a) 0. no nível de significância 0.05. Testar a hipótese da urna conter proporções iguais das bolas de gude de cores diferentes.75 2 = 0.25) 104. seria esperado 3 bolas de cada cor. rejeitar-se-á a hipótese ser honesta.05 b) 0. revelou 2 vermelhas.75) 312.01. Um sete pode ocorrer de seis maneiras e um onze de 2 maneiras. Para conter proporções iguais. 108 redondas e verdes. laranja. Como 4.50 < 6. ele observou 315 redondas e amarelas. respectivamente: o1 = 115 e o2 = 85. observaram 115 caras e 85 coroas.05. χ 0 . Assim consideramos as catagorias amarela ou verde. adotadas os níveis de significância: a) 0. Sartori Bioestatística FATEC 9 • υ = (h . Os números esperados estão na proporção 9:3:3:1 (9+3+3+1=16) (9/16)556=312.01. Então: Pr{" 7"}=1/6 e : Pr{" 11"}=2/36=1/18 Em 360 lances esperar-se-ia: 360 (1/6) = 60 " setes" e 360 (1/18) = 20 " onzes". mediante o teste qui quadrado.p a de uma mulher.01. Testar a hipótese do soro auxiliar a cura da enfermidade. multiplicando-se as probabilidade por 320: Assim: χ2 = ∑ j =1 k Grupo A (Usando o soro) Grupo B (Não usando o soro) Total 75 65 140 25 35 60 100 100 200 Freqüências esperadas: Curados Não curados Total (o j − ej ) ej 2 =∑ j =1 2 5 (o j − ej ) ej +( 2 = 2 χ2 = ( 18−10) 10 2 +( 56−50) 50 2 +( 110−100) 100 +( 88−100) 100 2 40−50) 50 +( 8−10) 10 2 = 12 2 2 ν = 6 − 1 = 5. respectivamente.95 = 11.3162 0. Sartori Bioestatística FATEC 10 χ =∑ 2 j =1 2 k (o j − ej ) ej 2 2 = = 4.O recenseamento de 320 famílias com cinco crianças revelou a distribuição apresentada na tabela abaixo.99 = 15.10 Freqüências observadas: Seja p a probabilidade do nascimento de 1 homem. a frequência esperada e medida.7 29.0332 0. Comoν 74 − 60 ) 60 +( 24 − 20 ) 20 2 = 2. Dado o desenvolvimento binomial: Curados Não curados Total ( p + q)5 = ∑⎛ ⎜ ⎜ 5 5⎞ 5−i i 5 ⎟p q = p + 5 p4q +10p3q2 +10p2q3 + 5 pq4 + q5 ⎟ i=0 ⎝ i ⎠ Os valores esperados (freqüências esperadas) para famílias com 5.9 316. a todos os outros respeitos. adotando o nível de significância: a) α = 0. curaram-se da enfermidade. χ 0 . cada um de 100 pessoas que têm a mesma enfermidade.1 e 0 meninos são obtidos.05 do dado ser honesto.Dr Cláudio S.1619 0.1507 0. são formados. q =1 .2 308.05 mas não de 0. Grupo A (Usando o soro) Grupo B (Não usando o soro) Total 70 30 100 70 30 100 140 60 200 10 . os dois grupos são tratados de modo idêntico.84 ⇒ rejeita-se a hipótese no nível de significância de 0. Determinou-se que 75 e 65 pessoas dos grupos A e B.1. χ 0. mas não ao B (denominado grupo de controle). χ 0 . Exemplo 5 .95 = 3. respectivamente.07 Exercícios χ2 = ( . Dois grupos.3.0294 p = 1/32 56 110 88 40 8 320 5p4 q =5/32 10p3 q2=10/32 10p2 q5=10/32 5p q4=5/32 q5=1/32 2. É ministrado um soro ao grupo A. A tabela mostra em cada lance o número de caras. Número de Caras X 0 1 2 3 4 5 Pr {X} fe 33.4.7 150.4 fo 38 144 342 287 164 25 Tipo 5 meninos 0 meninas 4 meninos 1 meninas 3 meninos 2 meninas 2 meninos 3 meninas 1 meninos 4 meninas 0 meninos 5 meninas Total Número De famílias 18 pe(X) 5 fei 0.3087 0.01 b) α = 0.2 161. Usar o teste de chi quadrado quando lançamos 5 moedas 100 vezes.1 ⇒ pode-se rejeitar a hipótese no nível de significância de 0. Esse resultado é compatível com a hipótese dos nascimentos de homens e mulheres igualmente prováveis? 1.2. A e B.05 c) α = 0. Y e Sr. Para cada um dos itens abaixo.75 8. Consumidores suspeitaram que o tempo de duração era inferior a 30 horas.00 e desvio padrão s = R$ 30. constatou um tempo médio de espera de 43. O departamento quer substituir os retalhos por um novo produto e estima-se que uma amostra de 25 peças custaria uma média de R$ 34. na média. 9. É coerente a suspeita dos consumidores a 5% de significância? 10.01.95 horas.00. Um novo método de aprimoração aplicada em uma amostra de 11 funcionários revelou uma média de 145 minutos e desvio padrão 9.025 a) Que a média populacional µ > 16 e N = 14. Freqüências observadas: Sr. Uma bateria alcalina para radio stereo FM-AM dura pelo menos 30 horas.1.62 minutos. c) Assumindo uma distribuição t de Student com ν = 25 graus de liberdade. vale R$ 30.50 minutos e desvio padrão de 10. α = 0.00. em anos.05. É consistente a suspeita do proprietário.05.005 iv) t 0.4 9. α = 0. O diretor de uma universidade sabe que famílias com renda acima de R$ 3. há suficiente evidência para justificar a hipótese do médico? 50 5 55 47 14 61 56 8 64 153 27 180 Freqüências esperadas: Sr.000. O proprietário de uma clínica dentária suspeita que o tempo médio de atendimento em uma clínica dentária ultrapassa 40 minutos.3 horas e desvio padrão de 2. Z Total 46. Para verificar essa hipótese. Umas amostras de 10 pacientes deram os seguintes tempos. de estudantes aprovados e reprovados por 3 instrutores:Sr.47 minutos.25 55 51. Sartori Bioestatística FATEC 11 Na tabela estão indicadas os números 3. Recentes estudos mostram que para um funcionário terminar determinado trabalho leva em média 160 minutos. x =23. 5. Z . s =4 b) Que a média populacional µ < 27 e N = 9. s =7 c) Que a média populacional µ ≠ 30 e N = 6. pois analisaram uma amostra de 38 baterias e obtiveram uma média de 29. α = 0. Estabelecer o teste de hipótese para a distribuição t de Student usando uma significância de 5%.00 contribuem com uma média de R$ 600. 8. x =25. X. Testar a hipótese das proporções dos estudantes reprovados pelos 3 instrutores serem iguais. s =16 6. relativa à compra de retalhos. ele pesquisou uma amostra de 20 famílias e encontrou uma média de R$ 620. Para cada item abaixo. encontre: ii) t 0. A média gasta por ano em um departamento de uma determinada loja de roupa. a 5% de significância? 11.00 na educação de uma 11 . s =4 d) Que a média populacional µ > 125 e N = 40. Um médico suspeita que fumantes entre 40-45 anos portadores de bronquite crônica haviam fumado na média por mais de 20 anos. Sr. pelos fumantes: 22 21 19 25 24 26 23 21 23 22 Usando 1% de significância. α = 0. X Aprovados Reprovados Total Sr. x =128.25 e desvio padrão s = R$5.01 iii) i) t 0. s =18 e) Que a média populacional µ < 50 e N = 8. X Aprovados Reprovados Total Sr.48.05 teste sua hipótese. Faça o teste de hipótese para a média utilizando a distribuição t de Student. Analisando uma amostra de 18 pacientes. Assumindo α = 0.6 64 153 27 180 4. b) Assumindo uma distribuição t de Student com ν = 12 graus de liberdade.1 a) Assumindo uma distribuição t de Student com ν = 7 graus de liberdade.05 v) t 0. 7. Z Total criança por ano. x =18.Dr Cláudio S.8 5 9. resolva o teste de hipótese assumindo: t 0. Y Sr. x =70. Y Sr.15 61 54. α = 0.01. Dr Cláudio S. Sartori Bioestatística FATEC 12 12 .