Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

March 17, 2018 | Author: Cristiano Damaceno | Category: Standard Deviation, Average, Variance, Calculus, Statistical Dispersion


Comments



Description

Ivone da Silva SalsaJeanete Alves Moreira Marcelo Gomes Pereira Autores aula 10 Medidas de dispersão: ferramentas úteis na análise estatística Matemática e Realidade D I S C I P L I N A 2ª Edição Divisão de Serviços Técnicos Catalogação da publicação na Fonte. UFRN/Biblioteca Central “Zila Mamede” Copyright © 2007 Todos os direitos reservados. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização expressa da UFRN - Universidade Federal do Rio Grande do Norte. 27/06/2007 Salsa, Ivone da Silva. Matemática e realidade: interdisciplinar / Ivone da Silva Salsa, Jeanete Alves Moreira, Marcelo Gomes Pereira. – Natal, RN: EDUFRN Editora da UFRN, 2005. 292 p. 1. Métodos estatísticos. 2. Análise estatística. 3. Proporção e porcentagem. 4. Dados estaísticos. 5. Medidas de dispersão. I. Moreira, Jeanete Alves. II. Pereira, Marcelo Gomes. III. Título. ISBN 85-7273-287-X CDD 519.5 RN/UF/BCZM 2005/47 CDU 519.22 Governo Federal Presidente da República Luiz Inácio Lula da Silva Ministro da Educação Fernando Haddad Secretário de Educação a Distância – SEED Ronaldo Motta Universidade Federal do Rio Grande do Norte Reitor José Ivonildo do Rêgo Vice-Reitor Nilsen Carvalho Fernandes de Oliveira Filho Secretária de Educação a Distância Vera Lúcia do Amaral Secretaria de Educação a Distância- SEDIS Coordenadora da Produção dos Materiais Célia Maria de Araújo Projeto Gráfico Ivana Lima Revisores de Estrutura e Linguagem Eugenio Tavares Borges Marcos Aurélio Felipe Pedro Daniel Meirelles Ferreira Tatyana Mabel Nobre Barbosa Revisoras de Língua Portuguesa Janaina Tomaz Capistrano Sandra Cristinne Xavier da Câmara Ilustradora Carolina Costa Editoração de Imagens Adauto Harley Carolina Costa Diagramadores Bruno Cruz de Oliveira Maurício da Silva Oliveira Júnior Mariana Araújo Brito Thaisa Maria Simplício Lemos Imagens Utilizadas Banco de Imagens Sedis (Secretaria de Educação a Distância) - UFRN MasterClips IMSI MasterClips Collection, 1895 Francisco Blvd, East, San Rafael, CA 94901,USA. MasterFile – www.masterfile.cpom MorgueFile – www.morguefile.com Pixel Perfect Digital – www.pixelperfectdigital.com FreeImages – www.freeimages.co.uk FreeFoto.com – www.freefoto.com Free Pictures Photos – www.fre-pictures-photos.com BigFoto – www.bigfoto.com FreeStockPhotos.com – www.freestockphotos.com OneOddDude.net – www.oneodddude.net 1 2ª Edição Aula 10 Matemática e Realidade Apresentação a aula 8, vimos como as Medidas de tendência central – média, moda e mediana – representam, de forma condensada, informações sobre o comportamento de dados. Entretanto, tais medidas referem-se a valores típicos, centrais do conjunto estudado e não nos dão informações sobre como os dados estão dispostos ao redor delas. Daí, podemos ter distribuições bem diferentes, porém com a mesma média, por exemplo. Isso pode, inclusive, conduzir a interpretações equivocadas. Uma medida de centro – as referidas acima – não dá esclarecimentos para perguntas do tipo: os dados estão muito concentrados ao redor da média? Da mediana? Será que eles se apresentaram muito dispersos em relação a essas medidas? As respostas para tais questionamentos podem ser obtidas através das Medidas de Dispersão (ou Medidas de Variabilidade). É justamente esse o assunto que abordaremos nesta aula. Estudaremos as seguintes medidas de dispersão: amplitude total, desvio quartil, variância e desvio-padrão. Elas, assim como as medidas de tendência central, são indispensáveis para a descrição do comportamento dos dados estudados. O conhecimento delas, portanto, nos possibilita melhor capacidade de análise sobre o fenômeno/fato pesquisado. N Objetivos Buscamos com esta aula, ajudá-lo a construir os conceitos relacionados às medidas de dispersão, assim como, a compreender a elaboração de seus cálculos e a forma de interpretá-las. Procuraremos também fazê-lo apreender a importância de tais medidas para a descrição e análise de observações numéricas. 2 Aula 10 Matemática e Realidade 2ª Edição Descobrindo o comportamento de dados quantitativos C Essa é uma das possíveis situações que podem ocorrer quando descrevemos conjuntos de dados, sobretudo quando precisamos fazer comparações. Ela nos mostra como é necessário e importante ter as informações sobre a dispersão dos dados que buscamos analisar. Concluímos então, que mesmo uma descrição mais simples de um conjunto de observações numéricas deve ser feita a partir de, pelo menos, uma medida de Tendência Central e uma medida de Dispersão. Analisar dados apoiando-nos apenas no resultado de onsidere, como exemplo, a seguinte situação: três universitários, A, B e C, se submetem a um teste de seleção para uma bolsa de apoio técnico. Nesse teste, aconteceram seis provas, mas foram escolhidas quatro para avaliar os candidatos: Português, Matemática básica, Inglês elementar e Informática. Esses três concorrentes, no final, ficaram com a mesma média, x = 6,0 pontos nas quatro disciplinas. Será que, com essa informação, podemos dizer que as suas notas foram valores não muito diferentes, nessas provas? Em outras palavras, será que apresentaram desempenho semelhante em tais matérias? Ora, somente com a informação da média não temos condições de responder a essa questão. Não podemos saber se as pontuações dos candidatos foram valores muito próximos da média x = 6,0 ou não. Imagine, por exemplo, que esses candidatos conseguiram os seguintes resultados para as provas de Português, Matemática básica, Inglês elementar e Informática, nesta ordem: A = 6, 0 6, 0 6, 0 6, 0 r = 6 ÷ 6 ÷ 6 ÷ 6 4 = 6, 0 B = 8, 0 10, 0 10, 0 1, 0 r = 8 ÷ 10 ÷ 10 ÷ 1 4 = 6, 0 C = 6, ò 7, 0 ò, ò ò, 0 r = 6, ò ÷ 7 ÷ ò, ò ÷ ò 4 = 6, 0 Observando atentamente as notas, em cada conjunto, vemos que, em relação à média r , , o candidato A está muito bem representado por essa medida, pois suas notas coincidem exatamente com ela. Já o candidato B parece ter pouco conhecimento em Português e, além disso, não teve bom desempenho em Informática. O valor médio somente foi igual a 6,0 porque suas outras notas (Matemática e Inglês) compensaram esse baixo rendimento. Portanto, essa medida de tendência central (ao contrário do candidato A) não representa tão bem o conjunto das notas do candidato B, porque seus valores estão muito dispersos em relação a ela. Quanto ao candidato C, suas notas não estão muito afastadas do valor médio, r , pontos. Assim, elas também estão bem representadas por essa medida. 3 2ª Edição Aula 10 Matemática e Realidade uma média (ou moda ou mediana), como vimos, pode nos levar a conclusões equivocadas. Portanto, as medidas de dispersão são muito importantes e nos ajudam bastante a entender, com maior clareza, dados estatísticos. Estudaremos as seguintes: „ AMPLITUDE TOTAL : A T „ DESVIO QUARTIL : D q „ VARIÂNCIA : 2 (para dados populacionais) ou s 2 (para dados amostrais) „ DESVIO-PADRÃO : (para dados populacionais) ou S (para dados amostrais) AMPLITUDE TOTAL: A T É a medida de dispersão mais simples que existe. Seu cálculo baseia-se apenas em dois valores de um conjunto numérico, os extremos, e não considera os demais. Por isso, nos dá apenas uma “rápida” indicação da dispersão e, conseqüentemente, tem pouca utilidade quando queremos dispor de informações mais apuradas sobre a variabilidade dos dados. Definimos a Amplitude total (A T ) de um conjunto numérico como o resultado da diferença entre o maior e o menor valor, observados nesse conjunto. Ou seja, A T = (maior valor) − (menor valor) Quando estudamos as distribuições de freqüências, na aula 5 (Dados quantitativos: como organizá-los?) Vimos essa medida, lembra? No caso desse exemplo, o resultado dessa medida é: candidatos: A ŸA T = 6,0 − 6,0 = 0 B ŸA T = 10,0 − 1,0 = 9,0 C ŸA T = 7,0 − 5,0 = 2,0 Como podemos ver, as notas do candidato B apresentaram uma dispersão muito mais alta que as dos demais, enquanto as do candidato A apresentaram dispersão nula e, em relação ao C, a dispersão foi pequena. Isso significa que os dados em A não variaram; em B, apresentaram grande variabilidade; e em C, pouca variação. Observação – (letra grega – sigma minúsculo) 4 Aula 10 Matemática e Realidade 2ª Edição DESVIO QUARTIL: D q Quando estudamos as separatrizes na aula 9 (As separatrizes na análise de dados estatísticos), vimos que os quartis dividem um conjunto de dados ordenados em 4 partes iguais. Esquematicamente, temos: Vamos ver um exemplo? Retome a aula 9, que trata das separatrizes. Com base na distribuição das médias de Matemática na amostra das turmas da manhã (Tabela 1), encontramos: Q 1 = 6,2 e Q 3 = 8,5. Então, nesse caso, o desvio quartil será: Atividade 1 Na auto-avaliação da aula 9, a primeira questão solicitava que você calculasse algumas separatrizes, entre elas os três quartis para as notas de Matemática da amostra das turmas da noite. Com esses valores, calcule o desvio quartil para essa distribuição e compare seu resultado com o da amostra da manhã que acabamos de calcular. Qual dessas duas amostras apresenta maior variação em relação a seus dados? , , 2 2 = 2, 8 2 = 1, 1ò = 1, 1ò pontos. Como vemos, entre o 1 o quartil ( ) e o 3 o ( ) se encontram 50/ (a metade) dos valores centrais de um conjunto de dados. O desvio quartil ( ) se baseia nesses dois quartis: e . Ele é o resultado que se obtém por meio da expressão: 5 2ª Edição Aula 10 Matemática e Realidade VARIÂNCIA: σ 2 (para dados populacionais) ou s 2 (para dados amostrais) Todas as somas foram iguais a zero! Será isso pura coincidência? Não. Isso é uma propriedade da média. Em qualquer situação, teremos: a soma dos desvios dos valores de um conjunto, em relação à sua média é sempre igual a zero. Esse resultado significa que a média é uma medida que reflete o ponto de equilíbrio dos dados. Diante disso, a soma dos desvios não pode servir como uma medida para nos informar sobre a dispersão dos dados, em relação à média. Para contornar esse problema, podemos: ou considerar o valor absoluto desses desvios (função módulo) ou elevar cada um deles a um expoente par, pois, assim, qualquer resultado negativo passa a ser positivo. (No caso, podemos considerar os desvios ao quadrado, pois o expoente dois simplifica os cálculos). Dessa forma, a soma do quadrado de todos os desvios nunca será nula, exceto se, e somente se, todos os valores do conjunto coincidirem com a média (esse fato indicará que não há dispersão entre os dados). = r média Parece intuitivo que, quanto mais os valores de uma série se distanciaremda sua média, maior deve ser a soma desses desvios, não é mesmo? Então, talvez nós pudéssemos usar essa soma como uma medida de dispersão. Vamos, então, calcular os desvios em relação à média (r = 6, ) para as notas de cada candidato (A, B e C), somar os desvios em cada conjunto e ver o que podemos concluir? Acompanhe os cálculos: Portanto, ( média) = 0, sempre. Essa medida de dispersão, muito utilizada na estatística mais avançada, é baseada nos desvios de cada valor observado, em relação à média (). Portanto, ela considera, além dessa medida de tendência central, todas as observações do conjunto estudado. Mas, o que quer dizer “desvios em relação à média”? Definimos desvio em relação à média ( ) como sendo o valor obtido pela expressão: Desvios A B C (x 1 x) (6 6) = 0 (8 6) = 8 (6,ò 6) = 0,ò (x 2 x) (6 6) = 0 (10 6) = 4 (7 6) = 1 (x 8 x) (6 6) = 0 (10 6) = 4 (ò,ò 6) = 0,ò (x 4 x) (6 6) = 0 (1 6) = ò (ò 6) = 1 Soma dos Desvios 0 0 0 6 Aula 10 Matemática e Realidade 2ª Edição Porém, utilizar apenas a soma do quadrado dos desvios para comparar situações pode nos levar a grandes equívocos, quando os conjuntos de dados tiverem números diferentes de elementos. Diante disso, como podemos usar os desvios para medir a dispersão dos dados? Uma maneira simples é utilizar a média aritmética do quadrado desses desvios (isso na realidade é a média quadrática dos desvios). Daí vem, justamente, a definição matemática dessa medida de dispersão. A variância de um conjunto qualquer de valores é a média quadrática dos desvios tomados em relação à média desse conjunto. Variância para dados não tabelados Quando os dados são isolados (não tabelados), o cálculo da variância é obtido através das fórmulas: Note que, na equação (2) (dados amostrais), o denominador é n−1. Essa pequena modificação proporciona uma estimativa melhor para a variância. Entretanto, não apresentaremos a prova desse fato, visto que requer um nível mais avançado de conhecimentos na área da Inferência Estatística, e não faz parte dos objetivos deste curso. Atividade 2 Vamos calcular o quadrado dos desvios para os conjuntos A, B e C e depois somá-los para obter a variância? Faça os cálculos e em seguida confira com os resultados apresentados na tabela seguinte. para dados populacionais: = (r ) (equação 1); e amostrais: = (r r) 1 (equação 2). 7 2ª Edição Aula 10 Matemática e Realidade Calcularemos s 2 , pois as quatro disciplinas escolhidas constituem uma amostra das seis. Portanto, temos: Podemos ver que o conjunto B apresentou uma variabilidade muito maior que os demais. Daí concluímos que seus valores não estão muito concentrados ao redor da sua média. Desenvolvendo-se algebricamente as expressões (1) e (2), e após as devidas simplificações, podemos reescrevê-las, respectivamente para 2 e s 2 , da forma: Embora essas novas fórmulas possam parecer mais complicadas, elas, na verdade, exigem cálculos bastante simples. Você precisa apenas calcular duas somas: uma, referente ao quadrado de cada observação, e a outra, ao total de todos os dados. Como exemplo, vamos calcular a variância para os dados do Censo de 2000, relativos às taxas de Mortalidade Infantil até 1 ano, dos 8 municípios que compõem a região metropolitana de Natal. Essas taxas representam a mortalidade de crianças menores de 1 ano em 1.000 nascidos vivos. Obs.: deixe sempre o resultado da variância com pelo menos 4 casas decimais, pois isso será importante para o cálculo do desvio-padrão que veremos mais adiante. \ o:( ) = (r r) n 1 = 0 8 = 0 \ o:() = : = 77 8 = 22 (pontos) \ o:() = : = 2, ò 8 = 0, 8888 (pontos) . = ( ) = (equação 3) e = ( ) 1 = 1 (equação 4) Desvios 2 =(x 1 x) 2 A B C (x 1 6) 2 0 0 0,2ò (x 1 6) 2 0 16 1,0 (x 1 6) 2 0 16 0,2ò (x 1 6) 2 0 2ò 1,0 Soma 0 66 2,ò 8 Aula 10 Matemática e Realidade 2ª Edição Tabela 1 – Cálculos auxiliares para obtenção da variância. A variância é uma medida de dispersão que assume valores maiores ou iguais a zero, porque é uma média quadrática, portanto nunca será um número negativo. Para efeito de análise, quanto maior a variância (quanto mais distante do zero), maior é a dispersão dos dados em relação à média. Atividade 3 Os dados apresentados a seguir foram obtidos do Atlas de Desenvolvimento Humano no Brasil e referem-se ao percentual * de analfabetismo funcional (menos de quatro anos de estudo) de pessoas com 15 anos ou mais em seis municípios da microrregião de Sousa (Paraíba), dos anos: 1991: 73 67 70 60 69 77 2000: 57 57 62 53 61 68 *Esses percentuais foram arredondados para facilitar os cálculos. Calcule a média e a variância para cada ano, comparando os resultados dos mesmos em relação à variabilidade dos dados. Os dados são: 48,86 40,16 43,96 36,53 48,41 38,10 35,26 36,99 Para facilitar os cálculos, construímos a tabela a seguir: = 1 = (186 8 2) (828 2 ) 8 = 186 8 2 184 0 1= = 20 08 (óbitos1000) x i x 2 i 8ò,26 1.248,27 86,ò8 1.884,44 86,00 1.868,26 88,10 1.4ò1,61 40,16 1.612,88 48,06 1.082,48 48,41 2.848.ò8 48,86 2.887,80 ¦x i 2 = 828,27 ¦x i 2 = 18.678,72 9 2ª Edição Aula 10 Matemática e Realidade Variância para dados agrupados em tabelas de freqüências Para dados agrupados em distribuições de freqüências, temos, respectivamente, as seguintes fórmulas para a variância populacional e para a amostral: Observe que agora trabalharemos com as freqüências e que a variação do índice no somatório vai de 1 a k, que representa exatamente a quantidade de valores assumidos pela variável estudada ou o número de intervalos, quando trabalhamos com dados agrupados em classes. Os valores x i são substituídos pelos pontos médios dos intervalos quando se trabalha com dados agrupados em classes. Vamos acompanhar duas situações através dos exemplos 1 e 2 para que você possa se familiarizar melhor com as fórmulas apresentadas. Exemplo 1 Retomaremos a aula 5 em que temos a pontuação no teste objetivo de Matemática numa amostra de 54 alunos da 8ª série/manhã, exposta na Tabela 2, que a seguir apresentamos. Observe que as duas últimas colunas da tabela são suficientes para a obtenção dos valores que serão utilizados na fórmula da variância. Veja também que a variável pontuação (X i ) assume 6 valores distintos, isto significa que: k = 6. (equação 5) e 1 (equação 6) 10 Aula 10 Matemática e Realidade 2ª Edição Fonte: Dados fictícios Como se trata de uma amostra, calcularemos s 2 ao invés de . Agora que temos todos os elementos, deveremos aplicar a equação (6): Atividade 4 Na aula 8, pedimos para você calcular a média para a pontuação no teste objetivo de Matemática na amostra das turmas da 8ª série/noite. Agora, calcule a variância e compare o resultado com o que acabamos de encontrar. Exemplo 2 A Tabela 3 que segue exibe dados agrupados em intervalos de classe. Vamos aprender como se calcula a variância, em situações como esta. Você se lembra que, nesse caso (dados agrupados em classes), x i se refere ao ponto médio de cada intervalo e representa todos os valores contidos em sua respectiva classe? Para facilitar os cálculos da variância, foram acrescentadas as três últimas colunas, tal como foi feito no exemplo 1. Tabela 2 – Pontuação no teste objetivo de Matemática, na amostra das turmas da 8 a série/manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. 1 77 (87) ò4 ò8 77 ò7 77 ò8 1 74 (pontos) . Pontuação x i Nº de alunos f i x i f i x 2 i f i 4 2 8 4 2 x 2 = 82 ò 8 40 ò 2 x 8 = 200 6 10 60 6 2 x 10 = 860 7 1ò 10ò 7 2 x 1ò = 78ò 8 12 06 8 2 x 12 = 768 0 7 68 0 2 x 7 = ò67 TOTAL ¦f i = f = ò4 ¦x i f i = 872 ¦x i 2 f i = 2.662 11 2ª Edição Aula 10 Matemática e Realidade Fonte: Dados fictícios Atividade 5 A Tabela 4 mostra o percentual de indigentes, com base no Censo de 1991, dos estados brasileiros. Calcule a variância apresentada por esses dados. Fonte: Atlas do Desenvolvimento Humano no Brasil Tabela 3 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8 a série/ manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Tabela 4 – Percentual de indigentes dos estados brasileiros, 1991. 1 8011 = (8 4) =4 =8 8011 =2 74 74 =8 8 7 (pontos) . Notas (médias) Nº de alunos (f i ) Ponto médio (x i ) x i f i x i 2 x 2 i f i 8 ` 4 2 8,ò 7,0 12,2ò 12,2ò x 2 = 24,ò0 4 ` ò 8 4,ò 18,ò 20,2ò 20,2ò x 8 = 60,70 ò ` 6 7 ò,ò 88,ò 80,2ò 80,2ò x 7 = 211,7ò 6 ` 7 8 6,ò ò2,0 42,2ò 42,2ò x 8 = 888,00 7 ` 8 14 7,ò 10ò,0 ò6,2ò ò6,2ò x 14 = 787,ò0 8 ` 0 12 8,ò 102,0 72,2ò 72,2ò x 12 = 867,00 0 ` 10 8 0,ò 76,0 00,2ò 00,2ò x 8 = 722,00 TOTAL ò4 804,0 8.011,ò0 % de indigentes classes Nº de Municípios f i 8 ` 11 8 11 ` 10 8 10 ` 27 ò 27 ` 8ò 6 8ò ` 48 4 48 ` ò1 1 TOTAL 20 12 Aula 10 Matemática e Realidade 2ª Edição DESVIO-PADRÃO: (para dados populacionais) ou s (para dados amostrais) A variância é uma importante medida de dispersão, entretanto, seu resultado é dado em unidade de medida que é o quadrado da original. Algumas dessas medidas não têm nenhum sentido prático, como na atividade referente à mortalidade infantil. Como avaliar, por exemplo, kg 2 , (Salário mínimo) 2 , anos 2 , pontos 2 etc.? Então, como alternativa para contornar esse problema, existe uma medida denominada desvio-padrão, definida como a raiz quadrada positiva da variância. Assim, Considerando todos os cálculos anteriores obtidos para a variância, vamos calcular o desvio-padrão. No exemplo, das notas dos candidatos (cujos resultados da variância estão na página 9) temos: Como podemos observar, o desvio-padrão associado ao candidato B é muito maior do que os demais. Isso significa que as notas desse candidato apresentaram-se bastante dispersas ao redor da média 6,0. Para os dados referentes à Mortalidade Infantil, a variância e o respectivo desvio-padrão são: Considerando as notas da amostra das turmas da 8 a série/manhã, no teste objetivo, e as médias trimestrais em Matemática, teremos os seguintes desvios-padrão: Obs.: tanto a variância quanto o desvio-padrão são medidas largamente usadas na Estatística Inferencial. Na Estatística Descritiva, que é o nosso caso, essas medidas têm sentido, principalmente, quando comparamos conjunto de dados de mesma natureza e que apresentam médias com valores aproximados. Desvio-padrão populacional: ÷ ; Desvio-padrão amostral: ÷ . Var(A)= = = = ; Var(B)= = = = 4, 60 pontos; Var(C)= = , 888 = , 888 = , 0 pontos. 8 (óbitos). teste objetivo: = 1, 2 = 1, 2 = 1, 8 pontos; médias trimestrais: = 8, 00 = 8, 00 = 1, 0 pontos. 13 2ª Edição Aula 10 Matemática e Realidade Atividade 6 Calcule o desvio-padrão para os percentuais (%) de indigentes apresentados na Tabela 4 (atividade 5). Para entendermos melhor o desvio-padrão, imagine, por exemplo, o tempo de espera numa fila de um banco durante uma semana típica. O tempo médio de espera dos clientes durante esse período independe da fila ser única ou não. Entretanto, os clientes ficam muito mais satisfeitos quando estão em fila única, uma vez que o tempo de espera, por não depender de um caixa em particular, se distribui de forma mais homogênea ao redor do tempo médio. Quando não há fila única, alguns clientes esperam mais do que outros, dependendo do caixa, fato que causa insatisfação. Essa situação reflete que a tomada de decisão dos bancos ao se optar por fila única, provavelmente se baseou em um estudo da variabilidade apresentada pelo tempo de espera dos clientes, que, no caso da fila única, diminui bastante. O desvio-padrão é a medida de dispersão mais utilizada, universalmente, na análise de dados, tendo se tornado um apoio indispensável na tomada de decisão. A seguir, apresentamos a Figura 1 que mostra uma distribuição de dados simétrica, ou seja, que apresenta média, moda e mediana iguais. Nessas distribuições, verifica-se que cerca de 68,26% dos dados estão a menos de 1 desvio-padrão da média; 95,45% dos dados estão a menos de dois desvios padrão e 99,7% dos dados estão a menos de três desvios padrão. Os valores que estão a mais de 3 desvios-padrão são considerados discrepantes dos demais. Como entender o desvio-padrão? 95,45% P P2V P2V Figura 1 – Distribuição simétrica 14 Aula 10 Matemática e Realidade 2ª Edição Resumo Os fenômenos que pesquisamos e exploramos com ferramentas estatísticas estão associados a dados que se apresentam de forma variada. Estudar como as observações coletadas estão se comportando em relação à variabilidade é de grande importância para o conhecimento da variável pesquisada. Neste texto, abordamos quatro medidas – amplitude total, desvio quartil, desvio-padrão e variância – utilizadas no estudo da dispersão ou variabilidade de dados estatísticos. Apresentamos o conceito e os cálculos referentes a cada uma delas. Mostramos – com ênfase através de exemplos – o importante papel que elas desempenham na descrição e análise de dados quantitativos. Encaminhamos várias situações para auxiliar no estudo e compreensão deste tema. Auto-avaliação Abaixo, reproduzimos a tabela que mostra as médias de Matemática da amostra das turmas da noite, apresentada na aula 6 (Gráficos representativos de uma distribuição de freqüências): 1 Fonte: Dados Fictícios Tabela 5 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8 a série/ noite, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Assim, o conhecimento de uma medida de tendência central (a média) e de uma medida de dispersão nos permite descrever com mais detalhes (e muito menor risco de equívocos) um conjunto de dados. Notas (médias) Nº de alunos (fi) 8 ` 4 6 4 ` ò 12 ò ` 6 14 6 ` 7 8 7 ` 8 ò 8 ` 0 4 0 ` 10 8 Total ò2 15 2ª Edição Aula 10 Matemática e Realidade Com base nessa Tabela, calcule a variância e o desvio-padrão e compare-os com essas mesmas medidas calculadas no decorrer da aula para a amostra das turmas da manhã. Faça comentários pertinentes ao contexto. Os dados a seguir referem-se ao Índice de Desenvolvimento Humano (IDH) de algumas capitais nordestinas, obtidos com dados dos Censos de 1991 e 2000. Tabela 6 – Índice de Desenvolvimento Humano nos anos de 1991 e 2000 de algumas capitais nordestinas. Capitais IDH-1991 IDH-2000 Fortaleza 0,688 0,767 Maceió 0,660 0,724 Natal 0,689 0,762 Recife 0,715 0,780 Salvador 0,735 0,794 São Luís 0,707 0,766 Fonte: Atlas do Desenvolvimento Humano no Brasil Obtenha, para cada ano, as seguintes medidas de variabilidade: a) amplitude total; b) variância; c) desvio-padrão. Faça comparações entre os anos de 1991 e 2000, usando as medidas calculadas. 2 Referências AZEVEDO, P. R. Introdução à estatística. Natal: EDUFRN, 2005. BARBETTA, P. A. Estatística aplicada às ciências sociais. Florianópolis: Ed. da UFSC, 2002. MOORE, D. A estatística básica e sua prática. Tradução de Alfredo Alves de Farias. Rio de Janeiro: LTC, 2000. PEREIRA, W.; TANAKA, O. K. Estatística: conceitos básicos. 2.ed. São Paulo: McGraw-Hill, 1990. 16 Aula 10 Matemática e Realidade 2ª Edição PROGRAMA DAS NAÇÕES UNIDAS PARA O DESENVOLVIMENTO (PNUD). Atlas do Desenvolvimento Humano no Brasil. Indicadores de Vulnerabilidade Familiar, 1991 e 2000, municípios da microrregião Cariri Ocidental (Paraíba). Disponível em: <http://www.pnud.org. br/> Acesso em 31/05/2005. TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2.ed. São Paulo: Atlas, 1985. TRIOLA, M. F. Introdução à estatística. Tradução de Alfredo Alves de Farias. 7.ed. Rio de Janeiro: LTC, 1999. Anotações USA. Moreira.oneodddude.SEDIS Coordenadora da Produção dos Materiais Célia Maria de Araújo Projeto Gráfico Ivana Lima Revisores de Estrutura e Linguagem Eugenio Tavares Borges Marcos Aurélio Felipe Pedro Daniel Meirelles Ferreira Tatyana Mabel Nobre Barbosa Divisão de Serviços Técnicos Catalogação da publicação na Fonte.freefoto. San Rafael.com – www. 1. 1895 Francisco Blvd. Proporção e porcentagem. 2. . Medidas de dispersão.com FreeStockPhotos.com FreeImages – www. – Natal. Jeanete Alves Moreira.pixelperfectdigital. 5.com Free Pictures Photos – www.net – www. Pereira. 4.morguefile. RN: EDUFRN Editora da UFRN. 292 p. MasterFile – www.com Pixel Perfect Digital – www. Marcelo Gomes. Ivone da Silva. East. UFRN/Biblioteca Central “Zila Mamede” Salsa. CA 94901. 3. Marcelo Gomes Pereira. III.freeimages.com OneOddDude.UFRN MasterClips IMSI MasterClips Collection. Título.bigfoto.com – www. I. Matemática e realidade: interdisciplinar / Ivone da Silva Salsa. ISBN 85-7273-287-X RN/UF/BCZM CDD 519.cpom MorgueFile – www. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização expressa da UFRN . Dados estaísticos. II.fre-pictures-photos.uk FreeFoto.5 CDU 519. 2005.22 2005/47 27/06/2007 Copyright © 2007 Todos os direitos reservados.Governo Federal Presidente da República Luiz Inácio Lula da Silva Ministro da Educação Fernando Haddad Secretário de Educação a Distância – SEED Ronaldo Motta Revisoras de Língua Portuguesa Janaina Tomaz Capistrano Sandra Cristinne Xavier da Câmara Ilustradora Carolina Costa Editoração de Imagens Adauto Harley Carolina Costa Diagramadores Bruno Cruz de Oliveira Maurício da Silva Oliveira Júnior Mariana Araújo Brito Thaisa Maria Simplício Lemos Imagens Utilizadas Banco de Imagens Sedis (Secretaria de Educação a Distância) . Jeanete Alves.freestockphotos.Universidade Federal do Rio Grande do Norte. Métodos estatísticos.masterfile.co. Análise estatística.com BigFoto – www.net Universidade Federal do Rio Grande do Norte Reitor José Ivonildo do Rêgo Vice-Reitor Nilsen Carvalho Fernandes de Oliveira Filho Secretária de Educação a Distância Vera Lúcia do Amaral Secretaria de Educação a Distância. centrais do conjunto estudado e não nos dão informações sobre como os dados estão dispostos ao redor delas. É justamente esse o assunto que abordaremos nesta aula.Apresentação N a aula 8. informações sobre o comportamento de dados. podemos ter distribuições bem diferentes. 2ª Edição Aula 10 Matemática e Realidade 1 . porém com a mesma média. Entretanto. Isso pode. Uma medida de centro – as referidas acima – não dá esclarecimentos para perguntas do tipo: os dados estão muito concentrados ao redor da média? Da mediana? Será que eles se apresentaram muito dispersos em relação a essas medidas? As respostas para tais questionamentos podem ser obtidas através das Medidas de Dispersão (ou Medidas de Variabilidade). Objetivos Buscamos com esta aula. a compreender a elaboração de seus cálculos e a forma de interpretá-las. Procuraremos também fazê-lo apreender a importância de tais medidas para a descrição e análise de observações numéricas. assim como as medidas de tendência central. ajudá-lo a construir os conceitos relacionados às medidas de dispersão. inclusive. desvio quartil. por exemplo. Daí. variância e desvio-padrão. O conhecimento delas. assim como. Estudaremos as seguintes medidas de dispersão: amplitude total. são indispensáveis para a descrição do comportamento dos dados estudados. portanto. de forma condensada. conduzir a interpretações equivocadas. tais medidas referem-se a valores típicos. moda e mediana – representam. vimos como as Medidas de tendência central – média. Elas. nos possibilita melhor capacidade de análise sobre o fenômeno/fato pesquisado. Esses três concorrentes.Descobrindo o comportamento de dados quantitativos C onsidere. vemos que.0 pontos nas quatro disciplinas. pois suas notas coincidem exatamente com ela. podemos dizer que as suas notas foram valores não muito diferentes. Concluímos então. A. não teve bom desempenho em Informática. porque seus valores estão muito dispersos em relação a ela.0 porque suas outras notas (Matemática e Inglês) compensaram esse baixo rendimento. além disso. por exemplo.0 ou não. suas notas não estão muito afastadas do valor médio. se submetem a um teste de seleção para uma bolsa de apoio técnico. que mesmo uma descrição mais simples de um conjunto de observações numéricas deve ser feita a partir de. B e C. Será que. em relação à média . Não podemos saber se as pontuações dos candidatos foram valores muito próximos da média x = 6. sobretudo quando precisamos fazer comparações. como exemplo. a seguinte situação: três universitários. com essa informação. mas foram escolhidas quatro para avaliar os candidatos: Português. que esses candidatos conseguiram os seguintes resultados para as provas de Português. O valor médio somente foi igual a 6. pelo menos. Imagine. x = 6. aconteceram seis provas. Assim. Quanto ao candidato C. Inglês elementar e Informática. será que apresentaram desempenho semelhante em tais matérias? Ora. nessas provas? Em outras palavras. Portanto. Já o candidato B parece ter pouco conhecimento em Português e. Nesse teste. essa medida de tendência central (ao contrário do candidato A) não representa tão bem o conjunto das notas do candidato B. no final. em cada conjunto. Analisar dados apoiando-nos apenas no resultado de 2 Aula 10 Matemática e Realidade 2ª Edição . Matemática básica. Essa é uma das possíveis situações que podem ocorrer quando descrevemos conjuntos de dados. ficaram com a mesma média. somente com a informação da média não temos condições de responder a essa questão. elas também estão bem representadas por essa medida. pontos. o candidato A está muito bem representado por essa medida. nesta ordem: A= B= C= Observando atentamente as notas. Ela nos mostra como é necessário e importante ter as informações sobre a dispersão dos dados que buscamos analisar. Inglês elementar e Informática. Matemática básica. uma medida de Tendência Central e uma medida de Dispersão. 0 Como podemos ver. pouca variação. os extremos. 2ª Edição Aula 10 Matemática e Realidade 3 . Ou seja.uma média (ou moda ou mediana). em B. nos dá apenas uma “rápida” indicação da dispersão e.0 − 5. enquanto as do candidato A apresentaram dispersão nula e. tem pouca utilidade quando queremos dispor de informações mais apuradas sobre a variabilidade dos dados. e em C.0 = 9. AT = (maior valor) − (menor valor) Quando estudamos as distribuições de freqüências. pode nos levar a conclusões equivocadas. as notas do candidato B apresentaram uma dispersão muito mais alta que as dos demais. apresentaram grande variabilidade. Estudaremos as seguintes: AMPLITUDE TOTAL : AT DESVIO QUARTIL : Dq VARIÂNCIA : 2 (para dados populacionais) ou s2 (para dados amostrais) DESVIO-PADRÃO : (para dados populacionais) ou S (para dados amostrais) Observação – (letra grega – sigma minúsculo) AMPLITUDE TOTAL: AT É a medida de dispersão mais simples que existe. a dispersão foi pequena. conseqüentemente. Isso significa que os dados em A não variaram. na aula 5 (Dados quantitativos: como organizá-los?) Vimos essa medida. o resultado dessa medida é: candidatos: A B C AT = 6.0 = 2. como vimos.0 = 0 AT = 10. observados nesse conjunto. Seu cálculo baseia-se apenas em dois valores de um conjunto numérico. Portanto. lembra? No caso desse exemplo. Por isso. e não considera os demais. Definimos a Amplitude total (AT) de um conjunto numérico como o resultado da diferença entre o maior e o menor valor.0 AT = 7. dados estatísticos. as medidas de dispersão são muito importantes e nos ajudam bastante a entender. com maior clareza.0 − 6.0 − 1. em relação ao C. vimos que os quartis dividem um conjunto de dados ordenados em 4 partes iguais. Com esses valores. que trata das separatrizes. ) se encontram 50 (a metade) dos O desvio quartil ( ) se baseia nesses dois quartis: obtém por meio da expressão: e . o desvio quartil será: pontos.2 e Q3= 8. Ele é o resultado que se Vamos ver um exemplo? Retome a aula 9. Qual dessas duas amostras apresenta maior variação em relação a seus dados? 4 Aula 10 Matemática e Realidade 2ª Edição . Com base na distribuição das médias de Matemática na amostra das turmas da manhã (Tabela 1). Esquematicamente. entre elas os três quartis para as notas de Matemática da amostra das turmas da noite. a primeira questão solicitava que você calculasse algumas separatrizes. entre o 1o quartil ( ) e o 3o ( valores centrais de um conjunto de dados.5. encontramos: Q1= 6. Atividade 1 Na auto-avaliação da aula 9.DESVIO QUARTIL: Dq Quando estudamos as separatrizes na aula 9 (As separatrizes na análise de dados estatísticos). temos: Como vemos. calcule o desvio quartil para essa distribuição e compare seu resultado com o da amostra da manhã que acabamos de calcular. Então. nesse caso. (No caso. em relação à sua média é sempre igual a zero. e somente se. 2ª Edição Aula 10 Matemática e Realidade 5 . Dessa forma. exceto se. Mas. não é mesmo? Então. Diante disso. sempre. Para contornar esse problema. Esse resultado significa que a média é uma medida que reflete o ponto de equilíbrio dos dados. média . talvez nós pudéssemos usar essa soma como uma medida de dispersão.VARIÂNCIA: σ2 (para dados populacionais) ou 2 s (para dados amostrais) Essa medida de dispersão. a soma do quadrado de todos os desvios nunca será nula. qualquer resultado negativo passa a ser positivo. então. em relação à média. todos os valores do conjunto coincidirem com a média (esse fato indicará que não há dispersão entre os dados). pois o expoente dois simplifica os cálculos). ela considera. maior deve ser a soma desses desvios. a soma dos desvios não pode servir como uma medida para nos informar sobre a dispersão dos dados. pois. é baseada nos desvios de cada valor observado. Isso é uma propriedade da média. podemos considerar os desvios ao quadrado. quanto mais os valores de uma série se distanciarem da sua média. calcular os desvios em relação ) para as notas de cada candidato (A. em relação à média ( ). podemos: ou considerar o valor absoluto desses desvios (função módulo) ou elevar cada um deles a um expoente par. todas as observações do conjunto estudado. B e C). assim. Portanto. o que quer dizer “desvios em relação à média”? Definimos desvio em relação à média ( ) como sendo o valor obtido pela expressão: média Parece intuitivo que. Vamos. somar os desvios em cada à média ( conjunto e ver o que podemos concluir? Acompanhe os cálculos: Desvios x x x x x x x x A B C Soma dos Desvios Todas as somas foram iguais a zero! Será isso pura coincidência? Não. Em qualquer situação. muito utilizada na estatística mais avançada. além dessa medida de tendência central. teremos: a soma dos desvios dos valores de um conjunto. Portanto. o denominador é n−1. o cálculo da variância é obtido através das fórmulas: para dados populacionais: (equação 1). Entretanto. utilizar apenas a soma do quadrado dos desvios para comparar situações pode nos levar a grandes equívocos. Daí vem. a definição matemática dessa medida de dispersão.Porém. Atividade 2 Vamos calcular o quadrado dos desvios para os conjuntos A. justamente. Essa pequena modificação proporciona uma estimativa melhor para a variância. 6 Aula 10 Matemática e Realidade 2ª Edição . Variância para dados não tabelados Quando os dados são isolados (não tabelados). como podemos usar os desvios para medir a dispersão dos dados? Uma maneira simples é utilizar a média aritmética do quadrado desses desvios (isso na realidade é a média quadrática dos desvios). não apresentaremos a prova desse fato. A variância de um conjunto qualquer de valores é a média quadrática dos desvios tomados em relação à média desse conjunto. Note que. e não faz parte dos objetivos deste curso. quando os conjuntos de dados tiverem números diferentes de elementos. Diante disso. e amostrais: (equação 2). B e C e depois somá-los para obter a variância? Faça os cálculos e em seguida confira com os resultados apresentados na tabela seguinte. na equação (2) (dados amostrais). visto que requer um nível mais avançado de conhecimentos na área da Inferência Estatística. Daí concluímos que seus valores não estão muito concentrados ao redor da sua média. e a outra. elas. Como exemplo. 2ª Edição Aula 10 Matemática e Realidade 7 . exigem cálculos bastante simples. Essas taxas representam a mortalidade de crianças menores de 1 ano em 1. podemos reescrevê-las.Desvios x x x x x x A B C Soma Calcularemos s2.000 nascidos vivos.: deixe sempre o resultado da variância com pelo menos 4 casas decimais. relativos às taxas de Mortalidade Infantil até 1 ano. Você precisa apenas calcular duas somas: uma. respectivamente para 2 e s . temos: (pontos) (pontos) . ao total de todos os dados. Desenvolvendo-se algebricamente as expressões (1) e (2). Obs. pois isso será importante para o cálculo do desvio-padrão que veremos mais adiante. pois as quatro disciplinas escolhidas constituem uma amostra das seis. Portanto. dos 8 municípios que compõem a região metropolitana de Natal. referente ao quadrado de cada observação. da forma: (equação 3) e (equação 4) Embora essas novas fórmulas possam parecer mais complicadas. Podemos ver que o conjunto B apresentou uma variabilidade muito maior que os demais. na verdade. vamos calcular a variância para os dados do Censo de 2000. e após as devidas 2 simplificações. portanto nunca será um número negativo. 8 Aula 10 Matemática e Realidade 2ª Edição . quanto maior a variância (quanto mais distante do zero). maior é a dispersão dos dados em relação à média.41 38.86 40.53 48. xi xi xi xi óbitos A variância é uma medida de dispersão que assume valores maiores ou iguais a zero. Atividade 3 Os dados apresentados a seguir foram obtidos do Atlas de Desenvolvimento Humano no Brasil e referem-se ao percentual* de analfabetismo funcional (menos de quatro anos de estudo) de pessoas com 15 anos ou mais em seis municípios da microrregião de Sousa (Paraíba). Para efeito de análise. porque é uma média quadrática. dos anos: 1991: 73 67 70 60 69 77 2000: 57 57 62 53 61 68 *Esses percentuais foram arredondados para facilitar os cálculos.26 36. Calcule a média e a variância para cada ano.Os dados são: 48.96 36.16 43.99 Para facilitar os cálculos.10 35. comparando os resultados dos mesmos em relação à variabilidade dos dados. construímos a tabela a seguir: Tabela 1 – Cálculos auxiliares para obtenção da variância. que representa exatamente a quantidade de valores assumidos pela variável estudada ou o número de intervalos. isto significa que: k = 6. temos. 2ª Edição Aula 10 Matemática e Realidade 9 . Observe que as duas últimas colunas da tabela são suficientes para a obtenção dos valores que serão utilizados na fórmula da variância. Os valores xi são substituídos pelos pontos médios dos intervalos quando se trabalha com dados agrupados em classes. as seguintes fórmulas para a variância populacional e para a amostral: (equação 5) e (equação 6) Observe que agora trabalharemos com as freqüências e que a variação do índice no somatório vai de 1 a k.Variância para dados agrupados em tabelas de freqüências Para dados agrupados em distribuições de freqüências. Exemplo 1 Retomaremos a aula 5 em que temos a pontuação no teste objetivo de Matemática numa amostra de 54 alunos da 8ª série/manhã. Vamos acompanhar duas situações através dos exemplos 1 e 2 para que você possa se familiarizar melhor com as fórmulas apresentadas. Veja também que a variável pontuação (Xi) assume 6 valores distintos. exposta na Tabela 2. respectivamente. quando trabalhamos com dados agrupados em classes. que a seguir apresentamos. município de Carapeba. em situações como esta. 10 Aula 10 Matemática e Realidade 2ª Edição . E. foram acrescentadas as três últimas colunas. calcularemos s2 ao invés de . Pontuação xi Nº de alunos fi xi fi x i fi TOTAL Fonte: Dados fictícios fi f xi fi xi fi Como se trata de uma amostra. Você se lembra que. Atividade 4 Na aula 8. calcule a variância e compare o resultado com o que acabamos de encontrar. tal como foi feito no exemplo 1. Nair Burégio. em abril de 2004. pedimos para você calcular a média para a pontuação no teste objetivo de Matemática na amostra das turmas da 8ª série/noite. deveremos aplicar a equação (6): pontos . Exemplo 2 A Tabela 3 que segue exibe dados agrupados em intervalos de classe. Agora que temos todos os elementos. xi se refere ao ponto médio de cada intervalo e representa todos os valores contidos em sua respectiva classe? Para facilitar os cálculos da variância.Tabela 2 – Pontuação no teste objetivo de Matemática. nesse caso (dados agrupados em classes). Agora. na E. Vamos aprender como se calcula a variância. na amostra das turmas da 8a série/manhã. município de Carapeba. 1991. Calcule a variância apresentada por esses dados. na amostra das turmas da 8a série/ manhã. % de indigentes classes Nº de Municípios fi TOTAL Fonte: Atlas do Desenvolvimento Humano no Brasil 2ª Edição Aula 10 Matemática e Realidade 11 . Tabela 4 – Percentual de indigentes dos estados brasileiros. Nair Burégio. E. com base no Censo de 1991. dos estados brasileiros. na E.Tabela 3 – Distribuição das médias trimestrais de Matemática. Atividade 5 A Tabela 4 mostra o percentual de indigentes. Notas (médias) Nº de alunos (fi ) Ponto médio (xi) xi fi xi x i fi TOTAL Fonte: Dados fictícios pontos . em abril de 2004. que é o nosso caso.DESVIO-PADRÃO: (para dados populacionais) ou s (para dados amostrais) A variância é uma importante medida de dispersão. Algumas dessas medidas não têm nenhum sentido prático. existe uma medida denominada desvio-padrão. pontos. definida como a raiz quadrada positiva da variância. kg2. como na atividade referente à mortalidade infantil. 12 Aula 10 Matemática e Realidade 2ª Edição .0. principalmente. entretanto. seu resultado é dado em unidade de medida que é o quadrado da original. Para os dados referentes à Mortalidade Infantil. a variância e o respectivo desvio-padrão são: (óbitos ). Como avaliar. No exemplo. . Desvio-padrão populacional: Desvio-padrão amostral: . (Salário mínimo)2. das notas dos candidatos (cujos resultados da variância estão na página 9) temos: Var(A) Var(B) Var(C) . quando comparamos conjunto de dados de mesma natureza e que apresentam médias com valores aproximados. teremos os seguintes desvios-padrão: teste objetivo: médias trimestrais: pontos. por exemplo. vamos calcular o desvio-padrão. Considerando as notas da amostra das turmas da 8a série/manhã. Considerando todos os cálculos anteriores obtidos para a variância.? Então. pontos2 etc. Como podemos observar.: tanto a variância quanto o desvio-padrão são medidas largamente usadas na Estatística Inferencial. no teste objetivo. Na Estatística Descritiva. pontos. Obs. e as médias trimestrais em Matemática. o desvio-padrão associado ao candidato B é muito maior do que os demais. Assim. pontos. essas medidas têm sentido. anos2. Isso significa que as notas desse candidato apresentaram-se bastante dispersas ao redor da média 6. como alternativa para contornar esse problema. imagine. alguns clientes esperam mais do que outros. dependendo do caixa. se distribui de forma mais homogênea ao redor do tempo médio. na análise de dados. Os valores que estão a mais de 3 desvios-padrão são considerados discrepantes dos demais.45% dos dados estão a menos de dois desvios padrão e 99.26% dos dados estão a menos de 1 desvio-padrão da média. no caso da fila única. Nessas distribuições. diminui bastante. universalmente. 95. Como entender o desvio-padrão? Para entendermos melhor o desvio-padrão. que.45% 2 Figura 1 – Distribuição simétrica 2 2ª Edição Aula 10 Matemática e Realidade 13 . moda e mediana iguais.7% dos dados estão a menos de três desvios padrão. por exemplo. fato que causa insatisfação.Atividade 6 Calcule o desvio-padrão para os percentuais (%) de indigentes apresentados na Tabela 4 (atividade 5). O tempo médio de espera dos clientes durante esse período independe da fila ser única ou não. Entretanto. A seguir. por não depender de um caixa em particular. apresentamos a Figura 1 que mostra uma distribuição de dados simétrica. Essa situação reflete que a tomada de decisão dos bancos ao se optar por fila única. uma vez que o tempo de espera. verifica-se que cerca de 68. Quando não há fila única. 95. os clientes ficam muito mais satisfeitos quando estão em fila única. que apresenta média. O desvio-padrão é a medida de dispersão mais utilizada. tendo se tornado um apoio indispensável na tomada de decisão. ou seja. o tempo de espera numa fila de um banco durante uma semana típica. provavelmente se baseou em um estudo da variabilidade apresentada pelo tempo de espera dos clientes. desvio quartil. apresentada na aula 6 (Gráficos representativos de uma distribuição de freqüências): Tabela 5 – Distribuição das médias trimestrais de Matemática. Mostramos – com ênfase através de exemplos – o importante papel que elas desempenham na descrição e análise de dados quantitativos. reproduzimos a tabela que mostra as médias de Matemática da amostra das turmas da noite.Assim. na E. Notas (médias) Nº de alunos (fi) Total Fonte: Dados Fictícios 14 Aula 10 Matemática e Realidade 2ª Edição . Apresentamos o conceito e os cálculos referentes a cada uma delas. Neste texto. Auto-avaliação 1 Abaixo. Resumo Os fenômenos que pesquisamos e exploramos com ferramentas estatísticas estão associados a dados que se apresentam de forma variada. na amostra das turmas da 8a série/ noite. Estudar como as observações coletadas estão se comportando em relação à variabilidade é de grande importância para o conhecimento da variável pesquisada. E. o conhecimento de uma medida de tendência central (a média) e de uma medida de dispersão nos permite descrever com mais detalhes (e muito menor risco de equívocos) um conjunto de dados. Encaminhamos várias situações para auxiliar no estudo e compreensão deste tema. em abril de 2004. abordamos quatro medidas – amplitude total. Nair Burégio. município de Carapeba. desvio-padrão e variância – utilizadas no estudo da dispersão ou variabilidade de dados estatísticos. 1990. Tradução de Alfredo Alves de Farias.762 0. para cada ano. da UFSC. Tabela 6 – Índice de Desenvolvimento Humano nos anos de 1991 e 2000 de algumas capitais nordestinas. Faça comparações entre os anos de 1991 e 2000. usando as medidas calculadas.. 2 Os dados a seguir referem-se ao Índice de Desenvolvimento Humano (IDH) de algumas capitais nordestinas. MOORE. A.707 IDH-2000 0. variância. BARBETTA. 2000. Referências AZEVEDO. desvio-padrão. 2. 2ª Edição Aula 10 Matemática e Realidade 15 . Estatística aplicada às ciências sociais. as seguintes medidas de variabilidade: a) b) c) amplitude total. Estatística: conceitos básicos. 2002.Com base nessa Tabela. R. W.660 0. K.766 Obtenha. Introdução à estatística.724 0. calcule a variância e o desvio-padrão e compare-os com essas mesmas medidas calculadas no decorrer da aula para a amostra das turmas da manhã. Rio de Janeiro: LTC. Florianópolis: Ed. O. Faça comentários pertinentes ao contexto.ed. 2005.715 0.780 0.688 0. TANAKA. A estatística básica e sua prática.689 0. PEREIRA.767 0. São Paulo: McGraw-Hill. Capitais Fortaleza Maceió Natal Recife Salvador São Luís Fonte: Atlas do Desenvolvimento Humano no Brasil IDH-1991 0.735 0. P. obtidos com dados dos Censos de 1991 e 2000.794 0. Natal: EDUFRN. P. D. municípios da microrregião Cariri Ocidental (Paraíba). F. Rio de Janeiro: LTC. I. M. 1991 e 2000. Indicadores de Vulnerabilidade Familiar. TRIOLA.pnud. TOLEDO. 1985. G. L. OVALLE. 2.ed.. Atlas do Desenvolvimento Humano no Brasil. Disponível em: <http://www. Estatística básica.PROGRAMA DAS NAÇÕES UNIDAS PARA O DESENVOLVIMENTO (PNUD). Introdução à estatística. Tradução de Alfredo Alves de Farias.org. São Paulo: Atlas. br/> Acesso em 31/05/2005.ed. 7. 1999. Anotações 16 Aula 10 Matemática e Realidade 2ª Edição . I.
Copyright © 2024 DOKUMEN.SITE Inc.