Licenciatura em MatemáticaEstatística Karin Elisabeth Von Schamlz Peixoto Instituto Federal de Educação, Ciência e Tecnologia de Pernambuco Recife-PE 2010 Presidência da República Federativa do Brasil Ministério da Educação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Este Caderno foi elaborado em parceria entre o Instituto Federal de Educação, Ciência e Tecnologiade Pernambuco - IFPE e a Universidade Aberta do Brasil - UAB Equipe de Elaboração Coordenação do Curso Maria de Fátima Neves Cabral Supervisão de Tutoria Sônia Quintela Carneiro Logística de Conteúdo Clayson Pereira da Silva Giselle Tereza Cunha de Araújo Maridiane Viana Verônica Emília Campos Freire Coordenação Institucional Reitoria Pró-Reitoria de Ensino Diretoria de Educação a Distância Pró-Reitoria de Extensão Pró-Reitoria de Pesquisa e Inovação Pró-Reitoria de Administração e Planejamento Diagramação Rafaela Pereira Pimenta de Oliveira Edição de Imagens Verônica Emília Campos Freire Revisão de Conteúdo Moacyr Cunha Filho Revisão Linguística Ivone Lira de Araújo . Sumário Sumário 5 Palavra do professor-autor 7 Apresentação da Disciplina 9 Aula 1 11 Aula 2 31 Aula 3 61 Aula 4 85 Aula 5 103 Aula 6 127 . . ministro cursos voltados à aplicação do método estatístico na Biologia. Arqueologia e Ciências Sociais. professora conteudista de Estatística. Fui professora da Universidade Federal Rural de Pernambuco. Sou graduada em Ciências Biológicas pela Universidade Federal de Pernambuco. na Inglaterra. Espero passar a vocês a admiração e entusiasmo que tenho por este ramo da Matemática. Comecei a ver a beleza da Estatística ainda na graduação e. ensinando Genética Quantitativa. laboratórios e empresas a entender como longas listas de números podem. ajudando pesquisadores.Palavra do professor-autor Olá! Eu sou Karin von Schmalz Peixoto. deixar suas vidas mais fáceis. desde 1995. Bom estudo! Estatística 7 UAB . e hoje sou consultora da área. mestre em Zoologia pela Universidade Federal da Paraíba e doutora em Zoologia Numérica pela University of Oxford. na verdade. . o poder das massas e como as tendências. quando populares. estudar a Estatística.Apresentação da Disciplina Caros alunos! Vamos. a partir de agora. Bons estudos! Estatística 9 UAB . superam os interesses individuais. vamos aprender todo o necessário para que possamos coletar dados. Neste curso. quando frequentes. A Estatística nos mostra. eventos. opiniões ou características. analisá-los através de métodos estatísticos e. mudam a face de uma multidão. Essa é a ferramenta que nos permite entender as grandes quantidades. que talvez seja a face mais popular das Ciências Matemáticas. A Estatística nos ajuda a entender como nos comportamos. e nos faz compreender como escolhas individuais. mais importante. também. interpretemos seus resultados com a confiança de entender como chegamos lá. além dos cálculos básicos que fazemos diariamente. sem que nos percamos em uma floresta de números. de pessoas. votamos e o que escolhemos enquanto população. . quais são seus objetivos e conceitos básicos e quais são os métodos utilizados na primeira etapa de um trabalho estatístico: a amostragem.Aula 1 Objetivos • Entender o que é a Estatística. Estatística 11 UAB . social e política das populações de seus estados. quais suas origens e diferentes abordagens. O nome “Estatística” vem do latim Statisticum collegium. que significa “conselho de estado”. • Compreender os conceitos básicos em Estatística. Statistik) foi usada pela primeira vez pelo filósofo alemão Gottfried Achenwalt (1719-1772). Introdução: Breve História da Estatística O que é a Estatística? Estatística é um ramo da matemática aplicada que visa à descrição e sumarização das características de uma população. A palavra (em alemão. estadista ou político. veremos como surgiu a Estatística. • Entender os diferentes métodos de amostragem e suas aplicações. para descrever os métodos usados pelos governos para analisar dados de censos demográficos e conhecer a situação econômica. em 1749. • Aprender a fazer as aplicações da Estatística no estudo de populações. e da palavra Statista. Assuntos Nesta aula. que veremos mais tarde. leite. sendo o primeiro a ensinar a disciplina na Universidade de Göttingen. em meados do Século XVIII. os estoques de manteiga. sumarização. documentado total e matematicamente mais elaborado. Os resultados de uma análise de Estatística Descritiva são apresentados através de tabelas de frequências e gráficos. governos sentiram a necessidade de saber as características de suas populações. Achenwalt é considerado um dos “pais” da Estatística. Censos demográficos são a forma mais antiga de aplicação da matemática na descrição de uma população. lã e vegetais. lida com o teste de hipóteses e a interpretação dos fatores que afetam os dados representativos de uma população. faraós realizaram censos entre 3340 e 3050 AC. mel. O primeiro censo. na tentativa de respondê-las. Como surgiu a Estatística? A partir do crescimento dos grandes aglomerados humanos e da formação de Estados. como os censos demográficos. descrição e apresentação dos dados representativos de uma população. a Estatística divide-se em duas áreas básicas: A Estatística Descritiva que lida com a coleta. foi realizado pelos militares do Império Persa no ano 500 e serviu como base para distribuição de terras e cobrança de impostos. quando representantes do rei contabilizavam a população. UAB 12 Licenciatura em Matemática .Por isso. Já a Estatística Inferencial. o gado. também chamada Indutiva. na Alemanha. como o gráfico de barras e a curva de frequências acumuladas. No Egito. De uma forma geral. Quantos súditos há no reino? Com quantos soldados podemos contar? Quais as principais atividades econômicas em nossas fronteiras? Qual a posição política ou a religião da maioria dos habitantes? Como devemos cobrar impostos dessa população? Essas perguntas são de importância crucial para a manutenção de um governo e assim os regentes passaram a organizar grandes pesquisas. organização. O mais antigo censo que se tem conhecimento foi realizado pelos babilônios em 3800 AC que era atualizado a cada seis ou sete anos. C. multiplicando-se a área cultivável total pela produção de. trigo ou beterraba em uma área menor. em 1066. encomendado. No período medieval. O relatório resultante ficou pronto em 1086 e até hoje. o “Livro do Juízo Final” do Rei Guilherme I. Fonte: Arquivo Nacional do Reino Unido. era possível saber qual o tamanho potencial dos exércitos. baseia-se. outra iria para o regente. como se conhece hoje. principalmente.Governos da Grécia Antiga usavam métodos matemáticos simples para contabilizar seus potenciais exércitos. é o melhor retrato da população britânica daquela época (fig. 1). o mais famoso censo realizado foi o Domesday Book (que pode ser traduzido como o “Livro do Juízo Final”). e queria saber quanta riqueza estava sobre seu comando. Com base em trabalhos anteriores que tentavam entender a nature- Estatística 13 UAB . como os descritos por Confúcio no Século V a. Usava-se a soma dos habitantes das vilas e províncias para saber a população geral do reino. que havia invadido e tomado as Ilhas Britânicas. crianças e os idosos. No Oriente. imperadores chineses faziam censos agrícolas e industriais. Calculava-se o quanto um reino poderia produzir. A Estatística. as quatro operações matemáticas básicas para seus fins. pelo rei Guilherme I. basicamente. que iremos ver mais adiante em nosso curso. Figura 1: Domesday Book. ao se subtrair do total as mulheres. Mas os censos demográficos antigos usavam. e os impostos eram calculados pela divisão da riqueza individual em partes iguais: uma parte era mantida pelo súdito. nos conceitos da Teoria das Probabilidades. por exemplo. Graunt (fig. no entanto. tanto que. no início do século. além do nome “Estatística” relacionar a ciência aos dados estatais. Fonte: Universidade de York. de saúde pública e de controle de qualidade industrial.za dos jogos de dados e cartas. o termo foi traduzido para o inglês como “aritmética política”. Inglaterra. entre outros. O desenvolvimento. 2) utilizou os dados coletados pelos censos britânicos para preparar “tabelas de vida”. O trabalho de Gottfried Achenwall ainda era voltado ao estudo demográfico. Figura 2: O demógrafo John Graunt. Muitos estudiosos citam o trabalho do demógrafo inglês John Graunt (16201674) como um dos primeiros trabalhos formais de Estatística. apesar deste ramo da ciência só ter se estabelecido um século mais tarde. o matemático holandês Christian Huygens (1629-1695) foi o primeiro a descrever as propriedades probabilísticas em um livro de 1657. Foi durante o século XX. em que estimava a expectativa de vida das várias faixas etárias nas diversas regiões do país. o termo passou a abranger a coleta. classificação e análise de dados de qualquer origem. capitão do exército britânico. Apenas no século XIX. levou a Estatística para fora de sua área de UAB 14 Licenciatura em Matemática . A partir daí. que a Estatística provou ser um instrumento fundamental para todas as ciências quantitativas e qualitativas. de fórmulas matemáticas especiais para lidar com questões agrícolas. a Estatística moderna começou a se formar. mas os significados desses termos em são bem claros e. médicas.origem e hoje ela é instrumento fundamental para as ciências sociais. a Estatística se presta a responder as perguntas dos pesquisadores em relação a um conjunto de dados que foram coletados de uma população. a descritiva e a inferencial. Atenção! Basicamente. “população” e “dados”. respondem a perguntas bem diferentes. diferentes do significado coloquial. ambientais. por vezes. As duas abordagens estatísticas. Estatística Descritiva: • Qual o valor mínimo e máximo? • Qual o valor mais comum? • Como difere um indivíduo em particular da população como um todo? • Quantos tipos diferentes existem? • Quais os tipos mais frequentes? • Qual evento é mais provável de ocorrer no futuro? Estatística Inferencial: • Como se relacionam duas características de uma população? • Há diferenças entre grupos dentro da população? • Qual a diferença entre grupos? • Como a variação de um elemento afeta o outro? • Quais elementos têm influência sobre uma característica? • Quão forte é a influência de uma característica sobre a outra? Conceitos Básicos A Estatística usa termos que estamos acostumados a usar em nosso dia-adia. A Estatística 15 UAB . humanas e econômicas. Abaixo estão alguns exemplos do que cada abordagem pode investigar. como “amostra”. geralmente. Pois. De forma.freefoto. em um estudo de saúde infantil.seguir. a média da amostra de um conjunto de dados deve fornecer informação sobre a média geral da população. • População: Para a Estatística. Ao se estudar uma amostra. antes de coletar a amostra. ao fazer qualquer generalização sobre uma população. que deve ser representativa da mesma. como um todo. É importante que o pesquisador defina a população. geral- UAB 16 Licenciatura em Matemática .com • Amostra: Uma amostra (fig. cuidadosa e completamente. 4) é um grupo de unidades selecionado de um grupo maior (a população). veremos os termos mais comuns que usaremos em nosso curso. Figura 3: Uma “população”. Por exemplo. Fonte: www. animais. ela é. Uma amostra estatística fornece informação sobre um parâmetro correspondente da população. Para cada população há muitas amostras possíveis. poderia ser todas as crianças nascidas no Brasil na década de 90. no qual estamos interessados e o qual desejamos descrever ou tirar conclusões sobre um aspecto em particular. espera-se que ela forneça conclusões válidas sobre o grupo maior. Um exemplo: a população. uma amostra. seus significados e suas variações. Uma amostra seria todas as crianças nascidas no dia seis de junho de qualquer um dos anos. ou “universo”. 3). plantas ou coisas da qual nós podemos coletar dados (fig. É o grupo inteiro. população é uma coleção completa de pessoas. incluindo uma descrição dos membros a ser inseridos. devemos estudar. é importante definir a população antes de fazer a amostragem. Fonte: www. ou seja. ou corre-se o risco de produzir uma amostra enviesada. tendenciosa. Por exemplo. Por exemplo.freefoto. alcançado com sucesso ao se fazer uma amostragem aleatória. Por exemplo. porque a população é grande demais para ser estudada por inteiro. geralmente. que não varia. a média de uma população é um parâmetro que é. a média dos dados. se numa pesquisa sobre a qualidade da água que a população de um município consome forem entrevistadas apenas as pessoas que moram em ruas pavimentadas. geralmente. Parâmetros são. Isso é. de uma quantidade. Cada amostra tirada da população tem seu próprio valor de qualquer estatística que é usada para estimar esse parâmetro. comumente. designados por caracteres gregos (como ou µ). a amostra será enviesada. Figura 4: Uma “amostra” da população acima. em uma amostra. ao acaso. Estatística 17 UAB . usado para indicar o valor médio. deve ser representativa da população em geral. o parâmetro é um valor fixo. é usada para dar informação sobre a média geral na população da qual foi tirada. em geral. Contudo. Assim.mente. pois essas residências tendem a ser servidas pelo sistema de abastecimento de água tratada e não representará os indivíduos que consomem água de poço ou outras fontes.com • Parâmetro: Um parâmetro é um valor. Dentro de uma população. selecionada. Mais adiante. usado para representar certa característica de uma população. enquanto estatísticas são designadas por caracteres romanos (como s ou x). desconhecido (e o qual deve ser estimado). veremos os diversos métodos de amostragem. ou seja. ou tendência central. Escalas de Mensuração ou Níveis de Medidas Uma das formas de se classificar as variáveis é de acordo com o nível de medida que utilizamos. a cor de um objeto (verde. Por exemplo. Para entendermos melhor a diferenciação dos tipos de variáveis. uma estatística é o valor que é calculado a partir de uma amostra de dados. veremos os tipos diferentes de variáveis. Qualquer medida de peso é uma variável em escala de razão. Temperatura em graus Celsius é um dos poucos exemplos de uma variável intervalar. Mais adiante. Uma variável nominal possui classes. de vegetais). uma área pode ter 20% de coqueiros.) ou a espécie de uma planta de uma área (coqueiro.). é o ramo da ciência que estamos estudando. podemos descrever um atributo de cada indivíduo ou objeto. Variáveis podem ser classificadas em grupos distintos de várias formas. cada uma um pouco mais refinada que a anterior. Exemplos de variáveis medidas em escala nominal são o gênero de um indivíduo (masculino ou feminino). teremos primeiro que entender as escalas de mensuração que podem ser usadas. ou categorias. vai variar de uma amostra para outra. se o peso de 30 indivíduos foi medido. Os níveis ou escalas de medidas são a nominal. É usada para dar informação sobre valores (ou parâmetros) desconhecidos na população correspondente. O tamanho dos sapatos. babaçu. 40% de palmeiras. No nível nominal. ou têm o mesmo “peso”. Variáveis nominais fornecem frequências em vez de medidas propriamente ditas. a ordinal. etc. a intervalar e a escala de razão. azul. apesar de representado por números inteiros. todas as categorias são iguais. todas as categorias têm igual importância e o mesmo “valor” para o pesquisador. • Nominal: A mais simples medida que pode ser tomada de uma característica é da escala nominal. Um objeto pode ser duas vezes mais pesado que outro e zero quer dizer ausência. 18 Licenciatura em Matemática . ou objetos. Como vemos. Por exemplo. uma população humana pode ter 49% de homens e 51% de mulheres. amarelo.Glossário • Estatística: com a inicial maiúscula. a média de um grupo de dados (estatística) fornece informação sobre a média geral (parâmetro) da população da qual se coletou a amostra. • Variável: Uma variável é qualquer atributo ou característica medida que difere para diferentes indivíduos. então o peso é uma variável. UAB É possível tirar mais de uma amostra da mesma população e o valor da estatística. estaremos criando uma variável nominal. Por exemplo. é uma variável ordinal. geralmente. Há quatro níveis possíveis de medidas que podemos coletar em uma amostra. etc. Se usarmos as espécies de plantas de uma área para descrever uma população (nesse caso. 30% de um tipo de grama e 10% de cajueiros. ou seja. escalas intervalares são raras. não fornecem informação sobre o tamanho da diferença entre as classes. ou zero kelvin. realmente.15 °C. em intervalos regulares. o nível ordinal já fornece a ideia de gradação. médio. e também vai fornecer frequências. gradualmente.• Ordinal: A escala ordinal também possui categorias. porque se pode descrever a relação entre medidas através de frações: José pesa duas vezes mais que Maria. Por exemplo. Mas. há uma ordem de importância das classes. na escala de temperatura Kelvin. etc. Outra característica das variáveis intervalares é que o valor de “zero” não significa ausência da característica. A escala de razão é assim chamada. Enquanto o nível nominal só permite que calculemos as frequências dos tipos. na variável ordinal “classe social” (baixa. Exemplos são tamanho. na escala ordinal. mais informação com precisão crescente. ou classes. Outro exemplo de medida intervalar é o calendário Gregoriano (que usamos): o Ano Zero foi estipulado pelo nascimento de Cristo e datas anteriores são “negativas”. Zero grau Celsius não quer dizer ausência de temperatura. o porte de um vegetal (erva. meu carro usa a metade da gasolina do seu. (antes de Cristo). e o de razão dá a ideia de ausência. homogeneamente. Exemplos de variáveis ordinais são o nível de escolaridade (primário. são em escala de razão. significa ausência de temperatura: quando a -273. o cabelo Estatística 19 UAB . Todas as variáveis “de contagem”. Apesar de classes ordinais ser organizadas em uma ordem graduada. mas é um ponto de referência. além de poder ser organizadas de forma graduada. • Intervalar: Se uma variável apresenta classes que. essa variável foi medida em uma escala intervalar. apresentam intervalos iguais entre si. até 10(dez) para minerais duros como o diamante). não há nenhuma transferência de energia térmica. mas é apenas um ponto de referência arbitrário e valores negativos também podem ser usados. a diferença entre a classe baixa e a média não é a mesma entre a média e a alta. o valor de zero. que incluam o valor de zero significando ausência. peso. Além desses exemplos. indicando a temperatura de congelamento da água. Por exemplo. quantidade de substâncias. número de vezes que um evento ocorre. média e alta). arbusto. o intervalar dá o tamanho da diferença entre classes. e designadas por a. Um exemplo clássico da escala de medida intervalar é a temperatura em graus Celsius: as classes (o valor da temperatura) são. distantes entre si. com a diferença que o valor de zero significa ausência do atributo medido. • Escala de razão: Variáveis medidas em escala de razão têm as mesmas características da escala intervalar. Glossário Os quatro níveis de mensuração fornecem.C. aparece mais uma informação sobre as características de uma população: o valor ou “peso” das categorias cresce gradualmente. superior). árvore) ou a escala de Mohs para identificar a dureza de um mineral (indo de 1(um) para minerais macios como o talco. Enquanto o nível nominal só permite que calculemos frequências dos tipos. o estatístico precisa de: –– Calculadora: para facilitar o cálculo das frequências. o intervalar dá o tamanho da diferença entre classes e o de razão dá a ideia de ausência. gradualmente. mais informação com precisão crescente. Ao usar o computador. Já análises inferenciais precisam de programas estatísticos. criar gráficos de frequências e calcular algumas estatísticas descritivas. Na pesquisa manual. Variáveis qualitativas são também chamadas categóricas e são medidas em escala nominal. “classe média” e “classe alta”). Os quatro níveis de mensuração fornecem. servem para organizar e armazenar os dados.de Joana é três vezes mais longo que o de Josefa. Os editores de planilhas são suficientes para a preparação de relatórios descritivos. Tipos de Variáveis Como foi dito antes. Se nos basearmos nos níveis de mensuração. Escalas de razão não têm valores negativos. –– Tabelas estatísticas: contêm os valores de significância de testes de estatística inferencial. o nível ordinal já fornece a ideia de gradação. ou escala ordinal não numérica (como “classe baixa”. Variáveis quantitativas UAB 20 Licenciatura em Matemática . –– Papel milimetrado: para desenhar os gráficos com mais precisão. Ferramentas do estatístico Análises estatísticas podem ser feitas manualmente ou com a ajuda de um computador. Usar o computador como ferramenta estatística permite a análise de uma grande quantidade de dados sem medo de cometer pequenos erros. as variáveis podem ser qualitativas ou quantitativas. –– Programas de estatística: Realizam tarefas complexas como testes de significância. podemos classificar as variáveis de diversas maneiras. há dois tipos básicos de programas: –– Editores de planilhas: como o Excel. criam gráficos elaborados e já possuem as tabelas estatísticas incluídas. produzem variáveis discretas. podemos dividir as variáveis entre independentes e dependentes. como o chumbo. de respostas. pois não podemos ter “meio habitante”. mesmo números não inteiros. Estatística 21 UAB . Assim. todos os valores serão números inteiros. Do ponto de vista da Estatística Inferencial. também chamadas descontínuas e contínuas. se perguntarmos aos alunos do jardim de infância qual a sua cor favorita. Já o peso dos peixes é o efeito da exposição ao chumbo. então a exposição ao chumbo. Variáveis discretas podem apresentar qualquer valor entre zero e infinito. a resposta seria uma variável categórica. as variáveis independentes são causa da variação de uma variável dependente. Se pensarmos em termos de causa e efeito. ou seja. Por exemplo.76m.61m. de fatores e as dependentes. intervalar ou de razão. suas variações são aleatórias. medida pelo nível do metal em cada peixe. a altura dos soldados de um batalhão pode ser qualquer medida entre as alturas mínima e a máxima permitidas: 1. 1. é uma variável independente. as contagens em geral. Variáveis independentes são chamadas. se contarmos o número de pessoas em cada cidade de um país. Já as variáveis dependentes têm sua variação atrelada à diversificação de uma variável independente. no peso dos peixes de um rio. a variável será quantitativa. Já as variáveis contínuas podem ter qualquer valor entre dois valores previamente estabelecidos. ou qualitativa. Não podemos controlar a quantidade de chumbo absorvida por cada peixe que pesarmos. Se medirmos o tempo de resposta de cada um a essa pergunta. como censos e levantamentos. Um exemplo seria uma pesquisa sobre o efeito de um poluente. quando usamos um programa de computador para cálculos estatísticos. Por exemplo. 1. Variáveis quantitativas podem ser subdivididas em discretas. Por exemplo. desde que seja um número inteiro.87m. sendo então a variável dependente. etc.são medidas em escalas ordinal numérica. Variáveis independentes são selecionadas e medidas pelo pesquisador na amostra de uma população e não são passíveis de controle. Se quisermos realizar um estudo sobre o tamanho das filas de um supermer- UAB 22 Licenciatura em Matemática . Uma população pode ser vista como um conjunto que inclui todas as pessoas. A seguir. de observações individuais com as quais se pretende estimar parâmetros de uma população de interesse. –– Especificação do método de amostragem para selecionar itens ou eventos da base de sondagem. é fácil definir uma população. –– Definição do tamanho da amostra. então devemos almejar a coleta de uma amostra representativa da mesma. –– Especificação da “base de sondagem”. Às vezes. Para que se realize a prática estatística com sucesso. por exemplo. Em outras ocasiões. A razão pela qual o processo de amostragem é tão rigoroso se deve ao fato de que um erro nesse processo pode invalidar toda a análise estatística. tornando o trabalho do pesquisador inútil. geralmente. itens ou eventos que possuem uma característica que desejamos compreender. que se deseje verificar a qualidade de uma remessa de material. Como vimos. olharemos cada uma das etapas em maiores detalhes. impossível coletar todos os dados de toda uma população de interesse. –– Amostragem e coleta de dados. –– Revisão do processo de amostragem. que é a “população” da qual será retirada a amostra. é necessário que a população de interesse seja definida com cuidado. Em uma indústria.Amostragem “Amostragem” é a parte da prática da Estatística que se refere à seleção de uma amostra. –– Implementação do plano de amostragem. ou conjunto de itens ou eventos mensuráveis. a população de interesse pode ser menos tangível e não envolver um conjunto de objetos. é. cheia de vieses que levarão a conclusões erradas. O processo de amostragem é fundamental para a coleta de dados e contém diversos estágios: –– Definição da população de interesse. Como já vimos. as amostras devem representar a população de interesse e uma amostragem desleixada vai nos prover uma amostra não representativa da população. ou subconjunto. ele passou a apostar nos números que ocorriam com maior frequência e se tornou conhecido como o homem que “quebrou a banca” em Monte Carlo. na qual podemos identificar todos os elementos em que podemos selecionar qualquer um para nossa amostra. a “população” estudada é ainda mais abstrata. representativa da população a ser estudada. Um estudo famoso. Após definir a base de sondagem. Dependendo do tipo de estudo. etc. nos quais podemos retirar amostras de cada lote. O mesmo se aplica a qualquer pesquisa que envolva medições repetidas de alguma característica física. na maioria dos casos. não é possível ter acesso imediato a toda a população. Assim. de modo que a amostra coletada a partir dessa base seja.cado durante as várias horas do dia. listas de usuários do SUS (para pesquisas de saúde). realmente. teve como “população” o desempenho de seis rodas de roleta. o pesquisador deve escolher o método de amostragem. em pesquisas de opinião. é possível ter acesso a toda uma população de interesse. Assim. registros de crianças matriculadas em escolas públicas (para pesquisas sobre educação). Em certos casos. listas de eleitores (para pesquisas eleitorais). podemos usar listas telefônicas como uma base de sondagem. é importante que a amostra seja aleatória. sem que haja repetições. como os materiais de uma fábrica. seja por que ela não é conhecida. da qual podemos selecionar. Por exemplo. Em outros casos. Jagger contratou seis pessoas para anotar todos os resultados dessas seis rodas de roleta e descobriu que. o tempo vira o foco dessa população e as amostras deverão ser coletadas dentro de determinados períodos de tempo. como quando os dados de jogar são testados. ou estuda-se a condutividade elétrica de materiais. feito pelo engenheiro britânico Joseph Jagger (1830-1892) no cassino de Monte Carlo em 1873. ou o comportamento de um animal nas várias estações do ano. ou por que não é possível identificar todos os indivíduos. é necessário o uso de uma base de sondagem. alguns números ocorriam com maior frequência que outros. aleatoriamente. Isso garante que cada um dos elementos da população Estatística 23 UAB . indivíduos para nossa pesquisa. Jagger investigou a distribuição de probabilidades dos resultados das roletas em tentativas infinitas e assim conseguiu identificar que roletas estavam enviesadas. Como vimos. Em alguns casos. podemos usar mapas de ruas (de que selecionamos as ruas que serão visitadas). em algumas delas. As bases de sondagem devem ser escolhidas com cuidado para incluir toda a população de interesse. Por causa de sua natureza não aleatória. entrevistaremos apenas as pessoas desempregadas. A amostragem probabilística permite que sejam calculados os erros que poderiam alterar os resultados da análise e levá-los em consideração quando da interpretação dos mesmos. se estivermos usando um mapa de ruas como base de sondagem e formos visitar cada uma das casas das ruas escolhidas. aleatoriamente. pois UAB 24 Licenciatura em Matemática . veremos brevemente os métodos mais comuns de amostragem. quando os resultados são apresentados. durante o horário de trabalho. dependendo de fatores como a natureza e qualidade da base de sondagem. para entrevistar a pessoa que abrir a porta. necessidade de acurácia de mensuração.tenha uma probabilidade maior que zero de ser escolhida. pois é impossível calcular a probabilidade de entrevistarmos um trabalhador e assim não poderemos calcular possíveis erros de amostragem. existem vários métodos que podem ser empregados. para uma amostra. Esse tipo de amostragem é chamado de amostragem probabilística e permite que calculemos a probabilidade exata de cada elemento da população de ser escolhido. A amostragem não probabilística é qualquer método em que alguns elementos da população não têm nenhuma chance de serem selecionados. como os censos demográficos. Tal abordagem é a comumente usada em estudos gerais. Essa é uma abordagem não probabilística. tanto da abordagem probabilística quanto da não probabilística Métodos Probabilísticos: Em que todos os elementos têm uma probabilidade maior que zero de ser escolhidos e envolvem seleção aleatória: • Amostragem Aleatória Simples – Todos os elementos da base de sondagem têm igual probabilidade de ser escolhidos para uma amostra. Por exemplo. ou quando não se pode calcular com precisão qual a probabilidade de seleção dos elementos. sozinhos ou em conjunto. excluindo todos os trabalhadores que não faltaram. A seguir. Métodos de Amostragem Dentro das duas abordagens de amostragem. a amostragem não probabilística não permite o cálculo de erros de amostragem e essa abordagem deve ser especificada. disponibilidade de informações auxiliares sobre os elementos da população. nível de detalhe da análise e custos operacionais. que pedem uma amostra não enviesada de uma população. o que minimiza o risco de um viés na amostra. No entanto. pois se o valor k for um múltiplo ou fator do valor de periodicidade da lista. esse método é vulnerável a erros de amostragem. mas selecionam-se os ele. Esse método oferece vantagens quando a base de sondagem permite que os elementos sejam estratificados. o início da “lista” é aleatório.a base não é subdividida ou particionada. desde que haja pouca variabilidade dentro dos estratos e grande variabilidade entre os estratos. definidos pela fórmula N = tamanho da população. criando “estratos” separados. Nesse método. n = tamanho da amostra. Tal método pode ser inadequado para populações muito grandes. • Amostragem Sistemática – Envolve organizar a população-alvo em algum sistema de ordenação antes de selecionar os elementos. algumas vezes. o método torna-se menos acurado que a amostragem aleatória simples. no qual elementos são escolhidos aleatoriamente. Estatística 25 UAB . Amostragens sistemáticas não podem ser usadas em bases de sondagem que possuem alguma periodicidade. qualquer par de elementos tem a mesma chance de seleção que outro. em que: mentos em intervalos k. Um exemplo seria a estratificação da população estudantil por séries. prática. através da lista ordenada. Na. o que tiraria o caráter probabilístico do método. Por exemplo. dentro de cada série. Além disso. pois uma amostra pode não representar a constituição da população. • Amostragem Estratificada – Usada quando a população possui categorias distintas. sendo as amostras coletadas. Cada estrato é então amostrado como uma população independente. dentro das quais a base de sondagem pode ser organizada. É importante que o início da “lista” seja aleatório e não seja escolhido o primeiro elemento. em intervalos. esse método pode ser mais oneroso que a amostragem simples. uma amostra de uma população humana pode não representar a real proporção entre homens e mulheres de uma população. aleatoriamente. para examinar possíveis efeitos cruzados que alterariam ou confundiriam os resultados da pesquisa. entrevista-se uma pessoa aleatoriamente.Métodos não probabilísticos: Quando não há probabilidade de se escolher alguns membros da população. ou quando outras variáveis ligadas aos elementos afetam a probabilidade de que sejam escolhidos. Além dos métodos probabilísticos e não probabilísticos mais comuns. Casos especiais são comuns nas ciências experimentais. É comumente usada nas pesquisas de mercado. a amostra é colhida da parte da população que está mais próxima. ao pesquisador. como na amostragem estratificada. vários métodos já foram desenvolvidos para endereçar problemas encontrados em pesquisas específicas. mas em que pessoas com aparência “simpática” são mais frequentemente entrevistadas do que as que parecem “antipáticas”. As amostras podem se tornar enviesadas nesse caso e seu uso. quando se está interessado em entender a aceitação de um produto dentro de determinados grupos sociais. ou disponível. é um método útil para “pesquisas-piloto”. Também é chamada de “amostragem de conveniência”. Por exemplo. sendo assim não aleatória. por exemplo). pois alguns elementos são excluídos da amostra. a amostra não é representativa da população e não é possível estimar parâmetros populacionais gerais a partir dela. Ainda assim. • Amostragem Acidental – Nesse método. Exemplos comuns são as pesquisas de opinião que abordam um número determinado de homens e mulheres (os ‘estratos’). que verificam a viabilidade da pesquisa antes que a coleta de dados válida seja iniciada. • Amostragem em cotas – A população é separada em grupos. que se refere a um amigo que também é entrevistado e recomenda outro amigo. • Amostragem em “Bola-de-neve” – Nesse método. Nesse caso. por misturar uma abordagem aleatória com uma não aleatória. mas a etapa seguinte não é aleatória. devem-se controlar todas as variáveis possíveis dos elementos. UAB 26 Licenciatura em Matemática . em que os elementos são conhecidos e em pequeno número (como ratos de laboratório. assim por diante. mutuamente. quando testando um novo medicamento em animais de laboratório. é motivo de controvérsia. a amostra contém todos os animais usados. Muito utilizada em pesquisas socioculturais. excludentes. Até lá! Estatística 27 UAB . falhas e lacunas. 4) Análise dos dados: Quando testando hipóteses. uma vez coletados. Na próxima aula. define-se qual é a população de interesse e toma-se cuidado para que o método de coleta forneça uma amostra que represente a população. os resultados podem ser interpretados dentro dos limites de qualidade dos dados. podese descrever a amostra através de estatísticas descritivas. os dados devem ser avaliados quanto a possíveis erros de coleta. os conceitos e métodos que vimos aqui. basicamente. que têm impacto maior na hora de se explicar os resultados da pesquisa. A descrição de uma amostra também deve ser feita através de tabelas. 3) Descrição dos dados: Após verificar-se que os dados são válidos. A pesquisa estatística conta. que servirão para a análise estatística. matematicamente.Os dados da amostra. na prática. 6) Análise dos resultados: As estatísticas descritivas devem ser suficientes para descrever uma população através da amostra coletada. veremos como utilizaremos. 5) Apresentação dos dados: Tanto as estatísticas descritivas quanto as inferenciais podem ser representadas por gráficos. devem ser organizados em bases de dados. cálculos específicos podem ser usados para análises inferenciais. 2) Avaliação dos dados: Antes de iniciar os trabalhos estatísticos propriamente ditos. Estatísticas inferenciais devem ser interpretadas com mais cuidados. os dados. mas podem servir para ilustrar as interações complexas entre fatores presentes em uma população. e começaremos a trabalhar. de seis etapas distintas: 1) Coleta de dados: Nessa fase. Estatística. MURRAY R. e a não probabilística. que podem ser usados isoladamente ou em conjunto. DA S. Há métodos probabilísticos e não probabilísticos de amostragem. J. de forma concisa e objetiva. o resumo deve conter todo teor da aula. para evitar problemas com a validade da amostra. em que características específicas dos indivíduos. R. Referências LEME. Os conceitos básicos da Estatística são conhecidos coloquialmente. SPIEGEL. A. na qual essa probabilidade é igual a zero para alguns elementos. onde todos os elementos de uma população têm uma probabilidade maior que zero de ser escolhidos para uma amostra. LEVIN. “população” e “variável”. servirão para se calcular os parâmetros populacionais. Cara Colega. 1967. a Medicina e a pesquisa científica. para facilitar o ensino/aprendizagem do (a) aluno (a).: Estatística Aplicada às Ciências Humanas. São Paulo: HARPER & ROW DO BRASIL.Agradece.: Curso de Estatística – Elementos. mas têm significados bem específicos dentro desse ramo do conhecimento. ou não pode ser calculada. incluindo palavras comuns como “amostra”. Hoje é uma ciência fundamental para campos tão diversos quanto as Ciências Econômicas e Sociais. as variáveis. Ivone Lira (revisora linguística e textual). 1978. a indústria e o comércio. Há duas abordagens básicas de amostragem: a probabilística. . Rio de Janeiro: AO LIVRO TÉCNICO. A primeira etapa de uma pesquisa estatística envolve a coleta de uma amostra que represente uma população de interesse. MAKRON. 1994.Resumo A Estatística é um ramo da Matemática que surgiu da necessidade dos governos de conhecer suas populações. Estatística 29 UAB . . • Entender as medidas de dispersão de uma variável e como medir as estatísticas em uma amostra.Distribuição de Frequências Objetivos • Aprender a descrever as frequências absolutas e relativas em uma amostra. Assuntos Nesta aula vamos entender como podemos descrever a distribuição de uma amostra. • Aprender a usar as ferramentas estatísticas do Excel da Microsoft. ou seja. poderemos calcular suas estatísticas e assim estimar os parâmetros da população. quais são os valores extremos. a estatística descritiva permite que sejam estimados os parâmetros populacionais. Introdução Os métodos de amostragem. O principal objetivo de uma pesquisa dessa natureza é descobrir como os dados estão distribuídos. Com esses dados amostrais. nos permitem coletar dados confiáveis que serão representativos de uma população de interesse. que valores Estatística 31 UAB . que vimos na nossa primeira aula. • Compreender as medidas de tendência central de uma população e como determinar essas estatísticas em uma amostra. usando técnicas simples. que fornecem uma visão geral dos dados coletados. Sendo a amostra válida e representativa de uma população. Vamos entender o que significam as estatísticas amostrais e como calculá-la através de fórmulas ou usando um editor de planilhas como o Excel. Mas a coleta de dados é apenas o primeiro passo de uma pesquisa estatística e os passos seguintes são cruciais para que um estudo tenha validade.Aula 2 . quantas vezes cada valor ou classe aparece na amostra que estudamos. Por exemplo. a distribuição de frequências é importante para entendermos não apenas quantas vezes cada valor ou classe de uma variável é representado. se estamos estudando a frequência da cor de olhos em uma população e ninguém tem olhos azuis. que irão ser assinalados com a frequência absoluta de zero. mas fornece informação sobre a amplitude de variação dessa variável e sobre a natureza dessa variação. Logo. Assim. listando todos os valores possíveis como uma coluna de números e a frequência de ocorrência de cada valor como outra. para se calcular a frequência absoluta de um valor ou categoria. UAB 32 Licenciatura em Matemática . Uma tabela de frequência é uma forma de organizar os dados. essa informação é relevante e deve ser incluída. Na maioria dos casos. Pode-se descrever uma amostra através de tabelas de frequência ou de gráficos. deve-se apenas contar quantas vezes cada um desses valores ou categorias aparece em um grupo de dados. Isso é importante para se entender a população através de uma amostra. devemos incluir valores que não aparecem no conjunto de dados. é preciso organizar tabelas de frequências. entendemos a distribuição de frequências dos valores de uma variável. pois azul é uma cor de olhos possível nos humanos. Tabelas de Frequências O primeiro passo de um pesquisador. o pesquisador necessita organizar os dados de uma forma prática. gráficos e planilhas de análise. Ao criarmos uma tabela de frequências. tornando mais fácil o trabalho de calcular a repetição de ocorrência dos eventos em questão. que pretende descrever uma população através de uma amostra. Para isso. ou seja.ocorrem mais frequentemente e que intervalos de valores englobam a maior parte da população. Para descrever uma distribuição de frequências. é descobrir a distribuição dos dados amostrais. como veremos mais tarde. de que possam ser retirados os valores necessários para o cálculo das estatísticas amostrais. em sua linha de produtos. 37 35 36 37 34 38 39 37 36 35 37 36 38 33 34 36 37 37 35 36 Digamos que o fabricante tem. Vamos. criar uma tabela de frequências. perguntando a vinte mulheres qual o número de seus sapatos e consegue os seguintes valores (tabela 1): Tabela 1: Tamanho dos sapatos de 20 mulheres de Recife – PE. Para ajudarmos ao fabricante. Recife. usando os números disponíveis em sua fábrica e contaremos quantas vezes esses números ocorrem na amostra que ele coletou na cidade (tabela 2): Tabela 2: Frequências absolutas dos números de sapatos usados por 20 mulheres da cidade de Recife – PE. então. devemos organizar os dados que ele coletou em relação às linhas de sapatos femininos que já tem. Estatística Número do sapato Frequência absoluta (f) 32 0 33 1 34 2 35 36 37 3 5 6 38 2 39 1 40 0 Total 20 33 UAB . ele coleta uma amostra do tamanho dos pés das mulheres da cidade.Criando uma tabela de frequências Vamos imaginar que um fabricante de sapatos femininos quer saber quais os tamanhos deve fabricar para suprir a demanda em uma cidade como. Para isso. digamos. uma numeração de sapatos femininos que vai do 32 ao 40. teríamos a tabela de frequências representada um pouco diferente (tabela 4): UAB 34 Licenciatura em Matemática . é só multiplicar a proporção por 100. acrescentaremos mais uma coluna na tabela que já vimos (tabela 3): Tabela 3: Frequências absolutas e relativas dos números de sapatos de 20 mulheres de Recife – PE. em valores proporcionais expressos em proporções (que vão de 0 a 1) ou porcentagens (que vão de 0 a 100). se quisermos representar as frequências absolutas em porcentagens.05 34 2 0. nos pergunta qual a proporção de cada número de sapatos que deveria fabricar. Assim.Podemos logo avisar ao fabricante de sapatos que.15 36 5 0. O fabricante. e que o tamanho mais comum é o 37. Assim.3 38 2 0. na amostra que ele coletou. Podemos responder a sua pergunta.1 35 3 0.25 37 6 0. não há nenhuma mulher que calce sapatos 32 ou 40. calculando as frequências relativas dos tamanhos de sapatos da amostra.1 39 1 0. Número do sapato Frequência absoluta (f) Frequência relativa (fr) 32 0 0 33 1 0. encalhados em suas lojas. para que não tenha números pouco procurados. Mas. então.05 40 0 0 Total 20 1 As frequências relativas são calculadas como se calculam proporções: dividese a frequência absoluta da classe em questão pelo total de dados da amostra. relativas proporcionais e percentuais. devemos apenas somar as frequências absolutas ou relativas de cada classe com a seguinte. poderíamos acrescentar uma coluna de frequências relativas acumuladas à nossa tabela (tabela 5): Tabela 5: Frequências absolutas. serve para termos uma ideia de onde a maioria dos valores se encontra. Outra forma de representar a distribuição das frequências é através das frequências acumuladas ou cumulativas. Para se conseguir isso. No exemplo que estamos usando. Número do sapato Frequência absoluta (f) Frequência relativa (%) 32 0 0 33 1 5 34 2 10 35 3 15 36 5 25 37 6 30 38 2 10 39 1 5 40 0 0 Total 20 100 Nosso amigo fabricante ficará feliz em saber que 30% das mulheres da amostra calçam sapatos tamanho 37. Estatística 35 UAB .Tabela 4: Frequências absolutas e frequências relativas proporcionais e percentuais dos números de sapatos de 20 mulheres de Recife – PE. mas. que 25% calçam 36 e assim por diante. Esse tipo de representação tem diversas aplicações que veremos nas próximas aulas. e frequências cumulativas percentuais dos números de sapatos de 20 mulheres de Recife – PE. de forma geral. poderá ajustar a sua produção para atender a demanda do mercado. Então. fica muito difícil criar tabelas de frequências. necessariamente iguais. como centímetros. em intervalos que cobrirão toda a variação encontrada na amostra. Se precisar reduzir a produção. Os tamanhos de calçados são categorias que podem ser ordenadas por ordem de tamanho (o 36 é menor que o 37. não fica perfeito. O tamanho do calçado. Assim. às vezes. ele não terá grandes prejuízos se parar. Ele mediu um soldado a cada cinco que UAB 36 Licenciatura em Matemática . Quando lidamos com variáveis medidas em escala de razão. em escala de razão. é relevante saber que 95% das mulheres da cidade calçam sapatos de número 38 ou menor. é uma variável em escala ordinal. etc. Os números dos sapatos não são representativos de uma medida. um calçado do número que usamos. Por isso. mas a diferença entre os tamanhos não é exatamente igual. seria impossível cobrir toda a variação milimétrica que encontramos nas pessoas. Uma forma. Vamos imaginar que um médico decidiu ver a frequência da altura dos soldados de um batalhão do exército. Se os fabricantes de sapatos fossem usar centímetros como base para seus produtos. que temos para lidar com isso. mas são categorias criadas em cima de medidas.). que utilizamos no exemplo.Número do sapato Frequência absoluta (f) Frequência relativa (%) Frequência cumulativa (F) 32 0 0 0 33 1 5 5 34 2 10 15 35 3 15 30 36 5 25 55 37 6 30 85 38 2 10 95 39 1 5 100 40 0 0 100 Total 20 100 100 Para o fabricante de calçados. foram criadas medidas relativas que podem ser usadas por pessoas com tamanhos de pés próximos. mas não. é classificar os dados de uma variável contínua. de fabricar números maiores que 38. normalmente. temporariamente. 61 1. em metros.88 1.65 1. 1. Devemos.80 Vemos que há dois soldados medindo 1. mas devemos deixar bem claro.66 1. em metros.94 1.72 1.83 1. quais são os limites de nossos intervalos).passavam em frente à porta do consultório e assim.73 1. se fôssemos criar uma tabela de frequências como a que fizemos com o tamanhos dos sapatos.65 1.77 1.649m (o médico não mediu com essa acurácia. de 1.62 1.699m.749m.80 1. Tabela 6: Altura. em primeiro lugar. e assim por diante.70m até 1. No fim do dia. Assim.85 1. de 30 soldados.60 1.74 1.68 1. dois com 1.73 1. podemos criar intervalos de medidas que cubram a variação das medidas e ainda assim nos dê uma ideia de qual intervalo de altura é o mais frequente no batalhão.76 1. e assim.67 1.61 1.69 1. relativas e cumulativa da altura de 30 soldados do Exército Brasileiro.81 1. o terceiro iria de 1. em intervalos de 5 cm.72 1.84 1.72m. Desse modo. Nossa tabela de frequências ficaria assim (tabela 7): Tabela 7: Frequências absoluta. de 30 soldados de um batalhão do Exército Brasileiro. verificar qual o valor mínimo e máximo.70 1.61m.75 1.65m até 1. Digamos que seria interessante fazer um intervalo de cinco centímetros: o primeiro cobriria alturas de 1. decidiremos quantas classes de intervalos serão criadas. Mas a maioria das medidas ocorre uma só vez.75 1. o segundo. ele tinha a altura. Estatística 37 UAB . teríamos um monte de medidas com a frequência absoluta de 1 e não chegaríamos a qualquer conclusão. etc. conseguiu uma amostra aleatória (tabela 6).60m até 1.62 1.79 1. deve-se indicar a fonte da informação. Como apresentar uma tabela de frequências Há regras bem estabelecidas sobre como uma tabela de frequências deve ser apresentada em um trabalho acadêmico ou relatório profissional. usando as tabelas de frequência e como essas informações podem nos ajudar a entender uma população que estamos estudando. verticais. No rodapé.Frequência absoluta Frequência relativa Frequência relativa (%) Frequência cumulativa (%) 5 0.2 20 37 1. vão as informações sobre os dados contidos nas colunas. Uma tabela deve ser apresentada com um título explicativo do seu conteúdo e deve ser. deve-se usar o formato “Tabela clássica”.90 – 1.17 17 74 1.849 5 0.699 6 0. UAB 38 Licenciatura em Matemática . O formato usado deve ser o de duas barras. entram as notas que elucidam detalhes de abreviaturas ou métodos utilizados.80 – 1.06 6 97 1. O corpo da coluna é formado pelas células. Verifiquem a tabela 7. para ver como o formato final deve ser.17 17 17 1.65 – 1.749 6 0. acima.2 20 57 1.17 17 91 1. No cabeçalho.03 3 100 30 1 100 100 Altura (m) 1.649 Total Veremos na próxima aula como podemos montar gráficos.949 1 0. Também no título.60 – 1. deve ser destacada e separada por duas barras. quando necessário. da Microsoft. que são a intercessão entre as linhas e colunas. como o cabeçalho.70 – 1.899 2 0. separando o cabeçalho e uma linha contendo a tabela na parte inferior. Se usarmos uma linha final para indicar totais. devidamente.799 5 0.85 – 1. A primeira coluna é denominada coluna indicadora e contém informação sobre os dados contidos nas linhas. horizontais.75 – 1. numerada dentro do trabalho. No editor de texto Word. criando uma distribuição de frequências. Medidas de Tendência Central Como vimos. é muito simples. As medidas de tendência central são medidas da localização do “meio” ou “centro” de uma distribuição. Assim. que representam os valores centrais de uma distribuição e as medidas de dispersão. Os símbolos (pronunciado “xis barra”) ou M representam a média de uma amostra. ou valores. a soma de todos os números dividida pela quantidade dos mesmos. As outras duas medidas de tendência central são a mediana e a moda. que representam sua amplitude. A fórmula para a média aritmética é a mesma para uma amostra ou população. A definição de “meio” ou “centro” é deixada um tanto quanto vaga de propósito. precisamos resumir a variável em medidas que representem seus valores centrais e sua amplitude. Para entendermos a distribuição dos dados de uma variável.Tal formato deve ser usado em toda a extensão de um relatório ou trabalho acadêmico. de modo que o termo “tendência central” pode se referir a uma larga variedade de medidas. Abaixo. de uma variável. que é um parâmetro. Esse é o primeiro passo para um bom trabalho descritivo de Estatística aplicada a qualquer área do conhecimento. fala-se sempre nessa medida. que é uma estatística. tendo-se o cuidado com a numeração das tabelas apresentadas. Média aritmética A média aritmética é. temos as medidas de tendência central. O símbolo µ (a letra grega mu) é usado para representar a média de uma população. as quais estudaremos mais tarde. podemos ver a fórmula da média aritmética de uma amostra ( ): Estatística 39 UAB . simplesmente. A média aritmética é a medida de tendência central mais comum e a que estamos mais acostumados a usar: das nossas notas em uma disciplina até notícias nos jornais. podemos descrever uma amostra representativa de uma população através das frequências das classes. como a acima. Em muitos casos. podemos calcular a média de chutes a gol dos times nesse campeonato. Por exemplo. ou valores. a melhor medida de tendência central para uma variável discreta. 3. apenas inteiros. lembrar que o valor 20. a média aritmética é muito mais acurada. Devemos. 37 33 33 32 29 28 28 23 22 22 22 21 21 21 20 20 19 19 18 18 18 18 16 15 14 14 14 12 12 9 6 Com esses valores. ou seja. Sabemos que o número de chutes a gol é uma variável descontínua. não é a média. pois a soma dos cinco números é 20. já que esse valor não é inteiro. pois não podemos somar.Em que x é a soma de todos os números. obviamente. Para valores contínuos. 6 e 8 é igual a 4. A média aritmética. usando a fórmula acima: Mas devemos prestar atenção quando o uso da média aritmética é válido e o quanto ela representa a realidade. vermelho e verde. UAB 40 Licenciatura em Matemática . não existem números decimais. Não é possível que exista meio chute a gol.4516 é uma aproximação da realidade. por exemplo. que possuem números não inteiros (como altura ou peso). azul. os dados estão no quadro abaixo. Podemos coletar dados sobre o número de chutes a gol de cada um dos 31 times de um campeonato de futebol (tabela 8). em uma amostra e n é a quantidade de números. então. 2. não pode ser usada em variáveis categóricas. a média dos números 1. mas uma das outras medidas que veremos a seguir. então 20/5 = 4. ou valores. nessa amostra. representando um valor possível de ocorrer. organizados do maior para o menor valor: Tabela 8: Número de chutes a gol de 31 times de futebol durante um campeonato. frequentemente. 54. 16. a amplitude dos dados é maior. A mediana. 20 e 25. sabemos que há 31 valores. 16. Ainda. a mesma divide a amostra em duas partes iguais. há a mesma quantidade de valores acima da mediana e abaixo dela. pois também há três valores maiores e menores que ele. a mediana será 76. na distribuição 11. No primeiro exemplo. devemos organizar os dados por ordem de tamanho. pois há 15 valores maiores e 15 valores menores que ele. No segundo exemplo. Para calcularmos a mediana. pois há três valores menores e três maiores que esse número. do meio. mais alta a posição da mesma. 53. se temos os valores: 1. 82. quando os dados forem organizados em ordem crescente. 13. 190. indo de 1 a 1098. no meio da distribuição: 4a posição. é dependente do tamanho da amostra. novamente. com o valor de 76 caindo. a mediana é igual a 16. usada. o seu valor que se encontrará na posição indicada pela fórmula. Estatística 41 UAB .Mediana A mediana também é uma medida de tendência central. ela será 76. a amostra consiste de sete números. Se tivermos uma amostra com um número ímpar de dados. Quanto maior a amostra. Em ambos os casos. vai apenas de 1 a 92. na série 1. 12. 17. é a mediana. Por exemplo. pois é o valor que está. pois divide a distribuição em duas partes iguais. ela será aquele. E a sua posição pode ser calculada pela fórmula: Em que Me é a mediana e n o número de dados em uma variável. no quadro acima. os dados dos chutes a gol dos times em um campeonato. 379 e 1098. no entanto. A mediana independe da amplitude da amostra. exatamente. Assim. exatamente. 76. no meio da distribuição. 23. O 16º valor mais alto. 90 e 92. que corresponde a 20. Por exemplo. Mas atenção: essa fórmula serve para localizar a posição da mediana e não. Se usarmos. É o ponto central de uma distribuição: se ordenarmos os dados. exatamente. 76. pois. apesar desse valor não existir na série em questão. Por exemplo. pois quatro dos 31 times fizeram 18 chutes a gol. 100. Os valores. podemos usar a fórmula acima: Isso significa que a mediana se encontra entre o quarto e o quinto valor da série. Vejamos um exemplo: um pesquisador mediu o tempo de resolução de 20 alunos para um quebra-cabeça. A mediana é ideal. e geralmente acabamos com vários valores da frequência de ocorrência 1. que na quarta posição é 16 e na quinta. cada valor só ocorre uma vez. Moda A terceira é última medida de tendência central é a moda. ou seja.5. variaram UAB 42 Licenciatura em Matemática . 300. Nesses casos. lá em cima. 3. mesmo que seu valor específico não figure entre os dados. Já a média aritmética seria 606/6 = 101 e dá uma ideia mais adequada desse grupo de dados. 25 e 26. que possuem valores decimais. no entanto. pois em um número par de dados. que consiste simplesmente no valor que ocorre mais frequentemente.Se o número de dados da amostra é par. medidos em segundo. 12. é muito difícil que se encontrem vários valores iguais. a mediana da série é 16. 17. o que se pode fazer é agrupar os dados em intervalos e criar uma distribuição de frequências agrupadas. no nosso exemplo. Por exemplos. para a série 1. o que a deixa muito mais perto dos valores menores da série e bem distante dos maiores. 2. 20. 13. E para achá-la . para descrever a tendência central de um grupo de dados proporcionais ou em porcentagem. a moda é 18. Assim. a mediana seria 3+100/2 = 51.5. há dois valores centrais. O fato de a mediana ser uma posição a torna inadequada para certas bases de dados. 200. 16. na distribuição 11. tiramos a média aritmética desses dois valores: Assim. a mediana é o ponto da distribuição que é antecedido e precedido por igual número de dados. 17. Para dados contínuos. dos chutes a gol dos 31 times em um campeonato d futebol. já que esses ficarão entre 0 e 1 ou 0 e 100. em segundos. com seis estudantes resolvendo o problema nesse intervalo de tempo. nominais ou ordinais não numéricos. Tabela 9: Frequência absoluta dos intervalos de tempo de resolução de um quebra-cabeça. exatamente. os estilistas criam peças exclusivas que poucas pessoas vão usar e chamam isso de “moda”. Enquanto no nosso dia-a-dia. Amplitude de tempo (segundos) Frequência absoluta 500 – 599 3 600 – 699 6 700 – 799 5 800 – 899 5 900 – 999 0 1000 – 1100 1 Nessa amostra. Medidas de dispersão Vimos como podemos verificar quais os valores mais comuns em uma variável. usando as medidas de tendência central. o termo estatístico tem um significado bem diferente do sentido coloquial da palavra. Moda quer dizer apenas o que é mais comum. a amplitude de tempo que contém o maior número de registros é a de 600 a 699 segundos. Assim. calças jeans e camiseta formam a moda estatística na maioria dos países ocidentais. Estatística 43 UAB . as medidas de tendência central podem dar uma impressão errada da variável. Assim. e nenhum aluno resolveu o quebra-cabeça. por 20 alunos de uma escola. podemos criar uma distribuição de frequência agrupada (tabela 9). A moda é a única medida de tendência central que pode ser utilizada em dados categóricos. A moda estará no meio do intervalo e corresponderá a 650 segundos. e assim. no mesmo tempo. já a moda estatística é o que a maioria das pessoas está vestindo. Mas sem sabermos algo sobre como os dados estão dispersos.entre 500 e 1100. mas que três casas valem R$1. Ela é usada apenas para ilustrar o intervalo de valores dentro do qual um grupo de dados se encontra. que veremos mais tarde. e a divide pelo número de dados. se a variação é homogênea ou se os valores estão mais agrupados próximos aos extremos.00 e as outras 17 custam cerca de R$ 60. ou seja. o resultado será um desvio igual a zero.000.000. seria muito diferente de uma rua cujas 20 casas têm o mesmo valor médio. As medidas de dispersão dão uma visão mais completa e nos fazem entender melhor o tamanho da variação dos dados. os valores residuais são utilizados para calcular o quanto cada ponto de dados está afastado dos valores esperados em uma distribuição.Por exemplo. mas com pouca variação entre os preços.00. que calcula a diferença média entre cada ponto de dados (cada valor da variável) e a média dos pontos de dados.000. por exemplo. o valor absoluto da diferença deve ser medido. uma rua residencial há 20 casas com um valor médio de R$ 200. Esses resíduos podem ser calculados com base nas diferenças entre cada ponto de dados e a média.00. a amplitude só fornece informação sobre os valores extremos e não diz nada sobre os valores entre eles. de modo. no entanto. Desvio médio Para se ter uma melhor compreensão da distribuição dos dados em uma amostra. Se esse método for usado. Amplitude A mais simples medida de dispersão é a amplitude que é calculada. No entanto. pois os valores acima da média irão cancelar aqueles abaixo. em uma amostra é o desvio médio. Elas incluem a amplitude. tomando-se a diferença entre os valores máximo e mínimo do conjunto de dados. Ao se fazer esse cálculo. simplesmente. que apenas valores positivos são obtidos e o resultado é chamado de “desvio médio absoluto”: ou UAB 44 Licenciatura em Matemática . ou resíduo. a variância e o desvio padrão. um cálculo de regressão. ou através de valores estimados através de.000. Um método para calcular o desvio. o desvio médio. Em que: = desvio médio absoluto. Desse modo. A variância de uma população é um parâmetro representado por ância de uma amostra é representada por s2. No entanto. 2 . o desvio padrão. Variância Uma maneira de resolver o problema que o desvio médio apresenta é usar a variância como medida de dispersão. = média da amostra. pois a maior parte dos teoremas estatísticos se baseia na minimização da soma dos resíduos ao quadrado. quando é utilizado para análises estatísticas subsequentes. O desvio médio não é difícil de calcular e tem certo apelo intuitivo. os cálculos matemáticos se tornam muito complexos. comumente. todos os valores são positivos e a unidade da variância é o quadrado da unidade da variável. o desvio médio não é. devemos usar a fórmula da variância amostral: Estatística 45 UAB . Para usarmos a medida de dispersão mais comum. por isso. precisamos primeiro calcular a variância. = cada ponto de dados. trabalhamos com amostras que representam uma população. que veremos a seguir. usado como uma medida de dispersão. A variância de uma variável é uma medida de dispersão estatística que tira a média da distância ao quadrado entre todos os valores possíveis e a média aritmética da variável. n = total de pontos de dados na amostra. a vari- Geralmente. em vez da soma dos resíduos absolutos. Por causa dessa complexidade. Mas sabemos que. Tabela 10: Toneladas de detritos produzidos. em dez tecelagens. a medida de dispersão é usada como base na maioria dos cálculos estatísticos.Lemos a fórmula como o somatório da diferença entre cada valor e a média. As fábricas. Queremos entender quantos quilos de detritos são produzidos em média pela indústria de tecelagem. que é o de criar valores residuais muito diversos. UAB 46 Licenciatura em Matemática . A partir desse resultado. esse valor se tornará positivo. podemos calcular a diferença entre cada valor e a média. Por exemplo. se o fazemos ao quadrado. então. menos um. teremos 1. O cálculo da variância resolve um problema que o desvio médio apresenta. ao quadrado. Por exemplo. Coletamos informação de dez tecelagens e conseguimos a seguinte amostra. A aplicação da potência quadrática funciona como se utiliza um logaritmo. terão desvios da média com valores negativos. se multiplicarmos um valor negativo por ele mesmo. esse é o problema que vimos sobre o uso do desvio médio como uma medida de dispersão: se somarmos todos os valores da coluna preenchida. em toneladas de detritos por ano (tabela 10). produzir uma tabela para calcular a variância.04. como o desvio padrão. que veremos a seguir.02) = 0. Vamos aplicar essa fórmula a um exemplo. O primeiro passo é calcular a média. ou seja. a soma será zero. dividida pelo número de valores.02) x (-0. homogeneizando as diferenças quando forem calculadas outras estatísticas. A soma dos valores de nossa amostra é 582. 60. por ano. Vamos então preencher a última coluna e fazer a soma dos desvios ao quadrado que precisamos para calcular a variância (tabela 11).8.2. 60 74 58 61 56 55 54 57 65 42 Vamos. se subtrairmos a média do primeiro número. inclusive em análises avançadas.2 toneladas de detritos por ano. que produziram menos que 58. Por esse motivo. (-0. A média será 582/10 + 58. Dizemos.8 46.8 3.07 toneladas por ano ao quadrado.20 1.44 65 6.60 Agora que temos a soma de todos os desvios da média ao quadrado e sabemos que (n-1) = 10-1 = 9. Estatística 47 UAB . Quando calculamos a variância de uma população.) Desvio da média ao quadrado (Xi .2 Soma: 603.24 74 15. que a variância na quantidade de detritos produzida pelas indústrias da tecelagem é de 67.24 54 -4.Tabela 11: Desvio da média e desvio da média ao quadrado da produção de detritos em dez tecelagens.20 17.20 4. então. que é uma estatística.84 55 -3.84 56 -2.24 42 -16.8 249. Desvio Padrão A variância dá a ideia da amplitude da distribuição.20 262. usando uma unidade igual à unidade da variável. precisamos saber qual o desvio da média em geral. A diferença é que usaremos a média da população (µ). usamos a mesma fórmula.64 57 -1. mas como seu resultado é um valor ao quadrado. como vimos.8 7.44 Média: 58. que é um parâmetro.2 0. Detritos (Toneladas/ano) Desvio da média (Xi . podemos substituir os termos da fórmula: Nesse caso.04 61 2.20 10.)2 60 1.64 58 -0. em vez da média amostral ( ). a unidade da variância é uma quantidade ao quadrado. 01 e 66. o resultado é de 66.39: 42 – 54 – 55 – 56 – 57 – 58 – 60 – 61 – 65 – 74 Nesse caso. Assim. usaremos a estatística amostral como exemplo em nossa fórmula: A raiz quadrada anula a potência de dois. dada nesse caso pela média. quando representando uma estatística amostral. Seguindo o exemplo que usamos até agora. damos duas ideias básicas: uma é a da tendência central da variável. sendo representado por . Para resumir.01 toneladas/ano. então temos o desvio padrão. O desvio padrão é. Novamente. cujo resultado é dado na mesma unidade da variável. UAB 48 Licenciatura em Matemática . simplesmente. ou por s. Por isso. devemos usar o desvio padrão. Vamos ver quanto dos nossos dados estão entre 50. a quantidade média de resíduos é de 58. a média é suficiente para cobrir 80% dos dados. De volta ao nosso exemplo. precisamos saber qual o desvio geral da média em toneladas de detritos por ano.No nosso exemplo. nós apresentamos os resultados da seguinte forma: a quantidade média de resíduos da indústria de tecelagem é de 58.2 ± 8. Com estas duas medidas. teremos: Podemos então dizer que. teremos o valor de 50.39 toneladas/ano. subtraindo ou adicionando o desvio padrão. A outra é a ideia de dispersão. estamos descrevendo a maioria dos dados que analisamos.19 toneladas por ano. o formato ± s ou µ ± serve bem para descrever os dados de uma amostra ou população. se subtrairmos o desvio padrão da média. a raiz quadrada da variância. quando representando um parâmetro populacional. se somarmos os valores. fornecida pelo desvio padrão.19 toneladas por ano.2 toneladas por ano e o desvio padrão é de 8. usando nossa amostra de indústrias de tecelagem. Quando apresentamos os resultados dessa forma. conterá o nome e a unidade de medida das variáveis. Outros editores possuem funções que permitem o cálculo de estatísticas básicas. os editores de planilhas como o Excel são hoje utilizados em todas as áreas do conhecimento que apresentem dados quantificáveis. A seguir. que realizam os cálculos. que apresenta várias funções estatísticas. É muito provável que a maioria de vocês já esteja familiarizada com esse programa. para a área financeira. A primeira linha será sua linha de título. veremos como criar uma pequena base de dados no Excel e como calcular as principais estatísticas de uma amostra. (figura 1). Figura 1: Aparência de um novo arquivo no editor de planilhas do Excel. O mais popular dos editores de planilhas é o Excel da Microsoft. Criado.Estatística no Excel Os programas de computador podem economizar muito tempo de uma pesquisa estatística e os editores de planilhas são ideais para a organização das bases de dados. como as medidas de tendência central e de dispersão. Alguns desses editores servem apenas como base para que sejam listados os dados. inicialmente. para depois serem transferidos a programas estatísticos. Estatística 49 UAB . O primeiro passo é criar um novo arquivo. que em muito facilita a vida de quem trabalha com números. Figura 2: Planilha de Excel contendo a altura (em cm). devemos selecionar toda a tabela (pois se selecionarmos apenas a variável. Se houver mais de uma medida de cada indivíduo. Temos a opção de “avisar” ao programa se temos ou não uma linha de cabeçalho (figura 3). possamos ver que características são mais frequentes. organizados em ordem crescente ou decrescente. usam-se as colunas seguintes. uma célula para cada indivíduo e uma abaixo da outra. só ela será classificada) e usar a ferramenta “classificar dados” (Dados => Classificar) para organizá-los em ordem crescente ou decrescente. UAB 50 Licenciatura em Matemática . o peso (em kg) e a cor dos olhos de 12 indivíduos. sempre mantendo os valores para um mesmo indivíduo na mesma linha (figura 2). Os dados inseridos nas planilhas de Excel podem ser.A partir da linha 2. Para isso. comece a colocar os valores da variável. ou mesmo qual o intervalo (amplitude) de dados numéricos. permitindo que. em um lance. facilmente. Mesmo que eles não sejam realizados pelo Excel da Microsoft. devemos inserir o intervalo de células que contém a variável. No caso. da célula 2 da coluna B (b2) até a célula 18 da coluna B (b18)( figura 4). a simples ordenação automática dos dados já remove a fase mais demorada desse tipo de teste. alfabeticamente. de forma rápida e fácil. como as chamadas “correlações de postos”. Por exemplo. para calcular a média da altura dos indivíduos da tabela vista na figura 2. A ordenação dos dados é importante em vários testes estatísticos. entre parênteses. os dados pela variável “Cor dos olhos”. Estatística 51 UAB . devemos ir até o fim da coluna em questão e digitar a seguinte fórmula: =média(b2:b13) O Excel reconhece o sinal de “=” como um aviso que vamos usar uma fórmula e. separado por dois pontos.Figura 3: Usando a ferramenta “Classificar dados” do Excel para ordenar. Média aritmética O Excel possui um sistema de fórmulas que podemos utilizar. Medidas de tendência central no Excel Podemos calcular as medidas de tendência central com a ajuda do programa Excel. O valor da média aparecerá. na célula em que escrevemos a fórmula (figura 5). pelo Excel. UAB 52 Licenciatura em Matemática . Figura 5: O valor da média da variável “Altura (cm)” é calculado. calcula a média dos dados em questão. bastando para isso que pressionemos a tecla “enter”.Figura 4: Calculando a média de uma variável no Excel. automaticamente. de forma automática. O programa. automaticamente. calculado (figura 7). é MED. no Excel. automaticamente. Figura 6: A fórmula para a mediana no Excel. usando a mesma tabela. Há uma fórmula para isso e seu comando. para que possamos calcular a mediana de nossa variável. a fórmula “=med(b2:b13)”. devemos escrever. o valor da mediana é. Figura 7: A mediana dos valores de altura de uma amostra com 20 indivíduos. em uma célula livre. pressionando-se a tecla “enter”. vamos calcular a mediana para a altura dos indivíduos. Assim. como pode ser visto na figura 6.Mediana Agora. Estatística 53 UAB . Novamente. Como fizemos para a organização dos dados. da mesma forma como foi vista naffigura 3. UAB 54 Licenciatura em Matemática . inserindo a fórmula “=var (b2:b13)” em uma célula livre ffigura 9). vamos usar nosso exemplo da altura de um grupo de indivíduos. vamos selecionar toda a tabela e pedir que o programa classifique os dados pela variável “cor dos olhos”. principalmente. Então. Figura 8: Dados nominais ordenados permitem a identificação da classe modal no Excel. O Excel possui um comando para calcular a variância: VAR. com grandes bases de dados. com a mesma tabela que estamos utilizando. vamos usar a variável categórica nominal “cor dos olhos”.Moda Para calcular a moda. Com as classes ordenadas. isso é muito útil. Variância e desvio padrão com Excel Podemos usar o Excel para calcular a variância de uma variável bem rapidamente. contar qual a classe mais abundante. em uma amostra de 12. apresentando olhos castanhos ffigura 8). com sete indivíduos. podemos. facilmente. Castanho é a moda para a cor dos olhos dos indivíduos da amostra. castanho e verde) e está representada na figura 2. que possui três classes (azul. automaticamente. Figura 10: A variância dos valores de altura de uma amostra com 20 indivíduos. ao se pressionar “enter” ffigura 10). o valor é calculado. tirar a raiz quadrada da variância em uma calculadora comum.Figura 9: A fórmula para calcular a variância em Excel. ou podemos aplicar o comando DESVPAD no Excel ffigura 11). Novamente. Há duas maneiras de se calcular o desvio padrão a partir de agora: podemos. simplesmente. Estatística 55 UAB . Figura 11: A fórmula do desvio padrão no Excel. A vantagem de se utilizar a fórmula na planilha do Excel é que podemos ter todos os cálculos em um único luga (ffigura 12). Não há problema se terminamos com uma sequência de valores, aparentemente, desconhecidos abaixo de nossos dados, pois, quando selecionamos a célula, a fórmula utilizada aparece na caixa de função (fx) no alto da janela do Excel. Figura 12: O desvio padrão dos valores de altura de uma amostra com 20 indivíduos. UAB 56 Licenciatura em Matemática Em nossa base de dados, estudamos a variável “Altura (cm)” e verificamos que, em nossa amostra, os indivíduos tinham uma altura média de 164,17 ± 11,38 cm. Podemos, rapidamente, calcular as mesmas estatísticas para a variável “Peso (kg)”, ou qualquer outra, em outras bases de dados, com a ajuda dos comandos e fórmulas do MS Excel. Resumo As medidas de tendência central são a média aritmética, a mediana e a moda, e dão uma ideia em que está a maioria dos dados ou onde cai o meio da distribuição, assim: • a média aritmética é influenciada pelos valores extremos; • a mediana é apenas a posição do valor central e não sofre influência dos valores extremos; • a moda é a classe mais comum em um grupo de dados. A média aritmética serve como tendência central de muitos tipos de dados, desde que a distância entre eles seja, relativamente, homogênea. Em bases de dados cujos valores estão agrupados mais aos extremos, a mediana se torna mais apropriada; essa medida também é ideal para variáveis proporcionais ou em porcentagem. A moda é usada para variáveis categóricas ou dados contínuos agrupados. As medidas de dispersão dão a ideia da amplitude da distribuição, que é, simplesmente, a distância entre o menor e o maior valor. O desvio médio parece ser adequado para descrever a amplitude, mas os cálculos complexos necessários a seu uso o tornam inadequado para análises estatísticas. A variância dá o desvio ao quadrado da média; calcula-se o desvio padrão, a partir desse valor, que é a medida de dispersão mais usada em análises estatísticas descritivas. A média e o desvio padrão juntos dão uma boa ideia de como é uma variável: sabemos onde estão a maioria dos dados e o quanto eles variam. O formato ± s é a maneira mais comum de resumir uma variável. Estatística 57 UAB Referências LEME, R. A. DA S.: Curso de Estatística – Elementos. Rio de Janeiro: AO LIVRO TÉCNICO. 1967. LEVIN, J.: Estatística Aplicada às Ciências Humanas. São Paulo: HARPER & ROW DO BRASIL. 1978. SCHMULLER, J.: Statistical Analysis with Excel. Hoboken: Willey Publishing Inc. 2009. SPIEGELRRAY R, Estatística. MAKRON. 1994 UAB 58 Licenciatura em Matemática Estatística 59 UAB . UAB 60 Licenciatura em Matemática . Assunto Nesta aula. veremos como é possível representar um conjunto de dados amostrais visualmente. • Aprender a construir os tipos mais comuns de representações gráficas na Estatística. ajudando-nos a reconhecer padrões já existentes. Nesta aula. Há dezenas de possíveis representações gráficas na Estatística. Introdução Uma forma simples de sumarizar uma variável é através das representações gráficas. a distribuição das frequências.Representações gráficas Objetivos • Conhecer a apresentação visual de dados amostrais e sua aplicação na pesquisa estatística. no entanto. • Usar o Excel na elaboração de gráficos. desenhados a mão Estatística 61 UAB . penosamente.entende-se. de forma a permitir uma rápida compreensão da informação coletada. Veremos os formatos de gráficos mais comuns para representar uma única variável e algumas maneiras de trabalhar com múltiplas informações visíveis. • Conhecer alguns tipos de gráficos para variáveis múltiplas. Gráficos e diagramas ajudam a visualizar os dados imediatamente . assim como aprenderemos a aplicar esse conhecimento nas pesquisas estatísticas. vamos nos ater às formas mais utilizadas em relatórios e trabalhos acadêmicos. O uso de gráficos em trabalhos estatísticos cresceu a partir da popularização dos computadores: gráficos que eram.Aula 3 . de forma a permitir a descrição adequada de dados amostrais. de pronto. importante. veremos o uso das representações de dados brutos na Estatística Inferencial. Esse tipo de sumário gráfico permite uma visualização imediata das frequências de ocorrência de dados categóricos. • Diagramas do tipo “ramo e folha”. Nos próximos itens vamos aprender a construir cada um deles. por distrair a atenção dos valores reais. que podem ser agrupadas ou cumulativas. muitas cores. no curso. a representação em um gráfico de barras fornece uma compreensão instan- UAB 62 Licenciatura em Matemática . texturas e formas originais. Para a análise descritiva de um grupo de dados. em segundos. há um lado bom e um lado mau no uso crescente de representações gráficas. igualmente. Qualquer resultado extraído de um grupo de dados é. geralmente. No lado bom. Porém. • Gráficos de frequência contínua e histogramas. existe o uso excessivo de recursos visuais mais sofisticados. os métodos de representação visual incluem: • Gráficos de barras e de “torta”. envolvem a apresentação de frequências de distribuição.podem ser feitos. Gráficos de barras e “torta” Gráficos de barras e “tortas” são o tipo mais comum de representação estatística. • Polígonos de frequência absoluta e curva de frequência acumulada. como animações. mas péssimo para a Ciência. As representações gráficas de uma variável. No mau. Logo. e com possibilidades infinitas de cores e formas. os gráficos fáceis de fazer incentivam a importância da análise exploratória. Para dados ordinais. Poucas linhas. então não há necessidade de distrair o leitor com cores e formas. Há uma regra muito simples no uso de gráficos: fazer tudo o mais simples possível. devemos lembrar que dados de uma pesquisa devem ser entendidos e necessitam ser representados o mais precisamente possível. hoje em dia. cores padronizadas e uma apresentação limpa são muito mais eficazes para apresentar dados científicos. Mais adiante. O embelezamento excessivo das representações estatísticas gráficas é ótimo para uma apresentação de negócios. dimensões múltiplas. Em seguida. mas os contínuos precisam ser separados em intervalos) com frequências absolutas. o tamanho da barra é limitado pela repetição de cada classe. os dados de uma variável nominal. Estatística 63 UAB . detalhando o tamanho da amostra e de onde vieram os dados (fig. um pouco mais de 10% dos eleitores em potencial. Vamos. A frequência absoluta de cada categoria também pode ser exibida. Descobrimos que 54 votariam em José. 89 em Ana e 65 em Robert. 167 em Maria. 198 em João. ou seja. representar. Aí. podemos criar um gráfico de barras.tânea sobre a distribuição. então. que vai conter as classes de materiais dentro da variável e o eixo de y. enquanto o gráfico de “torta” nos permite ver o tamanho das “fatias” de cada categoria nominal prontamente. na horizontal. desenhamos as barras correspondentes a cada classe. e para isso. Nela temos o eixo de x. Primeiro. Estamos interessados em saber qual candidato seria eleito como representante estudantil de uma universidade. graduado de forma a representar as frequências absolutas de cada classe. em um gráfico de barras. Todo gráfico deve ser acompanhado de uma legenda. Figura 1: Frequências absolutas das intenções de votos para a eleição de um representante estudantil de uma universidade (n = 573). devemos criar a área do gráfico. entrevistamos 573 alunos de um total de 5000. neste tipo de representação são usados dados categóricos (nominais e ordinais podem ser usados diretamente. 1). Agora que nossos dados foram quantificados. vertical. manualmente. qual é o candidato que possui mais intenções de voto. 240.Nesse caso. a variável é nominal. Para fazer. Outra forma de se representar esse tipo de dados é através do gráfico de “torta” (fig. sabemos. se estivéssemos pesquisando eleições estaduais ou nacionais. devemos transformar as frequências absolutas em relativas e daí em graus. a ordem das categorias também deverá ser mantida no gráfico. 159 e 58 eleitores. Isso é muito simples: se UAB 64 Licenciatura em Matemática . portanto podemos ordenar as categorias no eixo de x da forma que quisermos. 2). A grande vantagem desse tipo de gráfico é a visualização imediata da categoria mais frequente. especialmente. mesmo que as amostras fossem respectivamente de 330. Por exemplo. A grande diferença entre o gráfico de barras e o de torta é que o último representa dados proporcionais: os 360° do círculo representam 100% e cada fatia representa a proporção que cada categoria tem nesses 100%: Figura 2: Frequências relativas das intenções de votos para a eleição de um representante estudantil de uma universidade (n = 573). Os gráficos de torta são perfeitos para comparar as diferenças de frequências entre diferentes amostras. Se a variável fosse ordinal. poderíamos comparar os resultados entre os municípios. imediatamente. no caso. um gráfico de torta. se elas têm tamanhos diferentes. 93 Maria 167 29. Tabela 1: Frequências absolutas e relativas das intenções de votos para a eleição de um representante estudantil de uma universidade (n = 573) e seus equivalentes em graus (°).53 55. ou seja. mas de forma geral. Medidas como altura. então 1% = . nesses casos. como fizemos com o tempo de resposta de estudantes a um quebra-cabeça na aula anterior. variáveis contínuas possuem valores que aparecem apenas uma vez. relativa (%) Graus (°) José 54 9.40 Ana 89 15.92 Robert 65 11. variáveis contínuas.92 João 198 34. antes de começar os gráficos. O gráfico de barras contínuas daqueles dados teria a aparência vista na fig. absoluta Fr.84 Total 573 100 360 Com o uso do compasso e do transferidor. Estatística 65 UAB .34 40.55 124.14 104. O número de casas decimais usadas. Assim.100% = 360°. dando ideia do padrão geral da distribuição. peso ou comprimento podem ser representadas assim. seguindo nosso exemplo anterior. Gráficos de barras contínuas e histogramas Esses dois tipos de representação são utilizados para sumarizar intervalos ou escalas de razão.42 33. Candidato Fr. vamos construir uma tabela (tabela 1). devemos criar intervalos de valores. Assim. 3. podemos desenhar o gráfico de torta e colorir as “fatias” a gosto. depende do nível de detalhe necessário e da acurácia da medição. ou proporcionais. UAB 66 Licenciatura em Matemática . A principal característica do histograma é que a soma das áreas de suas barras vai sempre ser 1. o que é igual a 100%. por 20 alunos de uma escola. Vamos imaginar que coletamos informação sobre o comprimento das espigas de uma variedade de milho. das relativas.Figura 3: Histograma de frequências absolutas dos intervalos de tempo de resolução de um quebra-cabeça. chegamos à tabela 2. A diferença entre o gráfico de barras contínuas e um histograma é a mesma que entre um gráfico de barras e um de torta: o gráfico de barras contínuas é criado em cima de frequências absolutas e o histograma. em centímetros. Após medirmos 30 espigas. em segundos. de 30 espigas da variedade A de milho. Tabela 2: Tabela de frequências absoluta e relativa dos intervalos de comprimento. de 30 espigas da variedade A de milho.9 10 0.2 19 – 20.9 6 0.Tamanho da espiga (cm) Fr.9 2 0. relativa 15 – 16. Estatística 67 UAB . podemos construir um histograma (fig. informações vindas de amostras com tamanhos diferentes. em centímetros. lado a lado.3 23 – 24.9 9 0. absoluta Fr.9 3 0.1 Total 30 1 Com as frequências relativas. 4). A vantagem dos histogramas é a mesma do gráfico de torta: podemos colocar.33 21 – 22. Figura 4: Histograma de frequências relativas dos intervalos de comprimento.07 17 – 18. usaremos. Número de moradores por domicílio Número de domicílios 1 17 2 30 3 26 4 17 5 13 6 6 Total 109 O polígono de frequência pode ser construído tanto com frequências absolutas quanto relativas. as absolutas (fig. nesse caso. digamos que estamos tentando descobrir o número de moradores em 109 apartamentos de um conjunto residencial. Os resultados que encontramos estão na tabela 3. Polígonos e curvas de frequência Outra forma de apresentar frequências. basicamente.pois os dados estão representados em proporções. UAB 68 Licenciatura em Matemática . Não se poderia fazer isso com um gráfico de barras contínuas a não ser que as amostras fossem do mesmo tamanho. Por exemplo. é através dos polígonos e curvas de frequência. graficamente. Contudo.5). é um gráfico cujos pontos são conectados por uma linha. O polígono de frequência pode ser usado quando não há intervalos entre os valores e. apenas. Tabela 3: Tabela de frequências absolutas do número de moradores em 109 domicílios de um conjunto habitacional. mais duas colunas à nossa tabela.97 4 17 15.12 3 26 23. como vimos nas aulas passadas.93 94.60 82.50 5.50 100 100 100 6 Total Estatística 6 109 69 UAB . vamos usar frequências relativas e vamos somar cada valor com o anterior. Tabela 4: Tabela de frequências absoluta. criando a tabela 4. Número de espécies vegetais Número de lotes Fr.60 15. relativa e acumulada do número de moradores em 109 domicílios de um conjunto habitacional.52 43. Adicionaremos.85 66.57 5 13 11. relativa (%) Fr. acumulada (%) 1 17 15. Podemos representar os mesmos dados em uma curva de frequências acumuladas. Desta vez.60 2 30 27. então.Figura 5: Polígono de frequências absolutas do número de moradores em 109 domicílios de um conjunto habitacional. pois não representam todos os valores reais de uma variável. os sumariza e agrupa de forma a dar uma visão geral dos dados. chamados dendrogramas. e sim. ou com o auxílio de uma máquina de escrever ou processador de texto. Diagramas de “ramo e folha” Todas as representações gráficas anteriores perdem informação. como vista na fig. Vejamos um exemplo: coletamos a emissão de dióxido de carbono de 35 indústrias (em toneladas por ano) e conseguimos os seguintes dados: UAB 70 Licenciatura em Matemática . (apesar desse termo também ser usado para outros diagramas. Esse tipo de gráfico é. preservam os valores individuais dos dados. útil para comparar distribuições ordinais entre amostras de tamanhos diferentes e para entender onde está a maioria dos dados.O gráfico resultante será uma curva de frequências acumuladas. Outra vantagem dos diagramas de “ramo e folha” é que eles podem ser montados manualmente. especialmente em Linguística e Biologia). Figura 6: Curva de frequências relativas acumuladas do número de moradores em 109 domicílios de um conjunto habitacional. às vezes. Os diagramas de “ramo e folha”. em avaliações de segurança e em estudos sobre populações humanas. extremamente. sem a necessidade de planilhas ou programas estatísticos. no controle de qualidade. 6. Curvas cumulativas são muito usadas em avaliações ambientais. devemos separar os valores em dois dígitos. também colocaremos dois “ramos” para cada dezena: um conterá as “folhas” de 0 a 4. de 5 a 9: 2| 2| 5 3| 0 3| 5 4| 0 4| 5 5| 0 5| 7 6| 6| 6 7 4 8 0 7 0 7 8 8 8 9 0 2 3 3 3 4 7 7 8 8 8 8 8 9 3 8 Estatística 71 UAB . formando o “ramo”: 2 3 4 5 6 Depois acrescentamos os dígitos que sobraram (as unidades) nas fileiras correspondentes: são as “folhas”: 2| 5 3| 0 4| 0 5| 0 6| 6 7 4 0 0 8 5 8 8 8 9 0 2 3 3 3 4 5 7 7 7 8 8 8 8 8 9 3 7 7 8 Todos os dados estão expostos no diagrama. e o outro.48 48 43 48 38 57 49 40 53 35 66 48 44 43 30 48 47 40 43 38 50 57 34 25 38 58 40 42 45 28 47 50 47 39 27 Para criar o diagrama. Se quisermos. Escrevemos os dígitos das dezenas verticalmente. no eixo de y. pode-se usar a informação para outros tipos de análises ou representações. pois a amostra já está totalmente representada. ou por que queremos representar como duas ou mais características são afetadas por uma determinada variação de condições. podem ser usados para representar duas ou mais amostras de uma mesma população. como o gráfico acima. a frequência absoluta ou relativa da ocorrência de uma característica. em cada domicílio de um conjunto habitacional através dos anos. A mesma técnica pode ser usada com gráficos de barras ou curvas de frequência. usando os dados sobre uma mesma variável de amostras obtidas de populações diferentes. nossos gráficos apresentam. quais os valores mais repetidos. 2005 e 2010. ou seja. seja por que desejamos verificar se há alguma influência entre duas características de um mesmo elemento de uma população. Gráficos com informações múltiplas Às vezes. ou da mesma população em momentos diferentes. imediatamente.Além desse tipo de diagrama permitir que observemos. estamos represen- UAB 72 Licenciatura em Matemática . é necessário que se represente mais de uma informação em um único gráfico. podemos usar um polígono de frequência como o da figura 5 e criar linhas separadas para cada ano estudado (fig. Gráficos mais complexos. Figura 7: Polígonos de frequências absolutas do número de moradores em 109 domicílios de um conjunto habitacional nos Censos de 2000. se quisermos visualizar a variação do número de moradores. baseados nos tipos que vimos até agora. Por exemplo.7). Até agora. tando apenas uma variável. Para representar as relações entre duas ou mais variáveis, x e y vão representar duas características que se encontram em um indivíduo, ou elemento, da amostra. Por exemplo, podemos usar um gráfico de dispersão para verificar a relação entre duas variáveis. Digamos que pesamos e medimos 12 alunos de uma sala de aula e gostaríamos de saber se, como era esperado, os alunos mais pesados são também os mais altos. Então, usamos do eixo de x para a altura e o de y para o peso, e criamos um gráfico com doze pontos, cada um representando um aluno (fig. 8). Figura 8: Relação entre altura (em kg) e peso (em cm) de 12 alunos de uma escola municipal. É fácil perceber pelo gráfico da figura 7 que, de forma geral, quanto mais alto um aluno, mais pesado ele é, mesmo que a relação entre as duas variáveis não seja perfeita. Quanto mais dados apresentamos em um gráfico de dispersão, ou seja, quanto maior a amostra, mais visualmente clara se torna a existência, ou não, de uma relação entre as variáveis. Temos que nos lembrar que, cada ponto em um gráfico de dispersão é um elemento ou indivíduo da amostra; assim, se n = 250, haverá 250 pontos em um gráfico de dispersão xy. Voltaremos a falar desse tipo de gráfico e de sua interpretação, quando abordarmos Regressão. Estatística 73 UAB Os gráficos “em caixas” ou boxplots são muito úteis para visualizar subgrupos dentro de uma amostra. Digamos que tenhamos medido a altura dos indivíduos em um grupo de 13 mulheres e 13 homens (n = 26) e gostaríamos de visualizar uma possível diferença na dispersão e tendência central da altura em cada um dos gêneros. Podemos, então, criar um gráfico boxplot, usando o eixo de y para a altura em centímetros e o eixo de x para as duas categorias de interesse: mulheres e homens. Assim, o gráfico é criado traçando-se uma linha vertical sobre cada categoria que vai do menor ao maior valor para cada categoria, marcando os extremos da dispersão. A partir dessa linha, é marcado um ponto da medida da tendência central escolhida e marca-se, a partir da medida central, um valor de medida de dispersão acima e abaixo dela. Por exemplo, se usarmos a média, então marcaremos na linha a média e o desvio padrão positivo e negativo; se usarmos a mediana, usaremos o primeiro e o terceiro quartis (um quartil se consegue, dividindo a distância entre a mediana e os extremos em dois). A partir dessas medidas, desenha-se uma caixa limitando onde a maioria da população se encontra. O gráfico visto na fig. 9 ilustra como, em nossa amostra, há uma diferença aparente na distribuição das alturas entre mulheres e homens, sendo eles, geralmente, mais altos. Figura 9: Boxplot das alturas, em cm, de 13 mulheres e 13 homens; a linha central marca a mediana. UAB 74 Licenciatura em Matemática Sendo uma representação geral, o boxplot é mais indicado para amostras grandes, e é normalmente usado para ilustrar análises de variância. Em trabalhos gerais, ou quando a amostra é, relativamente, pequena, uma forma de representar a diferença entre subgrupos, sem perder nenhuma informação é o gráfico de valores individuais. Nele, cada valor (no nosso caso, cada indivíduo) é marcado como um ponto, formando uma linha vertical sobre cada categoria do eixo de x. Os dados usados no gráfico da figura 9, se apresentados em um gráfico de valores individuais, apresentam-se como visto na figura 10. Figura 10: Gráfico de valores individuais da altura, em cm, de 13 mulheres e 13 homens. O losango representa a média. É possível representar a média ± desvio padrão, ou a mediana e o primeiro e terceiro quartis (Q1 e Q3), usando símbolos, como o da média acima, ou linhas horizontais curtas. Há dezenas de outros gráficos múltiplos para representar a relação entre variáveis ou observar diferenças dentro de subgrupos amostrais e muitos deles são utilizados em conjunto com testes estatísticos específicos. Várias análises fazem uso de gráficos tridimensionais (com os de eixos x, y e z), como pesquisas de geografia, geologia, cartografia e oceanografia que usam a estatística espacial. Os tipos apresentados aqui, no entanto, são os mais comumente usados para descrever dados. Estatística 75 UAB até que se cubra a área desejada (fig. a área selecionada será usada para confeccionar um gráfico. e assim abriremos uma caixa de diálogo da função. Mas alguns deles não podem ser preparados pelo Excel e dependem de programas de estatística mais sofisticados. 12). clicamos no ícone do assistente de gráfico (fig. movendo as teclas direcionais enquanto se pressiona a tecla “shift”. preparada. adequadamente. Geralmente. UAB 76 Licenciatura em Matemática . desde que a tabela usada para criá-los esteja. uma vez que essa informação pode ser incluída depois. é possível ilustrar um relatório de estatística descritiva usando apenas o Excel. o “Assistente de gráfico” (um ícone com um gráfico no alto da barra de tarefas. 11). Em seguida. isso é feito. Há vários gráficos que podem ser criados com essa função. Não é necessário incluir sempre o título das colunas. à direita). Figura 11: Tabela de Excel com a frequência de intenção de votos em uma eleição para representante estudantil.Representações gráficas no Excel O Excel tem uma função para criar gráficos. O primeiro passo para criar um gráfico no Excel é selecionar os dados que queremos representar. porém. se queremos fazer um gráfico de barras (no Excel. além de permitir formatos personalizados. chamado de colunas. 13). A caixa de diálogo do Assistente de Gráfico oferece uma grande variedade de formatos pré-estabelecidos. Por exemplo. Figura 13: Caixa de diálogo do Assistente de Gráfico no Excel da Microsoft.Figura 12: Assistente de gráficos no Excel da Microsoft. clicamos no ícone correspondente (fig. Estatística 77 UAB . o de barras é orientado horizontalmente). 15). Podemos editar o gráfico. removendo legendas laterais desnecessárias. usadas em brochuras comerciais e em jornais e revistas. retirando linhas verticais. que é a recomendada na maioria dos relatórios estatísticos ou trabalhos acadêmicos (fig. acrescentando a legenda dos eixos. até aquelas que comportam dois conjuntos de dados ou têm barras tridimensionais. 14). de modo geral. Vamos escolher a apresentação mais simples. que vamos fazer. Há inúmeras opções de edição e apenas a prática com esse programa de computador permite explorar todas as possibilidades. As apresentações mais. visualmente. tridimensionais. (fig. Figura 14: Segunda etapa da criação de um gráfico de colunas no Excel da Microsoft. sofisticadas.Há várias opções de representação. etc. UAB 78 Licenciatura em Matemática .. etc. desde a mais simples. são. com efeitos de textura. Figura 16: Gráfico de barras (colunas) preparado pelo Excel da Microsoft. sempre que a tabela original dos dados for modificada. 16) ou em uma nova planilha. também existe a opção de atualização automática. Se ele for copiado e colado em um documento de Word. desde que os dois documentos estejam associados. Assim. Estatística 79 UAB . E o mesmo pode ser salvo na própria planilha do Excel (fig. ainda podemos editar o gráfico. o gráfico será. Depois de concluído. automaticamente. mudando cores e legendas.Figura 15: Editando um gráfico de colunas no Excel da Microsoft. atualizado. O gráfico de torta final será aquele que vimos na figura 2. 17).Os mesmos passos devem ser seguidos para preparar um gráfico de torta. Também é possível mudar o valor inicial dos eixos. Para os gráficos de dispersão. após o mesmo estar pronto. O Assistente de Gráfico permite que algumas séries. Para isso. selecionamos a opção inicial “Dispersão (XY)” na Caixa de Diálogo. muitas outras características podem ser editadas. Seguindo os mesmos passos que o gráfico anterior. podemos editar o diagrama durante a criação ou após estar pronto. UAB 80 Licenciatura em Matemática . Figura 17: Caixa de diálogo do Assistente de Gráfico do Excel da Microsoft. abrindo a caixa de diálogo para edição dele (fig. Assim. sejam removidas da apresentação gráfica. Polígonos e curvas de frequência acumulada são feitos com a opção de “gráficos de linhas” no assistente de gráfico. 18). Basta selecionar esse tipo quando abrir o assistente de gráfico (fig. como visto no gráfico da figura 8. mostrando as opções para um gráfico de torta (pizza). ou variáveis. incluídas em uma tabela. basta clicar duas vezes no eixo que se quer modificar. A forma do gráfico vai depender se estamos usando frequências absolutas ou acumuladas. as curvas de frequência acumulada e os gráficos de “ramo e folha”. ou em gráficos multivariados. de torta. os histogramas. Estatística 81 UAB . Resumo Representações gráficas são. esse editor de planilhas pode criar a maior parte das representações gráficas mais importantes para auxiliar a visualização imediata de dados amostrais. Todos os gráficos pedem. representando amostras múltiplas. extremamente. Por fim. e apenas com a prática é possível explorar a maioria dos recursos que esse programa de computador oferece. para sua confecção. úteis para a visualização de dados amostrais e são parte indispensável de qualquer relatório de pesquisa que envolva análises estatísticas. como os gráficos de dispersão. Informações múltiplas podem ser representadas em gráficos de frequências. em que mais de uma variável podem ser representadas. A enormidade de funções e opções de edição desses gráficos merece ser experimentada. Os tipos mais comuns de gráficos de frequência para uma variável são os gráficos de barras. os polígonos de frequência. a criação de tabelas de frequência.Figura 18: Caixa de diálogo para edição de um eixo de um gráfico do Excel da Microsoft. SCHMULLER.: Problem Solving – A Statistician’s Guide. São Paulo: HARPER & ROW DO BRASIL.: Statistical Analysis with Excel. 1978. 2009.: Introdução à Bioestatística. VIEIRA.Subgrupos amostrais podem ser representados através de gráficos de caixas (boxplots) ou de valores individuais. J. UAB 82 Licenciatura em Matemática . Referências CHATFIELD. LEVIN. São Paulo: EDITORA CAMPUS. C. 1998. London: CHAPMAN & HALL. 1991. S. 3ª edição. Hoboken: Willey Publishing Inc. O editor de planilhas do Excel possui um Assistente de Gráfico que permite a criação rápida de uma variedade de representações gráficas e apresenta inúmeros recursos para personalizar os gráficos criados. J. M.: Estatística Aplicada às Ciências Humanas. Estatística 83 UAB . UAB 84 Licenciatura em Matemática . vamos entender como funciona a Estatística e como podemos confiar que uma amostra seja representativa de uma população. desde os tempos romanos. Assim. provável.Probabilidades Objetivos • Entender os conceitos básicos de probabilidades e suas relações com a análise estatística de uma amostra. geralmente. Esse termo era empregado. Uma opinião “provável” era aquela que as pessoas sensatas teriam. então. Introdução O termo “probabilidade” vem do latim probabilis. Estatística 85 UAB . • Aprender a trabalhar com probabilidades aplicadas aos diversos tipos de variáveis. um nobre era provavelmente (probabilis) uma testemunha mais confiável que um plebeu. relacionada à nobreza. vamos compreender como as leis da probabilidade podem ser usadas para estimar parâmetros de uma população. Só quando o estudo matemático das “chances” se tornou mais profundo. principalmente no contexto jurídico e se referia à qualidade de uma testemunha legal ou à medida de autoridade de um cidadão. Até o século XVII. foi cunhado o termo “probabilidade” com o sentido que usamos hoje.Aula 4 . e era. o termo probabilis era usado no sentido de “aprovação” de uma opinião ou ação. Assunto Neste módulo. Vimos no primeiro módulo que a Estatística é baseada em probabilidades. que também era médico. 2). O italiano renascentista Girolamo Cardano (1501-1576. Os dois franceses passaram anos trocando ideias sobre probabilidades. resolveu as primeiras equações algébricas. descreveu os sintomas e desenvolvimento da febre tifóide. porque Pascal começou a se interessar pelas recém-criadas ciências econômicas e sociais. O livro só foi publicado quase um século após sua morte. Fermat era também advogado. em 1560. Nele. o Líber de Ludo Aleae. médico. Figura 1: Girolamo Cardano (1501-1576). inventou a primeira calculadora mecânica e desenvolveu muitas ideias sobre a natureza física do universo. Há milênios que jogadores tentam entender as chances em jogos diversos e apostam dinheiro. fig. foi pioneiro em muitas ciências. matemático e advogado. Amigo de Leonardo da Vinci.Uma Ciência de Jogadores O estudo das probabilidades é tão antigo quanto os chamados “jogos de azar”. 1) era filósofo. O Nascimento da Ciência Probabilística Considera-se que o estudo das probabilidades se tornou formal com a correspondência entre os matemáticos e filósofos franceses Pierre de Fermat (1601-1665) e Blaise Pascal (1623 – 1662. o Livro dos Jogos de Dados. calculando a probabilidade de que os ganhos cubram o investimento inicial. fig. também era um jogador inveterado e escreveu. UAB 86 Licenciatura em Matemática . Fonte: Wikimedia Commons. mas desenvolveu teoremas que servem de base ao Cálculo Diferencial moderno. há o primeiro tratamento sistemático das probabilidades (ou ‘chances’) e um capítulo inteiro em como trapacear. e descobriu a diferença entre energia elétrica e magnética. mais tarde revisadas por outros intelectuais. Já Pascal. dedicado ao estudo formal das probabilidades foi escrito por Christiaan Huygens (1629-1695). o que serviu mais tarde para o estudo das partículas subatômicas. Figura 3: Abraham de Moivre (1667-1754). fig. exclusivamente. de Abraham de Moivre (1667 – 1754. Seu livro sobre probabilidades foi escrito. usando teoremas com séculos de vida. Fonte: Wikimedia Commons. Vários matemáticos desenvolveram o tema através dos séculos XIX e XX. colocaram o estudo das probabilidades como um ramo formal da Matemática: Ars Conjectandi. o uso dos computadores permite cálculos quase infinitos. Já no século XXI. 3). O primeiro livro. Huygens descobriu que a luz se propaga em ondas. porque Pascal o encorajou. ou a Arte da Conjectura. físico e matemático holandês. Dois livros importantes. do século XVIII. a Doutrina das Chances. Fonte: Wikimedia Commons.Figura 2: Blaise Pascal (1623-1662). de Jakob Bernoulli (1654 – 1705) e The Doctrine of Chances. Estatística 87 UAB . UAB 88 Licenciatura em Matemática . Sabemos que existem dados “desonestos”. totalmente. ou “dado de jogar”. Toda vez que lançamos o dado. se jogarmos um dado três vezes e obtivermos três 1. ou seja. isso só se aplica a um dado de jogar “honesto”. Dizemos que a probabilidade associada a um evento é o número de vezes que tal evento pode ocorrer em relação ao número total de eventos. No contexto da Estatística. Essa relação entre jogos e probabilidade perdura até hoje nos termos que usamos em Estatística: a palavra “aleatório” vem do latim Alea. Isso vale para cada um dos valores em um dado. apostadores querem saber quais as chances que suas apostas têm de ganhar “a sorte grande”. ou seja. já que o dado tem seis faces e só uma tem o valor três. Esse é um conceito muito importante para entendermos sobre a probabilidade: que não é cumulativa. teremos quase 17% de chance de que ele caia em um número em particular. isso não quer dizer que temos mais chance de que saia um 6.67%. toda vez que o lançarmos. da sorte: Alea jacta est. provavelmente. o dado foi lançado. ou à chance que esse valor ou evento ocorra ao acaso. Por exemplo. não conseguiremos um número diferente em cada jogada. em um dado de jogar temos seis faces numeradas. há a mesma chance de cair em qualquer uma das seis faces. o termo probabilidade refere-se à frequência relativa de ocorrência de um valor ou evento qualquer. É conhecida a frase de Júlio César antes de uma dura campanha militar cujo resultado dependia quase. 166666667 = 16. Se usarmos um dado honesto e o jogarmos apenas seis vezes. Mas. feitos para sempre dar valores mais altos.Conceitos básicos da Probabilidade O estudo da probabilidade surgiu por causa dos chamados “jogos de azar”. temos quase 17% de chance que saia um 6. Desde a Grécia antiga. A probabilidade de obtermos um três quando lançamos um dado vai ser: Probabilidade de obter um três = = 0. Nossa amostra é pequena demais para representar as probabilidades de todos os possíveis lançamentos de dados. Com um dado de jogar honesto. então podemos ter uma distribuição como a representada na figura 4. todas as faces aparecem. no caso de um dado de jogar “honesto”. 5): Figura 5: Distribuição de frequências da ocorrência das faces de um dado em 20 lançamentos. Dessa vez. Não conseguimos nem um 4 ou 5 nas seis vezes que jogamos os dados. Lembremos que. há uma grande diferença entre as frequências com que as faces aparecem. ainda. todas as faces têm chances iguais de apa- Estatística 89 UAB . Mas. Vejamos o que acontece quando jogamos o dado 20 vezes (fig.Figura 4: Distribuição de frequências da ocorrência das faces de um dado em seis lançamentos. a face 1 e a face 6 apareceram duas vezes cada. no entanto. Apenas as faces 2 e 3 tiveram a frequência esperada. Vamos continuar jogando o dado e anotando os resultados.recer. UAB 90 Licenciatura em Matemática . mais próximas as frequências se encontram do esperado. chegamos à distribuição vista na Figura 6. cada face tem 16. mostrando a frequência relativa da ocorrência de cada face do dado após mil lançamentos (fig. Após 200 lançamentos. Se continuarmos jogando o dado. Figura 6: Distribuição de frequências da ocorrência das faces de um dado em 200 lançamentos. teremos pouca diferença entre as frequências de ocorrência de cada uma das faces. Figura 7: Distribuição de frequências da ocorrência das faces de um dado em 1000 lançamentos.67% de chance de ocorrer em cada lançamento de dado). 7). Quanto mais cresce o tamanho de nossa amostra. Um exemplo é o gráfico abaixo. após mil lançamentos. que é ter repetições de ocorrência de cada face muito próximas das outras. ou quase iguais (afinal. é possível que achemos um peso dentro dele para que caia com mais frequência na face 6.Assim. Nossa amostra de mil lançamentos é um exemplo de amostragem aleatória e representa a população de todos os lançamentos de dados possíveis. Estatística 91 UAB . o peso dentro do dado) está enviesando os resultados. dizemos que esses valores não são aleatórios. ou seja. mas são influenciados por algum fator (o peso). A distribuição de frequências desvia tanto dos valores esperados. também chamados determinísticos) servem de base para descobrirmos se fatores externos ou internos afetam os valores de um conjunto de dados estatísticos. Nesse caso. podemos afirmar que esse não é um dado “honesto”: se o cortamos ao meio. após mil lançamentos de um dado de jogar. Digamos que. da probabilidade calculada de ocorrência de cada face. 8): Figura 8: Distribuição de frequências da ocorrência das faces de um dado em 1000 lançamentos. que não há dúvida de que algo (no caso. Podemos dizer. se aproximando das frequências esperadas. que o dado que usamos é “honesto”. “balanceado” e não tem viés. Essa é a base da Estatística Inferencial. Entender o conceito de valores que estão dentro das probabilidades esperadas ao acaso (randômicos ou aleatórios) e de valores que desviam do esperado (não randômicos ou não aleatórios.Podemos ver que nos aproximamos muito das frequências relativas esperadas. chegamos à seguinte distribuição (fig. então. com 52 cartas. entra a aplicação das chamadas “Leis da Probabilidade”. ao menos no que se pode detectar do universo. Qual a probabilidade de conseguirmos dois 6. se lançarmos dois dados? UAB 92 Licenciatura em Matemática . a chance da face de um dado de jogar aparecer em um lançamento é de 1/6 e a chance de sair cara ou coroa ao se lançar uma moeda é de ½. Charlatães. podemos calcular que a chance de tirarmos. ao lançarmos um dado é de 1/6. ou 100%. de acontecer. Vamos ver como isso se aplica se lançarmos dois dados de jogar em vez de um só. tem 0% de chance de acontecer. ou 0 e 100%. por exemplo. o público só vai lembrar-se dos cinco acertos e esquecerá os cinco erros. 00098. Ela afirma que a chance de dois ou mais eventos independentes ocorrerem juntos é o produto da probabilidade dos eventos ocorrerem separadamente. Logo. um ás de espadas é de 1/52. ou pelo menos alguém de muita sorte: a probabilidade que acerte. Se usarmos um baralho de cartas completo. digamos. ao acaso. Se conseguirem acertar 50% de dez previsões do tipo “sim-ou-não”. Mas como fazemos. quando um evento possui dois ou mais termos? Aí. Assim. realmente. dez previsões tipo “sim-ou-não” seguidas é de 0. Tudo o mais tem uma probabilidade entre 0 e 1. usam probabilidades de “senso comum” para parecer que acertaram o futuro. a probabilidade de um evento impossível ocorrer é zero. Algo que vá contra as propriedades da matéria. dividindo o número de vezes que o evento pode ocorrer pelo número total de eventos possíveis. A primeira lei da probabilidade que vamos aplicar aqui é a Lei Multiplicativa. Essa chance é calculada. Já um evento certo tem probabilidade de 1.Algumas Ideias Sobre Probabilidades Há algumas ideias gerais sobre probabilidades que nada mais são do que o óbvio. Leis da Probabilidade Vimos como probabilidade é a chance que um evento ocorra ao acaso. mesmo que infinitesimal. Vimos que a probabilidade de conseguirmos um 6. um adivinho de verdade teria que acertar 100% das previsões para poder ser considerado. que se passam por adivinhos. alguém com visão do futuro. formando um 12. Por exemplo. Algo que possa ser respondido com um sim ou não tem 50% de chance de acontecer ou não. 2) (1.1) (4.2) (5. Estatística 93 UAB .6).1) (6. (4.5) (2.1) e um máximo de doze (6.4) (1. Para calcular a probabilidade de conseguirmos um nove ao lançar dois dados de jogar. todas as configurações possíveis ao se lançar dois dados de jogar.4). que só podem ser conseguidos em uma das 36 configurações possíveis. Tabela 1: Configurações possíveis dos lançamentos de dois dados de jogar.4) (2. através da soma das probabilidades de cada forma do evento. devemos aplicar a Lei Aditiva da Probabilidade: ela calcula a probabilidade de que um evento ocorra em duas ou mais formas diferentes e é calculada. simplesmente.2) (3.4) (5. na tabela 1. obteremos qualquer valor entre o mínimo de dois (1.6) Temos.78% Aqui já descobrimos que o evento “um seis em cada um dos dois dados” é uma possibilidade em 36. representados por (x. lançando dois dados de jogar? Se jogarmos dois dados. os 36 resultados possíveis ao lançarmos dois dados de jogar e apenas um deles representa o evento que calculamos acima: os dois dados com um seis.2) (4.3) (5.2) (6. exceto esses dois valores.3) (4.1) (3.3) (6. Por exemplo.1) (5.5) (3.4) (6.6) (2.5) (4.5) e (5.1) (1. outros valores podem ser conseguidos de mais de uma maneira. Será que há 36 configurações diferentes ao se jogar dois dados? Vamos colocar.3) (1.5) (1. podemos conseguir o valor de nove de quatro formas diferentes: (3.5) (5.67% Probabilidade de conseguirmos um seis em cada dado = = 2.6).3).6) (4.6) (3. Vejamos outro problema: qual a probabilidade de conseguirmos um valor específico. (1.2) (2.3) (2. (6.4) (3. então. y).5) (6. sendo: x= primeiro dado e y = segundo dado.6) (6.1) (2.6) (5.Probabilidade de conseguirmos um seis em um dado = = 16.3) (3.4) (4. Mas. a probabilidade de conseguirmos um sete. o evento em questão é o valor de nove com dois dados de jogar.78% de chance de ocorrer.6) 2 (1.6) + (6.2) (3.3) = Ou seja.3) + (4.2) (3.3) (4. (5.4) (5. UAB 94 Licenciatura em Matemática .5) (6.2) (3.6) (1. ou 2.6) + (6.5) (6.1) + (2.3) (4.4) (5. pois há seis formas diferentes de rolar um sete. Vejamos qual a probabilidade de conseguir um sete com dois dados: P(sete) = (1. em países onde o jogo de dados é legal.2) (3.6) (1.5) (6. Há quatro maneiras diferentes de conseguirmos um nove e cada uma das formas tem 1/36.5) (6. jogando dois dados.4) (5.2) (3.6) 5 6 7 8 9 10 11 12 3 4 Está claro que o valor de sete é o mais provável de ser conseguido com dois dados.No caso que estamos estudando. (1.3) (4.6) (1.4) + (4.5) + = 11.2) 16. Vamos.4) (5.5) + (5.5) (6.4) = Vejamos quantas maneiras diferentes há de se conseguir os valores possíveis com dois dados (tabela 2).3) (4. ao cálculo: Probabilidade de conseguir um nove com dois dados = (3.2) (3.11%.1) (2.1) (2. é a mesma de se conseguir qualquer uma das faces ao se jogar apenas um dado: 1/6.4) (5.1) (2. então.6) (2.5) (6.3) (4.67% + (3.1) (2. que têm menor probabilidade de sair. Por isso. sempre se paga menos por um sete do que por um dois ou um doze.4) (5.3) (4. Tabela 2: Valores possíveis no lançamento de dois dados de jogar e configurações necessárias.1) (2. 2). isso não quer dizer que temos mais ou menos chance de conseguirmos outro (6. Então. pois as 36 configurações têm chances iguais de ocorrer. se lançarmos os dados de forma a obter uma amostra representativa (digamos.3).6). já que esse é o valor mais comum. 2000 lançamentos) da população de lançamentos de dois dados possíveis (que tende ao infinito). a moda é sete. (2. Estatística 95 UAB . vemos que a probabilidade de conseguirmos qualquer uma das 36 configurações é igual. Se destrincharmos os valores.Consideremos a tabela dos valores possíveis de dois dados acima e as formas que esses valores podem tomar. Podemos dizer que. O exemplo que vimos é bem simples. Todas as vezes que lançarmos os dados. etc. vamos conseguir uma distribuição de frequências cuja forma se assemelha à “pirâmide” que conseguimos acima (fig. 9). (6.(3. as configurações dos dois dados de jogar . Mas. Figura 9: Frequências relativas (em %) dos valores possíveis em 2000 lançamentos de dois dados. nesse grupo de dados estatísticos.6). 1/36 ou 2. teremos a mesma chance de conseguir uma das 36 configurações e uma chance em seis de conseguir um valor de sete.4). atenção: probabilidades não têm “memória”! Se jogarmos os dados três vezes e obtivermos três (6. mas podem ser usadas as mesmas leis para entender a probabilidade de eventos muito complexos. – teríamos todas as 36 barras do mesmo tamanho.78%. Dada uma UAB 96 Licenciatura em Matemática . deverão nos servir para que entendamos suas aplicações nos cálculos de estimativas que são fundamentais nas análises estatísticas. explicitamente. chamada Probabilística. menor fica o erro e podemos ter mais segurança quando interpretamos os resultados. envolve comparar a nossa amostra (os valores observados). portanto. Elas servem de base para a estimação das frequências de ocorrência desses eventos em uma população. Muito do que se testa. Por isso mesmo. ter o entendimento profundo ou minucioso do cálculo das probabilidades.O estudo das probabilidades é extremamente intricado e alguns matemáticos dedicam suas carreiras a essa área. Usando os mesmo cálculos probabilísticos. pois são estimativas generalizadas passíveis de erro. pode-se garantir a validade de uma amostra em 95%. no entanto. Eis a razão pela qual devemos ter cautela quando interpretamos resultados de estatísticas. comparamos os dados que temos com aqueles calculados através de probabilidades. estatisticamente. nunca se tem certeza absoluta da validade de uma amostra. O primeiro é a chamada “Lei dos Grandes Números”. que descreve a estabilidade em longo termo da média de uma variável aleatória. como veremos mais tarde. Nunca 100%. Prevendo Erros Um dos pontos fundamentais da Estatística é que toda amostra contém erros que variam com o tamanho da amostra em relação à população estudada. Esperado x Observado Tudo em Estatística é baseado na ideia que as frequências de ocorrência de todo evento ao acaso vão assumir probabilidades que podem ser calculadas. Quanto maior o tamanho da amostra. A probabilidade de que nossos dados não representem a população está. Se os mesmos diferem muito dos valores esperados.99%. com aqueles valores conseguidos através dos cálculos de probabilidade (esperados). Os conceitos básicos. no entanto. Assim. 98% ou até 99. há dois teoremas básicos. inserida em todo cálculo estatístico. quando analisamos uma amostra. Teoremas básicos No estudo da probabilidade. Não é nossa intenção. há fatores influenciando as frequências da amostra. mas essas frequências só aparecem quando jogamos o dado muitas vezes. que diz que a soma de muitas variáveis aleatórias independentes. vimos como o tamanho da amostra é fundamental para validar as estimativas dos parâmetros da população da qual a mesma foi retirada: quanto maior a amostra. vimos que é o que ocorre quando jogamos dois dados de jogar juntos: a soma dessas duas variáveis aleatórias independentes (dois dados) vai produzir. se seus valores forem amostrados repetidamente. Estatística 97 UAB . como vimos acima. com os dois dados de jogar. mas próximo chegamos às frequências esperadas dos eventos dentro de uma população. Neste exemplo. O segundo é o “Teorema do Limite Central”. já que se trata de uma variável aleatória discreta. uma distribuição que muito se assemelha a uma curva gaussiana. nós calculamos as probabilidades de cada número sair de forma bem simples. poderemos descrever as frequências de ocorrência dos eventos em uma distribuição de frequências.variável com um valor esperado finito. estamos nos referindo à capacidade de estimar os parâmetros populacionais. vimos como as probabilidades são calculadas dentro de um número possível de eventos. Isso funciona da seguinte maneira: se usarmos uma amostra representativa de uma população. à medida que a amostra cresce. como se comportam e são equivalentes às frequências relativas de uma amostra. Probabilidade na Estatística Agora que temos uma noção do cálculo das probabilidades. vai produzir uma distribuição que se aproxima da distribuição normal. a média tende para o valor esperado. que tenham uma mesma distribuição de probabilidades. Depois. Nós vimos um exemplo com as frequências de um dado de jogar: cada valor de um dado tem 1/6 de chance de ocorrer. depois de muitas jogadas. podemos começar a entender como isso se relaciona à Estatística. Quando vamos aplicar os conceitos de probabilidade em Estatística. Em nosso curso. usando uma amostra representativa dessa população. Primeiro. Esse tipo de distribuição é chamado binomial. estimam-se os parâmetros populacionais que serão usados nos cálculos das probabilidades. 10). desde que se faça primeiro.ou seja. Usando essas ideias. mesmo aqueles que ainda não foram observados. Um gráfico que represente uma distribuição de probabilidades qualquer vai se parecer muito com um gráfico de distribuição de frequências de uma boa amostra. É possível extrapolar valores observados para incluir valores que são possíveis de ocorrer. elas se aproximam das frequências das probabilidades de uma população. Figura 10: Histograma das frequências relativas da distância entre 319 domicílios e um oleoduto. ele construiu um histograma das frequências relativas (fig. afinal. podemos construir. Então. um pesquisador coletou uma amostra da distância de 319 casas de uma região para um grande oleoduto. mas ninguém nunca viu. para tentar entender qual seria o risco para a população no caso de um vazamento. têm apenas números inteiros e que se situam dentro de uma amplitude restrita (no caso. Mas é possível calcular as probabilidades de quaisquer eventos. entre 2 e 12). pois são eventos muito raros. uma distribuição de probabilidades de ocorrências dos eventos em uma população. uma distribuição de frequências a partir de uma amostra. mesmo de variáveis aleatórias contínuas. Por exemplo. UAB 98 Licenciatura em Matemática . Matemáticos probabilistas usam cálculos mais elaborados para calcular as probabilidades de todos os eventos possíveis. com base em uma distribuição de frequências de uma amostra válida. Com base nessa amostra. A linha que forma uma curva em sino é chamada Curva Normal. 11). usando as leis da probabilidade. Vamos entender mais sobre ela na próxima aula.Vemos aqui que. pois em cima desses valores. a distribuição das frequências é um tanto irregular. que não poderia medir a distância de todas as casas da região em questão do oleoduto. qual a distribuição das probabilidades das distâncias de todas as casas para o oleoduto. Figura 11: Histograma de frequências relativas com curva normal da distância entre 319 domicílios e um oleoduto. Estatística 99 UAB . mas há um grande número de casas entre 160 e 400 metros de distância do oleoduto. Nosso amigo pesquisador. as probabilidades foram calculadas (fig. E também avaliou qual a média e o desvio padrão para a amostra que foi coletada. O programa estimou os dados que faltavam à amostra e criou uma distribuição de probabilidades correspondente. usou um programa de estatística para estimar. É uma curva estimada que dá uma ideia da forma da distribuição e permite que se saiba a probabilidade de ocorrência de qualquer evento dentro de uma população com base em amostras. Estatística no Computador Os programas de computador para Estatística são fundamentais para a análise de grandes bases de dados e para o uso adequado dos testes de Estatística Inferencial. Há vários programas disponíveis, desde os muito sofisticados, usados por astrônomos, até programas mais simples, que ajudam a calcular testes básicos. Alguns programas são de graça e podem ser baixados pela internet: • BioEstat 5.0 – Do Instituto Mamirauá, serve para a análise descritiva e alguns testes inferenciais com mais de uma variável (multivariados). Apesar de voltado para as Ciências Biológicas, esse programa pode ser usado para ajudar qualquer pesquisa científica que utilize a Estatística. A melhor característica do BioEstat é seu manual de instrução, que explica em detalhes como são feitos os cálculos oferecidos pelo programa e como evitar problemas. A versão em Português pode ser encontrada no endereço http://www.mamiraua.org.br/download/ • Winidams 1.3 – Para validação, manipulação e análise de dados. Em inglês. • ADE 4 (2004) – Para análises básicas, também em inglês. • Expansões do Excel – Podem ser baixados para que o editor de planilhas também possa realizar análises mais complexas. Alguns deles são o XLStatistics e o BiPlot. Programas avançados são, geralmente, caros, mas realizam todos os testes e ainda criam gráficos editáveis. Alguns dos mais conhecidos são o Statistica, o SPSS e o MINITAB. Muitos possuem versões demo em suas páginas da internet que podem ser usados, de graça, por um mês, e possuem versões em português. Todos os programas se baseiam nas mesmas regras. O que importa é saber utilizá-los. Resumo (contém todo teor da aula vista acima?) A análise de amostras retiradas de uma população pode servir de base para a estimação de parâmetros populacionais através de estatísticas amostrais. UAB 100 Licenciatura em Matemática O tamanho da amostra é fundamental para que ela seja válida na estimação dos parâmetros com base nas estatísticas. A Estatística se baseia na probabilística para assumir que muitas variáveis vão ter um padrão de distribuição normal, simétrico, que pode ser descrito, usando-se a média e o desvio padrão. Os pressupostos matemáticos sobre a distribuição normal permitem o cálculo da significância de testes de hipóteses. Referências CHATFIELD, C.: Problem Solving – A Statistician’s Guide. London: CHAPMAN & HALL. 1991. LEME, R. A. DA S.: Curso de Estatística – Elementos. Rio de Janeiro: AO LIVRO TÉCNICO. 1967. LEVIN, J.: Estatística Aplicada às Ciências Humanas. São Paulo: HARPER & ROW DO BRASIL. 1978. SCHMULLER, J.: Statistical Analysis with Excel. Hoboken: Willey Publishing Inc. 2009. SPIEGEL, M. R, Estatística. MAKRON. 1994 Estatística 101 UAB UAB 102 Licenciatura em Matemática Introdução Amostra e distribuição de amostras Na última aula. Assunto A aplicação da Probabilística na Estatística é baseada em distribuições de frequências prováveis. mais alta nos valores centrais (mais frequentes) e que desce. • Conhecer os diversos tipos possíveis de distribuições amostrais. • Compreender como são estimados e com que acurácia. em todas as áreas do conhecimento que possuam características mensuráveis. os parâmetros populacionais a partir de estatísticas amostrais. representando as frequências em uma população. vamos entender como os teoremas fundamentais das probabilidades são aplicados nas pesquisas que usam a Estatística como instrumento para estimar parâmetros populacionais. Esse tipo de distribuição é chamado distribuição normal e sua curva representativa tem uma forma simétrica. A partir desta aula.Aula 5 . para os valores extremos Estatística 103 UAB . vimos como a distribuição de frequências de uma variável aleatória contínua de uma amostra pode ser limitada por uma curva de probabilidades teórica. simetricamente.Distribuições de Probabilidades Objetivos • Compreender a aplicação dos teoremas fundamentais da probabilística na Estatística. que podem ser estimadas a partir de amostras. a curva normal. No caso. 1). Além dessas características óbvias. Figura 1: Curva normal de distribuição da distância entre 319 domicílios e um oleoduto. A Curva Normal Também chamada de Curva de Gauss. sempre há a probabilidade que haja uma casa mais distante ou mais perto do oleoduto do que aquelas que o pesquisador contou em sua amostra. não há uma frequência de zero. apresentando frequências maiores no centro. a curva normal do exemplo da última aula: distância em metros entre as casas de uma região e um oleoduto (fig. a curva normal também apresenta certas particularidades. novamente.(mais raros). Por isso. vamos nos deter. Muitos fenômenos naturais ou antrópicos têm este padrão de distribuição. Notem que as “caudas” da curva normal. conhecendo mais esse tipo de distribuição. nunca toca o eixo de x: mesmo nos extremos. como vimos. Podemos notar que a curva é simétrica. Vamos ver. onde estaria a média. um pouco. em direção aos extremos. todos os eventos têm uma probabilidade maior que zero. as quais vão caindo em direção aos extremos. UAB 104 Licenciatura em Matemática . exceto por eventos impossíveis. a curva normal é a representação teórica da distribuição das probabilidades de uma variável em uma determinada população. Isso ocorre por que. 43 metros. Se somarmos ou subtrairmos o desvio padrão do valor da média. ou estejam muito próximas. Uma população normal tem 99. igual a 1 (ou 100%). Essa particularidade faz com que. que a dividirá exatamente ao meio. Tal noção nos servirá para calcular estatísticas mais tarde. numa curva normal. todas as medidas de tendência central caiam no mesmo ponto. em uma curva normal.44% dos valores estarão nesse intervalo (fig. Nesse caso. a distância média entre as casas e o oleoduto é de 262. a média. 264 metros. que a torna totalmente simétrica. cobriremos 68. é representada por m e o desvio padrão é representado por s. Nela.74% dos seus valores a uma distância de três desvios padrão da média. A área sob a curva é a soma de todas as probabilidades de todas as distâncias possíveis. Uma curva normal representa a distribuição em uma população. Sendo. em uma distribuição normal. 95. mostrando nossa medida de tendência central. como já vimos.Outra característica dessa curva é que ela é. a mediana. Figura 2: Proporção de dados. por isso. Isso se dá por causa da padronização da distribuição normal. absolutamente. simétrica.26% dos dados ali representados. Por se tratar da representação de uma população e não de uma amostra. podemos traçar uma linha. inseridos nos intervalos µ± eµ±2 . Estatística 105 UAB . Se somarmos ou diminuirmos duas vezes o desvio padrão do valor da média. em uma curva normal. 2). referentes a uma população. A proporção das áreas cobertas pelos parâmetros µ e . média e mediana têm o mesmo valor. são criadas as tabelas de valores t.As proporções das áreas dentro de uma curva normal servem de base para o cálculo de um valor estatístico fundamental para o teste de hipóteses. No final de todo livro de Estatística. chamado z. é do tipo normal. assumindo-se que a amostra seja representativa da população. ± 3s. no entanto. Com base nas duas estatísticas. Na distribuição assimétrica à direita. UAB 106 Licenciatura em Matemática . as estatísticas que usam o valor z assumem que parâmetros como µ e são conhecidos. no entanto. nas Ciências Biológicas e Sociais. dá a forma da curva normal e serve de base para testar a significância de testes estatísticos. ou valores muito próximos. usando áreas proporcionais da curva de distribuição como alicerce matemático. Nela. a maior parte dos testes estatísticos que são realizados em amostras aleatórias supõe que a população da qual foi retirada uma amostra apresenta uma distribuição normal das frequências em questão e que 99. Isso não é verdade para as amostras: nela temos os valores de e s. No entanto. Algumas variáveis podem apresentar distribuições de outros tipos.7% dos dados estarão contidos em um intervalo de µ ± 3 ou. mesmo que se tenha uma amostra grande. que não são totalmente simétricas. Tipos de curva A curva de Gauss é a curva normal. totalmente. também usadas como base de testes de significância. a mediana é mais alta que a média e a curva tem uma “cauda” mais longa à direita do gráfico (fig. Resumindo. Nem toda distribuição amostral. há uma tabela. simétrica. que vão dar a significância dos testes de hipóteses. mostrando os valores de z e t. especialmente. Há distribuições. 3). que há essa diferença entre mediana e média. a mediana é mais baixa que a média e a curva apresenta uma “cauda” mais longa à esquerda (fig. durante a análise descritiva.4). com as posições da média e da mediana. sendo a segunda característica de importância na descrição da Estatística 107 UAB . devemos ter cuidado extra quando passamos à analise inferencial desses dados: às vezes. Figura 4: Curva de distribuição de probabilidades assimétrica à esquerda. O tamanho das “caudas” de uma distribuição de probabilidades é chamado de curtose. Quando descobrimos. a diferença impede que utilizemos certos testes estatísticos. Já na curva assimétrica à esquerda. com as posições da mediana e da média.Figura 3: Curva de distribuição de probabilidades assimétrica à direita. Se as caudas forem longas. UAB 108 ± 2s ou Licenciatura em Matemática . chamamos essa curva de leptocúrtica (fig. 6). a maioria dos dados está além de ± s (podendo estar em ± 3s). Só os valores realmente extremos são raros. 5). mas valores extremos são mais raros. Nesse tipo de distribuição.forma de uma distribuição normal. Figura 6: Curva de distribuição de probabilidades do tipo platicúrtica. Quando as caudas de uma distribuição são curtas. Figura 5: Curva de distribuição de probabilidades do tipo leptocúrtica. a amplitude total é grande. Quase todos os dados estão em ± s. Aqui. temos uma distribuição platicúrtica (fig. afastando-se da média. Um histograma das frequências dos números de sementes nessa espécie de leguminosa apresentaria dois “picos” de frequência e duas “modas”. No exemplo da figura 7. mas dois “picos” de frequência. Esse é um caso bem particular e impede que usemos as suposições sobre distribuições normais ao se trabalhar com esse tipo de dado. encontramos um tipo de distribuição de frequências amostrais que possui não um. Outros Tipos de Distribuição Às vezes. envolve variáveis aleatórias discretas (apesar de haver variáveis contínuas que se comportam dessa forma). vemos a frequência do número de sementes em uma espécie de leguminosa. geralmente. raramente. novamente. e geralmente. apresentar qualquer valor par entre esses dois extremos. Nela. comumente. é a distribuição assimétrica.A forma das distribuições normais tem implicações para a validação dos dados e para o uso de testes estatísticos. É chamado de bimodal. duas ou dezesseis sementes. Outro tipo de distribuição encontrado. Devido às características genéticas da espécie. que pode envolver tanto variáveis aleatórias discretas como contínuas. as suposições sobre a curva normal para calcular as estatísticas de uma amostra com esse tipo de distribuição. as vagens do vegetal possuem. por possuir duas modas. mas podem. os valores mais frequentes não estão no meio da distribuição e não podemos usar. Figura 7: Histograma de frequências absolutas do número de sementes em 25 vagens de uma planta leguminosa. em amostras nas Ciências Biológicas e Sociais. Estatística 109 UAB . um gráfico de barras com os dados do histograma acima. Podemos dizer que a distribuição das frequências de valores de dois dados de jogar segue um padrão normal. Então. ela tem uma distribuição binomial do tipo (a+b)2 = a2 + 2ab + b2. mas assimétrico.Um exemplo de distribuição assimétrica é o tamanho da ninhada de cães da raça Dálmata. posteriormente. Apesar de essa variável ser discreta. já temos uma ideia de que tipo é a distribuição. em direção aos limites de valores. devemos descobrir de que tipo é a distribuição das frequências. ele é tão importante que. simetricamente. o cálculo estatístico é muito mais complexo que o binômio de Newton aqui representado. 8). Ao criar uma tabela de frequências. Se criarmos uma tabela de frequências e. logo veremos que a distribuição dos dados não segue um padrão normal. Apesar de ser uma raça conhecida por produzir. ao criar um UAB 110 Licenciatura em Matemática . as maiores ninhadas entre todas as raças de cães. Porém. mas o resultado é simétrico e as frequências diminuem. Figura 8: Histograma de frequências absolutas do número de filhotes em 25 ninhadas de cães da raça Dálmata. raramente. antes de realizarmos um teste de hipótese com uma variável. De fato. Aplicação dos Conceitos de Distribuição Não podemos menosprezar o papel do tipo de distribuição na aplicação da Estatística. a grande maioria tem apenas três filhotes (fig. Vimos que a distribuição de frequências de ocorrência dos valores de dois dados se parece muito com uma curva normal. A Maturidade da Estatística A Estatística transformou-se com a compreensão da distribuição normal. na abordagem estatística chamada de paramétrica.gráfico de barras. Esses conceitos de probabilidades e distribuição são. já temos uma ideia se a distribuição dos dados da variável pode ser considerada normal ou não. usando dados coletados em uma amostra. usados para testar hipóteses sobre uma população. Estatística 111 UAB . fazendo em seu livro “A Teoria Analítica das Probabilidades”. primeiramente. sempre que se percebe que os dados não são. Apesar da maioria dos testes de hipóteses ser baseada na suposição de que os dados testados têm uma distribuição normal. Assim. o autor percebeu como a forma de distribuições binomiais se parecia quando a amostra era muito grande. 9). distribuídos. apresentam ferramentas em que podemos “avisar” se a distribuição é bimodal ou assimétrica e os cálculos são ajustados automaticamente. fig. Nele. Esses cálculos testam a hipótese de que a distribuição de um grupo de dados não difere de uma distribuição normal e sua aplicação garante que poderemos ter certeza do tipo de distribuição de nossos dados. deve-se dar preferência à aplicação de testes estatísticos não-paramétricos. A ideia de “normalidade” foi. expandiu o conceito. Pierre-Simon. no qual descreveu a aproximação normal de uma distribuição binomial. o Ryan-Joiner e o Kolmogorov-Smirnov. no entanto. O teorema descrito. no entanto. Programas de computador. frequentemente. Para o uso de testes de significância. hoje é conhecido como Teorema de Moivre-Laplace. a estatística não-paramétrica. o mais correto é testar a variável para saber se ela tem uma distribuição normal. ou um histograma. Os mais comuns são o Anderson-Darling. primariamente. sugerida por Abraham de Moivre (1667-1754) em um artigo de 1733. normalmente. há uma gama de testes que não calculam probabilidades com base em uma distribuição normal. Há vários testes de normalidade oferecidos por programas de computador que podem checar se os dados de uma amostra têm uma distribuição normal ou não. Marquês de Laplace (1749-1827. matemático francês. Fonte: Wikimedia Commons. o matemático alemão Johann Gauss (1777-1855. chamamos uma distribuição normal de “Gaussiana”. Esse é um exemplo da chamada “Lei de Stigler”. apesar de Gauss não ter sido o primeiro a descrever tal tipo de distribuição. às vezes. mas pelo nome daquele que difunde a ideia. que até hoje é usado no cálculo de análises de regressões. No entanto. fig. UAB 112 Licenciatura em Matemática . Figura 10: Johann Carl Friedrich Gauss (1777-1855). Hoje em dia.Figura 9: Marquês de Laplace (1749-1827). Em 1805. introduziu o “método dos Mínimos Quadrados”. Adrien-Marie Legendre (1752-1833). 10) afirmou que já usava esse método desde 1794 e provou sua tese que propunha a distribuição normal de erros em 1809. Fonte: Wikimedia Commons. que diz que as grandes descobertas científicas não são chamadas pelo nome de seus descobridores. podemos ter uma ideia geral da forma da distribuição desses dados. usado para depositar objetos sagrados nas sepulturas de uma civilização.Estimação de Parâmetros Populacionais Nas aulas anteriores. Mas nem sempre é na forma da distribuição amostral que estamos interessados. Para um pesquisador. único. Se. a partir desses dados. Vamos imaginar que uma arqueóloga está descrevendo. Nesta sessão. pois. Estatística 113 UAB . coletamos uma amostra sobre a produção dos detritos de tecelagens e conseguimos uma média de 58 toneladas por ano. Mas. mesmo que não tenhamos acesso aos valores brutos que um pesquisador usou. um tipo de vaso cerâmico de 10. Esse tipo de vaso. pela primeira vez. as médias da amostra e da população (assim como suas medidas de dispersão) deverão ter valores próximos. sobre o que ocorre com a população. Usando esses valores. podemos dar um palpite “educado” sobre a amostra. se coletarmos amostras diferentes de uma população. Mas podem ocorrer erros que não percebemos. vamos entender como podemos calcular quão próximas dos parâmetros populacionais são as estatísticas que obtemos de uma amostra dessa população.000 anos de idade. que era de 10 cm. nós aprendemos a calcular a média e o desvio padrão de uma amostra. como vimos. e vimos como. temos uma probabilidade maior de conseguirmos dados que cubram quase toda a distribuição de uma população do que dados que estejam próximos dos extremos dessa distribuição. o importante é saber o quanto podemos generalizar. foi achado em apenas uma sepultura dentre centenas que foram escavadas por sua equipe. e serão diferentes das medidas da população em geral. se a amostra for aleatória. e por isso devemos tomar cuidados ao estimar parâmetros através de estatísticas amostrais. coletada de forma não enviesada. por exemplo. e mediu a altura. ao conhecer essas estatísticas. a função e a forma do vaso. Média Amostral e Distribuição de Médias Quando coletamos uma amostra aleatória. Ela descreveu a decoração. suas medidas de tendência central e dispersão vão variar. será que conseguiremos o mesmo valor se coletarmos os dados de todas as tecelagens do Brasil? A resposta mais simples é não. a cientista foi feliz e encontrou outros quatro exemplares de vasos com a mesma forma. ela não estaria estimando. ou o “verdadeiro” desvio padrão da população.5 cm). os parâmetros verdadeiros. para nossa colega saber com certeza os valores dos parâmetros para a altura desse tipo de vaso. Mas.6 cm. Não há como saber se o vaso é. e não. estaria descrevendo um conjunto de dados enorme. a arqueóloga não teria outra opção a não ser dizer que esse tipo de vaso tem cerca de 10 cm de altura e não teria condições de dizer o tamanho da dispersão desses valores.5 cm. relativamente. Mas como medir toda a população de artefatos arqueológicos.Todavia. É lógico que. grande ou pequeno. ou coletar toda a informação sobre uma variável em uma população é. nesse caso. Escavando outro sítio arqueológico da mesma civilização antiga. que fornecem a média de 9. no entanto. desconhecidas com pouquíssima informação.5 cm) ou maiores que a média mais três vezes o desvio padrão (11. medindo 9. decoração e função por aquela civilização. mas essas inferências devem ser modificadas à medida que acrescentamos mais informação. ou se 10 cm está mais perto da média ou dos extremos da distribuição das alturas desse tipo de artefato. ou qualquer que seja o parâmetro. Junto com o primeiro vaso. tem alguma probabilidade de estar dentro de certa amplitude de valores possíveis. pequena: poucos vasos seriam menores que a média menos três vezes o desvio padrão (o que dá 8. 10. se fosse obrigada a “chutar” um valor. impossível. ela teria que medir todos os vasos já feitos com essa forma. 9. particularmente. A partir dessa pequena amostra. Podemos ver que é possível fazer muitas inferências sobre populações. nossa arqueóloga já infere – ou estima .3 cm e 10. Assim. O melhor que nós podemos fazer é dizer que a “verdadeira” média populacional. UAB 114 Licenciatura em Matemática .5 cm.2 cm. nossa colega está na desconfortável situação de ter uma amostra com apenas um dado. as estatísticas são estimativas dos valores dos parâmetros. ou fazendo uma inferência e sim. ela agora tem uma amostra de cinco artefatos. decoração e função. virtualmente.que a dispersão da distribuição da variável (altura do vaso) é. pois não há como compará-lo com outros da mesma escavação.9 cm de altura e o desvio padrão de apenas 0. completamente. 57 m. naquela praça e terminamos com uma altura média de 1. fizemos o mesmo procedimento. Novamente.68. 1.67 m. Mas digamos que. Como lidar com isso? Estatística 115 UAB . Mesmo assim.65 e 1. a variação da média entre as amostras seria menor.67.Toda inferência é passível de erro.67 m.77 m. No terceiro dia. 1. pedindo a uma pessoa de cada dez que passassem a nossa frente para que se deixasse medir. a variação dos valores das estatísticas de amostras diferentes tiradas de uma mesma população. pesquisando a média de altura dos habitantes de uma cidade. mas também entre amostras: a média de altura do segundo dia é 20 cm maior que a média do terceiro. Terminamos com uma amostra de dez pessoas e uma média de altura de 1. como vimos. pois teríamos uma menor probabilidade de incluir uma proporção grande de jogadores de basquete ou jóqueis em nossos dados. 1. Com as dez amostras. encontraríamos outra média e se nossas amostras diárias fossem maiores (50 pessoas em vez de dez). Mas se tirarmos outra amostra de 100 habitantes da cidade. 1. vimos que não apenas há uma variação nos dados dentro de cada amostra.67. A isto chamamos variação amostral. Não é possível eliminar o erro nem com todos os cálculos estatísticos existentes. Vamos entender a lógica da amostragem. pedindo para dez pessoas entre cem que passaram à nossa frente para que se deixassem medir. então devemos torná-lo explícito. o sindicato dos jóqueis de cavalos estava fazendo uma reunião próxima à praça e nós terminamos o dia com uma amostra que forneceu a média de altura de 1. mas outras estatísticas também. teremos uma amostra total de 100 pessoas e uma altura média de 1.68 m. sem que soubéssemos. havia uma convenção de jogadores de basquete dos times dos bairros.66. ou seja. Fomos a uma praça do centro da cidade e tiramos uma amostra aleatória. no segundo dia. que é a média das dez médias amostrais. Se agruparmos nossos resultados. essa variação amostral nunca há de desaparecer totalmente. há 10 cm de diferença entre a média da amostra do primeiro dia e a do terceiro.68. Nos dias seguintes. Há uma diferença de 10 cm entre as médias do primeiro e do segundo dia. Nos outros dias. justamente. 1. conseguimos médias de 1. Não apenas a média varia entre amostras. Se coletarmos um número. por sua vez. O gráfico abaixo (fig. Depois. com isso.A lógica é simples. então temos maior chance de encontrar pessoas de estatura mediana do que as muito altas ou muito baixas. pois a probabilidade de coletarmos uma amostra que se afaste muito da média da população diminui conforme cresce a diferença. A distribuição das médias amostrais. Essa será uma distribuição de médias amostrais. grande de amostras. Já as outras amostras apresentavam valores bem próximos da média das médias amostrais. incluíram pessoas muito altas – os jogadores de basquete – e pessoas muito baixas – os jóqueis. 11) representa uma dessas curvas. ter uma média também. ou seja. Tal distribuição de médias amostrais vai. Quanto maiores as amostras.67 m) foram aquelas que. as amostras que mais se afastam da média das médias amostrais (que calculamos em 1. mais simétrica será a curva de distribuição de médias amostrais. o valor das médias amostrais vai ser a média da população da qual essas amostras foram tiradas. Podemos notar a forma simétrica e as freqüências de ocorrência decrescentes de médias amostrais que se afastam muito da média populacional. Uma curva de distribuição de médias amostrais vai ser semelhante a uma curva normal. a curva de distribuição das médias amostrais vai ter sua tendência central em torno da tendência central da população. não importa se cada uma das amostras tem uma distribuição normal. nós usamos as 110 médias amostrais como uma variável e construímos. Isso por que valores extremos são mais raros que valores próximos à média de uma população. uma distribuição de frequências. Como vimos em nosso exemplo. UAB 116 Licenciatura em Matemática . Agora. Imaginem que continuamos nossa pesquisa sobre a altura dos habitantes por mais 100 dias. sem querer. suficientemente. ao invés de usar a altura dos 1100 habitantes como base para nossas análises. vai sempre ser normal. no entanto. Com certeza. teremos um erro ao avaliar a média populacional por essa única amostra e a pergunta que devemos fazer é: qual o tamanho do erro. temos que estimá-la com base em uma única amostra. menor é a chance de coletarmos uma amostra com essa média. como em qualquer outra distribuição. há outras medidas importantes para que possamos entendê-la: as medidas de dispersão. Em outras palavras. Geralmente. ou seja. Qual probabilidade é maior: a de coletarmos uma amostra que tenha a média um pouco diferente da média populacional ou a de coletarmos uma amostra que tenha a média muito diferente da média populacional? Vemos na distribuição das médias amostrais que. no entanto. quanto maior nosso erro. menor a chance de ocorrer. Estatística 117 UAB .Figura 11: Curva de distribuição de frequências de médias amostrais. quão distante da média populacional nossa média amostral estará? Vamos olhar novamente para o gráfico acima. Na vida real. Nessa distribuição de médias amostrais. Mas a média é uma medida de tendência central e nos diz onde está a maioria dos dados. nunca encontramos uma distribuição de médias amostrais para estimar a média da população. quanto maior for a diferença entre a média amostral e a média populacional. se usarmos. 68% dos dados encontram-se a um desvio padrão para mais ou para menos da média. O Erro Padrão e a Estimativa da Média da População Como vimos. de médias amostrais. a distribuição de uma estatística amostral vai ter uma média e um desvio padrão próprios. 12). Digamos que. Vimos em aulas passadas que. a distribuição de médias amostrais sempre vai ser menos dispersa que a distribuição dos dados brutos de uma população. ou seja. estão dentro de ± s. fig. pois a pessoa não foi medida sozinha.77 m. UAB 118 Licenciatura em Matemática . estamos lidando com estatísticas e não. chamamos o desvio padrão de uma distribuição de estatísticas de erro padrão (representado por SE. naquelas dez amostras que coletamos. Mas o desvio padrão da distribuição de estatísticas vai ser menor do que o desvio padrão da população. Por exemplo.Assim. Para evitar confusão. a dispersão dos dados em uma população real vai ser bem maior do que um desvio padrão calculado apenas através de médias de várias amostras. com dados brutos. A ideia do erro padrão é nos permitir saber as chances de que uma particular média amostral seja muito maior ou muito menor que a média populacional. Já que a distribuição de médias amostrais também é uma curva normal. Mas a média amostral mais baixa foi de 1. no caso. de 1. nosso exemplo da altura dos habitantes de uma cidade. Logo. 68% dos dados (as médias amostrais) estarão um erro padrão para mais ou para menos da média populacional (µ ± SE. e também temos um desvio padrão da mesma que vai ser menor que o desvio padrão da média de uma população. O mesmo vale para o habitante mais alto. temos a média das médias amostrais. do inglês standard error) e usamos o termo “desvio padrão” apenas para distribuições amostrais. numa distribuição normal. no gráfico acima. Sendo assim. Isso se dá por que numa distribuição de médias amostrais.98 m. a amplitude. A média dessa distribuição de estatísticas. a média amostral mais baixa nunca vai ser igual à altura do habitante mais baixo. vai ser a média populacional.42 m e a mais alta (um jogador de basquete) 1. ou seja.57 m e a mais alta. novamente. a pessoa mais baixa (um jóquei) medisse 1. importante. os outros 50%. Então. pois 34%+34% = 68%. mais nos aproximamos dos valores da população. pois a variação dentro da amostra é maior que entre as médias amostrais. é uma das várias amostras possíveis dentro de uma distribuição de estatísticas amostrais) e o tamanho da amostra. ou 100% da distribuição. a área coberta por +SE = 34% e por –SE = 34%. teoricamente. O erro padrão depende de dois valores: o desvio padrão da amostra que coletamos (que. extremamente. Digamos que queremos saber qual a probabilidade de nossa amostra ter uma média maior que m+SE. Assim. como vimos antes. ou outras combinações. da média para baixo. mais ou menos um erro padrão. Se 68% dos dados estão um erro padrão longe da média. estão 50% dos dados. O erro padrão é menor que o desvio padrão.Figura 12: Área em uma curva de distribuição de médias amostrais coberta pela média. a probabilidade de nossa amostra ter média maior que µ+SE é igual a 100% . o tamanho da amostra é. Da média para cima.84% = 16%. 50%+34% = 84%. Podemos usar o mesmo método para saber a probabilidade de nossa amostra ter média menor que µ-SE. A lógica é simples. A área correspondente às médias amostrais menores que µ+SE vai ser a soma de toda a área abaixo da média (50%) somada à área do erro padrão positivo (34%). ou seja. Devemos sempre lembrar que a área sob uma curva normal equivale a 1. Para Estatística 119 UAB . pois quanto maior a amostra. teremos que quadruplicar o tamanho da amostra: pontos. 13): nele temos as médias de quatro amostras ( 1. Para as amostras 2 e 3. por exemplo.calcular o erro padrão. Por causa da raiz quadrada no denominador dessa fração. a média populacional está dentro desse intervalo. pois estamos 68% confiantes que a média populacional vai estar entre esses valores. A fórmula do erro padrão é bem simples: Se. podemos esperar que as médias de todas as amostras desse tipo tenham um erro padrão de: pontos. Vejamos o gráfico abaixo (fig. Os valores resultantes são os limites de nosso intervalo de confiança. Podemos dizer. mais ou menos o erro padrão. usamos o desvio padrão da amostra dividido pela raiz quadrada do tamanho da amostra. UAB 120 Licenciatura em Matemática . Também diremos que há uma probabilidade de 68% de que a média da população estará dentro da amplitude da média de nossa amostra. 2. agora. quando usamos uma estatística amostral para estimar um parâmetro. Isso ocorre por que não sabemos se erramos para mais ou para menos. que mostra a amplitude coberta por ±SE. um intervalo de confiança de 68%. no caso. 3 e 4) e uma barra de erro padrão. que µ±SE contém 68% de todas as médias amostrais da população de que coletamos nossa amostra. temos amostra de 100 notas de provas com uma média de 50 pontos e desvio padrão de 15 pontos. se quisermos diminuir o erro pela metade. Fazemos isso.5 = 51. podemos afirmar que a média populacional das notas dos alunos estaria entre 50 – 4.5 = 45. As amostras 1 e 4 estão fora dos limites entre a média populacional e o erro padrão. Estatística 121 UAB . não é muito confiável para uma estimativa. para torná-lo mais abrangente. Assim.5 ( -SE) e 50 +1.5 pontos. Se quisermos ficar ainda mais confiantes de nossa estimativa para a média da população.1. Um intervalo de confiança de 68%. usando os dados da amostra de 100 notas de provas. mais ou menos o erro padrão.5 ( +SE) pontos. Por exemplo. aumentando o número de erros padrão que fazem os limites de nosso intervalo. podemos usar ±2SE. há uma probabilidade ainda alta (34%. Se quisermos aumentar nossa confiança de “pegar” a média populacional. em uma curva de distribuição de médias amostrais. nesse caso.5 e 50 + 4.Figura 13: Posição das médias de quatro amostras em relação ao intervalo de confiança de 68%. com um intervalo de confiança de 68%. devemos ampliar esse intervalo de confiança. a probabilidade da média populacional estar fora desse intervalo é de 4. entre 50 . subindo para 95.4%.7%: ±3SE.0 = 47 até 50 + 3 = 53 pontos. Podemos ainda usar um intervalo de confiança de 99.3%. portanto. mais do que uma chance em três) de nossa média amostral.5 = 54. A probabilidade aqui de não termos a média populacional dentro desse intervalo é de apenas 0. ou seja. Vemos então que. o intervalo vai de 50 – 3. nosso intervalo de confiança de 68% diz que a média da população está entre ±SE. Nele.6%. não conter a média populacional.5 = 48. o que é o suficiente para que tenhamos uma boa ideia dos parâmetros populacionais. o erro padrão da proporção será: UAB 122 Licenciatura em Matemática .Pode parecer pouco. Em análises estatísticas.21 em um terceiro e assim por diante. digamos que queremos saber a proporção de indústrias com programas de reciclagem em vários municípios. usando o desvio padrão da amostra. geralmente.23 em outro.3% de algo acontecer significa que o evento tem três chances em mil de acontecer. que é o valor que usado. usamos intervalos de confiança de 95% ou 99%. Um que pode ser usado em muitas situações diferentes é a proporção. podemos usar o erro padrão da proporção para calcular nosso intervalo de confiança. Por exemplo. não podemos calcular o erro padrão. mas uma probabilidade de 0. Por exemplo. Como não há variabilidade em uma amostra de um valor proporcional. mas podemos estimar esse valor com uma probabilidade muito pequena de estar completamente errados. 0. o qual é calculado através da multiplicação da proporção de interesse pela proporção restante. se acharmos que a proporção é verdadeira. se uma amostra aleatória de 100 indústrias mostrou que 20 têm programas de reciclagem e 80 não têm. 0.19 em um. quando estamos estudando uma variável categórica. Ainda. Outros parâmetros de uma população podem ser estimados de forma muito semelhante à que usamos para estimar a média populacional. Mas a distribuição de todas as proporções vai seguir o teorema do limite central e vai estar distribuída em torno da verdadeira proporção de todas as indústrias em todos os municípios que possuem programas de reciclagem. dividindo o resultado pelo número de casos da amostra e tomando a raiz quadrada. Nunca podemos ter certeza absoluta de que temos a média populacional em um intervalo de confiança. Essa proporção vai variar de um município para outros – 0. devem-se tomar cuidados especiais para validar a amostra. mas podem ser bimodais ou assimétricas. Mas é possível conseguir resultados relevantes com amostras de até quatro medições. Quando o tamanho total da população é conhecido. Tamanho das Amostras O tamanho das amostras. simétrico.04) = 0. A Estatística se baseia na Probabilística para assumir que muitas variáveis vão ter um padrão de distribuição normal. desde que certas precauções sejam tomadas e que a interpretação dos resultados seja comedida. quanto maior a amostra. ou de 10 a 30%.2±2. maior a precisão das estimativas. Alguns experimentos precisam ser feitos com tamanhos amostrais muito pequenos. Alguns testes estatísticos requerem um tamanho amostral mínimo de 30 medições. mas. Muitas variáveis não apresentam uma distribuição normal.5 (0. é fundamental para termos uma boa ideia da população que estudamos. regra geral. Resumo A análise de amostras retiradas de uma população pode servir de base para a estimação de parâmetros populacionais através das estatísticas amostrais. usando-se a média e o desvio padrão. o ideal é que a amostra corresponda ao menos a 5% da população total. Os métodos para se trabalhar na estimação de pa- Estatística 123 UAB . Os pressupostos matemáticos sobre a distribuição normal permitem o cálculo da significância de testes de hipóteses.10 a 0. que pode ser descrito. Nesses casos.30. como vimos. O tamanho da amostra é fundamental para que seja válida na estimação dos parâmetros com base nas estatísticas. dizemos que a proporção está no intervalo de 0. como testes de remédios e outros envolvendo animais de laboratório.Se quisermos ter 99% de confiança sobre a proporção real de programas de reciclagem na indústria. Há vários métodos para calcular o tamanho de uma amostra em relação à população estimada total. Amostras menores devem cumprir outras regras (como uma distribuição normal) para poder ser testadas. UAB 124 Licenciatura em Matemática . amostras. S. 1967. C.: Introdução à Bioestatística.: Estatística Aplicada às Ciências Humanas. Referências CHATFIELD. M. Parâmetros populacionais são estimados com base nas distribuições estimadas de médias amostrais. 3ª edição. o seu texto é muito bom. LEME. J.: Problem Solving – A Statistician’s Guide. 1991. que usa o erro padrão. A.râmetros populacionais com base em amostras não normais são diferentes dos usados em distribuições normais.) Grata. Rio de Janeiro: AO LIVRO TÉCNICO. Ivone Lira (revisora linguística e textual). London: CHAPMAN & HALL. média(s). MAKRON. VIEIRA. DA S. em vez do desvio padrão. contudo poderia torná-lo mais conciso se evitasse a repetição de alguns termos. Prezada Professora. Profª. R. haja vista que são termos técnicos. frequência. 1998. SPIEGEL. São Paulo: EDITORA CAMPUS. (Se for possível. LEVIN. São Paulo: HARPER & ROW DO BRASIL.: Curso de Estatística – Elementos. a saber: distribuição.: Estatística. 1994. R. M. como medida de dispersão. 1978. entre outros. Estatística 125 UAB UAB 126 Licenciatura em Matemática Aula 6 - Testes de Hipóteses e Medidas de Associação entre Variáveis Objetivos • Compreender as bases teóricas dos testes estatísticos de hipóteses; • Entender o Método Científico como forma de evitar vieses cognitivos; • Conhecer e aplicar os testes de medidas de associação entre variáveis. Assunto Em nossa última aula, vamos aprender como a Estatística pode ser usada para entender as relações entre duas ou mais variáveis, que podem se relacionar de diversas formas, seja causando um efeito que influencie a dispersão de outra, ou ainda podem ser, intimamente, relacionadas, causando uma variação quantificável que pode ser usada para prever os valores que não estão em uma amostra. Para compreender como isso ocorre, no entanto, temos que primeiro conhecer o embasamento filosófico para essa linha de aplicação da Estatística e como podemos evitar vieses que advêm de nossa própria percepção. Introdução Aprendendo a Entender Desde muito cedo, o Homem percebeu que não podia confiar somente em suas opiniões ou crenças se quisesse, realmente, entender os fenômenos da Estatística 127 UAB a Idade Média enfrentava tempos de ignorância supersticiosa. 2). Figura 1: Ruínas da Acrópole na Antiga Atenas. Enquanto na Europa. Filósofos muçulmanos passaram a usar métodos experimentais e quantitativos para resolver disputas entre correntes discordantes de pensamento. Na antiga Grécia (fig. com uma precisão que só foi pareada séculos depois. 1). a experimentação. época de acasalamento da espécie. Os médicos do Egito Antigo já haviam desenvolvido um método para descrever e diagnosticar doenças. fig. Ele usou métodos que envolviam a observação. a matemática e a argumentação lógica para explicar que a ideia antiga que a luz emanava dos olhos em vez dos objetos iluminados pelo sol ou outra fonte de luz. Aristóteles descreveu a fauna da ilha de Lesbos. filósofos como Platão (428 AC – 348 AC) e Aristóteles (384 AC – 322 AC) lançaram os primeiros fundamentos de uma metodologia lógica. UAB 128 Licenciatura em Matemática . que eram tratadas sistematicamente. O primeiro método científico propriamente descrito foi o de Ibn al-Haytham. muito do que ele escreveu fosse permeado por crenças e mitos: Aristóteles jamais viu um bode e uma cabra no ato reprodutivo. soprava em suas orelhas. há mais de 3500 anos atrás. porque o vento forte do outono. às vezes. embora. Fonte: Wikimedia Commons. no Oriente Médio ocorria a chamada Era Dourada do Islamismo. estava errada. para o estudo de fenômenos através da observação sistemática. ou Alhazen (965-1040. e deduziu que as cabras emprenhavam. como disse Aristóteles. físico e matemático iraquiano.natureza. Seu trabalho O Livro da Ótica é o primeiro exemplo de experimentação científica controlada com a finalidade de esclarecer dúvidas relevantes sobre a natureza dos fenômenos físicos. Estatística 129 UAB . o “pai” do método científico é Galileu Galilei (1564 – 1642). o contrário. que se desenvolveram. Apesar dos trabalhos dos cientistas islâmicos terem sido traduzidos para o latim desde o século XI. e não. O mundo islâmico também produziu cientistas como o mineralogista Al-Biruni (973 . entendessem a importância do método científico. Por essa razão. muitos outros filósofos e cientistas passaram a usar métodos sistemáticos de pesquisa. que aplicaram métodos experimentais e usaram a matemática. como observado por ele. os textos foram banidos como heréticos e passaram-se vários séculos para que os europeus. As Aparências Enganam Uma das razões para seguirmos o método científico é um fenômeno chamado viés cognitivo. Fonte: Wikimedia Commons. que chegou a ser excomungado por afirmar que a Terra gira em torno do Sol.1048) e o médico Avicena (982 – 1037). a partir do século XIX. como pregado pela Igreja. no método científico que usamos até hoje. finalmente. incluindo o uso da Estatística. em suas pesquisas. tão rigorosamente. que muitos de seus resultados estão corretos até os dias atuais. no mundo ocidental. O viés cognitivo é um erro de julgamento causado por fatores inerentes ao funcionamento de nosso cérebro e que pode levar a erros crassos em pesquisas científicas. Após Galilei.Figura 2: Homenagem a Alhazen em uma nota de 10 dinares iraquianos. ou testáveis. • Falácia do Jogador – é a tendência de achar que um evento aleatório individual é influenciado por outro evento aleatório anterior (‘Se eu tirei 1 no dado duas vezes.Há vários tipos de erros que podemos cometer se tentarmos entender algo “por instinto” e o método científico é sempre ajustado para reduzir ou eliminar esse problema.é a tendência a dar mais valor a um evento que ocorreu recentemente do que a um que ocorreu há mais tempo. manipula um experimento ou interpreta os dados. de forma a achar o que ele espera. erroneamente. Testes de Hipóteses Nesta aula. se o fenômeno. Falsificável não que dizer “falso”. ou UAB 130 Licenciatura em Matemática . • Efeito dos Eventos Recentes . O Método Científico Primeiro. nos resultados de pesquisas científicas. que estudam o efeito desses fenômenos na economia. política e. • Falácia da Conjunção – é a tendência de supor que condições específicas são mais prováveis do que condições gerais. Há dezenas de outros vieses cognitivos já descritos por psicólogos e sociólogos. que é objeto de estudo da Psicologia e da Sociologia. Alguns tipos comuns de viés cognitivo são: • Ilusão do Agrupamento – é a tendência de ver padrões onde não há nenhum. O Método Científico se presta a formular e testar fenômenos falsificáveis. • Efeito da Expectativa do Observador – é quando um pesquisador espera um dado resultado e de modo inconsciente. principalmente. vamos utilizar alguns métodos da Estatística Inferencial como uma ferramenta investigativa e para isso devemos primeiro entender qual a lógica por trás da pesquisa científica e. a próxima vai ser um 6!’). devemos entender o que é uma hipótese científica. por que devemos sempre tomar cuidado ao tentar entender um fenômeno através de análises de amostras. quer dizer que. Estatística 131 UAB .Em que estamos interessados? Qual a relevância dessa questão? • Coletar informações e recursos . “Será que cidades com uma maior rede de esgoto têm menos doentes?” ou “Uma cidade com uma melhor rede de esgotos tem menos doentes”. • Formular hipóteses . literal) que também produz dados. estatísticos. que deve ser postulada como uma pergunta ou afirmação. ou o que quer que estejamos pesquisando. Há várias “fórmulas” para se seguir o método científico. podemos detectar isso através de testes. • Publicar os resultados – De nada adianta ter uma pesquisa muito importante se ela não é divulgada para o público em geral ou um grupo de pessoas interessadas na pesquisa (governo. tanto para descrever nossos dados – e validar nossa amostra – quanto para testar as hipóteses que formulamos. esse é um tipo de “experimento” que produz dados. • Fazer experimentos e coletar dados – Se vamos a um bairro e fazemos perguntas a moradores aleatórios. grupos acadêmicos).Uma hipótese é uma “suposição educada”. pois nossas conclusões serão baseadas nessas interpretações. Obviamente. • Analisar os dados – Nessa etapa. A importância da coleta de dados (amostragem) já foi vista em nosso curso.conjunto de dados. de forma geral. mas. geralmente. • Interpretar os resultados e tirar conclusões – Devemos ser cuidadosos ao interpretar nossos resultados. as etapas a se completar são: • Definir uma questão . ou juntar informações através de referências bibliográficas. vamos precisar da Estatística.Devemos observar o fenômeno em questão. organizações civis. indústria. O método científico contém passos ou etapas que devemos seguir se quisermos ter resultados válidos e relevantes. Testar medicamentos em ratos de laboratório é outro tipo de experimento (esse. Vale a pena lembrar que resultados científicos devem deixar espaço para serem revalidados ou reformulados pelos autores ou por outros pesquisadores. Muitas pesquisas bem feitas acabam por se invalidar nessa etapa. uma hipótese tem que ser verificável e mensurável. for falso. estimamos parâmetros populacionais (como a média ou proporções) através de amostras. UAB 132 Licenciatura em Matemática . que é algo mensurável. vai tomar apenas uma forma básica: os dados coletados vieram ou não da mesma população? Digamos que queremos testar a eficiência de dois filtros para chaminés industriais. são parte de uma mesma população. Nossa pergunta é: a eficiência do filtro A é igual à do filtro B? A variável que vamos testar é a quantidade de poluentes no ar que sai dos filtros. Após coletarmos nossa amostra.• Testar novamente – Geralmente. A Hipótese Estatística Para que possamos testar uma hipótese científica com a Estatística. pois é isso que a Estatística calcula. Dessa forma. que contém o mesmo número de filtros A e B. um só de filtros A e outro só de filtros B e estimarmos a média da população com cada grupo separadamente. ao ser transformada em uma hipótese estatística. o pesquisador pode responder uma pergunta relevante sobre uma população-alvo com certo grau de confiança e pode dar oportunidade para que outras perguntas importantes sejam feitas. mas é fundamental para se compreender fenômenos complexos ou muito dispersos.3). em um teste para ver se os filtros A e B são iguais. têm eficiência igual (fig. supõe-se que A e B são parte da mesma população. Uma pergunta científica válida pode ter diversas formas. devemos fazer inferências sobre parâmetros da população-alvo. Os dois filtros. essa etapa é feita por outros pesquisadores. então. Isso é testado comparando-se as duas médias e vendo se poderiam ter saído de uma mesma população. Seguindo esses passos. ambos os grupos devem estar dentro do intervalo de confiança que contém a média da população. ou seja. mas. Como vimos antes. se dividirmos a amostra em dois grupos. podemos usar testes estatísticos para ver se as médias de poluentes são iguais ou diferentes. elucidando fenômenos dentro daquela população. Podemos perceber que os filtros A também deixam no ar. a diferença entre médias amostrais é tão grande que não podemos estimar a mesma média populacional com as duas amostras (fig. as médias obtidas com os grupos A e B. Se. menos poluentes que os filtros B. em média. Há vários testes que podem ser feitos em Estatística com essa finalidade e seus cálculos são bem distintos. por um acaso. Aqui. Estatística 133 UAB . vemos que a média de poluentes saindo dos filtros A é menor que a dos filtros B.Figura 3: Média e dispersão das amostras de filtros dos tipos A e B dentro de uma curva normal estimada para uma única população. Mas. aqui. mas. eles não são parte da mesma população e possuem eficiências diferentes. a diferença ainda está dentro do intervalo de confiança que contém a mesma média populacional. Figura 4: Média e dispersão das amostras de filtros dos tipos A e B dentro de uma curva normal estimada para uma única população. 4). não se sobrepuserem sobre uma estimativa de média populacional comum. separadamente. mas nem tão menor assim que não sirva para estimar a mesma média da população. é esse tipo de similaridade de parâmetros estimados que é calculado. basicamente. ou seja. Caso seja rejeitada. Ao comparar dois grupos de dados amostrais dessa forma. Aos falsos positivos. eles desenvolveram o que é. o teste apenas examina a hipótese nula. No nosso exemplo. estatisticamente. a hipótese nula diz que os filtros A e B têm eficiência semelhante. também conhecidos como “erros de credulidade excessiva”. estamos aplicando um teste de significância. Com o resultado do teste. UAB 134 Licenciatura em Matemática . realmente. • A Hipótese Alternativa (representada por H1. os “erros de ceticismo excessivo”.Este é o princípio do teste de hipóteses na Estatística Inferencial. ou seja. as duas estatísticas amostrais poderiam ter saído de uma mesma população. devemos aceitar a hipótese alternativa. podemos aceitar ou rejeitar a hipótese nula. o que indica que há uma probabilidade muito baixa – de acordo com o intervalo de confiança escolhido – que as duas médias venham de amostras de uma mesma população. chamaram de “erros tipo I”. usado como condição de eficiência para novos métodos de testes de hipóteses. Nos anos seguintes. Ela assume que as médias de duas amostras não são diferentes de uma maneira significante no que diz respeito às estatísticas. Reconhecendo os Próprios Erros Dois grandes nomes da Estatística. Na verdade. o polonês radicado nos EUA Jerzy Neyman (1894 – 1981) e o britânico Egon Pearson (1895 – 1980) desenvolveram o chamado “Lema de Neyman-Pearson” entre 1928 e 1930. de que as duas estatísticas vieram de uma mesma população. chamaram de “erros tipo II”. ou HA) – sustenta o contrário. Ela sugere que há diferença. Quando realizamos um teste. a hipótese alternativa é que há uma diferença significante entre a eficiência dos filtros A e B. Aos falsos negativos. Eles questionaram o problema de se obter “falsos positivos” e “falsos negativos” em testes de significância. E perguntamos se a diferença entre as estatísticas desses dois grupos é. nós formulamos duas hipóteses: • A Hipótese Nula (representada por H0) – supõe que não há diferenças entre dois grupos de dados. grande o suficiente para significar que há uma diferença real entre eles. significante entre duas médias. até hoje. No nosso exemplo. que não permitem aos cálculos detectar uma diferença que existiria se a amostra fosse maior. não percebemos uma diferença que existe. devemos primeiro entender que toda análise estatística tem certo grau de incerteza. perceber essa diferença. mas é sempre mais grave cometer um erro tipo I do que um erro tipo II. em uma pesquisa. pois. diretamente. vamos entender como podemos evitar erros de decisão. Não podemos eliminar essa incerteza totalmente. ou seja. portanto o melhor que podemos fazer é deixar. como vimos antes. ou . Isso é impossível. Nós esco- Estatística 135 UAB . Devemos tomar cuidado para evitar erros de decisão. Há dois valores que nós podemos ajustar para realizar testes estatísticos. é chamada de nível de significância de um teste estatístico. outros pesquisadores podem. rejeitar a hipótese nula quando ela é verdadeira. as repercussões podem ser mais graves. ou seja.Ou seja. que representa a probabilidade máxima de cometermos um erro tipo II. qual o grau de incerteza com que estamos trabalhando. O erro tipo II ocorre quando aceitamos a hipótese nula quando ela é falsa. aceitando a hipótese nula quando ela é falsa. por exemplo. A seguir. Mas se dissermos que há uma diferença que não é real. estamos implicando a existência de todo um universo de dados inexistentes. os parâmetros que nos interessam. É o chamado erro tipo I do lema de Neyman-Pearson. na análise estatística podemos incorrer em dois tipos de erros de decisão. O segundo é o valor (beta). Evitando Erros de Decisão Para evitar cometer erros de decisão. bem claro. Se não conseguimos. O primeiro é o valor (alfa). para isso precisaríamos analisar toda uma população e medir. que representa a probabilidade máxima de cometermos um erro tipo I. Podemos rejeitar a hipótese nula quando ela é verdadeira. assumimos desde o começo que não havia diferença entre as estatísticas amostrais e que todas fariam parte da mesma população. A especificação da probabilidade máxima de cometermos um erro tipo I. ou seja. Esse tipo de erro ocorre quando. ou seja. Afinal. pois implicam que há duas distribuições populacionais em vez de uma só. perceber uma diferença que existe. Podemos incorrer nesse erro se tomamos amostras pequenas demais. podemos “achar” uma diferença onde não há nenhuma. mais tarde. tomamos amostras enviesadas de uma população e assim fazemos estimativas irreais dos parâmetros populacionais. 95 em proporção).05. não perceber uma diferença real entre estatísticas amostrais. Em programas de computador. Ele servirá como “ponto de corte” para decidirmos se um teste é ou não significante. O termo 1 – é chamado de poder estatístico de um teste de significância e corresponde à probabilidade de rejeitar. O valor é também chamado valor crítico de significância.05. sendo o mais comumente usado. Vejamos a tabela 1 abaixo. quando ela é falsa. usamos o termo 1 – = 0. Aqui vemos as quatro consequências resultantes da tomada de decisão sobre um teste estatístico. é menor que 5%. ou seja. Ele é a probabilidade de cometermos O valor de um erro tipo II. Temos. mais “poderoso” é o teste. ou menos. que queremos ter em não cometer um erro tipo I: se queremos ter 95% de confiança (0. Decisão H0 é verdadeira H0 é falsa Aceitar H0 1 – : decisão correta : erro tipo II Rejeitar H0 : erro tipo I 1 – : decisão correta é também importante. automaticamente. aceitar a hipótese nula. Regra geral. tentando descobrir se há uma diferença real entre duas médias de 0. Após realizar um teste de significância amostrais usamos um adequado. UAB 136 Licenciatura em Matemática . menor deve ser o . = 0.lhemos esse valor de acordo com a segurança. Tabela 1: Consequências da tomada de decisão em testes estatísticos. de chance de cometer um erro tipo I. H0 quando for falsa. ou confiança. esse é o . Em outras palavras. usado.05. Podemos mudar o nível de significância para mais ou para menos. dependendo do tipo de amostra que estivermos usando e quantos testes faremos com um mesmo conjunto de dados. Isso significa que a probabilidade que estamos rejeitando a hipótese nula – de que não há diferença entre as médias amostrais – sendo ela verdadeira. para calcular a significância de um teste. Significa que só consideraremos significativo um teste em que tenhamos 5%. mais de 95% de confiança de que não estamos cometendo um erro de decisão tipo I. Por exemplo. então. Esse é um nível de significância de 0. quanto mais testes realizamos. obtemos um resultado menor que . Quanto mais alto o resultado de 1 – . ou 5%.95. corretamente. digamos.487% de que encontraríamos a mesma diferença de eficiência dos dois tipos de filtros que encontramos na amostra se estas amostras viessem de uma mesma população. O valor é determinado por nós. vemos que p < . quando interpretamos o valor p.05. veríamos que a probabilidade de termos essa diferença em uma mesma população seria maior que a probabilidade de cometermos um erro tipo I e devemos concluir que a diferença entre os dois tipos de filtros é. Há muitos enganos comuns. O valor p é uma probabilidade. p = 0. quando a diferença não é real (erro tipo I) é representada por . então. ou seja. Mas nem tudo é tão simples. achamos um valor tão extremo quanto o obtido. incluindo o tamanho da amostra e até a diferença máxima entre as médias amostrais. uma diferença que não existe ( ).4. o nível de significância. que a probabilidade de acharmos uma diferença entre duas estatísticas amostrais. dentro daquele conjunto de dados amostrais. se em nosso estudo sobre a eficiência dos filtros industriais A e B escolhermos um de 0. Por exemplo. o valor p é calculado com base nos dados e deve ser comparado com o limite crítico de que nós escolhemos. e podemos dizer que essa diferença é. como o de achar que um valor p é a probabilidade da Estatística 137 UAB . estatisticamente. que não haja uma diferença real entre as amostras. Significância Estatística: o Valor P Sabemos. estipularemos o limite aceitável da probabilidade de cometermos o erro de dizer que há uma diferença quando essa não existe. outros valores são usados para saber o poder de um teste. Mas se o resultado do teste fosse. Fizemos um teste de significância e obtivemos o valor p = 0. quando requisitado a realizar um teste de hipóteses. estatisticamente. dado que a hipótese nula seja verdadeira. Também chamamos este valor de valor crítico amostral. Podemos então dizer que há a probabilidade de 0. Esse valor é a probabilidade que. não significante.Na prática. portanto estará entre 0 e 1. Comparando a probabilidade (p) com a probabilidade de acharmos. um valor p. significante. Também podemos decidir qual o nível de significância aceitável para nosso teste de hipóteses. em um teste de hipóteses. erroneamente.00487. Mas como saber se o resultado de um teste estatístico está dentro ou fora do nível de significância que desejamos? A maior parte dos programas de computador estatísticos vai fornecer. o valor p apenas diminui a incerteza que temos sobre as diferenças amostrais. Podemos dizer que um teste com p = 0. O mais importante aqui é lembrar que não podemos extrapolar as suposições que baseiam os valores . As medidas de associação permitem que as conexões.hipótese testada ser verdadeira. ou de que o tamanho de p indica a força da influência de uma variável sobre outra. Há vários tipos de cálculo de correlação.60 é não significante e com p = 0. Há um método paramétrico. mas apenas indica que há 1% a mais de probabilidade de obtermos uma diferença como aquela dentro da mesma população.06 é marginalmente significante. A mídia está recheada de exemplos do mau uso da Estatística e da interpretação errônea de seus resultados. sejam identificadas e até medidas. UAB 138 Licenciatura em Matemática .60 e p = 0. mas nunca temos certeza absoluta das generalizações que fazemos através da Estatística. e simples. a correlação por postos de Spearman. há uma diferença muito grande entre p = 0. há uma probabilidade de 60% de que a diferença encontrada seja apenas amostral e não populacional. Como vimos. Medidas de Associação entre Variáveis Agora que já entendemos os pressupostos da Estatística Inferencial. O limite de aceitação de um valor p é baseado no nível de significância que decidimos antes mesmo de olhar os dados amostrais.05.06 é menor. Há dois tipos de medidas de associação: a correlação e a regressão. Comparado com . Na verdade. p. Estamos verificando probabilidades e tentando reduzir a incerteza.60. que existem entre duas variáveis. a correlação linear de Pearson e um método não paramétrico. Mas muitos pesquisadores cometem o erro de interpretar os testes estatísticos como se fosse uma resposta do tipo “sim-ou-não”: significante ou não significante. se temos um de 0. podemos trabalhar com as medidas de associação entre duas variáveis. A correlação permite medir o grau de associação entre uma variável x e uma variável y. p = 0. mas os mais comuns. Se p = 0. principalmente.06. devemos sempre exercer a parcimônia ao interpretar os resultados de testes de hipóteses. Para que nossas pesquisas sejam relevantes. são os de correlações lineares. e. ou relações. a distribuição é considerada normal se. mesmo não normal.05. simples e laboriosa. significantemente. o AndersonDarling e o Ryan-Joiner. diferente de uma distribuição normal ao acaso. ou seja. ainda podemos confirmar se a variância dentro da variável é homogênea. com três ou mais variáveis. facilmente. Assim. o teste de Kolmogorov-Smirnov para normalidade pode ser feito manualmente e há diversos livros que explicam a técnica. Regressões podem ser lineares ou não e podem ser simples. Para se saber se a distribuição dos dados é normal. usamos um teste de homocedasticidade (homogeneidade de variância). pois os principais cálculos de testes como a regressão e a correlação de Pearson? Ideia incompleta! Vamos agora aprender a utilizar as duas medidas de associação e entender que devemos ser cautelosos na interpretação de seus resultados. ainda é possível usar um teste paramétrico. Há vários testes que vão comparar a distribuição de uma variável aleatória com a distribuição normal hipotética de uma variável com as mesmas medidas de tendência central e de dispersão. são usados testes de normalidade. apresentar uma variância homogênea. o valor de p for maior que 0. Os mais comuns são o teste de Levene e o de Bartlett.05. e fornecem as tabelas estatísticas para verificar os valores necessários ao cálculo. veremos como um programa de computador apresenta o resultado de um teste K-S normal. também. calculados por programas de computador. Para amostras pequenas. para um = 0. Os mais conhecidos são os testes de Kolmogorov-Smirnov. As regressões devem ser feitas em dados que preencham as exigências para testes paramétricos e podem ser: a distribuição normal dos dados e a variância homogênea entre os vários pontos de dados dentro de uma variável. Para isso. Se o resultado de um teste de normalidade diz que a distribuição da variável difere de uma distribuição normal. Se a variável. Estatística 139 UAB . quando usam apenas duas variáveis.Já a regressão calcula o efeito de uma variável x sobre uma variável y e permite que calculemos um valor de y hipotético com base em um valor de x que não possuímos em nossa amostra. ou múltiplas. e qualquer programa de computador que trabalhe com Estatística oferece várias opções. há menos de 5% de chance de que a distribuição da variável seja. Mais adiante. 5. se não é normal. UAB 140 Licenciatura em Matemática . vamos usar os dados que citamos e pedir para o MS Excel criar um gráfico de pontos. usando dados já vistos em uma de nossas aulas anteriores. Após editar os eixos para que comecem um pouco abaixo da altura e peso mínimos (clicando no eixo do gráfico e em “Formatar”). em geral. devemos calcular a correlação entre essas variáveis. mais alto o valor de y (com exceção de alguns ‘magrinhos’ e ‘gordinhos’). quanto mais alto o valor de x. temos um gráfico como este da fig. Podemos. ou não paramétrico. quanto mais alta a pessoa. De modo geral. então. mesmo que uma amostra tenha indivíduos mais gordinhos ou mais magrinhos. Então. Podemos escolher entre o método paramétrico.Correlação A correlação mede o quanto duas variáveis se alteram juntas. geralmente. mudam juntas. Podemos ver que. Agora. contendo o peso e a altura de 24 indivíduos que são duas variáveis que. ver que parece haver uma relação entre as duas variáveis. Figura 5: Gráfico de dispersão XY dos pesos (x) e alturas (y) de 24 indivíduos. se a distribuição é normal. Uma forma simples de comprovar se há variação conjunta entre duas variáveis é criar um gráfico de pontos contendo uma variável no eixo de x e outra no eixo de y. Mas será que essa relação é real? Qual é a sua força? Para descobrir isso. mais pesada ela é. 088. vemos que essa também tem uma distribuição normal. significantemente. com um valor de P maior que 0. sendo que a altura e o peso de cada indivíduo devem estar na mesma linha. representando os valores esperados em uma distribuição normal. Para o alfa de 0. pois cria um gráfico em que são plotados os dados da variável contra uma linha. do qual falamos em uma aula anterior. uma para cada variável. podemos verificar que tanto a altura quanto o peso têm distribuição que não difere. vamos testar nossas variáveis para normalidade com o programa MINITAB 14 (www. Após realizar o mesmo teste com a variável “Peso (kg)”.05. devemos organizar os dados em duas colunas.minitab.150).28 cm. Usando o teste K-S normal (teste Kolmogorov-Smirnov para normalidade). Estatística 141 UAB . Figura 6: Gráfico do teste K-S normal para a variável “Altura (cm)” criado pelo programa de computador MINITAB. Para tal. indicando que a média é de 164. há 24 pontos de dados (N) e segue com os valores do teste K-S (0.9 cm e o desvio padrão de 10. Vemos que o resultado do teste aparece em uma legenda no gráfico.com). mas podemos usar qualquer programa de estatística. o teste indica que a distribuição da variável não difere de uma distribuição normal. A figura 6 apresenta um gráfico do teste de normalidade para a variável “Altura (cm)”. de uma distribuição normal. pois o programa calculará a correlação linha por linha.Então. no Excel: basta selecionar a coluna da variável que a soma dos valores aparece no canto inferior direito da janela. 7). usar a correlação de Pearson para testar a relação entre as duas variáveis. O resultado de uma correlação de Pearson vai ser o valor r. a correlação positiva indica que duas variáveis variam juntas (se x aumenta. é possível fazer esse cálculo. que indica a força e a direção de uma correlação e varia entre -1 e 1. então. O programa baseia esse teste na fórmula acima e vai fornecer os resultados em uma caixa de diálogo (fig. Figura 7: Caixa de diálogo do programa MINITAB. Assim. Para calcular a correlação de Pearson no MINITAB. Para achar o r de Pearson. “Estatísticas Básicas” e “Correlação”. y aumenta) e uma correlação negativa indica que se o valor de x aumenta y diminui. vamos então clicar em “Estatísticas”. Uma correlação de valor zero não existe. UAB 142 Licenciatura em Matemática . se bem que pode ser laborioso se houver muitos pontos de dados para somar manualmente: Essa fórmula utiliza apenas três valores: o total de observações ou tamanho da amostra (n). com os resultados de uma correlação de Pearson entre as variáveis “Altura (cm)” e “Peso”. mesmo com grandes bases de dados.Podemos. a soma de x e a soma de y. o cálculo é simples. 0. geralmente. a correlação é. di = xi – yi). o teste K-S normal nos indicasse que a distribuição dos nossos dados era.05).8). que é zero (bem menor que o limite de 0. mostrando os resultados do cálculo do coeficiente de correlação por postos de Spearman. Figura 8: Caixa de diálogo do programa de computador BioEstat 5. sendo os resultados mostrados em uma caixa de diálogo (fig.Em nosso exemplo.829. a correlação de Spearman. positiva com o valor de r de 0. d2 = x2 . após testarmos nossas variáveis para normalidade. entre o peso e a altura de 17 indivíduos. que é um teste não paramétrico. fortemente.05): nesse caso.y2. Digamos que.0.. Estatística 143 UAB . Em outros programas. o coeficiente de correlação de Pearson é calculado pela fórmula: Programas de computador também realizam esse cálculo.. usaríamos o coeficiente de correlação por postos de Spearman. A significância do teste é mostrada pelo valor de P. a mesma ferramenta para a correlação de Pearson calcula. como o BioEstat 5.. diferente de uma distribuição normal (p>0.. No MINITAB. significantemente. Representado pela letra grega . o qual é calculado a partir da organização dos dados de cada variável em ordem crescente (os postos) e calculando-se a diferença entre os valores pareados (d1 = x1 . se os dados estiverem ordenados.y1. imediatamente. pode-se pedir para que o programa calcule o coeficiente de Spearman em dados não ordenados. na ferramenta estatística para análise não paramétrica. positiva.Os dois testes que vimos agora são correlações lineares simples que pedem que as variáveis sejam medidas em escala de razão (a correlação de Spearman também permite que dados em escala ordinal sejam trabalhados). Se a associação é. testes paramétricos. vamos ter um gráfico como o representado na figura 9. Esses testes usam tabelas de contingência nas quais se encontram dados agrupados por categorias ordinais. e assim por diante. y. Para entender as correlações entre várias variáveis. não paramétricos. Nela. como o teste de Spearman. uma matriz de correlação vai calcular as correlações entre x e y. w e z. Já para dados nominais. Já a contingência c. temos o coeficiente de contingência C e o coeficiente de concordância de Kendall. Correlações Lineares As correlações lineares só são eficientes em dados que tenham associações lineares. fortemente. a concordância e a correlação de Kendall. Para o cálculo da correlação entre duas variáveis que são afetadas por uma terceira. como diz o nome. sendo os dados organizados em frequências absolutas das categorias. usa-se a correlação parcial. O coeficiente de correlação de Kendall também é usado em dados ordinais. Figura 9: Gráfico de dispersão xy com correlação de Pearson. como a correlação de Pearson. utiliza-se o coeficiente phi. podemos “corrigir” a correlação entre x e y por causa da influência de uma variável z. e o coeficiente phi são. Há testes que trabalham com mais de uma variável ao mesmo tempo. Matrizes de correlação e correlação parcial são. Mas há muitos outros tipos de correlação. fortemente positiva. entre x e z. Para dados ordinais. pode-se usar uma matriz de correlação: se temos x. UAB 144 Licenciatura em Matemática . entre x e w. enquanto uma correlação mais fraca teria pontos de dados mais esparsos. negativa apresentaria os pontos dos dados bem próximos. fortemente negativa. Estatística 145 UAB . em uma configuração descendente (fig. fortemente. 12). apesar de manter a configuração descendente (fig. O mesmo se dá com as correlações negativas.Uma associação positiva mais fraca mostra os pontos de dados menos centralizados. Figura 10: Gráfico de dispersão xy com correlação de Pearson positiva. Figura 12: Gráfico de dispersão xy com correlação de Pearson negativa. mas ainda ascendentes (fig. Uma correlação. 10). Figura 11: Gráfico de dispersão xy com correlação de Pearson. 11). 0. pois se duas variáveis se correlacionam de forma não linear. há testes sofisticados mais apropriados para calcular a força e direção da associação. UAB 146 Licenciatura em Matemática . Se aplicarmos um teste de correlação linear. Figura 13: Gráfico de dispersão xy mostrando duas variáveis não associadas. O coeficiente de correlação de Pearson confirma a não associação. ele deverá mostrar essa associação (fig. o gráfico apresentaria pontos dispersos. No entanto. O gráfico tira a dúvida. 13). Figura 14: Gráfico de dispersão xy mostrando uma associação não linear entre duas variáveis. mesmo que fortes.0. as duas variáveis podem estar correlacionadas de forma não linear.Devemos sempre checar o gráfico de uma correlação com r = 0. Como os testes de correlação são feitos para detectar correlações lineares. Por exemplo. ela não detecta correlações não lineares. o coeficiente de correlação linear ainda vai ser r = 0. 14). como o Pearson. Nesse caso. se dois grupos de dados não possuem nenhum tipo de correlação. O r de Pearson não detecta essa associação. nessas variáveis. sem nenhuma associação evidente (fig. 059).25.5 não é duas vezes mais forte que uma de 0. no entanto. Já o valor de R2 calculado a partir do teste de regressão. Numa correlação. que permitem achar a medida de tendência central de um grupo de correlações. • Tirar a média aritmética de várias correlações – É um erro muito grave. quando não há correlação real. as duas podem ser causadas por uma variável z que não é conhecida. uma correlação fracamente positiva (de.Os Enganos Comuns no Uso (e Abuso) das Correlações Apesar das correlações serem ferramentas importantes no estudo de muitos fenômenos. sem sentido e pode levar a enganos de interpretação. ou vice-versa. pois correlações não são números comuns. • Comparar coeficientes de correlação – Os coeficientes de correlação (r.98). 0012). Há cálculos. completamente. Na verdade. pode ser comparado. r = 0. Se a variável x está correlacionada com a variável y. mas ter o valor de p no limite crítico escolhido (como p = 0.) não podem ser comparados diretamente. é a probabilidade de acharmos tal coeficiente de correlação por pura sorte. não devemos nunca esquecer que se trata de testes estatísticos e como tal devem ser interpretados com parcimônia. etc. Uma média aritmética de vários coeficientes de correlação é. Outras podem ter uma correlação fortemente negativa (r = -0. digamos. Às vezes. explicado por outra. é sempre bom lembrar que o valor de p é a probabilidade de que o resultado achado ocorra ao acaso. • Achar que o valor de p indica a importância da correlação – Apesar de já termos falado disso. não quer dizer que x causa y. portanto não podem ser tratados como medidas de uma variável. pois indica o quanto da variância de uma variável é. estatisticamente. Uma correlação de 0. Os coeficientes de correlação indicam a direção da ligação e não sua força real. que devem ser evitados sob pena de invalidarem uma análise estatística: • Confundir correlação com causa – Esse é o engano mais comum.15) pode ter um p bastante significativo (como p = 0. . caso a hipótese nula seja verdadeira. ou estarem ligadas por forças (como as leis da física ou aspectos da biologia) que permeiam todos os fatores estudados. que veremos a seguir. Há muitos enganos comuns no uso das correlações. Uma regressão com o R2 de 80% explica duas vezes mais a variância do que uma de 40%. Estatística 147 UAB . O tamanho da amostra vai ter um efeito maior no valor de p do que o coeficiente de correlação. usando-se a transformação z de Fisher. ou erros. a regressão utiliza valores ajustados através da técnica de mínimos quadrados. Esse teste é de amplo uso em pesquisas. e uma dependente (y). ou efeito. x1 e y1. contendo todas as variáveis possíveis e examinando todas as correlações em busca de resultados significativos que são “explicados” posteriormente. formando uma reta (quando a regressão é linear) que liga estes valores calculados. Assim. fazendo com que possamos “prever” como a variável dependente vai se comportar. Se escolhermos um α = 0. quando a variável independente alcançar um valor ainda desconhecido. em Meteorologia e Economia. devemos ser comedidos na quantidade de testes de hipóteses utilizados em uma base de dados. vamos acabar por achar resultados significativos ao acaso. por exemplo.05. o grande atrativo da regressão é a capacidade de fornecer uma equação que servirá pra prever valores fora daqueles coletados em uma amostra. etc. que usa apenas uma variável independente (x). o que é o contrário da pesquisa científica válida. Isso significa que a hipótese foi elaborada após a análise. para prever eventos que ainda não ocorreram. temos uma grande chance de ter um “falso positivo” entre os resultados.• “Pescar” correlações significativas – A “Pescaria” estatística é um erro fatal de análise e pode invalidar toda uma base de dados. É comum ver pesquisadores criando matrizes de correlação. a variável-resposta.). Regressão Outro teste para medir associações entre variáveis é a análise de regressão. sejam científicas. x2 e y2. da associação entre uma variável independente (o fator de predição) e uma variável dependente (ou resposta). de mercado ou de opinião e serve para entender a influência. fazendo com que a variável dependente seja uma função da independenteA grande diferença entre a correlação e a regressão é que esta é usada para extrapolar os valores que temos em nossa base de dados. temos uma chance em 20 de achar um “falso positivo”. Regressões são usadas. também chamada variável de efeito. que testa hipóteses criadas a priori. Por isso. se realizarmos muitos testes estatísticos em um mesmo conjunto de dados. Se realizarmos 20 ou mais testes. Devemos tomar cuidado para não confundir a regressão com a correlação. Além disso. A regressão usa os resíduos. permitindo extrapolar os valores amostrais até os limites da distribuição dos UAB 148 Licenciatura em Matemática . A forma mais simples da regressão é a da regressão linear simples. Enquanto a correlação é calculada através da associação de cada ponto de dados de uma variável com a outra (por exemplo. de uma variável sobre a outra. A partir da amostra. E nossa hipótese inicial presume que a propaganda não influencia as vendas. Todos os programas de computador.dados. Caso nos interesse verificar. qual valor y teria se x = 0. Então. calcula o quanto y muda. para chegarmos à covariância entre as variáveis. o tempo de exposição na mídia. Como com a correlação de Pearson. através de propagandas de rádio e televisão. em média. É calculado a partir da covariância de x e y. é calculado. o teste estima uma linha de progressão (chamada ‘linha de regressão de melhor ajuste’). O volume de vendas deve ser analisado para que possamos saber se ele é ou não dependente da intensidade de publicidade. por aumento de x. subtraindo-se a média de y da multiplicação da média de x pelo coeficiente de regressão: Assim. em que y é calculado pela fórmula: y = a + bx O valor b. a fórmula y = a + bx pode ser aplicada para estimar qualquer valor y a partir de um valor x. como fizemos em aulas passadas. o quanto elas variam conjuntamente. então. Programas de computador calculam a regressão linear simples e produzem um gráfico de dispersão xy com a linha de regressão de melhor ajuste. o cálculo da regressão linear simples envolve saber a covariância entre as duas variáveis. a variância de x. devemos antes testar as variáveis envolvidas para a normalidade. vol- Estatística 149 UAB . Logo. ou seja. e as médias de x e y. dando a inclinação da linha de regressão. A regressão linear simples é um teste paramétrico e estima uma curva normal a partir da amostra. podemos calcular manualmente ou com a ajuda do Excel. chamado de coeficiente de regressão. dividido pela variância de x: O valor a é a interseção y. dentro da qual valores ausentes são estimados. influencia as vendas de um produto alimentício. é a variável independente. ou seja. se o tempo de exposição de um produto na mídia. tados à Estatística. em que selecionamos a variável-resposta (response. ligeiramente. entre o tempo (em minutos por mês) de exposição na mídia e o volume de vendas (em milhares) de um produto alimentício.84 + 0. o programa retornou a seguinte informação: Análise de Regressão: Vendas (milhares) x Minutos/mês A equação de regressão é: Vendas (milhares) = 5. diferente. oferecem a opção de regressão linear simples e produzem gráficos de qualidade. no programa MINITAB. Figura 15: Tabela de variáveis e caixa de diálogo para regressão linear simples.000 Licenciatura em Matemática . Para a nossa pesquisa sobre o efeito da propaganda nas vendas. A maioria dos programas apresenta uma configuração semelhante.72 0. T P Minutos/mês 0.26882 0.01087 24. O MINITAB apresenta um estudo detalhado da regressão. em inglês). os resultados são expostos de forma. 269 Minutos/mês UAB 150 Variável independente Coeficiente Erro padrão do coef. em inglês) e a variável independente (ou predictor. Dependendo do programa. A figura 15 apresenta a caixa de diálogo do MINITAB para a regressão simples. Tal linha mostra o melhor ajuste possível de uma reta dentro de um gráfico de pontos das duas variáveis. Quanto maior esse valor. Em nosso caso.2% da variação em y. colocado logo após F. O valor R2 é o coeficiente de determinação e representa a porcentagem da variação total da variável-resposta (y) que é explicada pela variação da variável de efeito (x). e aceitar a hipótese alternativa. de que há uma influência da publicidade nas vendas do produto.b = 0. O gráfico de uma regressão é muito similar ao de uma correlação. Ou seja. 881761. vemos que o valor de p. 0000. ou seja. como pode ser visto na fig.000 O primeiro valor que devemos olhar é o valor F (regressão). De forma geral. devemos rejeitar a hipótese nula. a linha que mais se aproxima os pontos do gráfico. de 0. Isso significa que temos 0. a variação em x explica 98. No caso. Para o nosso exemplo.4% R2 (ajustado) = 98. fortemente.2% Análise de Variância Regressão F P 611. positiva. quanto mais próximo de 100% é o R2. Estatística 151 UAB . na mídia.11 0. por mês. 16. 881761 R2 = 98. quanto mais tempo um produto é anunciado em média. ou seja.00% de chance de conseguir o valor F quando a hipótese nula é verdadeira. tanto melhor o modelo (a equação de regressão) se ajusta aos dados. com a diferença que ele contém uma linha de regressão ajustada. de que a propaganda na mídia não influencia a quantidade de vendas. é de 0. A direção dessa influência é dada pelo Coeficiente de Correlação (b) acima. mais chance temos de ter uma regressão significante. o gráfico de regressão fica assim. mais consumidores irão comprá-lo. As duas variáveis têm uma associação. no entanto. podemos verificar a influência de duas ou mais variáveis independentes sobre uma variável dependente. logarítmica ou geométrica. • Ajustamento de curvas – Esse método é.Figura 16: Gráfico de regressão linear. do efeito do tempo de exposição à mídia (em minutos/mês) e as vendas (em milhares de unidades) de um produto alimentício. útil quando a associação entre as variáveis não é linear. os mais comuns são: • Regressão Linear Múltipla – Nesse teste. Há outros tipos de regressão que podem ser aplicados para verificar a influência de várias variáveis independentes sobre uma dependente. com linha de regressão. precisamos de outros tipos de testes de regressão. Outros Tipos de Regressão Apesar de regressões lineares simples serem. pois podemos invalidar esse modelo se. por exemplo. geralmente. apenas uma das três variáveis independentes tiver um efeito sobre a dependente. extremamente. Métodos de seleção de variáveis incluem a seleção por passos. mas exponencial. ou para lidar com dados que têm associações não lineares. feita por muitos programas estatísticos. UAB 152 Licenciatura em Matemática . O teste procura que tipo de curva mais se ajusta à associação entre variáveis e calcula o coeficiente de regressão. para selecionar as variáveis que vão entrar no modelo. em algumas ocasiões. Devemos ter cuidado. suficientes para que possamos entender o efeito de uma variável sobre a outra. em forma de “sim-ou-não”. É importante. mas todos chegarão à mesma resposta. na organização dos dados. cúbicas ou quárticas podem ser calculadas em situações em que a associação entre variáveis assume formas curvas diversas. com a esperança de que a introdução ao vastíssimo universo da Estatística tenha despertado o interesse e fomentado o aprofundamento dos seus conhecimentos nessa ciência. permitem tantos ajustes específicos a cada caso que o método se torna “feito sob medida”. como também ajuda a entendê-los e saber qual a situação adequada para seu uso. ou “sucessos/insucessos”. Formas como regressões quadráticas. Com o crescimento das populações. há duas ou mais variáveis independentes. no entanto. características dos cálculos estatísticos. escolherem governantes e exigir eficiência dos serviços públicos.• Regressão Logística Simples – A regressão logística simples é usada quando a variável dependente pode ser colocada de forma binária. Esse teste é muito útil em análises de presença/ausência ou quando comparamos dois grupos distintos e excludentes. A maioria dos programas de computador não apenas realiza esses testes. as pesquisas estatísticas serão cada vez mais frequentes e Estatística 153 UAB . Chegamos ao final de nossa disciplina.Mas a variável independente pode ser contínua. Não há uma receita única de se trabalhar com a Estatística. • Regressão Logística Múltipla – Como a logística simples. no entanto. a variável dependente é binária. mas sendo uma regressão múltipla. • Regressões Polinomiais – Referem-se a um conjunto de testes que usam fórmulas polinomiais para o cálculo dos coeficientes de regressão. e sem ela todos os resultados perdem o sentido. representados pelos dígitos 0 e 1. A flexibilidade e a interação entre fórmulas matemáticas. mas devemos sempre seguir os fundamentos básicos que vimos aqui. Há um velho ditado da área que diz: se apresentarmos um problema para dez estatísticos. cada um deles terá um método diferente. Devemos ter cuidado redobrado. que os intervalos nos dados sejam de tamanhos homogêneos. A Estatística cria vida quando aplicada e são inúmeras as maneiras de se extrair informação de um conjunto de dados. Essa é a lógica que a guia. ou seja. que podem ser todas binárias ou ter uma contínua. e o enorme poder que grandes grupos têm ao preferir produtos. LEVIN. GRAFEN. 1991. UAB 154 Licenciatura em Matemática . Referências CHATFIELD. existindo um método paramétrico (correlação de Pearson) e um não paramétrico (correlação de Spearman). LITTLE. R. J. São Paulo: HARPER & ROW DO BRASIL. 1994. podendo assim ser usada com certo grau de confiança para entender relações e efeitos entre variáveis. Oxford: OXFORD UNIVERSITY PRESS.: Statistical Analysis with Missing Data. A.: Problem Solving – A Statistician’s Guide. essa abordagem deve seguir algumas regras metodológicas baseadas no Método Científico. Bom trabalho! Resumo A Estatística Inferencial se preocupa com o teste de hipóteses. não são.importantes. 2002. SPIEGEL. a regressão verifica se há algum efeito da variável x sobre a variável y. 1978. certamente. J. ou serão no futuro.: Statistics Without Tears.: Modern Statistics to the Life Sciences. As medidas de associação são utilizadas em diversas áreas do conhecimento. comparando a distribuição de dados amostrais com uma distribuição estimada ou esperada. especialistas nesse ramo da Matemática. R. desperdiçados. Londres: PENGUIN BOOKS. A correlação verifica o quanto duas variáveis variam juntas. mas se deve tomar cuidado com a interpretação dos resultados.: Estatística. Para que seja válida. 1987. A. M. . As medidas de associação mostram como duas ou mais variáveis se relacionam. 2000. D. assim. ROWNTREE.: Estatística Aplicada às Ciências Humanas. New York: WILEY. e permite que dados sejam extrapolados além ou aquém dos valores amostrais. C. Há métodos de correlação e regressão para variáveis múltiplas que podem ser usados para lidar com muitas variáveis ao mesmo tempo e métodos de regressão que permitem lidar com dados binários e distribuições não normais. London: CHAPMAN & HALL. MAKRON. Estatística 155 UAB .