Apostila_estatistica Descritiva_2011-NOVO ESTILO 2

March 19, 2018 | Author: Ruan Amorim | Category: Statistics, Scientific Method, Science, Time, Geography


Comments



Description

CENTRO UNIVERSITÁRIO DE ENSINO SUPERIOR DO AMAZONASCOORDENAÇÃO DE ADMINISTRAÇÃO ESTATÍSTICA Disciplina: Estatística Aplicada Professora: Simara Moraes Vasconcelos João Alves de Souza Filho Jarder Allyson 2 Conteúdo 1 A natureza da estatística 2 População, amostra e amostragem 3 Representação gráfica de séries estatísticas 4 Distribuição de freqüência 5 Medidas de posição 6 Medidas de dispersão 7 Medidas de assimetria e curtose 8 Números índices 9 Probabilidade 10 Correlação e regressão linear simples 3 CAPÍTULO 1 A NATUREZA DA ESTATÍSTICA A Estatística é a parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. - É uma ferramenta adequada para descrever os acontecimentos e tirar conclusões sobre os dados coletados nas observações; - Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem; - Um instrumento fundamental para o estudo quantitativo e qualitativo dos fenômenos aleatórios e coletivos, quaisquer que sejam seus campos de observação. O significado da palavra Estatística – Um conjunto de dados numéricos relativos a uma categoria de fatos, agrupados de forma que possam ser analisados. 1. PANORAMA HISTÓRICO Todas as ciências têm suas raízes na história do homem. A Matemática, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico. A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras aos povos, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de “estatísticas”. Envolviam aspectos quantitativos e qualitativos que eram de interesse do Estado, relativos á necessidade de tomada de decisão face à realidade dos fatos registrados (tais como reservas de alimentos, disponibilidade de armamentos e homens para a realização de um cerco ou resistência ao sítio que fosse imposto, por exemplo). Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tabelas e os primeiros números relativos. Nesta época o registro quantitativo - qualitativo dos dados se desprendeu do caráter de atendimento ao controle do Estado, para aplicar-se a campos particulares de conhecimento; No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente cientifica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes desse todo (amostra). 4 2. A ESTATÍSTICA NAS EMPRESAS 2.1. APLICAÇÕES: As técnicas estatísticas, associadas com programas adequados de computação, constituem valiosos instrumentos na administração. - Lançamento de um novo produto no mercado – Pesquisa de mercado para conhecer as preferências dos consumidores no mercado de interesse; - Auditoria nos livros de uma empresa para se certificar de que os lançamentos refletem efetivamente a situação financeira da companhia – Verifica uma amostra de documentos escolhidos aleatoriamente e, com base nessa amostra, fazer inferências (tendências) sobre toda a população; - Experiências para garantir que um novo remédio lançado no mercado é seguro e eficiente – Testar um remédio consiste em tomar dois grupos tão semelhantes quando possível, e dar o remédio a um grupo (grupo experimental), mas não ao outro (grupo de controle), e verificar então se os resultados nos dois grupos são diferentes; - Estatística na administração pública – Produto Interno Bruto (PIB) e o índice de Preço ao Consumidor (IPC); - Consultoria a um órgão de trânsito sobre a viabilidade e eficiência da instalação de controladores de velocidade em pontos estratégico da cidade – Análise do registro de ocorrências definindo quando, onde, de que forma para definirmos os locais estratégicos para investir em equipamento e pessoal. A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. Através de sondagem, por meio de coleta de dados, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazos. A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas. Tudo isso que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho. O esquema do planejamento é o plano, que pode ser resumido, com auxilio da Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatístico que lhes deram origem. 2.2. OBJETIVOS - Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem; - Descrever adequadamente todos os grandes grupos de pessoas, animais ou acontecimentos que pretendemos estudar, tanto em relação aos padrões típicos como à variação esperada. 5 2.2.1. Por que um administrador deve estudar ESTATÍSTICA? Para através de técnicas específicas ser capaz de saber:  Como extrair informações significativas de pilhas de dados brutos;  Como analisar tendência sobre a natureza de uma população com base em observações de uma amostra dela extraída;  Como predizer taxas de ocorrência de eventos aleatórios;  Como entender e interpretar cálculos estatísticos efetuados por outras pessoas. 3. ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL 3.1. ESTATÍSTICA DESCRITIVA É a parte da estatística que nos permite coletar, organizar e interpretar de uma maneira eficaz um conjunto de dados de um fenômeno pesquisado. Permite-nos descrever adequadamente todos os grandes grupos de pessoas, animais ou acontecimentos que pretendemos estudar, tanto em relação aos padrões típicos como a variação esperada. Utiliza de rol, tabelas, fórmulas para cálculos, gráficos que permitam descrever resumidamente os fenômenos. 3.2. ESTATÍSTICA INFERENCIAL OU INDUTIVA Consiste em obter e generalizar conclusões, a partir da análise e interpretação dos dados. Ou seja, inferir propriedades para o todo (população) com base na parte (amostra). O processo de generalização está associado a uma margem de incerteza devido ao fato de que a conclusão baseia-se em uma parcela do total de observações. 4. MÉTODO É um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja; Maneira de ordenar a ação segundo certos princípios. 4.1. Método Científico – Ordem seguida na investigação, no estudo, na persecução de quaisquer fatos. Dos métodos científicos podemos destacar o método experimental e o estatístico. 4.1.1. Método Experimental Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. Aplicado no estudo da Física, da Química etc. 4.1.2. Método Estatístico Aplicamos o método estatístico quando precisamos estudar fenômenos que se refere a um conjunto onde suas características próprias estão sujeitas a condições peculiares e complexas, influenciados por vários fatores. Na impossibilidade de manter as causas constantes, admite todas essas causas presentes variando- as, registrando essas variações e procurando determinar, no resultado final, que influência cabem a cada uma delas. Exemplo: Determinação das causas que definem o preço de uma mercadoria. As causas não são fixas, no momento da pesquisa. Não existe uma uniformidade dos salários, o gosto dos consumidores não é constante, seria necessária a fixação do nível geral dos preços das outras necessidades e outros fatores. Todas as causas variam. 6 5. FASES DO MÉTODO ESTATÍSTICO Quando se pretende um estudo estatístico completo, existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do estudo. Essas etapas ou operações são chamadas fases do trabalho estatístico. 5.1 Definição do Problema A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado. Além de considerar minuciosamente o problema objeto do estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. Exemplo: Um fabricante de sabonete, que deseja lançar um produto novo no mercado, poderia estar interessado em um estudo sobre as características dos consumidores atuais. Não havendo estudos semelhantes, ele deverá formular o problema com base em sua própria experiência. Uma lista de fatores relevantes deverá resultar dessa investigação preliminar: - Número de unidades consumidas por família em cada ano; - Número médio de pessoas que compõe cada família; - Número de membros adultos da família, as marcas preferidas e assim por diante. Saber exatamente o que se pretende pesquisar é o mesmo que definir corretamente o problema. 5.2 Planejamento O passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste em determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. - Que dados deverão ser obtidos? - Como obtê-los? - O que será pesquisado? - Quem participará da pesquisa? (Critérios de inclusão e exclusão) - Em que setor geográfico será feita a pesquisa? - Qual o grau de precisão exigido na pesquisa? - Qual o tipo de amostragem? - Qual o tamanho da amostra? - Quais materiais serão necessários para realizar a pesquisa? - Qual o tempo disponível para fazer a pesquisa? - Qual o custo previsto? - Qual a verba destinada ao projeto? Etc. É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se pretende atingir. Mais especificamente, na fase do planejamento a preocupação maior reside na escolha das perguntas, bem como sua correta formulação, qualquer que seja a modalidade de coleta dos dados. O planejamento pode ser dividido em: censitário que é utilizado quando a contagem for completa, ou por amostragem quando for parcial. Exemplos: Censitário → levantamento do IBGE. Amostragem → opinião dos eleitores sobre o presidente. 7 5.3 Coleta de Dados Após planejamento e análise do que se quer pesquisar, damos inicio à coleta dos dados numéricos necessários à sua descrição. Pode ser direta e indireta: A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola, quando os dados são coletados pelo próprio pesquisador através de questionários, como é o caso do censo demográfico etc. É classificada em: a. Contínua (registro) - quando feita continuamente. b. Periódica - quanto feita em intervalos constante de tempo, como os censos. c. Ocasional - quanto feita extemporaneamente, a fim de atender a conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta é indireta quando é inferida de elementos conhecidos (direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por outra coleta direta. 5.4 Crítica de Dados Obtidos os dados, eles devem ser cuidadosamente criticados, á procura de possíveis falhas e imperfeições, a fim de não incorremos em erros grosseiros, que possam influir sensivelmente nos resultados. É externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da coleta. 5.5 Apuração dos dados Soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual ou eletrônica. 5.6 Exposição ou apresentação dos dados. Os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 5.7 Análise dos resultados O objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). APRESENTAMOS O DIAGRAMA DA ESTATÍSTICA DESCRITIVA QUESTÕES 1. O que estatística? 2. Diferencie Estatística Descritiva de Estatística Inferencial. Coleta De dados Organização ou critica de dados Tabulação dos dados Apresentação dos dados Tabela Gráfico Análise 8 CAPÍTULO 2 POPULAÇÃO, AMOSTRA E AMOSTRAGEM 1. POPULAÇÃO E AMOSTRA 1.1. População - é o conjunto de elementos (pessoas, coisas, objetos) que têm em comum uma característica em estudo. A população pode ser: i. Finita: quando apresenta um número limitado de indivíduos. Exemplos: (a) A população constituída por todos os parafusos produzidos em uma fábrica em um dia. (b) Nascimento de crianças em um dia em Manaus. ii. Infinita: quando o número de observações for infinito. Exemplo: A população constituída de todos os resultados (cara e coroa) em sucessivos lances de uma moeda. 1.2. Amostra - é o conjunto de elementos retirados da população, suficientemente representativos dessa população. Através da análise dessa amostra, estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. Eis alguns exemplos: Exemplo 1: "Os campos de aplicação da Estatística são muitos e os mais variados." Estudos de mercado O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar louça, uma empresa especialista em estudos de mercado é encarregada de "estimar" a percentagem de potenciais de compradores desse produto. População: Conjunto de todos os agregados familiares do País. Amostra: Conjunto de alguns agregados familiares, inquiridos pela empresa. Problema: Pretende-se, a partir da percentagem de respostas afirmativas, dos inquiridos sobre a compra do novo produto, obter uma estimativa do número de compradores na População. 9 Exemplo 2: "Os campos de aplicação da Estatística são muitos e os mais variados." Medicina Pretende-se estudar o efeito de um novo medicamento para curar determinada doença. É selecionado um grupo de 20 doentes, administrando-se o novo medicamento a 10 desses doentes escolhidos ao acaso e o medicamento habitual aos restantes. População: Conjunto de todos os doentes com a doença que o medicamento a estudar pretende tratar. Amostra: Conjunto dos 20 doentes selecionados. Problema: Pretende-se, a partir dos resultados obtidos, realizar um "teste de hipóteses" para tomar uma decisão sobre qual dos medicamentos é melhor. Exemplo 3: "Os campos de aplicação da Estatística são muitos e os mais variados." Controle de Qualidade O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. População: Conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo. Amostra: Conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos. Problema: Pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção. Exemplo 4: "Os campos de aplicação da Estatística são muitos e os mais variados." Pedagogia Um conjunto de pedagogos desenvolveu uma técnica nova para a aprendizagem da leitura, na escola primária, a qual, segundo dizem, encurta o tempo de aprendizagem relativamente ao método tradicional. População: conjunto de todos os alunos que entram para a escola primária, sem saber ler. Amostra: conjunto de alunos de algumas escolas selecionadas para este estudo. Os alunos foram separados em dois grupos para se aplicarem as duas técnicas em confronto. Problema: do estudo da amostra, decidir qual a técnica melhor. 10 Outros exemplos. a. População: Todos os eleitores do estado do Amazonas. Amostra: 3.000 eleitores entrevistados em uma pesquisa de opinião. b. População: Todos os livros e lançamento anual de uma grande firma. Amostra: Livros e lançamentos escolhidos aleatoriamente para auditoria. c. População: Produtos de um fornecedor a serem embarcados. Amostra: Inspeção de algumas peças de item escolhido aleatoriamente. Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo. 2. AMOSTRAGEM 2.1. Amostragem Aleatória Simples Este tipo de amostra é equivalente a um sorteio lotérico. Exemplo: Vamos obter uma amostra representativa para pesquisa da estatura de noventa alunos de uma escola: a. Numeramos os alunos de 01 a 90 (numera-se a população). b. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da amostra é grande, utilizamos a Tabela de Números Aleatórios, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo. 2.2. Amostragem proporcional estratificada Muitas vezes a população se divide em sub-populações – estratos. Exemplo: Supondo, que em uma sala de aula com noventa alunos, sendo que 54 são meninos e 36 são meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: SEXO POPULAÇÃO 10% AMOSTRA M 54 100 10 54× = 5,4 5 F 36 100 10 36× = 3,6 4 Total 90 100 10 90× = 9,0 9 11 2.3. Amostragem sistemática Quando os elementos da população já se acham ordenados, não há a necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Esta amostragem é semelhante à aleatória simples, mas a listagem é ordenada. Devemos seguir os seguintes passos:  Divide-se o tamanho da população (N) pelo tamanho da amostra (n), obtendo um intervalo de retirada (k).  sorteia-se o ponto de partida.  a cada k elementos retira-se uma para amostra. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer à amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exemplo: Suponhamos uma rua com 450 casas, das quais desejamos obter uma amostra formada por 25 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: 1º Passo: como 450/25 = 18, portanto o intervalo é 18. 2º Passo: escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; 3º Passo: os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc. 3. TIPO DE VARIÁVEIS Variáveis podem ser classificadas da seguinte forma: 3.1. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. 3.1.1. Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. 3.1.2. Variáveis contínuas, características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. 12 3.2. Variáveis Qualitativas (ou categóricas): são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. 3.2.1. Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. 3.2.2. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). Outros exemplos: O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser quantitativa! Exemplo dos ursos marrons (continuação): No conjunto de dados ursos marrons, são qualitativas as variáveis sexo (nominal) e mês da observação (ordinal); são quantitativas contínuas as demais: idade, comprimento da cabeça, largura da cabeça, perímetro do pescoço, perímetro do tórax, altura e peso. EXERCÍCIO 1) Amostragem estratificada. Em uma fábrica existem 180 funcionários, sendo: 8 no financeiro; 6 no fiscal; 4 no RH; 7 no CPD; 9 na Manutenção; 46 na Embalagem; 80 na Produção; 20 na Expedição. Crie uma tabela que obtenha uma amostra de 80 funcionários. 2) Amostragem estratificada. O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, deseja conhecer as condições de vida extra-escolar de seus alunos e não dispõe de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para este diretor, os elementos componentes da amostra. 3) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1= 40, n2 = 100 e n3 = 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da amostra foram retirados do 3º estrato, determine o número de elementos da amostra. 4) Tenho 80 lâmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lâmpadas, a partir da amostragem sistemática? 5) De uma população de 480 elementos ordenados, retire uma amostra sistemática de tamanho 20. 6) Deseja-se retirar uma amostra sistemática de 10 unidades de uma população de tamanho 890. 13 7) Classifique as variáveis em qualitativas(nominal ou ordinal) ou quantitativas (contínuas ou discretas): a. Da População, alunos de uma cidade estuda-se a variável, cor de olhos. b. Da População, estação meteorológica de uma cidade, estuda-se a variável, precipitação pluviométrica, durante um ano. c. Da População, Bolsa de Valores de São Paulo, estuda-se a variável, número de ações negociadas. d. Da População, funcionários de uma empresa, estuda-se a variável, salários. e. Da População, pregos produzidos por uma máquina, estuda-se a variável, comprimento. f. Da População, casais residentes em uma cidade, estuda-se a variável, sexo dos filhos. g. Da População, propriedades agrícolas do Brasil, estuda-se a variável, produção de algodão. h. Da População, segmento de reta, estuda-se a variável, comprimento. i. Da População, bibliotecas da cidade de São Paulo, estuda-se a variável, número de volumes. j. Da População, aparelhos produzidos em uma linha de montagem, estuda-se a variável, número de defeitos por unidade. 14 Tabela de Números Aleatórios 15 CAPÍTULO 3 REPRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICAS 1 TABELAS É um quadro que resume um conjunto de observações. Uma tabela compõe-se de: a. corpo – conjunto de linhas e colunas que contêm informações sobre variável em estudo; b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas; c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas; d. linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que inscrevem nos seus cruzamentos com as colunas; e. casa ou célula – espaço destinado a um só número; f. título – conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela. Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas e as chamadas, colocados, de preferência, no seu rodapé. Exemplo: PRODUÇÃO DE CAFÉ TÍTULO BRASIL - 1998-02 ANOS PRODUÇÃO (1.000 t) CABEÇALHO 1998 2.535 CASA OU CÉLULA CORPO 1999 2.665 2000 2.122 LINHAS 2001 3.750 2002 2.007 RODAPÉ FONTE: IBGE. COLUNA INDICADORA COLUNA NUMÉRICA De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar: o um traço horizontal ( - ) quando o valor é zero; o três pontos ( ... ) quando não temos os dados; o zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; o um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. 16 2 SÉRIES ESTATÍSTICAS Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. 2.1 Séries históricas, cronológicas, temporais ou marchas Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Exemplo: PRODUÇÃO DE FERTILIZANTES FOSFATADOS – BRASIL 1996-00 ANOS QUANTIDADE (t) 1996 3.570.115 1997 4.504.201 1998 5.448.835 1999 4.373.226 2000 4.024.813 FONTE: Associação Nacional para Difusão de Adubos e Corretivos Agrícolas. 2.2 Séries geográficas, espaciais, territoriais ou de localização Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo: 2.3 Séries específicas ou categóricas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: REBANHOS BRASILEIROS - 2001 ESPÉCIE QUANTIDADE (1.000 dúzias) Bovinos 139.599 Bufalinos 1.181 Eqüinos 5.855 Asininos 1.304 Muares 1.984 Suínos 32.121 Ovinos 20.085 Caprinos 11.313 Coelhos 909 FONTE: IBGE PRODUÇÃO DE OVOS DE GALINHA NO BRASIL - 2001 REGIÃO QUANTIDADE (1.000 dúzias) Norte 66.092 Nordeste 356.810 Sudeste 937.463 Sul 485.098 Centro-Oeste 118.468 FONTE: IBGE 17 2.4 SÉRIES CONJUGADAS TABELA DE DUPLA ENTRADA Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Exemplo: TELEFONES INSTALADOS - 1999-2001 REGIÃO 1999 2000 2001 Norte 373.312 403.712 457.741 Nordeste 1.440.531 1.567.006 1.700.467 Sudeste 8.435.308 8.892.409 8.673.660 Sul 2.106.145 2.192.762 2.283.581 Centro-Oeste 803.013 849.401 944.075 Total 13.158.309 13.905.290 14.059.524 Fonte: IBGE A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal. EXERCÍCIOS 1) Classifique as séries estatísticas: a) PRODUÇÃO DE BORRACHA NATURAL – 1991-93 ANOS TONELADAS 1991 29.543 1992 30.712 1993 40.663 FONTE: IBGE b) AVICULTURA BRASILEIRA 1992 ESPÉCIES NÚMERO (1.000 cabeças) Galinhas 204.160 Galos, frangos, frangas e pintos 435.465 Codornas 2.488 FONTE: IBGE c) EXPORTAÇÃO BRASILEIRA 1985-1990-1995 IMPORTADORES 1985 % 1990 % 1995 % América Latina 13,0 13,4 25,6 EUA e Canadá 28,2 26,3 22,2 Europa 33,9 35,2 20,7 Ásia e Oceania 10,9 17,7 15,4 África e Oriente Médio 14,0 8,8 5,5 Fonte: MIC e SECEX 2) Verificou-se, em 1993, o seguinte movimento de importação de mercadorias: 14.839.804 t, oriundas da Arábia Saudita, no valor de US$ 1.469.104.000; 10.547.889 t, dos Estados Unidos, no valor de US$ 6.034.946.000; e 561.024 t, do Japão, no valor de US$ 1.518.843.000. Confeccione a série correspondente e classifique-a, sabendo que os dados acima foram fornecidos pelo ministério da fazenda. 17 3 Gráficos Estatísticos A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos, permitindo que se chegue a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados, quando da elaboração de um gráfico. Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros. Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo. Diretrizes para a construção de um gráfico: - O título do gráfico deve ser o mais claro e completo possível. Quando necessário, deve-se acrescentar subtítulos; - A orientação geral dos gráficos deve ser da esquerda para a direita; - As quantidades devem ser representadas por grandezas lineares; - Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0 (zero); - Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar do leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame do gráfico; - A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo para cima; - Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam facilmente lidos, partindo da margem horizontal inferior ou da margem esquerda. Leitura e interpretação de um gráfico: - Declarar qual o fenômeno ou fenômenos representados, a região considerada, o período de tempo, a fonte dos dados, etc.; - Examinar o tipo de gráfico escolhido, verificar se é o mais adequado, criticar a sua execução, no conjunto e nos detalhes; - Analisar cada fenômeno separadamente, fazendo notar os pontos mais em evidência, o máximo e o mínimo, assim como as mudanças mais bruscas; - Investigar se há uma “tendência geral” crescente ou decrescente ou, então, se o fato exposto é estacionário; - Procurar descobrir a existência de possíveis ciclos periódicos, qual o período aproximado, etc. 18 Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas. 3.1 Diagramas São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser: Gráficos em linhas ou lineares. É um dos mais importantes gráficos; representa observações feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas séries históricas. Exemplo: Vendas de televisões de tubo em R$ 1000,00 nos anos de 2001 a 2007 da empresa LL da Amazônia Ltda, localizadas em Manaus. Vendas de TV da Empresa LL - Manaus 0 100 200 300 400 500 2001 2002 2003 2004 2005 2006 2007 Mil Reais Fonte: Fictícia Gráficos em Barras (ou em colunas). É a representação de uma série por meio de retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas).  Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados.  Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Se as legendas não são breves usa-se de preferência o gráfico em barras na horizontal. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. 19 Exemplo: População Brasileira nas décadas de 40 a 70 em milhões. População Brasileira em Milhões 0 20 40 60 80 100 1940 1950 1960 1970 Fonte: Fictícia Gráficos em colunas superpostas. Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desse fenômeno é denominada de área de excesso. Exemplo: População urbana do Brasil por região de 1940 a 1980 (x 1000) 20 Gráficos em setores. Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da sér ie. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Obs: As séries temporais geralmente não são representadas por este tipo de gráfico. Exemplo: Representar a série em gráficos de barras e gráfico de setor: Matrículas nos cursos da Cidade A 2009 CATEGORIA N.º DE ALUNOS % Alfabetização 25.286 62,90 Médio 11.681 29,06 Superior 3.234 8,04 Total 40.201 100,00 Fonte Fictícia Representação em barras Representação em setores 21 Gráfico Polar É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que apresentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao longo do ano, ou da temperatura ao longo do dia, o consumo de energia elétrica durante o mês ou o ano, etc. Exemplo: Movimento Mensal de Compras de uma agência em 2006. Meses Valores (R$ 1.000,00) Janeiro 12 Fevereiro 13 Março 14 Abril 12 Maio 15 Junho 19 Julho 17 Agosto 18 Setembro 14 Outubro 16 Novembro 12 Dezembro 18 Fonte: dados Fictícios Movimento Mensal de Compras de uma agência em 2006 Fonte: Dados Fictícios, em mil reais. 22 3.2 Estereogramas: São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. 3.3 Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo: 23 3.4 Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Exemplo: População da Região Sul do Brasil – 1990 População da Região Sul do Brasil – 1990 Densidade populacional da Região Sul do Brasil 24 EXERCÍCIOS 3) Faça a representação em linha dos dados contidos na série abaixo: PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ 1987- 92 ANOS QUANTIDADE (1.000 t) 1987 39,3 1988 39,1 1989 53,1 1990 65,1 1991 69,1 1992 59,5 FONTE: Agropalma 4) Escolha o melhor tipo de gráfico para representar os vários tipos de séries. a) Os dez Estados que fizeram maior número de Transplantes de rim em 98. Estados N o de Transplantes DF 34 BA 38 ES 56 PE 56 CE 87 PR 181 RJ 181 MG 231 SP 756 FONTE: Assoc. Brasileira de Transplante de Órgãos. b) Área Terrestre do Brasil REGIÃO PERCENTUAL NORTE 45,25 NORDESTE 18,28 SUDESTE 10,85 SUL 6,76 CENTRO-OESTE 18,86 FONTE: IBGE c) IMUNIZAÇÕES - DOSES APLICADAS POR MUNICÍPIO - 1997 MUNICÍPIO DOSES APLICADAS ERECHIM 51.215 NOVO HAMBURGO 110.844 PORTO ALEGRE 615.317 RIO GRANDE 84.997 SANTA MARIA 107.701 FONTE: Minstério da Saúde. d) COMÉRCIO EXTERIOR BRASIL - 1988/1993 Anos Exportação Importação 1988 169.666 58.085 1989 177.033 57.293 1990 168.095 57.184 1991 165.974 63.278 1992 167.295 68.059 1993 182.561 77.813 FONTE: Ministério da Indústria, Comércio e Turismo. 25 e) O estado das florestas do planeta e o que foi devastado pela ocupação humana - em milhões de km. Continente Área Desmatada Área Atual de Florestas Oceania 0,5 0,9 Ásia 10,8 4,3 África 4,5 2,3 Europa 6,8 9,6 América do Sul 2,9 6,8 América do Norte e Central 3,2 9,4 FONTE: World Resources Institute 5) De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela para apresentar esses dados, classifique e faça uma representação gráfica. 6) De acordo com Ministério da Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para apresentar esses dados, classifique e faça uma representação gráfica. 7) Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte subdivide-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. Faça uma tabela para apresentar esses dados, classifique e faça uma representação gráfica. 8) Faça a representação gráfica em polar da série a seguir, em que a fonte é fictícia: Precipitação pluviométrica de Santa Maria – RS - 1999 Meses Precipitação (mm) Janeiro 174,8 Fevereiro 36,9 Março 83,9 Abril 462,7 Maio 418,1 Junho 418,4 Julho 538,7 Agosto 323,8 Setembro 39,7 Outubro 66,1 Novembro 83,3 Dezembro 201,2 9) ENADE – 2006. A legislação de trânsito brasileira considera que o condutor de um veículo está dirigindo alcoolizado quando o teor alcoólico de seu sangue excede 0,6 gramas de álcool por litro de sangue. O gráfico abaixo mostra o processo de absorção e eliminação do álcool quando um indivíduo bebe, em um curto espaço de tempo, de 1 a 4 latas de cerveja. 26 Considere as afirmativas a seguir. I - O álcool é absorvido pelo organismo muito mais lentamente do que é eliminado. II - Uma pessoa que vá dirigir imediatamente após a ingestão da bebida pode consumir, no máximo, duas latas de cerveja. III - Se uma pessoa toma rapidamente quatro latas de cerveja, o álcool contido na bebida só é completamente eliminado após se passarem cerca de 7 horas da ingestão. Está(ão) correta(s) a(s) afirmativa(s) (A) II, apenas (B) I e II, apenas (C) I e III, apenas (D) II e III, apenas (E) I, II e III. 27 CAPÍTULO 4 DISTRIBUIÇÃO DE FREQÜÊNCIA Distribuição de freqüência é uma tabela resumida na qual os dados são organizados em grupos de classe ou categorias convenientemente estabelecidas e numericamente ordenadas. Nas distribuições de freqüência, os dados são agrupados segundo um critério de magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal forma que se possa determinar a percentagem ou número, de cada classe. É um tipo de apresentação que condensa uma coleção de dados conforme as freqüências ou repetições de seus valores. A construção da distribuição de freqüência depende do tipo de dado com os quais se está lidando: contínuos ou discretos. O histograma mostra a Pirâmide etária relativa de homens e mulheres nos anos de 1997 e 2007. 28 1. DISTRIBUIÇÃO SEM INTERVALOS DE CLASSE Distriduições em que não há uma necessidade de ordenar a variável em estudo em intervalos. Digamos que um aluno ao fazer a avaliação institucional do CIESA, tem as seguintes opções péssimo, ruim, bom, muito bom e ótimo. Portanto podemos organizar esse dados em uma distribuição de frequencia sem intervalos de classe, veja o exemplo: Exemplo 1: Na avaliação institucional do CIESA, temos o item “auto-avaliação dos alunos” de uma determinada turma de Logística, vejam a tabela primitiva (dados coletados sem ordenação). Ruim Ruim Bom Muito Bom Bom Bom Bom Muito Bom Ótimo Ótimo Bom Ruim Muito Bom Muito Bom Bom Péssimo Muito Bom Ótimo Muito Bom Bom Podemos organizar esses dados (rol): Péssimo Bom Bom Muito Bom Muito Bom Ruim Bom Bom Muito Bom Ótimo Ruim Bom Bom Muito Bom Ótimo Ruim Bom Muito Bom Muito Bom Ótimo Com esses dados podemos construir uma distribuição de freqüência sem intervalos de classe: Conceito Número de alunos Péssimo 1 Ruim 3 Bom 7 Muito Bom 6 Ótimo 3 20 Exemplo 2: Número de Partos Produzidos em uma maternidade, contagem diária durante um mês: 0; 1; 0; 2; 1; 4; 4; 1; 2; 1; 3; 2 ; 4; 4; 1; 4; 1; 2; 4; 2; 4; 4; 3; 2; 2; 4; 2; 3; 4; ; ROL (ordenando os fenômenos) 0; 0; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4. Número de partos Dias 0 2 1 6 2 8 3 4 4 10 Total 30 29 2. DISTRIBUIÇÃO DE FREQUENCIA COM INTERVALOS DE CLASSE Distribuições em que ordenamos a variável em estudo em intervalos. 2.1 TABELA PRIMITIVA E ROL Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores: TABELA 1 ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm ) 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. A tabela obtida após a ordenação dos dados recebe o nome de rol. TABELA 2 ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm) 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); 2.2 DISTRIBUIÇÃO DE FREQÜÊNCIA Denominamos freqüência o número de vezes que o elemento fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência. TABELA 3 Estat. Freq. Estat. Freq. Estat. Freq. 150 1 158 2 167 1 151 1 160 5 168 2 152 1 161 4 169 1 153 1 162 2 170 1 154 1 163 2 172 1 155 4 164 3 173 1 156 3 165 1 157 1 166 1 Total 40 O processo da tabela de freqüência dado é ainda inconveniente, já que exige muito espaço. A solução é o agrupamento dos valores em vários intervalos, denominado: Distribuição de freqüência com intervalos de classe: TABELA 4 ESTATURA DE 40 ALUNOS DO COLÉGIO A 30 Estaturas (cm) Freqüências 150 ├─ 154 4 154 ├─ 158 9 158 ├─ 162 11 162 ├─ 166 8 166 ├─ 170 5 170 ├─ 174 3 Total 40 Assim, se um dos intervalos for, por exemplo, 154 ├─ 158 (é um intervalo fechado à esquerda e aberto à direita, diremos que nove alunos têm estaturas entre 154, inclusive, e 158 cm, exclusive. Deste modo, estaremos agrupando os valores de variável em intervalos, sendo que, em Estatística, preferimos chamar os intervalos de classes. Atenção: o sinal ├─ significa que o número onde que está fechado é incluído na contagem, e o aberto é excluído. Ex. No intervalo de 150 cm (incluindo) a 154 cm ( excluindo este valor ) na Tabela 2 existem 4 alunos. Representamos assim 150 ├─ 154. 2.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA COM CLASSE Vantagens – Ganhamos em simplicidade e visualização. Desvantagens – Perdemos em pormenores (detalhes) – Os valores não aparecem individualmente. 2.3.1 CLASSE Classe de freqüência ou, simplesmente, classes são intervalos de variação de variável. Representadas simbolicamente por i, sendo i = 1,2,3,...,k (onde k é o número total de classes da distribuição). Classe: Agrupamento dos valores da variável em intervalos. Intervalos de variações da variável. i = índice n.º de classes k = n.º total de classes da distribuição. 2.3.2 LIMITES DE CLASSE Determinamos limites de classe os extremos de cada classe. Li = limite inferior Ls = limite superior 31 Amplitude: Medida do intervalo observado da variável, da classe ou da amostra. 2.3.3 AMPLITUDE TOTAL DA AMOSTRA ( AT ) É a diferença entre o valor máximo e o valor mínimo da amostra: AT= Xmáx – Xmin Xmáx = valor máximo da amostra Xmin = valor mínimo da amostra Ex. Na tabela 2 a amplitude de variação amostral é de 173 – 150 = 23 cm. 2.3.4 AMPLITUDE DE UM INTERVALO DE CLASSE É a medida do intervalo que define a classe hi = Ls – Li 2.3.5 AMPLITUDE TOTAL DA DISTRIBUIÇÃO DE CLASSE (AT) É a diferença entre o limite superior da última classe (máximo) e o limite inferior da primeira classe (mínimo). AT = L(máx) – L(min) L (máx ) = Limite superior da última classe L (mín) = Limite inferior da primeira classe 2.3.6 PONTO MÉDIO DE UMA CLASSE Ponto que divide o intervalo de classe ao meio, ou seja, é o ponto que divide o intervalo de classe de classe em duas partes iguais. xi = 2 Ls + Li 2.3.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA É o número de observações correspondentes a essa classe ou a esse valor. Soma de todas as freqüências. ¿ fi = n 32 Podemos, agora, dar a distribuição de freqüência das estaturas dos quarentas alunos do Colégio A a seguinte representação tabular técnica: TABELA 4.1 ESTATURA DE 40 ALUNOS DO COLÉGIO A i Estaturas (cm) fi hi xi 1 150 ├─ 154 4 4 152 2 154 ├─ 158 9 4 156 3 158 ├─ 162 11 4 160 4 162 ├─ 166 8 4 164 5 166 ├─ 170 5 4 168 6 170 ├─ 174 3 4 172 40 L(máx ) 174 ℓ2 = 154 ℓ (mín) 150 - L5 = 170 AT 24 3 TIPOS DE FREQÜÊNCIAS PARA DISTRIBUIÇÃO COM CLASSES Freqüência simples ou absoluta (fi) são os valores que realmente representam o número de dados de cada classe. Freqüência relativa (fr) são os valores das razões entre as freqüências simples de cada classe e o somatório das freqüências, freqüência total. fr = ¿ i i f f . 100 Freqüência acumulada (fac) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: fac = f1 + f2 + … + fk Freqüência acumulada relativa (frac) de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição. frac = ¿ i f f ac . 100 Considerando a Tabela 4, podemos montar a seguinte tabela com as freqüências estudadas: TABELA 4.2 i Estaturas (cm) fi xi fr fac frac 1 150 ├─ 154 4 152 0,100 4 0,100 2 154 ├─ 158 9 156 0,225 13 0,325 3 158 ├─ 162 11 160 0,275 24 0,600 4 162 ├─ 166 8 164 0,200 32 0,800 5 166 ├─ 170 5 168 0,125 37 0,925 6 170 ├─ 174 3 172 0,075 40 1,000 40 1,000 33 ROTEIRO PARA ELABORAÇÃO DA TABELA DE FREQUÊNCIA COM CLASSE 1) Transformar os dados Brutos em rol; 2) Encontrar a Amplitude Amostral, AA; 3) Definir o nº de classes, para isso podemos usar as seguintes metodologia: a) O número de classe é determinado pela raiz quadrada do número de observações*: k = n b) A regra de Sturges descrita da seguinte forma, k = 1 + 3,3(log n); 4) Determinar a amplitude do intervalo de classes, h= k AT ; 5) Determinar os limites das classes; 6) Construir a tabela de freqüência conforme as classes. 7) BOM SENSO. *Neste curso usaremos somente a metodologia (1), para definir o número de classes. EXERCÍCIO 1. Calcule as classes e Preencha a distribuição de freqüência: Foi contado o nº de alunos por sala de aula para dimensionarmos a Escola, 38 49 26 7 41 52 47 46 46 9 22 8 22 24 16 25 16 41 20 12 51 12 19 30 23 20 27 48 31 26 52 41 52 22 49 21 33 51 16 29 i Nº de alunos N o de salas ( fi ) xi fr fac frac 1 ├─ 14 2 ├─ 22 3 ├─ 30 4 ├─ 38 5 ├─ 46 6 ├─ 54 Responda: a. Qual amplitude da distribuição (AT)? b. Qual o limite inferior da 5ª classe? c. Qual o limite superior da 2ª classe? d. Qual a amplitude do 6º intervalo de classe (hi )? e. Efi = ? f. Quantas salas existem com 30 alunos inclusive e 38 exclusive? g. Quantas salas existem com 22 alunos inclusive e 46 exclusive? h. Quanto por cento de salas tem entre 30 alunos inclusive e 46 exclusive? 34 4 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO HISTOGRAMA É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. À distribuição da tabela 4 corresponde ao seguinte histograma. POLÍGONO DE FREQÜÊNCIA É um gráfico em linha, sendo as freqüências (fi) marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios (xi) dos intervalos de classe. À distribuição da tabela 4 corresponde ao seguinte polígono de freqüência. POLÍGONO DE FREQÜÊNCIA ACUMULADA É traçado marcando-se as freqüências acumuladas (fac) sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores (Li) dos intervalos de classe. Portanto, à distribuição da tabela 4 corresponde ao seguinte polígono de freqüência acumulada. 35 EXERCÍCIO 1. O controle de qualidade de uma indústria selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas, obtendo os seguintes dados: 2 -0 -0 -4 -3 -0 -0 -1 -0 -0 -1 -1 -2 -1 -1 -1 -1 -1 -1 -0 -0 -0 -3 -0 -0 -0 -2 -0 -0 -1 -1 -2 -0 -2 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -1 -0 Determinar: a) o rol; b) a tabela de distribuição de freqüência sem intervalos; c) qual a porcentagem de caixas que apresentam 2 ou mais peças defeituosas? 2. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obt eve os seguintes dados: 10 -15 -25 -21 -6 -23 -15 -21 -26 -32 -9 -14 -19 -20 -32 -18 -16 -26 -24 -20 -7 -18 -17 -28 -35 -22 -19 -39 -18 -21 -15 -18 -22 -20 -25 -28 -30 1-6 -12 -20 a) Monte a tabela de distribuição de freqüência com intervalos. b) Faça uma análise dos resultados. 3. A amostra abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firmacomercial: 14 -12 -11 -13 -14 -13 -12 -14 -13 -14 -11 -12 -12 -14 -10 -13 -15 -11 -15 -13 -16 -17 -14 -14 Forme uma distribuição de freqüências sem intervalos. 4. Considere os salários quinzenais de 100 funcionários da Empresa Yasmim Ltda (em US$): 151 -152 -154 -155 -158 -159 -159 -160 -161 -161 -161 -162 -163 -163 -163 -164 -165 -165 -165 -166 -166 - 166 -166 -167 -167 -167 -167 -167 -168 -168 -168 -168 -168 -168 -168 -168 -168 -168 -169 -169 -169 -169 - 169 -169 -169 -170 -170 -170 -170 -170 -170 -170 -171 -171 -171 -171 -172 -172 -172 -173 -173 -173 -174 - 174 -174 -175 -175 -175 -175 -176 -176 -176 --176 -177 -177 -177 -177 -178 -178 -178 -179 -179 -180 -180 - 180 -180 -181 -181 -181 -182 -182 -182 -183 -184 -185 -186 --187 -188 -190 -190 Pede-se determinar: a) A amplitude amostral; b) O número de classes; c) A amplitude das classes; d) Construir a tabela de distribuição de freqüências com as classes; e) Qual a porcentagem de funcionários que ganham salários com valor igual ou superior a US$179; f) Qual a porcentagem de funconários que ganham salários com valores inferiores a US$163; g) O histograma; h) O polígono de freqüência; i) Qual o ponto médio da 3ª classe. 5. O conjunto de dados amostrais a seguir fornece uma lista do número de minutos que 50 assinantes da internet gastaram durante sua conexão mais recente. 50 29 72 7 36 30 19 67 46 42 41 41 59 17 44 30 56 37 31 39 18 56 11 77 69 21 54 33 54 44 40 34 56 22 39 80 23 39 31 88 78 17 73 7 28 62 29 51 53 20 Determine: (a) Construa uma distribuição de freqüência que tenha sete classes; (b) Faça o histograma. 36 6. Os salários semanais de 50 funcionários de um hospital, em reais, foram os seguintes: 100 122 130 140 152 160 164 176 180 188 192 200 216 104 126 134 146 156 160 170 176 184 190 194 200 218 116 128 138 150 156 162 170 178 186 190 196 200 120 128 140 150 156 162 176 180 186 192 196 210 a) Construa uma distribuição de freqüências, com h = 20 e limite inferior para a primeira classe igual a 100. b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$ 160,00 (exclusive)? c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00 (inclusive) e R$ 200,00 (exclusive)? d) Faça o histograma, o polígono de freqüência e o polígono de freqüência acumulada. 7. Um administrador fez uma pesquisa de satisfação em sua empresa de um determinado item e obteve os seguintes resultados: Ruim Péssimo Bom Muito Bom Bom Bom Bom Muito Bom Ruim Ruim Bom Ruim Muito Bom Muito Bom Bom Péssimo Muito Bom Ótimo Muito Bom Bom Determine, (a) Uma distribuição de freqüência; (b) O histograma. 8. Um diâmetro foi medido 30 vezes, tendo sido obtidos os seguintes resultados (em milímetros): Construa uma tabela sem intervalo de classe e determine: a) ¿ i f ; b) as freqüências relativas (em percentuais); c) as freqüências acumuladas; d) as freqüências acumuladas (relativas em percentuais). 9. Dada as notas dos alunos da disciplina de Estatística em uma turma no CIESA: 7 7 8 8 8 7 7 8 8 9 7 7 8 8 9 7 7 8 8 9 Construa uma tabela e determine: a) ¿ i f ; b) as freqüências relativas (em percentuais); c) as freqüências acumuladas; d) as freqüências acumuladas relativas (em percentuais). 37 QUESTÕES OBJETIVAS DOS CAPÍTULOS: 2, 3, 4 8. (SMV) Da população, aparelhos produzidos em uma linha de montagem, estuda-se a variável, número de defeitos por unidade. A variáveis é: a) Qualitativas ordinal; b) Qualitativas nominal; c) Quantitativas discretas; d) Quantitativas contínuas. e) N.D.A. 9. (SMV) Para a realização de uma auditoria em uma firma, 16 contas, dentre as 120 por elas mantidas, foram aleatoriamente selecionadas para verificação da presença de erro ou não. I. A população consiste de todas as contas mantidas pela firma. II. A variável observada é do tipo qualitativa ordinal. III. A amostra consiste das 16 contas selecionadas Pode-se afirmar que: a) Apenas I é correta. b) Apenas II é correta. c) Apenas III é correta. d) Apenas I e III são correta. e) I, II e III são corretas. 10. (SMV) O tipo de gráfico que procura demonstrar em figuras é: a) Gráfico de setores b) Ogiva de Galton c)Gráfico Pictórico d)Cartograma e) Gráfico Polar 11. (SMV) Os intervalos de classe podem ser apresentados de várias maneiras, dentre as situações abaixo, a correta é : a) 5 – 10 compreende todos os valores entre 5 e 10, inclusive os extremos; b) 5 – 10 compreende todos os valores entre 5 e 10, exclusive os extremos; c) 5 |–| 10 compreende todos os valores entre 5 e 10, exclusive os extremos; d) 5 |– 10 compreende todos os valores entre 5 e 10, exclusive o 5 e inclusive o 10; e) 5 –| 10 compreende todos os valores entre 5 e 10, inclusive o 5 e exclusive o 10; 12. (J.A.) Marque a afirmativa correta 1-…(Três pontos),quando não se dispuser dos dados. 2-…(Três pontos),é quando se dispõe do dado. 3- – – (Traço) Quando o dado for nulo. 4- – – (Traço) Quando o dado existe. Resposta: a)Estão certas 1 e 3 b)Estão certas 1 e 4 c)Estão certas 2 e 3 d)Estão certas 2 e 4 e) N.D.A. 38 13. (SMV) Os dados abaixo, mostram a distribuição de freqüência d levantamento de dados sobre o salário de 50 funcionários de uma determinada empresa. Quant. de salários mínimos Quant. de funcionários 2 |– 4 14 4 |– 6 16 6 |– 8 10 8 |– 10 07 10|– 12 03 50 É correto afirmar que; a) 60% dos funcionários recebem menos do que 6 salários mínimos; b) 20% dos funcionários recebem acima de 6 salários mínimos; c) 5% dos funcionários recebem menos do que 3 salários mínimos; d) 80% dos funcionários recebem de 6 a 8 salários mínimos. e) N.D.A. 14. (SMV) ENADE Das regiões estudadas, aquela que apresenta o maior percentual de jovens com carteira assinada, dentre os jovens que são assalariados do setor privado, é: a) Belo Horizonte b) Recife c) Distrito Federal d) São Paulo e) Salvador 39 CAPÍTULO 5 MEDIDAS DE POSIÇÃO 1. MÉDIA ARITMÉTICA - x É o quociente da divisão da soma dos valores da variável pelo número deles: n x x i ¿ = Sendo xi os valores da variável e n o número de valores. DADOS NÃO-AGRUPADOS Determinamos a média aritmética simples. Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante a semana, foi de 10, 14, 13, 15, 16, 18, e 12 litros, temos, para produção média da semana: x = 7 12 18 16 15 13 14 10 + + + + + + = 7 98 = 14. Logo: x = 14 litros DESVIO EM RELAÇÃO À MÉDIA A diferença entre cada elemento de um conjunto de valores e a média aritmética. di = xi – x Exemplo: d1 = 10 – 14 = – 4 d2 = 14 – 14 = 0 d3 = 13 – 14 = – 1 d4 = 15 – 14 = 1 d5 = 16 – 14 = 2 d6 = 18 – 14 = 4 d7 = 12 – 14 = – 2 PROPRIEDADE O somatório dos desvios em relação a média é igual a zero ( ) 0 ¿ = ÷ x x i Do exemplo anterior vamos fazer o somatório: ( ) ¿ ÷ x x i = –4 + 0 –1 +1 +2 +4 –2 = 0 40 DADOS AGRUPADOS Sem intervalos de classe Consideramos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Neste caso, como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada. ¿ ¿ = i i f f x i x xi fi xi fi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 34 78 x = = 34 78 2,3 x = 2,3 meninos Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio de fórmula: ¿ ¿ = i i f f x x i onde xi é o ponto médio da classe. i ESTATURAS (cm) fi xi xifi 1 150 ├── 154 4 152 608 2 154 ├── 158 9 156 1.404 3 158 ├── 162 11 160 1.760 4 162 ├── 166 8 164 1.312 5 166 ├── 170 5 168 840 6 170 ├── 174 3 172 516 40 6.440 x = = 40 6440 161 x = 161 cm 41 2. A MODA (Mo) O valor que ocorre com maior freqüência em uma série de valores. DADOS NÃO-AGRUPADOS Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete A série de dados : 7, 8, 9, 10, 10, 10, 11, 12, 13, 15, tem moda igual a 10. Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 12, 13, que não apresenta moda (amodal). Em outros casos, ao contrario, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 5, 7, 7, 7, 8, 9, temos duas modas: 4 e 7 (bimodal). DADOS AGRUPADOS Sem intervalos de classe Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Filhos do sexo masculino (xi) Número de famílias (fi) 0 2 1 6 2 10 3 12 4 4 E fi = 34 A freqüência máxima (12) corresponde o valor da variável 3. Logo, o número de filhos modal é 3, Mo = 3. Com intervalos de classe É o valor dominante que está compreendido entre os limites da classe modal Método para o cálculo da moda é dado pela fórmula de Czuber: h . Li Mo 2 1 1 A + A A + = No qual: Li é o limite inferior da classe modal h é o intervalo de classe modal 1 A = f - fant 2 A = f - fpost Sendo: f a freqüência simples da classe modal fant a freqüência simples da classe anterior à classe modal fant a freqüência simples da classe anterior à classe modal 42 Exemplo: Calcular a moda usando a fórmula de Czuber. i ESTATURAS (cm) fi 1 150 ├── 154 4 2 154 ├── 158 9 3 158 ├── 162 11 4 162 ├── 166 8 5 166 ├── 170 5 6 170 ├── 174 3 E = 40 Para esta distribuição, temos que a 3ª classe é a classe modal, logo Li = 158 cm h = 4 cm f = 11 1 A = f - fant = 11 − 9 = 2 2 A = f - fpost = 11 − 8 = 3 Encontrando a moda: Mo = 4 3 2 2 158 × + + = 158 + 1,6 = 159,6 cm 3 A MEDIANA É outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. 3.1 DADOS NÃO-AGRUPADOS Série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, o primeiro passo a ser dado é o de ordenação dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18. Em seguida, tomamos aquele número central que apresenta o mesmo número à direita e à esquerda. Temos, então: Md = 10. Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. Assim, a série de valores ordenados: 2, 6, 7, 10, 12, 13, 18, 21, tem para mediana a média aritmética entre 10 e 12. Logo: Md = 2 12 10 + = 2 22 = 11 3.2 DADOS AGRUPADOS 3.2.1 Sem intervalos de classe É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. É dada por 2 n 43 Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Filhos do sexo masculino (xi) Número de famílias (fi) fac 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 34 Sendo: 34/ 2 = 17 A menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor de 2 da variável, sendo este o valor mediano. Logo, Md = 2 meninos. Exemplo: A distribuição mostra a nota de uma disciplina de uma turma Nota (xi) Número de alunos (fi) fac 5 3 3 6 5 8 7 4 12 8 3 15 9 1 16 16 Sendo, 2 16 = 8 = fac2 , a mediana é Md = 2 7 6 + = 6,5. A nota mediana desta turma é 6,5. 3.2.2 Com intervalos de classe Neste caso o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. i ESTATURAS (cm) fi fac 1 150 ├── 154 4 4 2 154 ├── 158 9 13 3 158 ├── 162 11 24 4 162 ├── 166 8 32 5 166 ├── 170 5 37 6 170 ├── 174 3 40 40 Temos : 2 n = 2 40 = 20 Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20.º lugar, a partir do início da série, vemos que este deve estar localizado na terceira classe (i = 3). Como há 11 elementos nessa classe e o intervalo de classe é igual a 4 (162 – 158), devemos tomar, a partir do limite inferior, a distância. Sendo: 44 Md = Li + md f h . 2 | . | \ | ÷ ant f n No qual: Li é o limite inferior da classe mediana; fant é a freqüência acumulada da classe anterior à classe mediana; fmd é a freqüência simples da classe mediana; h é a amplitude do intervalo da classe mediana; Temos: Md = 158 + 4 11 3 1 20 × ÷ = 158 + 2,54 = 160,54 Isto é: Md = 160,5 cm Exercícios 1) Encontre a média dos seguintes conjuntos de observações. a) X = {2, 3, 7, 8, 9}. R: 5,8 b) Y = {10, 15, 22, 18, 25, 16}. R: 17,67 c) Z = {1, 3, 6, 8}. R: 4,5 d) T = {1, 3, 6, 100}. R: 27,5 2) Encontre a média das notas na disciplina de Estatística Aplicada. Notas na disciplina de Estatística Aplicada Notas fi 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 3) Dados os conjuntos abaixo, calcule a média aritmética, mediana e moda. A = {3, 5, 2, 1, 4, 7, 9}. B = {6, 12, 15, 7, 6, 10}. C = {10, 5, 11, 8, 15, 4, 16, 5, 20, 6, 13}. D = {4, 4, 10, 5, 8, 5, 10, 8}. 4) Calcule a média aritmética, a mediana e a moda da distribuição: xi fi 2 4 5 7 10 3 5 8 6 2 Σfi = 24 45 5) Encontre a moda e a mediana das notas na disciplina de Estatística Aplicada. . Notas na disciplina de Estatística Aplicada Notas fi 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 FONTE: Dados hipotéticos. 6) O salário de 40 funcionários de um escritório está distribuído segundo o quadro. Calcule a média aritmética, a mediana e a moda. Salários (R$) fi 400 ⌐ 500 500 ⌐ 600 600 ⌐ 700 700 ⌐ 800 800 ⌐ 900 900 ⌐ 1000 12 15 8 3 1 1 Σ = 40 7) Um diâmetro foi medido 30 vezes, tendo sido obtidos os seguintes resultados (em milímetros): Construa uma tabela sem intervalo de classe e determine a média aritmética, a moda e a mediana (Nota. A tabela já foi montada no capítulo anterior): 8) Uma pesquisa sobre os gastos semanais com refeições realizados pelos funcionários de determinada empresa está consolidada na tabela de distribuição abaixo: Gastos semanais (R$) fi 10,00 a 19,99 6 20,00 a 29,99 8 30,00 a 39,99 12 40,00 a 49,99 9 50,00 a 59,99 5 60,00 a 69,99 3 Determine: a) a média aritmética; b) a moda; c) a mediana. 46 4 Medidas de Separatrizes São números que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade de elementos da série. Desta forma, a mediana que divide a seqüência ordenada em dois grupos, cada um deles contendo 50% dos valores da seqüência, é também uma medida de separatriz. Além da mediana, as outras medidas de separatrizes que destacaremos são: quartis, decis e percentis. Quartis Se dividirmos a série ordenada em quatro partes, cada uma ficará com seus 25% de seus elementos. Os elementos que separam estes grupos são chamados de quartis. - O primeiro quartil, que indicaremos por Q1, separa a seqüência ordenada deixando 25% de seus valores à esquerda e 75% de seus valores à direita. - O segundo quartil, que indicaremos por Q2, separa a seqüência ordenada deixando 50% de seus valores à esquerda e 50% de seus valores à direita. Portanto, o Q2 é a Mediana da série. - O terceiro quartil, que indicaremos por Q3, separa a seqüência ordenada deixando 75% de seus valores à esquerda e 25% de seus valores à direita. Decis Se dividirmos a série ordenada em dez partes, cada uma ficará com seus 10% de seus elementos. Os elementos que separam estes grupos são chamados de decis. - O primeiro decil, que indicaremos por D1, separa a seqüência ordenada deixando 10% de seus valores à esquerda e 90% de seus valores à direita. - De modo análogo são definidos os outros decis. Percentis Se dividirmos a série ordenada em cem partes, cada uma ficará com 1% de seus elementos. Os elementos que separam estes grupos são chamados de centis ou percentis. - O primeiro percentil, que indicaremos por P1, separa a seqüência ordenada deixando 1% de seus valores à esquerda e 99% de seus valores à direita. - De modo análogo são definidos os outros percentis. Observamos que os quartis e decis são múltiplos dos percentis, então basta estabelecer uma relação entre eles, ou seja, todas as medidas podem ser identificadas como percentis: 47 Q1 = P25 Q2 = P50 Q3 = P75 D1 = P10 D2 = P20 D3 = P30 D4 = P40 D5 = P50 D6 = P60 D7 = P70 D8 = P80 D9 = P90 4.1. Dados agrupados com intervalos de classe Para obtermos a fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula de mediana: Pi = . L + h f f 100 . ant ÷ n i Sendo: Pi – Percentil i (1, 2, 3, ..., 99); L - limite inferior da classe que contém o percentil; n – número de elementos da série ( Σfi); fant – freqüência acumulada da classe anterior à classe que contém o percentil; f - freqüência simples da classe que contém o percentil; h - amplitude do intervalo da classe. Exemplo: Calcule os quartis da tabela abaixo: i ESTATURAS (cm) fi Fi 1 150 ├── 154 4 4 2 154 ├── 158 9 13 3 158 ├── 162 11 24 4 162 ├── 166 8 32 5 166 ├── 170 5 37 6 170 ├── 174 3 40 E = 40 . O quartil 2 = Md , que calculamos anteriormente: Primeiro Quartil ÷ Q1 = P25 Temos, 100 n . 25 = 100 40 . 25 =10 Q1 = P25 = . ℓ * + * h * f F(ant) 100 . 25 ÷ n =. 154 + ( ) 9 4 4 10 × ÷ = 156,7 cm Terceiro Quartil ÷ Q3 = P75 Temos, 100 n . 75 = 100 40 75× =30 Q3 = P25 = . ℓ * + * h * f F(ant) 100 75 ÷ n = 162 + ( ) 8 4 24 30 × ÷ = 165 cm ÷ Q 1 ÷ Q 3 48 Exercício 9) O salário de 40 funcionários de um escritório está distribuído segundo o quadro. Calcule a Q1, Q2 e Q3. Salários (R$) fi 400 ⌐ 500 500 ⌐ 600 600 ⌐ 700 700 ⌐ 800 800 ⌐ 900 900 ⌐ 1000 12 15 8 3 1 1 Σ = 40 10) Utilizando-se do enunciado abaixo, determine os valores do Primeiro Quartil, Terceiro Quartil, Primeiro Decil e Nono Decil: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70 – 90 5 90 – 110 15 110 – 130 40 130 – 150 70 150 – 170 85 170 – 190 95 190 – 210 100 49 CAPÍTULO 6 MEDIDAS DE DISPERSÃO 1. Dispersão ou Variabilidade Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. Exemplo 1: Consideremos os seguintes conjuntos de valores das variáveis x, y e z: X: 70, 70, 70, 70, 70. Y: 68, 69, 70, 71, 72. Z: 5, 15, 50, 120, 160. Calculando a média aritmética de cada um desses conjuntos, obtemos: n x x i ¿ = ¬ x = 5 350 = 70 n y y i ¿ = ¬ y = 5 350 = 70 n z z i ¿ = ¬ z = 5 350 = 70 Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Podemos dizer então que o conjunto X apresenta dispersão ou variabilidade menor que o conjunto Z. Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade. 2. Amplitude Total É a diferença entre o maior e o menor dos valores da série. A utilização da amplitude total como medida de dispersão é muito limitada, pois sendo uma medida que depende apenas dos valores externos, é instável, não sendo afetada pela dispersão dos valores internos. 2.1 Dados não-agrupados A amplitude total é a diferença entre o maior e o menor valor observado: AT = x(max.) – x(mín) Exemplo 2: Para os valores: 40, 45, 48, 52, 54, 62 e 70. Temos, AT = 70 – 40 = 30 AT = 30 50 Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total, maior é a dispersão ou variabilidade dos valores da variável. Relativamente aos três conjuntos de valores mencionados no início: ATx = 70 – 70 = 0 (dispersão nula) ATy = 72 – 68 = 4 ATz = 160 – 5 = 155 2.2 Dados agrupados 2.2.1. Sem intervalos de classe AT = x(max.) – x(mín.) Exemplo 3: Considerando a tabela abaixo: xi 0 1 2 3 4 fi 2 6 12 7 3 Temos: AT = 4 – 0 = 4 AT = 4 2.2.2. Com intervalos de classe Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe: AT = L(max.) – ℓ(mín.) Exemplo 4: Considerando a distribuição abaixo: i ESTATURAS (cm) fi 1 150 ├── 154 4 2 154 ├── 158 9 3 158 ├── 162 11 4 162 ├── 166 8 5 166 ├── 170 5 6 170 ├── 174 3 Efi =40 Temos: AT = 174 – 150 = 24 Logo: AT = 24 cm A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade. 51 3. Variância e Desvio Padrão 3.1 Introdução Como já vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso. A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados. Variância (s 2 ) A variância leva em consideração os valores extremos e os valores intermediários, isto é, expressa melhor os resultados obtidos. A variância relaciona os desvios em torno da média, ou, mais especificamente, é a média aritmética dos quadrados dos desvios*. ( ) n x x i ¿ ÷ = 2 2 o (da população)** Quando temos dados descritos de uma da amostra e não da população, o denomi nador da expressão deverá ser igual a (n – 1), em vez de n. A razão desse procedimento reside no fato de que, utilizando-se o divisor (n – 1), obtém-se uma estatística melhor do parâmetro de população. ( ) 1 2 2 ÷ ÷ = ¿ n x x s i (amostra) ou ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i 2 i 2 n x x 1 1 s n (forma prática) Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente; por isso, tem pouca utilidade na estatística descritiva, mas é extremamente importante na inferência estatística e em combinações de amostras. Desvio padrão (s) O desvio-padrão é a medida mais usada na comparação de diferenças entre conjuntos de dados, por ter grande precisão. O desvio padrão determina a dispersão dos valores em relação à média e é calculado por meio da raiz quadrada da variância. DESVIO PADRÃO = VARIÂNCIA Para dados amostrais: ( ) 1 2 ÷ ÷ = ¿ n x x s i ou ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i 2 i n x x 1 1 s n (forma prática) Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. * Nota: Lembremos que E di = E(xi – x ) = 0, por esse motivo usamos o quadrado dos desvios para definirmos a variância. * *Nota: Não trabalharemos com dados populacionais neste curso. 52 Propriedades do desvio padrão O desvio padrão goza de algumas propriedades, dentre as quais destacamos: 1ª) Somando-se (ou subtraindo-se) uma constante a de todos os valores de uma variável, o desvio padrão não se altera: yi = xi ± c ¬ sy = sx 2ª) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante: yi = c . xi ¬ sy = c . sx Essas propriedades nos permitem introduzir, no cálculo do desvio padrão, simplificações úteis. 3.2 Dados não-agrupados Exemplo 5: Tomemos, como exemplo, o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi 2 . Assim: xi xi 2 40 45 48 52 54 62 70 1.600 2.025 2.304 2.704 2.916 3.844 4.900 E = 371 E = 20.293 O desvio padrão populacional é, ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i 2 i n x x 1 1 s n = ( ¸ ( ¸ ÷ ÷ 7 371 20293 1 7 1 2 = 10,25 53 3.3 Dados agrupados 3.3.1 Sem intervalos de classe Como, neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando a fórmula: ( ) 1 f x x s i 2 i 2 ÷ ÷ = ¿ n ou ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i i 2 i i 2 n x f x f 1 1 s n ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i i 2 i i n x f x f 1 1 s n (forma prática) Exemplo 6: Consideremos a distribuição da tabela abaixo: xi 0 1 2 3 4 fi 2 6 12 7 3 O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para fixi 2 , lembrando que para obter fixi 2 basta multiplicar cada fixi pelo seu respectivo xi. Assim: xi fi fixi fixi 2 0 1 2 3 4 2 6 12 7 3 0 6 24 21 12 0 6 48 63 48 E = 30 E = 63 E = 165 O desvio padrão é: ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i i 2 i i n x f x f 1 1 s n = ( ¸ ( ¸ ÷ ÷ 2 30 63 165 1 30 1 = 1,13 3.3.2 Com intervalos de classe Exemplo 7: Tomemos como exemplo a amostra da distribuição da estatura de 40 alunos do colégio A, calcular o desvio padrão amostral I Estaturas (cm) fi xi fixi fixi 2 1 150 ├─ 154 4 152 608 92.416 2 154 ├─ 158 9 156 1.404 219.024 3 158 ├─ 162 11 160 1.760 281.600 4 162 ├─ 166 8 164 1.312 215.168 5 166 ├─ 170 5 168 840 141.120 6 170 ├─ 174 3 172 516 88.752 Efi =40 E fixi = 6.440 E fixi 2 = 1.038.080 54 Comecemos por abrir as colunas para xi (ponto médio), para fixi e para fixi 2 . Assim: ( ) ( ( ¸ ( ¸ ÷ ÷ = ¿ ¿ 2 i i 2 i i n x f x f 1 1 s n = ( ¸ ( ¸ ÷ ÷ 2 40 6440 1038080 1 40 1 = 5,64 Portanto, s = 5,64 cm 4 Coeficiente de variação (CV) O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV). 100 x s CV = Exemplo 8: Para uma distribuição em que a média é 161 cm e s = 5,57 cm, temos o seguinte coeficiente de variação: CV = 161 5,57 100 = 3,5% Diz- se que uma distribuição tem: - Baixa dispersão: CV s 15% - Média dispersão: 15% < CV < 30% - Alta dispersão: CV > 30% Exemplo 9: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos, calcular os respectivos coeficientes de variação e compará-los, para saber qual obteve a maior dispersão relativa. x s ESTATURA 175 cm 5,0 cm PESO 68 kg 2,0 kg Exercício 1) Calcule a amplitude total e o desvio padrão dos conjuntos de dados: a. 1, 3, 5, 9 b. 20, 14, 15, 19, 21, 22, 20 c. –10, –6, 2, 3, 7, 9, 10 55 2) O número de carros vendidos por cada um dos vendedores de um negócio de automóveis durante um mês particular, em ordem crescente: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Determinar (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão. 3) A distribuição a seguir mostra como varia a idade de um grupo de jovens que participam de uma colônia de férias. Determine (a) A amplitude total e (b) O desvio padrão. Idade (anos) Número de Jovens 10 2 12 5 13 1 14 5 15 3 16 4 4) Calcule a amplitude e o desvio padrão das distribuições abaixo: a) Em um período de um mês, há o seguinte registro de atendimentos de urgência em um hospital em Manaus. xi 0 1 2 3 4 fi 1 5 10 8 2 b) Em uma amostra contendo crianças e jovens, temos a distribuição em classes: Idade (anos) 2 ├─ 6 ├─ 10 ├─ 14 ├─ 18 ├─ 22 fi 5 12 21 15 7 5) Uma pesquisa sobre os gastos semanais com refeições realizados pelos funcionários de determinada empresa está consolidada na tabela de distribuição abaixo: Gastos semanais (R$) fi 10,00 a 19,99 6 20,00 a 29,99 8 30,00 a 39,99 12 40,00 a 49,99 9 50,00 a 59,99 5 60,00 a 69,99 3 Determine: (a) A média aritmética; (b) A variância; (c) O desvio padrão. 6) Para duas emissões de ações ordinárias da indústria eletrônica, o preço médio diário, no fechamento dos negócios, durante um período de um mês, para as ações A, foi de R$ 150,00 com um desvio padrão de R$ 5,00. Para as ações B, o preço médio foi de R$ 50,00 com um desvio padrão de R$ 3,00. Em relação ao nível do preço, qual dos tipos de ações é mais variável? Exercício Complementar 7) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão, (e) o coeficiente de variação, para este grupo de salários. 8) Considerando que foi extraída uma amostra aleatória simples de 10 alunos de uma grande escola, cuja variável em estudo é a nota obtida em Matemática, obteve-se: 5, 7, 8, 6, 5, 4, 8, 9, 10 e 6. Determine a média da amostra, a variância da amostra e o desvio padrão da amostra. 56 9) Dado os salários dos funcionários de uma determinada empresa. Salários semanais para 100 operários não especializados Salários semanais fi 140 |-- 160 7 160 |-- 180 20 180 |-- 200 33 200 |-- 220 25 220 |-- 240 11 240 |-- 260 4 ∑fi =100 Calcule usando a definição: a. A média aritmética; b. A variância; c. O desvio padrão. 10) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário para realizar a auditoria de 50 balanços contábeis. Calcular (a) a média, (b) o desvio padrão, para o tempo de auditoria necessário para esta amostra de registro. Tempo necessário para a auditoria de balanços contábeis. Tempo de auditoria. (min.) Nº de balanços. (fi) 10 |-- 20 3 20 |-- 30 5 30 |-- 40 10 40 |-- 50 12 50 |-- 60 20 Total 50 11) Considerando que as três distribuições hipotéticas apresentam os valores indicados abaixo: DISTRIBUIÇÃO A B N = 200 N = 50 Efx = 4000 Efx = 500 Efx 2 = 85000 Efx 2 = 5450 a) Determine os indicadores: média aritmética, variância, desvio padrão e coeficiente de variação. b) Baseado nos resultados encontrados mencione a distribuição que apresenta maior homogeneidade e a que apresenta maior heterogeneidade. 12) A distribuição das alturas de um grupo de pessoas apresentou uma altura média de 182 cm e um desvio padrão de 15 cm, enquanto que a distribuição dos pesos, apresentou um peso médio de 78 kg, com um desvio padrão de 8 kg. Qual das duas distribuições apresentou maior dispersão? Por quê? 13) Considere as duas amostras abaixo: Amostra “A”: 23; 32; 18; 14; 37; 11; 16; 5; 27; 34; Amostra “B”: 132; 158; 220; 97; 114; 215; 238; 179; 108; 142; 150. Determine para cada uma destas amostras: a) média aritmética; b) moda, mediana; c) o desvio padrão; d) qual dos processos apresenta maior variabilidade? Por quê? 57 CAPÍTULO 7 MEDIDAS DE ASSIMETRIA E CURTOSE 1. MEDIDAS DE ASSIMETRIA Estas medidas referem-se à forma da curva de uma distribuição de freqüência, mais especificamente do polígono de freqüência ou do histograma. Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria. - Simetria Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e moda. x = Md = Mo - Assimetria Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na cauda esquerda ou na direita da curva de freqüências. Assimetria à direita (ou positiva) Em uma distribuição assimétrica positiva, ou assimetria à direita, tem-se: Mo < Md < x Mo Md x Assimetria à esquerda (ou negativa) Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores inferiores à Moda. x < Md < Mo x Md Mo 58 Observar que a Média “puxa” a cauda da Distribuição para seu lado, em função de ser a média uma medida não resistente, ou seja, ser altamente sensível aos valores extremos da série de dados. Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais utilizadas são: 1.1. COEFICIENTE DE ASSIMETRIA DE PEARSON É uma medida de assimetria que não depende dos valores da variável em estudo, e portanto serve para comparações entre distribuições diferentes. s Md x As ) ( 3 ÷ × = O valor em módulo do Coeficiente de Pearson indica a intensidade da assimetria, e o seu sinal indica a direção da assimetria. 0,15 s |As| s 1 Assimetria Moderada |As| > 1 Assimetria Forte As < 0 Assimetria Negativa As > 0 Assimetria Positiva 2. MEDIDAS DE ACHATAMENTO OU CURTOSE A curtose ou achatamento é mais uma medida com a finalidade de complementar a caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em uma distribuição de freqüências. Para uma distribuição de freqüências, o Coeficiente percentílico de curtose pode ser calculado conforme a fórmula abaixo: ) P 2(P Q Q C 10 90 1 3 ÷ ÷ = Denominamos Curtose o grau de achatamento de uma distribuição em relação à Distribuição Normal. A distribuição de referência (Distribuição Normal) é denominada MESOCÚRTICA (Meso = Meio, Central, etc). Quando a distribuição apresenta uma curva de freqüência mais fechada (mais aguda em sua parte superior), ela é denominada LEPTOCÚRTICA (Lepto = Delgado, Alongado, Magro, etc). Quando a distribuição apresenta uma curva de freqüência mais aberta (mais achatada em sua parte superior), ela é denominada PLATICÚRTICA (Plato = Chato, Plano, Largo, etc). Uma distribuição é classificada quanto ao grau de achatamento como: - Leptocúrtica: quando a distribuição apresenta uma curva de freqüência bastante fechada, com os dados fortemente concentrados em torno de seu centro, C < 0,263. - Mesocúrtica: quando os dados estão razoavelmente concentrados em torno de seu centro, C = 0,263. - Platicúrtica: quando a distribuição apresenta uma curva de freqüência mais aberta, com os dados fracamente concen em torno de seu centro, C > 0,263. 59 Exercício 1. Uma distribuição de freqüência apresenta as seguintes medidas: x = 48,1, Md = 47,9 e s = 2,12. Calcule o coeficiente de assimetria. 2. Calcule o coeficiente de assimetria de cada distribuição. Distribuição A Peso (kg) Fi 2 ├─ 6 6 6 ├─ 10 12 10 ├─ 14 24 14 ├─ 18 12 18 ├─ 22 6 60 x = ...... Md = ....... Mo = ....... s = ....... As = ....... Distribuição B Peso (kg) fi 2 ├─ 6 6 6 ├─ 10 12 10 ├─ 14 24 14 ├─ 18 30 18 ├─ 22 6 78 x = ...... Md = ....... Mo = ....... s = ....... As = ....... Distribuição C Peso (kg) fi 2 ├─ 6 6 6 ├─ 10 30 10 ├─ 14 24 14 ├─ 18 12 18 ├─ 22 6 78 x = ...... Md = ....... Mo = ....... s = ....... As = ....... 60 3. Dada a distribuição de peso dos funcionários de uma determinada empresa: PESO (kg) 50|----- 60 60|----- 70 70|----- 80 80|----- 90 90|----100 FUNCIONÁRIOS 5 10 15 8 3 Determine: a) A média aritmética; b) A mediana; c) O coeficiente de assimetria; d) a distribuição é simétrica? Justifique a sua resposta. QUESTÕES OBJETIVAS DOS CAPÍTULOS: 5, 6, 7 4. A média de uma série de valores iguais a uma constante é: a) Zero; b) A unidade; c) Não é possível calcular; d) O valor da constante; e) N.D.A. 5. (FISCAL DE TRIBUTOS DE MG-96) Um candidato obteve, nas diversas provas de um concurso, as seguintes notas com os respectivos pesos: Matéria Nota Peso Português 66 3 Contabilidade 63 3 Estatística X 2 Direito 79 2 A média aritmética ponderada, obtida pelo candidato foi de 69,3. A nota que o candidato obteve em Estatística foi de: a) 66 b) 68 c) 70 d) 72 e) 74 6. Dentre as medidas de posição, aquela que apresenta sempre a mesma quantidade de elementos, à sua esquerda e à sua direita é: a) A moda b) A mediana c) A média aritmética d) A variância e) N.D.A. 7. Numa curva simétrica, podemos afirmar que: a) a média é maior que a moda, que por sua vez é maior que a mediana; b) a média é menor que a moda, que por sua vez é menor que a mediana; c) a média, a moda e a mediana são medidas iguais; d) a média é igual a moda e a mediana é nula; e) N.D.A. 61 8. O desvio padrão de um conjunto de dados é 9. A variância será: a) 3 b) 36 c) 18 d) 81 e) N.D.A. 9. (Controladoria de arrecadação RJ 2004 FJG) Os valores de uma amostra de cinco elementos são: 4, 3, 3, 5, 5. A variância dessa amostra é de: a) 4,00 b) 3,00 c) 2,33 d) 1,00 e) N.D.A. 10. 11. Sabe-se que uma distribuição apresentou as seguintes medidas: Q1 = 24,4cm Q3 = 41,2cm P10=20,2cm P90 = 49.5cm, com tais medidas a curtose é : a) Leptocúrtica b) Platicúrtica c) Mesocúrtica d) Assimétrica. e) N.D.A. 62 CAPÍTULO 8 NÚMEROS ÍNDICES 1 INTRODUÇÃO Segundo Milone (2004): - Em Estatística, como em muitas outras áreas, o número índice é sinônimo de variação na variável de interesse. - Em Economia, há índices de preço, quantidade e valor dos bens, de custos de vida, de desemprego, de bolsas de valores, de concentração dos mercados, de monopólio de empresas, de importação e exportação. - Para o economista, o conhecimento de número índices é indispensável como um instrumento útil ao exercício profissional, quer seus problemas estejam voltados para a micro-economia, quer para a macro-economia. No primeiro caso, podemos citar, por exemplo, a necessidade de se saber até que ponto o preço de determinado produto aumentou com relação aos preços dos demais produtos em um mesmo mercado. Se, por outro lado, o problema for quantificar a inflação, será necessário medir o crescimento dos preços dos vários produtos como um todo, por intermédio do índice geral de preços. - Em Administração, índices de produção, de liquidez (corrente e seco), velocidade de vendas, lucratividade e endividamento possibilitam avaliar a saúde financeira das empresas; em Administração Pública, diversos índices permitem avaliar a qualidade de vida, a permanência ou evasão escolar, o nível de criminalidade e o padrão de saúde das populações. - É grande a importância dos números índices para o administrador, especialmente quando a moeda sofre uma desvalorização constante e quando o processo de desenvolvimento econômico acarret a mudanças contínuas nos hábitos dos consumidores, provocando com isso modificações qualitativas e quantitativas na composição da produção nacional e de cada empresa individualmente. - E há mais, bem mais, em Engenharia, Física, Medicina (índices de fertilidade, natalidade, morbidez, mortalidade, etc.), nas chamadas ciências do comportamento (Psicologia, Sociologia etc.) e em educação (quociente de inteligência, coeficiente de aprovação etc.). 1.1 Índices simples e compostos Quando só um produto está em jogo, o índice é chamado índice simples. Por exemplo, quando uma família nota que o preço do pão é o dobro do que era há 10 anos, está fazendo uso de certo tipo de Numero Índice de um só produto. Enquanto que uma comparação que envolva um grupo de artigos é chamada de índice composto. Por exemplo, além do pão, uma família pode incluir em sua observação itens como leite, manteiga, carne, verduras e enlatados. Alguns desses artigos podem ter tido aumentos substanciais no preço, outros podem ter tido aumentos pequenos, e outros ainda uma redução de preço. A finalidade do índice composto é sintetizar a variação global de preços para estes tipos de produtos. Mas, as compras daquela família podem também ter se modificado ao longo dos anos. Talvez tenha aumentado o consumo de leite e carne. Isto ocorrerá se tiver 63 aumentado o número de pessoas na família. O consumo de manteiga, por outro lado, pode ter diminuído, particularmente por questão de peso. Logo, é preciso incluir não só variações de preço, como também variações de quantidades, a fim de obter um quadro mais preciso da variação global. 2 ÍNDICES SIMPLES Um número índice simples avalia a variação relativa de um único item ou variável econômica entre dois períodos de tempo. As três variáveis em que estudaremos: preço, quantidade e valor, sendo este último o resultado do produto do preço pela quantidade. 2.1 RELATIVOS DE PREÇOS Trata-se do número índice mais simples. Relacionando-se o preço de um produto numa época chamada época atual ou época dada, com o de uma época chamada básica ou simplesmente base, teremos um relativo de preço. Fazendo-se t p = preço numa época atual e 0 p = preço na época-base, definiremos relativo de preço pela seguinte quantidade: 0, 0 t t p p p = Se quisermos expressar em termos percentuais o relativo de preço, bastará multiplicarmos o quociente citado por 100. 0, 0 100 t t p p p = × Exemplo: O preço de determinado artigo, em 1999, foi R$ 1,20 e em 2000 subiu para R$ 1,38. Tomando-se por base o ano 1999, determinar o preço relativo em 2000. Solução: O ano considerado base corresponderá sempre ao índice igual a 100. Os demais apresentarão, portanto, valores que flutua em torno de 100. Então: - Período base (0) = 1999 - Período atual (t) = 2000 15 , 1 20 , 1 38 , 1 99 00 00 , 99 = = = p p p ou 115% Esse resultado pode ser interpretado da seguinte maneira: que em 2000 houve um aumento de 15% (115-100) no preço do artigo, com relação ao preço do mesmo artigo em 1999. Se tivéssemos 2000 R$1,02 p = e 1999 R$1,20 p = , o relativo de preço seria: 85 , 0 20 , 1 02 , 1 99 00 00 , 99 = = = p p p ou 85% Em 2000, o artigo em questão apresentou um preço de 15% (85-100) inferior ao de 1999. 2.2 RELATIVOS DE QUANTIDADE Assim como podemos comparar os preços de bens, podemos também fazê-lo em relação a quantidades, quer sejam elas produzidas, vendidas ou consumidas. 0, 0 t t q q q = 64 Exemplo: Uma empresa produziu 46 toneladas de aço em 1999 e 69 toneladas em 2000. Qual a quantidade relativa será, tomando-se o ano de 1999 como base? 50 , 1 46 69 99 00 00 , 99 = = = q q q ou 150% No ano de 2000 esta empresa aumentou sua produção em 50% (150−100) em relação a 1999. 2.3 RELATIVOS DE VALOR Se p for o preço de determinado artigo em certa época e q a quantidade produzida ou consumida desse mesmo artigo na mesma época, então, o produto p x q será denominado valor total de produção ou de consumo. 0, 0, 0, 0 0 0 t t t t t t v p q v p q v p q × = = = × × Exemplo: Uma empresa vendeu, em 2000, 1000 unidades de um artigo ao preço unitário de R$ 500,00. Em 2001, vendeu 800 unidades do mesmo artigo ao preço unitário de R$ 600,00. O valor relativo da venda em 2001 foi: 01 01 01 00,01 00 00 00 600 800 0, 96ou 96% 500 1000 v p q v v p q × × = = = = × × Em 2001, o valor das vendas foi 4% (96-100) inferior ao de 2000. 3 PROPRIEDADES DOS NÚMEROS ÍNDICES - Propriedade da identidade: O número índice deve ser igual à unidade quando a época dada (t) coincidir com a época básica (0). Ia,a = 1 Em que I representa um número índice simples qualquer. Assim, caso seja tomado como base de comparação o ano de 2000, tem-se que para o ano 2000, o preço relativo é igual 1 ou 100%. - Propriedade da reversão do tempo: Ao se permutarem dois períodos, os resultados serão o inverso um do outro. a b b a I I . , 1 = - Propriedade cíclica: O valor do índice na última data, com base na primeira, será igual ao produto dos valores da série de índices cujas bases são as datas anteriores. t t t I I I I I , 0 , 1 3 , 2 2 , 1 1 , 0 = × × × × ÷  Exemplo 4: Um artigo foi vendido, em fevereiro, com um acréscimo de 10% em relação a janeiro; em março, com um acréscimo de 5% relativamente a fevereiro; em abril com uma queda de 4% comparativamente a março. Calcular o acréscimo percentual de preço em abril com relação a janeiro. Solução: jan-fev = 10%; fev-mar = 5%; mar-abr = −4% Pjan,fev = 100% +10% = 110% Pfev,mar = 100% +5% = 105% Pmar,abr = 100% − 4% = 96% Pjan,abr = Pjan,fev × Pfev,mar × Pmar,abr = 1,10 × 1,05 × 0,96 = 110,88% 65 Houve um acréscimo de preço de 10,88% no período de janeiro a abril. EXERCÍCIO 1) O preço de um produto, em 2003 (data-base) era R$ 1.200,00. Em 2004 esse mesmo produto foi vendido por R$ 1.100,00. Qual o relativo de preço e qual a variação porcentual de preço? 2) Pedro ganhava por dia, em dezembro de 1997, R$ 9,87, e, em dezembro de 2007, R$ 19,96. Qual o seu índice de salário e qual seu percentual de aumento no período? 3) Em 2002, o preço de um produto era 35% mais baixo que em 2003 e, em 2004, 30% maior que em 2003. Qual o índice de preço de 2002 (base) para 2004? R: 200 4) O salário de um empregado, em janeiro de 2004, era de R$ 2.500,00. Se o índice de preços nesse mesmo mês, em relação a dezembro de 2003 era de 101,13, qual é o salário desse empregado em dezembro de 2003? 4 NÚMEROS ÍNDICES DE LIGAÇÃO 4.1 ELOS DE RELATIVOS (RELATIVOS DE LIGAÇÃO) Vários relativos formam elos quando cada um deles é calculado tomando como base o ano anterior; são os relativos de base móvel. Exemplo: Um bem apresentou no período de 2001 a 2004, respectivamente os preços de R$ 240, R$ 300, R$ 360 e 540. Vamos calcular os elos de relativos. 100 01 02 02 , 01 × = p p p 100 240 300 × = =125% 100 02 03 03 , 02 × = p p p 100 300 360 × = =120% 100 03 04 04 , 03 × = p p p 100 360 540 × = =150% Portanto: Ano Relativos 2001 --- 2002 125 2003 120 2004 150 Fazemos uso dos elos de relativos quando queremos acompanhar os crescimentos (positivos ou negativos) anuais (ou mensais, ou diárias). 66 4.2 RELATIVOS EM CADEIA O relativo em cadeia é o índice de base fixa: todos os relativos são calculados tomando-se uma determinada época como base. Exemplo: Utilizando o exemplo anterior, tomando como base fixa 2001, temos: 100 01 01 01 , 01 × = p p p 100 240 240 × = =100% 100 01 02 02 , 01 × = p p p 100 240 300 × = =125% 100 01 03 03 , 01 × = p p p 100 240 360 × = =150% 100 01 04 04 , 01 × = p p p 100 240 540 × = =225% Portanto: Ano Relativos do Preço 2001 100 2002 125 2003 150 2004 225 Fazemos uso dos relativos em cadeia quando desejamos comparar um determinado ano, considerado significativo, com os anos anteriores e os consecutivos. 4.3 MUDANÇA DE BASE A mudança de uma série de número índices para uma outra base é feita dividindo-se cada índice da série original pelo número índice correspondente à nova base, e exprimindo os resultados em porcentagens. Exemplo: Fazer a mudança de base do exemplo anterior, para 2003. Solução: Dividi-se os valores dos índices do preço da anterior pelo preços relativos a 2003. Ano Preços Relativos 2001 67 2002 83 2003 100 2004 150 Isso sempre pode ser feito, quando não temos os valores e somente os índices. Seria a mesma coisa que calcular os índices do preço com base fixa de 2003 usando a tabela original. 67 EXERCÍCIO 5) São dados os valores das exportações de um país em moeda local. Determine os índices tomando como base o ano de 2006. Ano Exportação em milhões de Dólares 2002 1,234 2003 1,345 2004 1,027 2005 1,825 2006 1,975 2007 1,754 2008 1,938 6) Dada a Tabela: Mês Quantidade Preço Valor Jan. 6,35 1,97 12,51 Fev. 8,63 2,56 22,09 Mar. 7,09 2,13 15,10 Abr. 6,65 1,95 12,97 Maio 7,17 1,83 12,12 Determine: a) Os elos de relativos do preço (ou seja, os relativos de base móvel); b) Os relativos da quantidade com base em Janeiro (ou seja, os relativos de base fixa); c) Os relativos do valor com base em abril (ou seja, os relativos de base fixa). 7) A tabela abaixo apresenta os valores da arrecadação anual da Contribuição Provisória sobre Movimentação Financeira (CPMF), medidos em R$ milhões, entre 1999 e 2003. Ano Valor 1999 7.956 2000 14.546 2001 17.196 2002 20.368 2003 26.207 Fonte: Conjutura Econômica, vol. 58, no 3 mar. 2004. Responder: a. O número-índice com base de comparação fixa em 1999. b. O número-índice com base de comparação fixa em 2003. c. O número-índice com base de comparação móvel no ano imediatamente anterior. 8) A seguir temos os relativos de base lixa da produção de um artigo. Anos 1995 1996 1997 1998 1999 2000 Relativos 90 100 110 125 135 170 Pede-se: a) Determine os correspondentes relativos de base móvel. b) Determine os correspondentes relativos com base em 1995. c) Determine a produção de cada ano, sabendo que ela, no ano base dado, foi de 300 toneladas. 68 9) Dada a tabela: QUANTIDADE DE BENS (1991-94) BENS 1991 1992 1993 1994 Auto-Veículos (mil unid.) 1.128,0 1.165,2 780,9 859,3 Cimento (milhões de t) 24,9 27,2 26,1 25,4 Aço (milhões de t) 13,9 15,2 13,1 12,9 Petróleo bruto (milhões de m³) 9,6 10,6 12,4 15,1 Dados: fictícios a) Calcule os relativos para o bem auto-veículos, tomando 1991 = 100; b) Forme a tabela dos elos de relativo para o cimento; c) Calcule os relativos para o bem aço, tomando 1992 = 100; d) Forme a tabela dos elos de relativo para o petróleo bruto. 10) Os preços e os Consumos, de um certo bem, tiveram o seguinte comportamento através do tempo. ANO 1996 1997 1998 1999 2000 2001 2002 2003 PREÇO 25 40 50 60 75 90 100 115 CONSUMO 20 25 30 15 35 40 50 55 Pede-se: a) Determine os preços relativos com base em 1996 b) Determine as quantidades relativas com base em 1996. c) Determine os valores relativos com base em 1996. d) Determine os preços relativos de base móvel. e) Interprete os valores obtidos para o ano de 1999, nos itens 'a', 'b", "c' e “d”. 69 5 ÍNDICES AGREGATIVOS SIMPLES Os índices agregativos é um índice de fácil aplicação. Nos itens acima, foram demonstrados o preço ou quantidade de um só bem, porém a variação de preços, quando se trata de uma cesta de bens, exige um índice que possa sintetizar a variação dos preços de um conjunto de bens (agregado). Para a apuração dos referidos índices vamos usar o índice agregativo. 5.1 ÍNDICES AGREGATIVO SIMPLES DE PREÇO E QUANTIDADE Uma maneira de determinar o índice agregativo simples é calcular a média aritmética dos relativos, obtendo o índice médio de relativos 1 . Os problemas envolvendo índices de preços e quantidades são mais complexos que a simples comparação dos relativos. Há a necessidade de comparação de várias séries. Para solução destes problemas criou-se um conjunto de índices. Os principais são: Índice agregativo simples: De preços:  i 0 i t p Σp Σp I = De Quantidade:  i 0 i t q Σq Σq I = Onde: i 0 Σp : Soma de todos os preços no ano-base i 0 Σq : Soma de todas as quantidades no ano-base i t Σp : Soma de todos os preços na época atual i t Σq : Soma de todas as quantidades na época atual OBSERVAÇÕES: É um índice de fácil aplicação, porém apresentam algumas limitações: a) Não se leva em consideração a importância relativa dos itens. Assim, por exemplo, no cálculo do índice do custo de alimentação, seria atribuída ao arroz e ao “bacalhau do Noruega” a mesma importância 2 . b) Não há homogeneidade entre as unidades dos diversos bens (O arroz, a carne, o açúcar e outros bens podem ser expressos em quilogramas ou toneladas; O leite, os refrigerantes, em litros; os tecidos, linhas, em metros etc). 1 CRESPO (1998), op. cit. p. 165 2 Vide MARTINS e DONAIRE (1993), op. cit. pp. 219-20 70 5.2 ÍNDICES MÉDIOS DOS RELATIVOS DE PREÇOS E QUANTIDADES Para o cálculo dos índices médios dos relativos, pode-se utilizar as médias aritmética, geométrica ou harmônica. Veremos as médias aritmética e geométrica: Para Média aritmética: De Preços: De quantidades n Σp P i t 0, t 0, = n Σq Q i t 0, t 0, = Para Média Geométrica: De Preços De Quantidades: n [ = i t 0, t 0, p P G n [ = i t 0, t 0, q Q G Onde: i t 0, Σp : relativo de preço na época-base do i-ésimo bem i t 0, Σq : relativo de quantidade na época atual do i- ésimo bem EXERCÍCIOS 11) Calcular os índices agregativos simples pela média aritmética e pela média harmônica para os dados abaixo (ano base 2000): ANO CIMENTO PEDRA AREIA 2000 35 12 40 2001 42 17 45 2002 47 24 53 (média aritmética: 100,0 124,7 155,6) (média harmônica 100,0 123,6 150,0) 12) Calcular os índices agregativos simples pela média aritmética e pela média harmônica para os dados abaixo (ano base 2000): ANO CIMENTO PEDRA AREIA 2000 35 12 40 2001 42 17 45 2002 47 24 53 (média aritmética: 100,0 124,7 155,6) (média harmônica 100,0 123,6 150,0) 71 6 EMPREGO DE ÍNDICES (AGREGATIVOS) PONDERADOS Como vimos, os índices simples apresentam algumas desvantagens, em especial quando se refere à inexistência de pesos diferentes para cada utilidade que os compõe de acordo com sua importância relativa. No caso dos índices ponderados, além da fórmula a ser usada para interpretar as variações de preço e de quantidade dos bens, há o problema do critério para a fixação dos pesos relativos de cada um deles. A ponderação proposta pelos métodos mais usados baseia-se na participação de cada bem no valor transacionado total e, é feita, em geral, segundo dois critérios: peso fixo na época básica ou peso variável na época atual. 6.1.1 Índice de Laspeyres ou método da época básica O Índice de Laspeyres constitui uma média ponderada de relativos, sendo os fatores de ponderação determinados a partir de preços e de quantidades da época básica, por conseguinte, no Índice de Laspeyres, a base de ponderação é a época básica, por isso a denominação método da época básica. a) Índice de Preço de Laspeyres O problema de determinar variações de preço para um grupo de artigos é que, usualmente, além de variações nos preços, há variações nas quantidades compradas. Assim, para focalizarmos só preços, as variações nas quantidades devem ser eliminadas. Em outras palavras, queremos saber até que ponto as variações de valor são devidas à variação de preço, sem precisarmos considerar variações de quantidades. Uma forma de conseguir isto é fazer as quantidades do ano corrente iguais às quantidades do ano base. Dessa forma, a única diferença será nos preços entre os dois anos. ¿ ¿ = 0 0 0 , 0 . . q p q p L t p t Onde: p0  é o preço de um item qualquer no período base pt  é o preço de um item qualquer no período “atual” q0  é a quantidade de um item qualquer no período base qt  é o quantidade de um item qualquer no período “atual” Exemplo: Um comprador noturno que adquire quatro itens: cogumelos (em kg), limões (em unidades), bolos (em unidades) e o jornal. Conforme consta a tabela a seguir: Itens 2000 2004 Preço0 Quantidade0 Preçot Quantidadet Cogumelos 0,80 2 1,20 1,5 Limões 0,10 4 0,08 6 Bolos 1,00 1 2,00 0,5 Jornais 0,10 1 0,25 1 Observe que tanto os preços, como as quantidades se modificaram de 2000 a 2004. Se quisermos saber qual foi a variação global dos preços, poderemos imaginar as quantidades como tendo permanecido inalteradas. Tomando-se o ano de 2000 e utilizando o Índice de Laspeyres de preço, temos: 72 1 10 , 0 1 00 , 1 4 10 , 0 0 , 2 80 , 0 1 25 , 0 1 00 , 2 4 08 , 0 0 , 2 20 , 1 . . 00 00 00 04 04 , 00 × + × + × + × × + × + × + × = = ¿ ¿ q p q p L p Esse índice sugere que, globalmente, os preços subiram 60%. Neste caso, os preços da época básica são considerados os fatores de ponderação. O índice agregativo de quantidade procura responder a seguinte ponderação, que são: se em cada uma de duas épocas forem adquiridas quantidades diferentes de determinadas mercadorias, mas aos mesmos preços (fixos na época básica, no caso do índice de Laspeyres), quanto se gastará na época atual em relação ao que se gastou na época básica? Enquanto no índice de preço a diferença da importância gasta devi a-se à variação nos preços, no de quantidade ela se deve às variações nas quantidades adquiridas, uma vez que os preços permanecem constantes. b) Índice de Quantidade de Laspeyres De modo análogo podemos calcular o índice de quantidade, mantendo constantes os preços e isolando, assim, as variações de quantidades. ¿ ¿ = 0 0 0 , 0 . . p q p q L t q t Exemplo: Utilizando as mesmas informações da tabela do exemplo anterior, o índice de quantidade de Laspeyres para ano o base 2000, e utilizando os preços como pesos do ano base, têm-se: 10 , 0 1 00 , 1 1 10 , 0 4 80 , 0 2 10 , 0 1 00 , 1 5 , 0 10 , 0 6 80 , 0 50 , 1 . . 00 00 00 04 04 , 00 × + × + × + × × + × + × + × = = ¿ ¿ p q p q L q = 77% O índice pode ser interpretado como indicativo de que as quantidades globais dos artigos em estudo, adquiridos por aquele comprador, diminuíram 23% (77-100). 6.1.2 Índice de Paasche ou Método da Época Atual No Índice agregativo proposto por Paasche, a ponderação é feita em função dos preços e quantidades do período atual. Entretanto, uma desvantagem dos pesos do período atual é que eles devem ser revistos cada ano. Outro processo seria utilizar pesos de algum período intermediário entre período base e o atual. a) Índice de Preço de Paasche ¿ ¿ = t t t p t q p q p P . . 0 , 0 Observando a expressão anteriormente citada pode-se ver que os fatores de ponderação são as quantidades da época atual. Como a época atual é variável, os pesos, no índice de Paasche, mudam quando as épocas atuais mudarem, o caracterizando. Como um índice agregativo com ponderações variáveis, o índice de Paasche realça a baixa porque a ponderação é determinada pela época atual. Uma séria limitação ao uso do índice de preço de Paasche reside no fato de os pesos variarem em cada período, o que onera substancialmente a pesquisa, no caso de ser difícil estimar as quantidades na época atual. Esse fato torna proibitivo o emprego do índice de Paasche quando se deseja montar um í ndice ponderado para se fazerem comparações semanais, mensais ou mesmo trimestrais. 73 b) Índice de Quantidade de Paasche O índice de Paasche de quantidade é definido por: ¿ ¿ = t t t q t p q p q P . . 0 , 0 Exemplo: Utilizando os dados do exemplo anterior e usando 2000 como base, obtenha os índices de Paasche de preços e quantidades. ¿ ¿ = 04 00 04 04 , 0 . . p q p q P p t = 1 10 , 0 5 , 0 00 , 1 6 10 , 0 5 , 1 80 , 0 1 25 , 0 5 , 0 00 , 2 6 08 , 0 5 , 1 20 , 1 × + × + × + × × + × + × + × =147,08% Esse índice sugere que, globalmente, os preços subiram 47,08%. Neste caso, os preços da época atual são considerados os fatores de ponderação. O índice agregativo de quantidade procura responder: se em cada uma das duas épocas forem adquiridas quantidades diferentes de determinadas mercadorias, mas aos mesmos preços (fixos na época atual, no caso do índice de Paasche), quanto se gastará na época atual em relação ao que se gastou na época básica? Enquanto no índice de preço a diferença da importância gasta devia-se à variação nos preços, no de quantidade ela se deve às variações nas quantidades adquiridas, uma vez que os preços permanecem constantes. EXERCÍCIOS 13) Calcular os índices de preços e de quantidade pelos métodos de Laspeyres e Paasche para os dados abaixo: (ano-base 2002) ITENS 2002 2003 Preço quantidade preço quantidade X 35 3 39 5 Y 28 5 20 8 Z 12 9 18 10 14) Numa sociedade em que há apenas três bens (denominados A, B e C), temos os preços e as quantidades consumidas em dois anos mostradas na tabela a seguir. Determine a variação de preços no período (a) pelo índice de Laspeyres (b) pelo índice de Paasche. ITENS 1999 2000 Preço Quantidade Preço Quantidade A 1 1000 2 500 B 3 1500 4 1200 C 4 1000 3 1200 74 7 Principais Índices Brasileiros: 7.1 IPC – Índice de Preços ao Consumidor IPC/Fipe (São Paulo): É calculado com base em 4 conglomerados de, aproximadamente, 300 endereços, sistematicamente pesquisados. A ponderação é alterada sempre que ocorram mudanças significativas. São pesquisados mais de 250 produtos, gerando cerca de 50.000 preços a pesquisar. É calculado pela média geométrica dos relativos (Divisia) e divulgado semanalmente. ICV/Dieese (São Paulo): São utilizados aproximadamente 350 produtos, pesquisados em famílias paulistanas com renda mensal entre 1 e 30 s.m. (cesta de bens pesquisada em 1982/83). INPC- Índice Nacional de Preços ao Consumidor: É calculado com base nos preços de 11 regiões metropolitanas (São Paulo, Rio de Janeiro, Porto Alegre, Belo Horizonte, Salvador, Recife, Belém, Fortaleza, Curitiba, Goiânia e Brasília), num total de 116 municípios, em famílias com renda entre 1 e 8 s.m. São utilizados, aproximadamente, 350 produtos e 140.000 preços a pesquisar. São obtidos índices regionais. O índice nacional é obtido por ponderação dos regionais. O índice para produtos sazonais é calculado por Paasche. IPCA – Índice de Preços ao Consumidor Ampliado: Variante do INPC, utiliza renda entre 1 e 40 s.m. 7.2 IPA – Índice de Preços por Atacado: Utiliza, aproximadamente, 430 produtos, totalizando cerca de 10.000 preços atualizados mensalmente. O cálculo do índice é feito por Laspeyres com base móvel. 7.3 INCC – Índice Nacional da Construção Civil: É obtido com base nos preços e quantidades padrões consumidas na construção de casas térreas (em média 82 m²) e edifícios com quatro, oito e doze pavimentos. São considerados 427 itens de materiais de construção, serviços e mão-de-obra. 7.4 IGP – Índice Geral de Preços: Calculado pela FGV - Fundação Getúlio Vargas, utiliza bens e serviços, assim como os respectivos pesos, atualizados sistematicamente, de acordo com o momento econômico. Utiliza a fórmula de Laspeyres de base móvel. É a média ponderada do IPA (0,6), do IPC (0,3) e do INCC (0,1). EXERCÍCIOS COMPLEMENTARES DE NÚMEROS ÍNDICES 15) Considere os relativos de base fixa constantes da tabela seguinte, referentes aos preços da utilidade W, em reais. ano 1994 1995 1996 1997 1998 1999 relativo 100 130 150 180 200 250 Pede-se: a) Determine os correspondentes relativos de base móvel. b) Determine os correspondentes relativos com base em 1996. c) Determine os preços no período 1997/99 sabendo que no ano base dado ele foi de R$400,00. 16) O preço de um produto aumentou de 40% no período 2001/03, enquanto que a quantidade vendida do mesmo nesse período diminuiu em 10%. Pede-se: a) De que percentagem o valor total das vendas deste produto aumentou ou diminuiu nesse período? b) Se o valor total das vendas do produto em 2001 foi de 20 milhões de reais qual foi o valor total das vendas em 2003? 75 17) Os dados seguintes apresentam a estrutura de preços e consumos de uns certos produtos: produto preço 2002 consumo 2002 preço 2003 consumo 2003 A 10 18 20 15 B 12 10 18 12 C 8 15 13 14 D 20 5 25 10 E 35 7 42 13 Considerando 2002 como ano base, calcule e interprete o valor do a) Índice Agregativo Simples de Preços. b) Índice Aritmético Simples de Preços c) Índice de Laspeyres d) Índice de Paasche. e) Índice de Fisher . 18) Considere os dados seguintes referentes aos preços e consumos de alguns produtos Produto Preço 2000 Consumo 2000 Preço 2003 Consumo 2003 Carne (kg) 3,0 40 5,0 35 Laranja (dz) 1,5 60 2,8 90 Leite (l) 0,5 10 1,3 12 Pede-se: a) Usando como base 2000 determine os relativos de preço de cada bem para 2003. b) Usando como base 2000 determine os relativos de quantidade de cada bem para 2003. c) Calcule o índice aritmético simples de preços com base em 2000 e interprete o resultado. d) Calcule o índice de Paasche com base em 2000 e interprete o resultado. e) Qual dos dois índices Aritmético simples ou Paasche seria o mais indicado, se desejássemos estimar um índice de custo de vida com os dados deste problema? 19) A tabela seguinte apresenta os relativos de base móvel referentes as quantidades produzidas de certo bem. Ano 1993 1994 1995 1996 1997 1998 1999 Relativos 110 115 120 110 105 130 120 Pede-se: a) obtenha os correspondentes relativos com base em 1995. b) interprete o relativo de base móvel de 1997. c) interprete o relativo de 1994 calculado no tem "a”. d) sabendo que em 1993 foram produzidas 5 milhões de toneladas do bem em questão determine o número de toneladas produzidas em 1999. 20) De quanto aumentou o consumo de um bem, num período em que seu preço de venda teve um aumento de 80% e seu valor total vendido triplicou? 21) Se no estudo da estrutura de preços e consumos de alguns bens numa certa região constatou-se que no período de 1995 a 2000 o valor do índice de Paasche foi calculado em 157,98% e o de Laspeyres em 154.53%, o que podemos afirmar sobre a variação dos preços desses bens através de critério de Fisher ? 76 CAPÍTULO 9 PROBABILIDADE 1 Histórico Os primeiros estudos matemáticos sobre probabilidades foram feitos pelos italianos Cardano (1501 - 1576) e Galileu Galilei (1564 - 1642) e tratavam dos jogos de dados. Em 1654, o francês Pascal (1612 -1668) foi procurado por Chevalier de Méré amigo seu e jogador profissional, que lhe apresentou questões do tipo: “Em oito lances de um dado, um jogador deve tentar o número 1, mas, depois de três tentativas fracassadas, o jogo é interrompido por seu oponente. Como ele poderia ser indenizado?”. Resolvido os problemas de Méré, Pascal escreveu a seu amigo Fermat (1601 - 1665) expondo-lhe vários problemas. Essa correspondência entre os dois, onde encontram-se inúmeros problemas de probabilidade resolvidos, foi o ponto de partida para a moderna teoria das Probabilidades. As idéias centenárias de Cardano foram esquecidas. Pascal e Fermat nada publicaram a respeito, mas o holandês Huygins (1629 - 1695), tendo conhecimento desses estudos, passou a interessar-se e, em 1657, publicou “Sobre o raciocínio em jogo de dados”, o primeiro livro sobre a Teoria das Probabilidades. Dentre os matemáticos que contribuíram para a evolução dessa teoria destacam-se: o suíço Bernoulli (1654-1705), o francês Moivre (1667 - 1754), o francês Laplace (1749 - 1827) e os Russos Tchebycheff (1821 - 1894) e Markov (1856 - 1922). Atualmente, a Teoria das Probabilidades tem muita importância e várias aplicações em estatística, economia, engenharia, física, química, sociologia, biologia e vários outros campos do conhecimento. 2 Conceitos básicos de probabilidade 2.1. Experimento probabilístico Definição Um experimento probabilístico é uma ação ou um ensaio por meio do qual resultado específico (contagem, medidas e respostas) são obtidos. A conseqüência de um único ensaio em um experimento probabilístico é um resultado (ponto amostral). O conjunto de todos os resultados possíveis de um experimento probabilístico é o espaço amostral. Um evento consiste em um ou mais resultados e é um subconjunto do espaço amostral. Exemplos de experimentos probabilísticos: a) No “lançamento de uma moeda”, temos o espaço amostral {cara, coroa}. b) No “lançamento de um dado”, temos o espaço amostral: {1, 2, 3, 4, 5, 6}. c) “Dois lançamentos sucessivos de uma moeda”, temos o espaço amostral: {(ca,ca); (co,co); (ca,co); (co,ca)}. 77 d) No “nascimento de uma criança”, temos o espaço amostral: {feminino, masculino}. e) No “resultado de uma partida de futebol” temos o espaço amostral: {vitória, empate, derrota}. 2.2. Eventos Um evento de um experimento aleatório é qualquer subconjunto do espaço amostral desse experimento. O número de elementos de um evento E será representado por n(E). 2.2.1. Eventos unitário, certo e impossível Dois ou mais eventos elementares de certo espaço amostral são ditos: - Evento Unitário: é formado por um único elemento do espaço amostral. Ex.: ocorrência da face 3 no lançamento de um dado. - Evento Certo: é aquele que ocorre em qualquer realização do experimento. Se E = S, E é chamado de evento certo. Ex.: no lançamento de um dado fatalmente sairá a face 1, 2, 3, 4, 5 ou 6. - Evento Impossível: é aquele que não ocorre em qualquer realização do experimento. Se E = Ø, E é chamado de evento impossível. Ex.: No lançamento de um dado sair a face 7. Exemplo: No lançamento de um dado e a observação da face voltada para cima, temos os eventos: * Evento A: a face observada é um nº par. A = {2, 4, 6}, n(A) = 3 * Evento B: a face observada é um quadrado perfeito. B = {1, 4}, n(B) = 2 * Evento C: a face observada é um número múltiplo de 5. C = {5}, n(C) = 1 (evento unitário) * Evento D: a face obtida é um número menor que 7. D = { 1, 2, 3, 4, 5, 6}, n(D) = 6 (evento certo) * Evento F: a face obtida é um número maior que 6. F = { }, n(F) = zero (evento impossível) 2.2.2. Evento complementar Para um evento A qualquer, o complementar de A, denotado por A é dado por A = S – A, ou seja, é um outro conjunto formado pelos elementos que pertencem a S e não pertencem a A. O resultado da reunião de A e A é exatamente o espaço amostral. Exemplo: 1. Coroa é complementar de cara (e vice-versa). 2. O conjunto de cartas de paus, ouros e copas é complementar do conjunto de espadas. 3. Num jogo em que acontece um (empate), o evento complementar é (ganhar, perder). 4. Numa jodada de um dado que sai o número (1), o evento complementar é (2,3,4,5,6). 2.2.3. Evento mutuamente exclusivos - Evento Mutuamente Exclusivo: Caracteriza-se quando dois ou mais eventos não podem ocorrer simultaneamente, ou seja, a ocorrência de um exclui a possibilidade de ocorrência do outro e vice-versa. Exemplos: 78 1. Se a carta é de copas, então ela não é de ouro; 2. Se o tempo está nublado, então não há sol. Eventualmente poderão esgotar todos os resultados possíveis, nesse caso serão chamados de mutuamente excludentes e exaustivos. - Eventos não mutuamente exclusivos Caracteriza-se quando dois ou mais eventos podem ocorrer simultaneamente. 2.2.4. Evento independente e condicionado - Evento Independente: Dizemos que dois ou mais eventos são independentes quando não exercem ações recíprocas, comportando-se cada um de maneira que lhe é própria sem influenciar os demais. Caracteriza-se, portanto, quando a ocorrência de um evento não for afetada pela ocorrência do outro, sendo a recíproca verdadeira. Ex.: Consideremos o lançamento de duas moedas: Temos: S = {(ca, ca), (ca, co), (co, co), (co, ca)} Os resultados dos eventos são independentes de uma moeda para outra. - Evento Condicionado: Quando associados dois ou mais eventos a um experimento aleatório qualquer, dizemos que eles são condicionados a outro evento A do mesmo experimento. Caracteriza-se quando a ocorrência de um evento B qualquer dependa da ocorrência de outro evento A. Ex.: retirada, sem reposição, de duas cartas vermelhas de um baralho completo. Exemplos: Decida se os eventos são dependentes ou independentes 1. Selecionar um rei de um baralho comum (A), não o recolocando, e então selecionar uma dama do baralho (B). Solução: A ocorrência de A modifica a probabilidade da ocorrência de B; portanto, os eventos são dependentes. 2. Jogar uma moeda, obter cara (A) e então jogar um dado de seis faces e obter um 6 (B). Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B; portanto, os eventos são independentes. Importante! - Um evento certo é o próprio espaço amostral; - Um evento impossível é o subconjunto vazio do espaço amostral. 3 Tipos de Probabilidade Há três tipos de probabilidade: clássica, empírica e subjetiva. A probabilidade de um evento E ocorrer é escrita como P(E) – lê-se “a probabilidade do evento E”. 3.1. Probabilidade Clássica 79 Definição A probabilidade clássica (ou teórica) é usada quando cada resultado no espaço amostral tem a mesma probabilidade de ocorrer. A probabilidade clássica para um evento E é dada por ou Exemplos: a. No lançamento de uma moeda qual a probabilidade de obter cara: S = { ca, co } , n(S) = 2 A = {ca} , n(A) = 1 P(A) = = 0,5 = 50% b. No lançamento de um dado qual a probabilidade de obter um número par: S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6 A = { 2, 4, 6 }, n(A) = 3 P(A) = = 0,5 = 50% c. No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6: S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6 A = { 1, 2, 3, 4, 5, 6 }, n(A) = 6 P(A) = = 1,0 = 100% d. No lançamento de um dado qual a probabilidade de obter um número maior que 6: S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6 A = { }, n(A) = 0 P(A) = = 0 = 0% Exercícios: 1. No lançamento de um dado e a observação da face voltada para cima, determine a probabilidade de se obter: A) Um número ímpar. B) Um número múltiplo de 3. C) Um número menor que 7. D) Um número maior que 6. 2. No lançamento simultâneo de dois dados e a observação das faces voltadas para cima, determine a probabilidade de se obter: A) Números iguais. B) A soma dos números igual a 9. 3.2. Probabilidade empírica e Lei dos Grandes números Definição A probabilidade empírica (ou estatística) baseia-se em observações obtidas em experimentos probabilísticos. A probabilidade empírica de um evento E é a freqüência relativa desse evento. ( ) total frequência E evento do frequência = E P Exemplo: Em um pequeno açude contém três tipos de peixes: Matrinxã, Tambaqui e Tucunaré: Tipo de peixe Quantidade Matrinxã 13 Tambaqui 17 Tucunaré 10 80 Total 40 Qual a probabilidade de se pescar um Tambaqui? P(Tambaqui) = 40 17 = 0,425 = 42,5% Lei dos grandes números À medida que um experimento é repetido mais e mais vezes, a probabilidade empírica de um evento tende à sua probabilidade teórica (real). Exemplo: Como exemplo dessa lei, suponha que você queira determinar a probabilidade de obter cara com uma moeda normal. O mapa de dispersão abaixo mostra o resultado de similar jogada da moeda 500 vezes. Observe que, à medida que o número de jogadas cresce, a probabilidade de obter cara fica mais perto da probabilidade teórica, que é de 0,5. 3.3. Probabilidade subjetiva O terceiro tipo de probabilidade é a subjetiva. A probabilidade subjetiva resulta da intuição, estimativa, ou de um “palpite bem fundamentado”. Veja os exemplos: - Dado o estado de saúde do paciente e a extensão dos ferimentos, um médico pode sentir que esse paciente tem uma chance de 90% de se recuperar completamente. - Um analista de negócios pode predizer que a chance dos funcionários de uma determinada companhia entrarem em greve é de 0,25. 4 Propriedades da probabilidade - Uma probabilidade não pode ser negativa ou maior que 1. Assim, a probabilidade de um evento E está entre 0 e 1. 0 s P(E) s 1 - A soma das probabilidades de todos os resultados de um espaço amostral é de 1 (100%). Uma conseqüência importante desse fato é que, se souber a probabilidade de um evento E, poderá obter a probabilidade do complemento do evento E. 81 Probabilidade de Eventos Complementares Sabemos que um evento A pode ocorrer ou não. Sendo P(A) a probabilidade de que ele ocorra (sucesso) e P(Ā) a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: P(A) + P(Ā) = 1 Exemplo: Sabemos que a probabilidade de tirar o nº 4 no lançamento de um dado é igual 1/6. Logo, a probabilidade de não tirar o nº 4 no lançamento de um dado: P(Ā) = 1− P(A) P(Ā) = 1 − 6 1 = 6 5 . Exercícios 1) Uma caixa contém bolas numeradas de 1 a 15. Retira-se uma bola ao acaso, qual a probabilidade de se obter uma bola cujo número seja múltiplo de 4? 2) Qual é a probabilidade de um eleitor amazonense escolhido ao acaso não ter votado em Amazonino Mendes na eleição de 2008? - Cerca de 1.050.230 votaram em outro candidato ou em outra opção. - Cerca de 1250.000 votaram em Amazonino Mendes. 3) Determine a probabilidade, considerando uma companhia que seleciona funcionários ao acaso para um teste de drogas. A companhia usa um computador para selecionar aleatoriamente números de funcionários em um intervalo que vai de 1 a 6.296. a) Obtenha a probabilidade de selecionar um número menor do que mil. b) Obtenha a probabilidade de selecionar um número maior do que mil. c) Obtenha a probabilidade de selecionar um número divisível por mil. d) Obtenha a probabilidade de selecionar um número não divisível por mil. 4) Dada a distribuição de freqüência dos números de eleitores brasileiros (em milhões) de acordo com a idade. Idade dos eleitores em anos frequência (em milhões) 18 a 20 10,8 21 a 24 13,9 25 a 34 40,1 35 a 44 43,3 45 a 64 53,7 65 ou mais 31,9 Obtenha a probabilidade de um eleitor escolhido ao acaso: a) Ter entre 21 e 24 anos; b) Não ter entre 18 a 20 anos. 5) Quando duas flores boca-de-leão cor-de-rosa (RW) são cruzadas, há quatro resultados possíveis igualmente prováveis para a estrutura genética da descendência: vermelho (RR), cor-de-rosa (RW), cor- de-rosa (WR) e branco (WW). Então, se duas bocas-de-leão forem cruzadas, qual será a probabilidade de a descendente ser (a) cor-de-rosa? (b) vermelha? (c) branca? 82 6) O diagrama mostra o número de trabalhadores (em milhares) por setor numa certa cidade. Calcule a probabilidade de: a) Um trabalhador escolhido ao acaso estar empregado no setor de serviços. b) Um trabalhador escolhido ao acaso não estar empregado no setor de serviços. 5 Probabilidade Condicional e a Regra da Multiplicação 5.1. Probabilidade condicional Uma probabilidade condicional é a probabilidade de ocorrer um evento, dado que outro evento já ocorreu. A probabilidade condicional de o evento B ocorrer, dado que o evento A já ocorreu, é denotada por P(B|A) – lida como “probabilidade de B, dado A”. Exemplos: 1. Duas cartas são selecionadas em seqüência em um baralho comum (52 duas cartas). Determine a probabilidade de a segunda ser uma dama, dado que a primeira foi um rei. Assuma que o rei não seja recolocado. Solução: Uma vez que a primeira carta foi um rei e não foi recolocada, restou no baralho 51 cartas, quatro delas damas. Assim, P(B|A) = ~ 51 4 0,078. 2. A tabela abaixo mostra os resultados de um estudo no qual pesquisadores examinaram o QI de 102 crianças e a presença de um gene específico nelas. (a) Obtenha a probabilidade de determinada criança ter um QI alto, dado que ela tem o gene. Gene presente Gene não presente Total QI alto 33 19 52 QI normal 39 11 50 Total 72 30 102 Solução: Existem 72 crianças com o gene. O espaço amostral, portanto, consiste de 72 crianças. Delas, 33 têm QI alto. Assim, 83 P(B|A) = ~ 72 33 0,458. (b) Determine a probabilidade de uma criança não ter o gene. (c) Determine a probabilidade de uma criança não ter o gene, dado que ela tem um QI normal. 5.2. Probabilidade de eventos independentes Como dois eventos são independentes se a ocorrência de um deles não afeta a probabilidade de ocorrência do outro, então P(B|A) = P(B) ou P(A|B) = P(A) Os eventos que não são independentes são dependentes (condicionados) Exemplos: 1. Qual a probabilidade de selecionar um rei de um baralho comum (A), não o recolocando, e então selecionar uma dama do baralho (B). Solução: A ocorrência de A modifica a probabilidade da ocorrência de B; portanto, os eventos são dependentes (ou condicionados. Probabilidade de selecionar um rei: P(A) = 52 4 Probabilidade de selecionar uma dama(de ocorre B após ter ocorrido A): P(B|A) = 51 4 . 2. Jogar uma moeda, obter cara (A) e então jogar um dado de seis faces e obter um 6 (B). Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B; portanto, os eventos são independentes. Probabilidade de ocorrer cara: P(A) = 2 1 Probabiliade de obter a face 6 (de ocorrer B após ter ocorrido A): P(B|A) = P(B) = 6 1 . 5.3. A regra da Multiplicação (e) 84 A probabilidade de dois eventos A e B ocorrerem em seqüência é: a) para eventos condicionados: Se A e B são dois eventos, a probabilidade de B ocorrer: depois de A ter acontecido é definida por: P(B,A), ou seja, é chamada probabilidade condicional de B. Neste caso os eventos são dependentes e definidos pela fórmula: P (A e B) = P (A ∩ B) = P (A) . P (B,A) b) para eventos independentes: Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. P (A e B) = P (A ∩ B) = P (A) . P (B) 6 Regra da Adição 6.1. Eventos mutuamente exclusivos Na seção anterior vimos como obter a probabilidade de dois eventos, A e B, ocorrerem em seqüência. Nesta seção, vamos obter a probabilidade de pelo menos um dos eventos ocorrer. Probabilidades como essas são denotadas como P(A ou B) e dependem dos eventos serem mutuamente exclusivas. Definição Dois eventos A e B serão mutuamente exclusivos se A e B não puderem ocorrer ao mesmo tempo. A e B são mutuamente exclusivos. A e B não são mutuamente exclusivos. Exemplos: Decida se os eventos são mutuamente exclusivos. Explique seu raciocínio. 1. Jogue um dado. A: obter um 3. B: obter um 4. 2. Escolha um estudante. A: escolher um estudante do sexo masculino. B: escolher um estudante com especialidade em enfermagem. 85 3. Escolha um doador sanguíneo. A: o doador é do tipo O. B: O doador é do sexo feminino. 6.2. Regra da Adição a) para eventos mutuamente exclusivos P (A ou B) = P (A U B) = P (A) + P (B) b) para eventos não mutuamente exclusivos P (A ou B) = P (A U B) = P (A) + P (B) – P (A ∩ B) Exemplos: 1. No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4: Solução: Os dois eventos são mutuamente exclusivos então: P(nº 3 ou nº 4) = 6 1 + 6 1 = 6 2 = 3 1 2. No lançamento de um dado qual a probabilidade de se tirar um número menor que 3 ou um número ímpar. P(nº menor do que ou nº ímpar) = 6 2 + 6 3 – 6 1 = 6 4 = 3 2 ≈ 0,667. Exercícios 1. Joga-se um dado duas vezes. Qual a probabilidade de se obter a face 5 em ambas as jogadas? Resposta: 1/36 2. Uma caixa contém 100 peças das quais 5 são defeituosas. Seleciona-se ao acaso uma peça, que não é recolocada e, seleciona-se outra peça. Qual a probabilidade de que ambas as peças retiradas sejam defeituosas? Resposta: 0,2% 3. Em um pequeno açude contém três tipos de peixes: Matrinxã, Tambaqui e Tucunaré: Tipo de peixe Quantidade Matrinxã 13 Tambaqui 17 Tucunaré 10 Total 40 a) Qual a probabilidade de se pescar um Tucunaré? b) Em uma captura, qual a probabilidade de se pescar ou a Matrinxã ou um Tucunaré? c) Em duas capturas (sem reposição), qual a probabilidade de se pescar uma matrinxã e um Tucunaré? d) Em duas capturas (com reposição), qual a probabilidade de se pescar uma matrinxã e um Tucunaré? 86 4. Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a) a probabilidade de essa peça ser defeituosa; b) a probabilidade de essa peça não ser defeituosa. 5. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da 1ª: 2ª e 3ª urnas serem, respectivamente, branca, preta e verde. 6. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. R: 30% 7. Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. Resposta: 24% 8. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5 bolas verdes. Qual a probabilidade de que ambas sejam da cor branca?. 9. Uma caixa contém 3 bolas brancas, 4 pretas e 5 vermelhas. Retirando-se uma bola, qual a probabilidade de ela ser branca ou vermelha? 10. Um júri consiste de nove pessoas naturais do local e três naturais de outros estados, Se dois dos jurados são selecionados aleatoriamente para uma entrevista, qual a probabilidade de serem ambos naturais de outro estado? Resposta: 4,55% 11. Em uma caixa há sete lâmpadas, sendo quatro boas e três queimadas. Retirando três lâmpadas ao acaso, sem reposição, qual a probabilidade de que: a) Todas sejam boas; R: 24/210 b) Todas sejam queimadas. R: 6/210 12. Na jogada de um dado, qual a probabilidade de sair um 6 ou um número ímpar. 13. Ao selecionar uma carta de um baralho, obtenha a probabilidade de tirar um 4 ou um às. 14. Ao selecionar uma carta de um baralho, obtenha a probabilidade de tirar um 4 ou um naipe de ouro. 15. Um banco de sangue registra o tipo sanguíneo e o fator Rh de doadores durante os últimos cinco dias conforme a tabela a seguir: 87 Determine as seguintes probabilidades: (a) Doador ter tipo sangüíneo O; (b) Doador ser fator Rh positivo; (c) Doador ter tipo sangüíneo A ou B; (d) Doador ter tipo sanguíneo B ou ser Rh negativo. Questões objetivas 16. (UERJ) - Um instituto de pesquisa colheu informações para saber as intenções de voto no segundo turno das eleições para governador do estado. Os dados estão indicados no quadro abaixo: Intenção de Voto Percentual Candidato A 26% Candidato B 40% Votos nulos 14% Votos Brancos 20% Escolhendo aleatoriamente um dos entrevistados, verificou-se que ele não vota no candidato B. A probabilidade de que esse eleitor vote em branco é (A) 1/6 (B) 1/5 (C) 1/4 (D) 1/3 (E) 2/5 17. (UF São Carlos) - Uma urna tem 10 bolas idênticas numeradas de 1 a 10. Se retirarmos uma bola da urna, a probabilidade de não obtermos a bola número 7 é igual a (A) 2/2 (B) 9/10 (C) 1/10 (D) 9/11 (E) 1/5 18. (FUVEST) - Escolhem-se ao acaso dois números distintos de 1 a 20. Qual a probabilidade de que o produto dos números escolhidos seja ímpar? (A) 9/38 (B) 1/2 (C) 9/20 (D) 1/4 (E) 8/25 19. (UniRio) - As probabilidades de três jogadores marcarem um gol cobrando um pênalti são, respectivamente, 1/2, 2/5 e 5/6. Se cada um bater um único pênalti, a probabilidade de todos errarem é igual a (A) 3% (B) 5% (C) 17% (D) 20% (E) 25% 20. (UEM-PR) - Um número é escolhido ao acaso entre os 20 inteiros, de 1 a 20. A probabilidade de o número escolhido seja primo ou quadrado perfeito (A) 1/5. 88 (B) 2/25. (C) 4/25. (D) 2/5. (E) 3/5. 21. (UNESP) - Dois dados perfeitos e distinguíveis são lançados ao acaso. A probabilidade de que a soma dos resultados obtidos seja 3 ou 6 é (A) 7/18. (B) 1/18. (C) 7/36. (D) 7/12. (E) 4/9. 22. (Santa Casa-SP) - Num grupo de 60 pessoas, 10 são torcedores do São Paulo, 5 são torcedoras do Palmeiras e as demais são torcedoras do Corínthians. Escolhido ao acaso um elemento do grupo, a probabilidade de ele ser torcedora do São Paulo ou do Palmeiras é (A) 40%. (B) 25%. (C) 50%. (D) 30%. (E) n.d.a. 23. (CESGRANRIO) - Em uma amostra de 500 peças, existem exatamente quatro defeituosas, Retirando-se, ao acaso, uma peça dessa amostra, a probabilidade de ela ser perfeita é de (A) 99,0%. (B) 99,1%. (C) 99,2%. (D) 99,3%. (E) 99,4%. 24. (CESGRANRIO) - Uma urna contém 4 bolas brancas e 5 bolas pretas. Duas bolas, escolhidas ao acaso, são sacadas dessa urna, sucessivamente e sem reposição. A probabilidade de que ambas sejam brancas vale (A) 1/6. (B) 4/9. (C) 20/81. (D) 2/9. (E) 16/81. 25. (CESGRANRIO) - Uma urna contém 4 bolas vermelhas, 3 bolas azuis e 3 bolas brancas. Qual é a probabilidade de retirarmos uma bola vermelha e, sem reposição desta, uma branca? (A) 1/15. 89 (B) 2/15. (C) 3/15. (D) 4/15. (E) 10/15. 26. (FEI-SP) - Numa moeda viciada, a probabilidade de ocorrer face cara num lançamento é igual a 4 vezes mais a probabilidade de ocorrer coroa. A probabilidade de ocorrer cara num lançamento dessa moeda é: (A) 40%. (B) 80%. (C) 25%. (D) 20%. (E) 50%. 7 Análise Combinatória Quando a contagem direta do número de possibilidades é muito trabalhosa, podemos nos valer da análise combinatória para determinar os números de casos favoráveis e/ou possíveis dos experimentos estudados. Para tanto, é necessário primeiro classificar adequadamente o grupamento e depois aplicar a fórmula correta. 7.1 Notação Fatorial: Define-se como fatorial de um número n (n!), sendo esse número um inteiro maior do que 1. n! = n . (n−1) . ... . 1 Exemplos: 5! = 5.4.3.2.1 = 120 7! = 7.6.5.4.3.2.1 = 5040 7.2 Permutação Permutar é (re)ordenar os elementos de um conjunto numa seqüência previamente definida. As permutações podem ser: a) Permutação sem Repetição Conjuntos com elementos distintos. Pn = n! Exemplo: Três membros de uma organização social se ofereceram como voluntários, para compor a diretoria, para o próximo ano, assumindo as funções de Presidente, Tesoureiro e Secretário. Qual o número de maneiras pelas quais os três podem assumir tais cargos? P3 = 3!= 6 b) Permutação com Repetição Conjuntos com alguns elementos iguais entre si. ! ! t n P k t t n H =  1 Exemplo: Quantos anagramas distintos têm na palavra MISSISSIPI? 90 ! ! ! , 4 4 10 4 4 10 = P = 6300 Obs.: Os anagramas são permutações (troca de lugar) das letras da palavra. Exercícios resolvidos 1) Encontre o anagrama de cada palavra abaixo: a) AMOR: P4 = 4! = 4.3.2.1 = 24 b) CASTELO: P7 =7! = 5040 c) ARARA: ! ! ! , 2 3 5 2 3 5 = P = 2 6 120 . =10 2) Em cada uma das dez bolas de uma urna está impressa uma letra da frase FELIZ NATAL. Sorteadas as bolas uma a uma, qual a chance de surgir a tal mensagem? P = 2 2 10 1 , P = ! 10 4 = 0,0001% 7.3 Arranjo Quando a permutação é feita com apenas uma parte dos elementos do espaço amostral, ou seja, por arranjo se entende o número total de permutações possíveis nos subconjuntos de ‘r’ elementos de um conjunto composto por ‘n’ elementos. Permutar sem reposição significa extrair o elemento, avalia-lo e descarta-lo, quando o item selecionado é devolvido ao conjunto de origem antes do próximo sorteio, fala-se em permutação com reposição. Arranjo com reposição: An,r = n r Exercícios resolvidos 1) Calcule os arranjos com reposição: a) A9,3 = 9 x 9 x 9 = 9 3 = 729 b) A9,2 = 9 x 9 = 9 2 = 81 2) Quantos números de dois algarismos se podem formar com os dígitos 1, 2 e 3. A3,2 = 3 2 = 9 Exercício de aplicação 1) Qual o número máximo formado pela empresa de Telefonia celular que você usa com em Manaus? 2) Qual o número máximo de CPF formado formados com 11 dígitos? Arranjo sem reposição: 91 An,r = ( )! ! r n n ÷ Exercícios resolvidos 1) Calcule os arranjos sem reposição: a) A9,3 = 9 x 8 x 7 = 504 b) A9,2 = 9 x 8 = 72 2) Um grupo de Cinco pessoas, deseja montar uma chapa eleitoral composta por um presidente, um vice e um tesoureiro. Calcule quantas chapas podem ser formadas. A5,3 = ( )! ! 3 5 5 ÷ = ! ! 2 5 = ! ! . . . 2 2 3 4 5 = 60 Observe que se utiliza um arranjo quando se quer formar grupos a partir de um conjunto maior em que a ordem é importante. 7.4 Combinação Quando as escolhas se distinguem só pela qualidade e não pela ordem dos elementos. Para se calcular o número de combinações possíveis de ‘n’ elementos, tomando-se ‘r’ de cada vez, usa-se a expressão: Cn,r= ( )! ! ! r n r n ÷ Exercícios resolvidos 1) Calcule a seguinte combinação: C15,3 = ( )! 3 15 ! 3 ! 15 ÷ = ! 12 !. 3 ! 12 . 13 . 14 . 15 = 1 . 2 . 3 13 . 14 . 15 = 455 2) Qual a probabilidade de tirarmos 5 cartas de espadas sem reposição de um baralho de 52 cartas: Método tradicional: P(5 espadas) = 52 13 x 51 12 x 50 11 x 49 10 x 48 09 = 0,0005... Técnica de contagem: P(5 espadas) = 5 , 52 5 , 13 C C = 48 . 49 . 50 . 51 . 52 9 . 10 . 11 . 12 . 13 = 0,0005... 3) De 20 pessoas que se oferecem para doar sangue 15 possuem sangue tipo B. Qual a probabilidade de, escolhendo-se 3 pessoas desse grupo todas as 3 escolhidas tenham sangue tipo B: P (3 sangue B) = 3 , 20 3 , 15 C C = 0,399 92 4) Qual a probabilidade de retirarmos 2 ases em uma amostra de 5 cartas retiradas de um baralho de 52 cartas: P (2 ases) = 3 , 52 3 , 48 2 , 4 C C C × 5) Qual a probabilidade de retirarmos 4 ases em uma amostra de 13 cartas retiradas de um baralho de 52 cartas: P (4 ases) = 13 , 52 9 , 48 4 , 4 C C C × 6) Cinco pessoas constituem a junta de diretores de uma empresa. Suponha que somente três destes diretores sejam convidados a representar a empresa num banquete. Quantas combinações diferentes seriam possíveis para compor este trio? C5,3 = ( )! ! ! 3 5 3 5 ÷ = ! ! ! 2 3 5 = ! ! ! . . . 2 3 2 3 4 5 = 10 Observe que se utiliza uma combinações quando se quer formar grupos a partir de um conjunto maior em que a ordem não é importante. Exercícios (ver Larson pág. 120) 1) Sistema de segurança. O código de acesso a um sistema de um carro consiste de 4 dígitos, quantos códigos diferentes estão disponíveis? 2) Diretoria. Uma diretoria deve ser escolhida a partir de 15 candidatos. Os cargos são de presidente, vice-presidente, secretário e tesoureiro. De quantas maneiras os cargos podem ser preenchidos? 3) Letras. De quantas letras distinguíveis as letras da palavra estatística podem ser escritas? 93 CAPÍTULO 10 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 INTRODUÇÃO Em muitas pesquisas estatísticas, o objetivo principal é estabelecer relações que possibilitem predizer uma ou mais variáveis em termos de outras. Assim é que se fazem estudos para predizer:  As vendas futuras de um produto em função do seu preço;  A despesa de uma família com médico e remédios em função de sua renda;  O consumo per capita de certos alimentos em função de seu valor nutritivo; A análise de correlação mede o grau de relacionamento entre as variáveis. Estudaremos a Análise de Correlação Simples, a qual diz respeito à medida entre X e Y. Hipóteses: 1. A relação entre X e Y é linear; 2. Ambas são variáveis aleatórias; 3. Homocedasticidade, as variâncias das distribuições condicionais de Y dado X são todas iguais. 4. As distribuições condicionais de Y dado X têm distribuição Normal; 5. As duas distribuições, de X e de Y, têm distribuição Normal na população. Naturalmente, o ideal seria que pudéssemos predizer uma quantidade exatamente em termos de outra, mas isso raramente é possível. Na maioria dos casos, devemos contentar-nos com a predição de médias ou valores esperados. 2 DIAGRAMA DE DISPERSÃO Para desenhar um diagrama de dispersão, primeiro traça-se o sistema de eixos cartesianos. Depois representa uma das variáveis no eixo “x” e a outra no eixo “y” colocam-se, então os valores das variáveis sobre os respectivos eixos e marca-se um ponto para cada par de valores. 94 EXEMPLO 1: Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma classe da Universidade A e pelas notas obtidas por eles em Matemática e Estatística: Notas Matemática (x) Estatística (y) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 Tabela 1 Representando os pares ordenados em um sistema cartesiano, obtemos uma nuvem de pontos que denominamos de diagrama de dispersão. Esse diagrama nos fornece uma grosseira idéia da correlação existente entre essas duas variáveis. Figura 1 Atividade: Reproduzir esse diagrama de dispersão no “EXCEL”. 95 3 CORRELAÇÃO LINEAR SIMPLES 3.1 CORRELAÇÃO POSITIVA E CORRELAÇÃO NEGATIVA Se as variáveis x e y crescem no mesmo sentido, isto é, quando x cresce, y também cresce, diz-se que as duas variáveis têm correlação positiva. Se as variáveis x e y variam em sentido contrário, isto é, quando x cresce, em média y decresce, diz-se que as duas variáveis têm correlação negativa. Assim, uma correlação é: a. Linear positiva se os pontos do diagrama têm como "imagem" uma reta crescente; b. Linear negativa se os pontos têm como "imagem" uma reta descrescente; c. Não-linear se os pontos têm como "imagem" uma curva. d. Não há correlação linear se os pontos apresentarem-se dispersos, não fornecendo uma “imagem” definida. 3.2 COEFICIENTE DE CORRELAÇÃO LINEAR O objetivo do estudo da correlação é determinar a força do relacionamento entre duas observações emparelhadas, nos limitaremos ao estudo de correlação linear com duas variáveis. 96 PROPRIEDADES - O valor de r está sempre entre o intervalo [−1,+1]; - O valor de r não varia se todos os valores de qualquer uma das variáveis são convertidos para uma escala diferente; - r mede a intensidade, ou grau, de um relacionamento linear. Não serve para medir a intensidade de um relacionamento não-linear. 3.3 INTERPRETAÇÃO DO COEFICIENTE DE CORRELAÇÃO LINEAR Como definimos, o instrumento empregado para a medida da correlação linear é o coeficiente de correlação, veja a Eq.(1). Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).  Se r = +1, há uma correlação perfeita e positiva entre as variáveis;  Se r = −1, há uma correlação perfeita e negativa entre as variáveis;  Se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura exista não é linear.  Se 1 6 0 s s r , , há uma correlação forte, e podemos tirar algumas conclusões significativas sobre o comportamento das variáveis.  Se r s 3 0, < 0,6, há uma correlação fraca entre as variáveis.  Se 0 < r < 0,3, há uma correlação muito fraca entre as variáveis, e não é viável tiramos conclusões sobre as variáveis em estudo. Observação importante: DEFINIÇÃO A correlação é a medida padronizada da relação entre duas variáveis e é dada pela seguinte expressão: ( )( ) ( ) | | ( ) | | 2 2 2 2 . ¿ ¿ ¿ ¿ ¿ ¿ ¿ ÷ ÷ ÷ = i i i i i i i i y y n x x n y x y x n r (1) Onde: n é o número de observações e r é o coeficiente de correlação linear. 97 É um erro concluir que a Correlação implica em CAUSALIDADE ⇒pode haver uma variável oculta que afeta as variáveis em estudo que não está sendo levada em consideração, ou seja, a correlação não implica que um causa o outro. Podemos dizer que duas variáveis X e Y estão correlacionadas, mas não que X causa Y ou Y causa X, na média eles simplesmente estão relacionados ou associados um com o outro. EXEMPLO 2: Encontre o coeficiente de correlação para os dados da tabela 1. xi yi xi yi xi 2 yi 2 5 6 30 25 36 8 9 72 64 81 7 8 56 49 64 10 10 100 100 100 6 5 30 36 25 7 7 49 49 49 9 8 72 81 64 3 4 12 9 16 8 6 48 64 36 2 2 4 4 4 65 65 473 481 475 ( )( ) 2 2 65 475 . 10 65 481 . 10 65 . 65 473 . 10 ÷ ÷ ÷ = r 911 , 0 525 585 505 = × = r Interpretação do coeficiente de correlação linear desse exemplo: O coeficiente de correlação linear entre as varáveis é r = 0,911, portanto observamos que há um alto grau de correlação entre as duas variáveis, pois encontra-se entre o intervalo 1 6 , 0 s s r . Então, notas de matemática e notas de estatística dos alunos tem correlação positiva, porque quando uma das variáveis cresce, a outra , em média, também cresce. 98 4 REGRESSÃO LINEAR SIMPLES As equações lineares são úteis e importantes não só porque muitas relações têm efetivamente esta forma, mas também porque, em geral, constituem boas aproximações de relações que, de outro modo, seriam difíceis de descrever em termos matemáticos. O objetivo principal da análise de regressão é predizer o valor da variável dependente Y dado que seja conhecido o valor da variável independente X. A equação de regressão é a fórmula algébrica pela qual se determina Y. A Análise de Regressão Simples diz respeito à predição de Y por uma única variável X. A Análise de Regressão Múltipla diz respeito à predição de Y por mais de uma variável X ( x 1 , x 2 , ....). As hipóteses gerais são: 1. Y é uma variável aleatória obtida de uma amostra; 2. Y e X estão associadas linearmente; 3. homocedasticidade – as variâncias das distribuições condicionais de Y dado X são todas iguais. Se em conjunto com a análise de regressão, utiliza-se a estimação por intervalo, é necessária a hipótese de que as distribuições condicionais de Y dado X são todas distribuídas normalmente para os valores da população. Sempre que possível procuramos expressar, em termos de uma equação matemática, as relações entre grandezas conhecidas (variáveis dependentes) e grandezas que devem ser determinadas (variáveis independentes). Para nosso trabalho, nos concentraremos em equações lineares com duas incógnitas, da forma ŷ = ax + b onde b é o intercepto-y ( valor de y para o qual x = 0) e a é o coeficiente angular da reta (ou seja, a variação de y que acompanha um aumento de uma unidade em x). 99 Na prática, os valores de a e b costumam ser estimados com base em dados através das expressões: Onde: x é a média dos valores de xi | | . | \ | = ¿ n x x i e y é a média dos valores de yi | | . | \ | = ¿ n y y i Portanto, ao fazermos o uso de uma amostra para obtermos os parâmetros, o resultado na realidade é uma estimativa da verdadeira função de regressão. Assim, as equações (2), são os parâmetros da reta estimada, escrita como ŷ = ax + b onde ŷ é o valor estimado de y. Observado os dados e, uma vez estimada a equação da reta, podemos introduzir, na equação, valores de x, calculando os correspondentes valores preditos de y. Observação importante As equações de regressão podem ser úteis para PREDIZER o valor de uma variável, dado um valor determinado da outra variável. Usar a equação de regressão somente quando indicar correlação linear significativa. E, usá-la somente dentro dos limites de valores disponíveis. Quando não há correlação linear significativa, a melhor estimativa de uma variável é sua média. EXEMPLO 3. Como verificamos que há um alto grau de correlação entre as variáveis do exemplo 1, vamos obter a reta ajustada. ( )( ) ( ) ¿ ¿ ¿ ¿ ¿ ÷ ÷ = 2 2 i i i i i i x x n y x y x n a x a y b ÷ = (2) 100 xi yi xi.yi 2 i x 5 6 30 25 8 9 72 64 7 8 56 49 10 10 100 100 6 5 30 36 7 7 49 49 9 8 72 81 3 4 12 9 8 6 48 64 2 2 4 4 65 65 473 481 O coeficiente angular: a = 8632 , 0 585 505 65 481 . 10 65.65 - 10.473 2 = = ÷ O intercepto: 8892 , 0 10 65 . 8632 , 0 10 65 = ÷ = b A equação da reta estimada: 8892 , 0 8632 , 0 ˆ + = x y Com a reta estimada podemos fazer previsões, tais como. Qual a nota estimada de estatística, de um aluno que obteve 4 em matemática? Ao substituir x = 4, na reta estimada obtemos: 8892 , 0 4 . 8632 , 0 ˆ + = y = 4,3 Portanto, para esse grupo de estudantes um aluno que obtém nota 4 em matemática, estima-se que obtenha 4,3 em estatística. Exercícios 101 1. Correlação. Qual é o valor de r que indica uma correlação mais forte: r = 0,75 ou r = 0,86? Justifique sua resposta. 2. Correlação. Qual dos valores a seguir pode não representar um coeficiente de correlação? (a) r = 0,92 (b) r = 1,05 (c) r = –0,73 (d) r = – 0,05 3. Correlação. Um administrador de marketing conduz um estudo para determinar se existe uma relação linear entre o dinheiro gasto em propagandas e as vendas de uma companhia. Os dados estão dispostos na tabela abaixo, (a) Posicione os dados em um mapa de dispersão e (b) Com apenas uma análise do gráfico verifique se existe uma correlação linear negativa ou positiva ou se não existe uma correlação linear. Gastos com propaganda em milhões de reais (x) 2,4 1,6 2,0 2,6 1,4 1,6 2,0 2,2 Vendas da empresa em Milhões de reais (y) 225 184 220 240 180 184 186 215 4. Correlação. Uma estudante de enfermagem conduz um estudo para determinar se existe uma relação entre o peso de uma pessoa (em quilogramas) e o consumo diário de água (em litros). Os dados estão dispostos na tabela abaixo. Organize os dados em um mapa de dispersão e descreva o tipo de correlação, fazendo somente uma analise gráfica. 5. Dada duas variáveis x (independente) e y (dependente). Para cada caso faça uma análise de regressão linear simples. a. Esboce o diagrama de dispersão das variáveis; b. Calcule o coeficiente de correlação (analise o resultado para prosseguir o outro item); c. Determine a reta ajustada, ŷ = ax + b. I . II. III . xi yi xi yi xi yi 1 70 45 90 13 2,5 2 50 10 25 33 7,0 3 40 47 45 45 9,0 4 30 37 23 56 9,5 5 20 47 52 60 11,0 6 10 8 95 70 13,5 45 48 80 15 Peso (kg) (x) 102 119 124 141 142 154 201 220 Água (litros) (y) 1,47 0,98 2,42 1,89 1,59 0,62 2,54 1,15 102 6. Uma cadeia de supermercado financiou um estudo dos gastos realizados por famílias de 4 pessoas com renda líquida entre 8 e 20 salários mínimos (s.m.). A pesquisa levou à seguinte equação ŷ = −1,2 + 0,4x, onde ŷ representa a despesa mensal estimada com mercadorias (através do modelo) e x a renda mensal líquida expressa em salários mínimos. a. Estime a despesa mensal de uma família com renda de 15 salários mínimos; b. Um dos diretores da firma ficou intrigado com o fato da equação sugerir que uma família com renda de 3 s.m. não gaste nada em mercadorias. Qual a sua explicação; c. Explique por que a equação acima não poderia ser usada nos seguintes casos; i. Estimar despesas com mercadorias para famílias de cinco pessoas; ii. Estimar despesas com mercadorias para famílias com renda de 20 a 35 s.m. 7. Um aluno de economia se interessa em estudar a depreciação de um uma marca de computador com uma determinada configuração, veja os dados obtidos: Anos (xi) Semestres (xi) Valor (yi) Janeiro de 2001 1 4500 Julho de 2001 2 3800 Janeiro de 2002 3 2700 Julho de 2002 4 1900 Janeiro de 2003 5 1200 Junho de 2003 6 1000 Determine: a. O diagrama de dispersão; b. O coeficiente de correlação linear, e analise o grau de correlação; c. A equação da reta ajustada; d. No sétimo semestre, qual o valor do computador? Exercícios Avaliativos 8. A tabela mostrada relaciona os números x de azulejos e os custos y (em dólares) de sua ajustagem e colocação. X 1 2 3 5 6 y 5 8 11 17 20 Determine: a. O diagrama de dispersão; b. O coeficiente de correlação linear, e analise o grau de correlação; c. A equação da reta ajustada; 103 d. Para x = 4, ache yˆ , o valor predito de y. 9. Dados sobre os gastos com publicidade (US$ 1.000) e faturamento (US$ 1.000) para o Four Seasons Restaurant são apresentados a seguir. Determine: a. O diagrama de dispersão; b. O coeficiente de correlação linear, e analise o grau de correlação; c. A equação da reta ajustada; d. Sabendo que os gastos com publicidade foi de US$ 7.000,00. Quanto espera-se ganhar o Four Seasons Restaurant? 10. Certa empresa, estudando a variação da demanda de seu produto em relação à variação de preço de venda, obteve a tabela: Preço em reais (xi) 18 22 30 36 39 43 50 Demanda (yi) 150 125 97 70 56 46 38 a. Esboce o diagrama de dispersão; b. Determine o coeficiente de correlação; c. Estabeleça a equação da reta ajustada; d. Estime a demanda para o preço de R$ 40,00; 11. A tabela apresenta dados de amostra referentes ao número de horas de estudo fora de classe para determinados alunos de um curso de estatística, bem como os graus obtidos em um exame aplicado no fim do curso. Horas de estudo (x) 20 16 34 23 27 32 18 22 Grau no exame (y) 64 61 84 70 88 92 72 77 a. Esboce o diagrama de dispersão; b. Determine o coeficiente de correlação; c. Determine a função da reta de regressão linear; d. Estimar o grau no exame obtido por um estudante que dedicou 30 horas fora de classe. Gastos com publicidade(xi) 1 2 4 6 10 14 20 Faturamento(yi) 19 32 44 40 52 53 54 104 12. Os dados emparelhados que se seguem consistem no perímetro torácico (em polegadas) e dos pesos (em libras) de uma amostra de ursos machos. Tórax (x) 26 45 54 49 41 49 44 19 Peso (y) 90 344 416 348 262 360 332 34 a. Esboce o diagrama de dispersão; b. Determine o coeficiente de correlação; c. Determine a função da reta de regressão linear; d. Para um urso com perímetro torácico de 52 in, ache yˆ , o peso predito. 13. Os dados seguintes foram obtidos da altura (polegadas) e do peso (libras) de mulheres nadadoras. Altura 68 64 62 65 66 Peso 132 108 102 115 128 a. Esboce o diagrama de dispersão; b. Determine o coeficiente de correlação; c. Determine a equação da reta de regressão linear; d. Estimar o peso de uma mulher, que possui 67 polegadas. 14. Os dados a seguir são a média das notas x e salários mensais y de estudantes que obtiveram bacharelado em administração com ênfase em sistemas de informação. Média das Notas 2,6 3,4 3,6 3,2 3,5 2,9 Salário Mensal (US$) 2800 3100 3500 3000 3400 3100 a. Esboce o diagrama de dispersão; b. Determine o coeficiente de correlação; c. Determine a equação da reta de regressão linear; d. Supondo que a nota de um estudante de bacharelado em administração com ênfase em sistemas de informação seja 8,0. Estime qual será seu salário mensal. 15. Um gerente de vendas reuniu os seguintes dados considerando os anos de experiência e as vendas anuais. Anos de experiência 1 3 4 4 6 8 10 10 11 13 Vendas anuais (US$1.000) 80 97 92 102 103 111 119 123 117 136 a) Esboce o diagrama de dispersão; b) Determine o coeficiente de correlação; c) Determine a equação da reta de regressão linear; d) Estimar as vendas anuais, supondo que um vendedor tenha nove anos de experiência. 16. A tabela abaixo relata os custos de manutenção por hora, classificados por idade de máquina em meses. 105 Idade (meses) 6 15 24 33 42 Custos médios (R$) 9,7 16,5 19,3 19,2 26,9 a) Esboce o diagrama de dispersão; b) Determine o coeficiente de correlação; c) Determinar equação da reta dos custos sobre a idade; d) Faça uma previsão de custo para uma máquina de 45 meses. 17. Os dados seguintes mostram o gasto com mídia (milhões de dólares) e as vendas de caixas (milhões) para sete grandes marcas de refrigerantes. Marca Gastos com mídia (US$) Vendas de caixas (US$) Coca-Cola 131,3 1929,2 Pepsi-Cola 92,4 1384,6 Coca-Cola Light 60,4 811,4 Sprite 55,7 541,5 Dr. Pepper 40,2 536,9 Mountain Dew 29,0 535,6 7- Up 11,6 219,5 Fonte: Superbrands ’98, 20 de outubro de 1997 b) Determine o coeficiente de correlação; c) Determine a função da reta de regressão linear; d) Estimar as vendas, sabendo que foi gasto 80 milhões de dólares com mídia. 18. Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0 Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1 (a) Construa o diagrama de dispersão para esses dados. (b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa reta pode ser útil na avaliação do instrumento? (c) Calcule o coeficiente de correlação entre as variáveis X e Y. (d) Obtenha a reta de regressão da variável Y em função de X. (e) Com base nos itens anteriores tire conclusões sobre a eficiência do instrumento. 106 19. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y). Massa muscular (Y) Idade (X) 82.0 71.0 91.0 64.0 100.0 43.0 68.0 67.0 87.0 56.0 73.0 73.0 78.0 68.0 80.0 56.0 65.0 76.0 84.0 65.0 116.0 45.0 76.0 58.0 97.0 45.0 100.0 53.0 105.0 49.0 77.0 78.0 73.0 73.0 78.0 68.0 (a) Construa o diagrama de dispersão e interprete-o. (b) Calcule o coeficiente de correlação linear entre X e Y. (c) Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular (dependente) e X: idade (independente). (d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos. 107 20. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias. Renda Familiar (X) Gasto com Alimentação (Y) 3 1,5 5 2,0 10 6,0 10 7,0 20 10,0 20 12,0 20 15,0 30 8,0 40 10,0 50 20,0 60 20,0 70 25,0 70 30,0 80 25,0 100 40,0 100 35,0 100 40,0 120 30,0 120 40,0 140 40,0 150 50,0 180 40,0 180 50,0 200 60,0 200 50,0 (a) Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X). (b) Calcular o coeficiente de correlação entre essas variáveis. (c) Obtenha a equação de regressão do gasto com alimentação em função da renda familiar. (d) Qual o significado prático do valor da inclinação da reta de regressão do item (c)? 108 Bibliografia CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. 2005. MEDEIROS, Ermes da Silva Et al. Estatística 1 - Para Os Cursos De: Economia, Administração E Ciências Contábeis. São Paulo: Atlas, 2006 BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5ª edição. Editora Saraiva, 2002. TRIOLA, Mário. Introdução a Estatística. Editora LTC. 9ª edição. 2005. LARSON, Ron e FARBER, Betsy. Estatística Aplicada. 2ª edição, Ed. Pearson-Prentice hall, São Paulo, 2007. FREUND, John e SIMON, Freund. Estatística Aplicada - Economia, Administração e Contabilidade. Editora Bookman. 9ª edição. 2002. LEVIN Jack, e FOX, James A. Estatística para Ciências Sociais, 9ª Edição. São Paulo. Pearson Prentice Hall, 2008. Laponi, J. C. , Estatística Usando Excel, 4ª Edição, Editora Campus, RJ, 2005. . 2 Conteúdo 1 A natureza da estatística 2 População, amostra e amostragem 3 Representação gráfica de séries estatísticas 4 Distribuição de freqüência 5 Medidas de posição 6 Medidas de dispersão 7 Medidas de assimetria e curtose 8 Números índices 9 Probabilidade 10 Correlação e regressão linear simples 3 CAPÍTULO 1 A NATUREZA DA ESTATÍSTICA A Estatística é a parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.    É uma ferramenta adequada para descrever os acontecimentos e tirar conclusões sobre os dados coletados nas observações; Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem; Um instrumento fundamental para o estudo quantitativo e qualitativo dos fenômenos aleatórios e coletivos, quaisquer que sejam seus campos de observação. O significado da palavra Estatística – Um conjunto de dados numéricos relativos a uma categoria de fatos, agrupados de forma que possam ser analisados. 1. PANORAMA HISTÓRICO Todas as ciências têm suas raízes na história do homem. A Matemática, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico. A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras aos povos, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de “estatísticas”. Envolviam aspectos quantitativos e qualitativos que eram de interesse do Estado, relativos á necessidade de tomada de decisão face à realidade dos fatos registrados (tais como reservas de alimentos, disponibilidade de armamentos e homens para a realização de um cerco ou resistência ao sítio que fosse imposto, por exemplo). Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tabelas e os primeiros números relativos. Nesta época o registro quantitativo - qualitativo dos dados se desprendeu do caráter de atendimento ao controle do Estado, para aplicar-se a campos particulares de conhecimento; No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente cientifica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes desse todo (amostra). mas não ao outro (grupo de controle). por fim. associadas com programas adequados de computação. Através de sondagem. dirigir e controlar a empresa. constituem valiosos instrumentos na administração. OBJETIVOS   Conjunto de processos que têm por objetivo a observação. incluindo as estatais e governamentais. Tudo isso que se planejou. podemos conhecer a realidade geográfica e social. e verificar então se os resultados nos dois grupos são diferentes.1. médio ou longo prazos. que pode ser resumido. documentado para evitar esquecimentos. e dar o remédio a um grupo (grupo experimental). tanto em relação aos padrões típicos como à variação esperada.  Estatística na administração pública – Produto Interno Bruto (PIB) e o índice de Preço ao Consumidor (IPC).  Lançamento de um novo produto no mercado – Pesquisa de mercado para conhecer as preferências dos consumidores no mercado de interesse. fazer inferências (tendências) sobre toda a população. de que forma para definirmos os locais estratégicos para investir em equipamento e pessoal. humanos e financeiros disponíveis. . A ESTATÍSTICA NAS EMPRESAS 2. a indução das leis a que eles obedecem. animais ou acontecimentos que pretendemos estudar.4 2. para um controle eficiente do trabalho. que facilitarão a compreensão visual dos cálculos matemático-estatístico que lhes deram origem. da energia e do material e. com auxilio da Estatística. como também na seleção e organização da estratégia a ser adotada no empreendimento e.  Auditoria nos livros de uma empresa para se certificar de que os lançamentos refletem efetivamente a situação financeira da companhia – Verifica uma amostra de documentos escolhidos aleatoriamente e. onde. de qualquer tipo. precisa ficar registrado. O esquema do planejamento é o plano. com base nessa amostra. exige de seu administrador a importante tarefa de tomar decisões. APLICAÇÕES: As técnicas estatísticas. ainda. 2. Descrever adequadamente todos os grandes grupos de pessoas. A direção de uma empresa. ainda. por meio de coleta de dados. seus objetivos com maior possibilidade de serem alcançados a curto. os recursos naturais.  Experiências para garantir que um novo remédio lançado no mercado é seguro e eficiente – Testar um remédio consiste em tomar dois grupos tão semelhantes quando possível.  Consultoria a um órgão de trânsito sobre a viabilidade e eficiência da instalação de controladores de velocidade em pontos estratégico da cidade – Análise do registro de ocorrências definindo quando. a fim de garantir o bom uso do tempo. em tabelas e gráficos. a classificação e a análise dos fenômenos coletivos (ou de massa) e. A Estatística ajudará em tal trabalho. e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar. e estabelecer suas metas. na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas.2. as expectativas da comunidade sobre a empresa. Dos métodos científicos podemos destacar o método experimental e o estatístico.  Como predizer taxas de ocorrência de eventos aleatórios.1. tabelas. 3. O processo de generalização está associado a uma margem de incerteza devido ao fato de que a conclusão baseia-se em uma parcela do total de observações. . no resultado final. 4. Por que um administrador deve estudar ESTATÍSTICA? Para através de técnicas específicas ser capaz de saber:  Como extrair informações significativas de pilhas de dados brutos. Na impossibilidade de manter as causas constantes. Aplicado no estudo da Física.1.5 2. As causas não são fixas. Todas as causas variam. menos uma. caso existam.1.2. animais ou acontecimentos que pretendemos estudar. organizar e interpretar de uma maneira eficaz um conjunto de dados de um fenômeno pesquisado.1. Método Científico – Ordem seguida na investigação. a partir da análise e interpretação dos dados. admite todas essas causas presentes variandoas. gráficos que permitam descrever resumidamente os fenômenos. seria necessária a fixação do nível geral dos preços das outras necessidades e outros fatores. ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL 3. Maneira de ordenar a ação segundo certos princípios. Método Experimental Consiste em manter constantes todas as causas (fatores). registrando essas variações e procurando determinar. tanto em relação aos padrões típicos como a variação esperada. ESTATÍSTICA INFERENCIAL OU INDUTIVA Consiste em obter e generalizar conclusões. 4. Utiliza de rol. fórmulas para cálculos.2. Ou seja. o gosto dos consumidores não é constante. ESTATÍSTICA DESCRITIVA É a parte da estatística que nos permite coletar. Método Estatístico Aplicamos o método estatístico quando precisamos estudar fenômenos que se refere a um conjunto onde suas características próprias estão sujeitas a condições peculiares e complexas. 4. na persecução de quaisquer fatos. 3. Permite-nos descrever adequadamente todos os grandes grupos de pessoas. no estudo. da Química etc. MÉTODO É um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.2. que influência cabem a cada uma delas.1. Exemplo: Determinação das causas que definem o preço de uma mercadoria.  Como entender e interpretar cálculos estatísticos efetuados por outras pessoas. no momento da pesquisa. influenciados por vários fatores. inferir propriedades para o todo (população) com base na parte (amostra). 4.  Como analisar tendência sobre a natureza de uma população com base em observações de uma amostra dela extraída. e variar esta causa de modo que o pesquisador possa descobrir seus efeitos.1. Não existe uma uniformidade dos salários.  Número médio de pessoas que compõe cada família. ele deverá formular o problema com base em sua própria experiência. qualquer que seja a modalidade de coleta dos dados. . O planejamento pode ser dividido em: censitário que é utilizado quando a contagem for completa. Essas etapas ou operações são chamadas fases do trabalho estatístico. Além de considerar minuciosamente o problema objeto do estudo. em especial. Uma lista de fatores relevantes deverá resultar dessa investigação preliminar:  Número de unidades consumidas por família em cada ano. poderia estar interessado em um estudo sobre as características dos consumidores atuais. na fase do planejamento a preocupação maior reside na escolha das perguntas. existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do estudo. o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos. Mais especificamente. 5. Exemplo: Um fabricante de sabonete. 5. ser encontrada nesses últimos.  Que dados deverão ser obtidos?  Como obtê-los?  O que será pesquisado?  Quem participará da pesquisa? (Critérios de inclusão e exclusão)  Em que setor geográfico será feita a pesquisa?  Qual o grau de precisão exigido na pesquisa?  Qual o tipo de amostragem?  Qual o tamanho da amostra?  Quais materiais serão necessários para realizar a pesquisa?  Qual o tempo disponível para fazer a pesquisa?  Qual o custo previsto?  Qual a verba destinada ao projeto? Etc. bem como sua correta formulação. FASES DO MÉTODO ESTATÍSTICO Quando se pretende um estudo estatístico completo. Saber exatamente o que se pretende pesquisar é o mesmo que definir corretamente o problema. após a definição do problema.  Número de membros adultos da família.2 Planejamento O passo seguinte. as marcas preferidas e assim por diante. tendo em vista o objetivo que se pretende atingir.6 5. ou por amostragem quando for parcial.1 Definição do Problema A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado. compreende a fase do planejamento. uma vez que parte da informação de que necessita pode. É preciso planejar o trabalho a ser realizado. que deseja lançar um produto novo no mercado. que consiste em determinar o procedimento necessário para resolver o problema e. Amostragem → opinião dos eleitores sobre o presidente. muitas vezes. Não havendo estudos semelhantes. como levantar informações sobre o assunto objeto do estudo. Exemplos: Censitário → levantamento do IBGE. b. Pode ser manual ou eletrônica.quando feita continuamente.7 Análise dos resultados O objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra).3 Coleta de Dados Após planejamento e análise do que se quer pesquisar. casamentos e óbitos. Pode ser direta e indireta: A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos. como os censos. É externa quando visa às causas dos erros por parte do informante. tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. . eles devem ser cuidadosamente criticados. É classificada em: a. quando os dados são coletados pelo próprio pesquisador através de questionários. 5. a fim de não incorremos em erros grosseiros. podemos citar a pesquisa sobre a mortalidade infantil.7 5. Como exemplo. 5. Periódica . damos inicio à coleta dos dados numéricos necessários à sua descrição. a fim de atender a conjuntura ou a uma emergência. Ocasional . elementos pertinentes aos prontuários dos alunos de uma escola.6 Exposição ou apresentação dos dados. como é o caso do censo demográfico etc. importação e exportação de mercadorias). que é feita através de dados colhidos por outra coleta direta. por distração ou má interpretação das perguntas que lhe foram feitas. Contínua (registro) .quanto feita em intervalos constante de tempo. como no caso de epidemias que assolam ou dizimam rebanhos inteiros. á procura de possíveis falhas e imperfeições. 5. A coleta é indireta quando é inferida de elementos conhecidos (direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos). que possam influir sensivelmente nos resultados. c. O que estatística? 2.quanto feita extemporaneamente.4 Crítica de Dados Obtidos os dados. APRESENTAMOS O DIAGRAMA DA ESTATÍSTICA DESCRITIVA Organização ou critica de dados Tabulação dos dados Apresentação dos dados Tabela Análise Gráfico Coleta De dados QUESTÕES 1.5 Apuração dos dados Soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. 5. é interna quando visa observar os elementos originais dos dados da coleta. Diferencie Estatística Descritiva de Estatística Inferencial. 8 CAPÍTULO 2 POPULAÇÃO. Exemplos: (a) A população constituída por todos os parafusos produzidos em uma fábrica em um dia. Através da análise dessa amostra.é o conjunto de elementos retirados da população. Exemplo: A população constituída de todos os resultados (cara e coroa) em sucessivos lances de uma moeda. coisas. Pretende-se. (b) Nascimento de crianças em um dia em Manaus.1. obter uma estimativa do número de compradores na População.2." Estudos de mercado O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar louça. População: Amostra: Problema: Conjunto de todos os agregados familiares do País. inquiridos pela empresa. POPULAÇÃO E AMOSTRA 1. A população pode ser: i. dos inquiridos sobre a compra do novo produto. a partir da percentagem de respostas afirmativas. 1. População . ii.é o conjunto de elementos (pessoas. objetos) que têm em comum uma característica em estudo. Finita: quando apresenta um número limitado de indivíduos. estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. . uma empresa especialista em estudos de mercado é encarregada de "estimar" a percentagem de potenciais de compradores desse produto. Infinita: quando o número de observações for infinito. Amostra . Exemplo 1: "Os campos de aplicação da Estatística são muitos e os mais variados. suficientemente representativos Eis alguns exemplos: dessa população. AMOSTRA E AMOSTRAGEM 1. Conjunto de alguns agregados familiares. Os alunos foram separados em dois grupos para se aplicarem as duas técnicas em confronto. . segundo dizem. Amostra: conjunto de alunos de algumas escolas selecionadas para este estudo. utilizando o mesmo processo. Amostra: Conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos. decidir qual a técnica melhor. Problema: do estudo da amostra. administrando-se o novo medicamento a 10 desses doentes escolhidos ao acaso e o medicamento habitual aos restantes. Exemplo 4: "Os campos de aplicação da Estatística são muitos e os mais variados. "Os campos de aplicação da Estatística são muitos e os mais variados. É selecionado um grupo de 20 doentes." Controle de Qualidade O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor. Conjunto dos 20 doentes selecionados. sem saber ler." Medicina Pretende-se estudar o efeito de um novo medicamento para curar determinada doença. a partir da percentagem de parafusos defeituosos presentes na amostra." Pedagogia Um conjunto de pedagogos desenvolveu uma técnica nova para a aprendizagem da leitura. a qual. realizar um "teste de hipóteses" para tomar uma decisão sobre qual dos medicamentos é melhor. "estimar" a percentagem de defeituosos em toda a produção. na escola primária. a partir do qual determinada encomenda poderia ser rejeitada.9 Exemplo 2: "Os campos de aplicação da Estatística são muitos e os mais variados. População: conjunto de todos os alunos que entram para a escola primária. População: Conjunto de todos os parafusos fabricados ou a fabricar pela fábrica. Problema: Pretende-se. População: Amostra: Problema: Exemplo 3: Conjunto de todos os doentes com a doença que o medicamento a estudar pretende tratar. Pretende-se. encurta o tempo de aprendizagem relativamente ao método tradicional. a partir dos resultados obtidos. 10 Outros exemplos. a. b. c. População: Todos os eleitores do estado do Amazonas. Amostra: 3.000 eleitores entrevistados em uma pesquisa de opinião. População: Todos os livros e lançamento anual de uma grande firma. Amostra: Livros e lançamentos escolhidos aleatoriamente para auditoria. População: Produtos de um fornecedor a serem embarcados. Amostra: Inspeção de algumas peças de item escolhido aleatoriamente. Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo. 2. AMOSTRAGEM 2.1. Amostragem Aleatória Simples Este tipo de amostra é equivalente a um sorteio lotérico. Exemplo: Vamos obter uma amostra representativa para pesquisa da estatura de noventa alunos de uma escola: a. Numeramos os alunos de 01 a 90 (numera-se a população). b. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população. Quando o número de elementos da amostra é grande, utilizamos a Tabela de Números Aleatórios, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo. 2.2. Amostragem proporcional estratificada Muitas vezes a população se divide em sub-populações – estratos. Exemplo: Supondo, que em uma sala de aula com noventa alunos, sendo que 54 são meninos e 36 são meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: SEXO M F Total POPULAÇÃO 54 36 90 10% AMOSTRA 5 4 9 54  10 = 5,4 100 36  10 = 3,6 100 90  10 = 9,0 100 11 2.3. Amostragem sistemática Quando os elementos da população já se acham ordenados, não há a necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Esta amostragem é semelhante à aleatória simples, mas a listagem é ordenada. Devemos seguir os seguintes passos:  Divide-se o tamanho da população (N) pelo tamanho da amostra (n), obtendo um intervalo de retirada (k).  sorteia-se o ponto de partida.  a cada k elementos retira-se uma para amostra. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer à amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exemplo: Suponhamos uma rua com 450 casas, das quais desejamos obter uma amostra formada por 25 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: 1º Passo: como 450/25 = 18, portanto o intervalo é 18. 2º Passo: escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; 3º Passo: os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc. 3. TIPO DE VARIÁVEIS Variáveis podem ser classificadas da seguinte forma: 3.1. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. 3.1.1. Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. 3.1.2. Variáveis contínuas, características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. 12 3.2. Variáveis Qualitativas (ou categóricas): são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. 3.2.1. Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. 3.2.2. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). Outros exemplos: O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser quantitativa! Exemplo dos ursos marrons (continuação): No conjunto de dados ursos marrons, são qualitativas as variáveis sexo (nominal) e mês da observação (ordinal); são quantitativas contínuas as demais: idade, comprimento da cabeça, largura da cabeça, perímetro do pescoço, perímetro do tórax, altura e peso. EXERCÍCIO 1) Amostragem estratificada. Em uma fábrica existem 180 funcionários, sendo: 8 no financeiro; 6 no fiscal; 4 no RH; 7 no CPD; 9 na Manutenção; 46 na Embalagem; 80 na Produção; 20 na Expedição. Crie uma tabela que obtenha uma amostra de 80 funcionários. 2) Amostragem estratificada. O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, deseja conhecer as condições de vida extra-escolar de seus alunos e não dispõe de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para este diretor, os elementos componentes da amostra. 3) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n 1= 40, n2 = 100 e n3 = 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da amostra foram retirados do 3º estrato, determine o número de elementos da amostra. 4) Tenho 80 lâmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lâmpadas, a partir da amostragem sistemática? 5) De uma população de 480 elementos ordenados, retire uma amostra sistemática de tamanho 20. 6) Deseja-se retirar uma amostra sistemática de 10 unidades de uma população de tamanho 890. bibliotecas da cidade de São Paulo. h. Da População. i. salários. produção de algodão. g. estuda-se a variável. e. sexo dos filhos.13 7) Classifique as variáveis em qualitativas(nominal ou ordinal) ou quantitativas (contínuas ou discretas): a. Da População. c. número de ações negociadas. propriedades agrícolas do Brasil. pregos produzidos por uma máquina. . comprimento. Da População. número de defeitos por unidade. f. d. estuda-se a variável. Da População. estuda-se a variável. estuda-se a variável. aparelhos produzidos em uma linha de montagem. Da População. Bolsa de Valores de São Paulo. cor de olhos. estuda-se a variável. Da População. Da População. comprimento. Da População. funcionários de uma empresa. estuda-se a variável. j. estação meteorológica de uma cidade. Da População. Da População. estuda-se a variável. estuda-se a variável. estuda-se a variável. casais residentes em uma cidade. segmento de reta. durante um ano. alunos de uma cidade estuda-se a variável. b. número de volumes. precipitação pluviométrica. 14 Tabela de Números Aleatórios . título – conjunto de informações. o um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor.535 1998 1999 2. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas. Quando?. linhas – retas imaginárias que facilitam a leitura.122 2001 3. o três pontos ( . as notas e as chamadas. casa ou célula – espaço destinado a um só número. de preferência. Uma tabela compõe-se de: a. as mais completas possíveis. TÍTULO CABEÇALHO CASA OU CÉLULA LINHAS CORPO RODAPÉ COLUNA INDICADORA COLUNA NUMÉRICA De acordo com a Resolução 886 do IBGE.665 2000 2.. no sentido horizontal. de dados que inscrevem nos seus cruzamentos com as colunas. .. localizado no topo da tabela.007 FONTE: IBGE. Há ainda a considerar os elementos complementares da tabela. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. c. b. respondendo às perguntas: O quê?. ) quando não temos os dados. Onde?.1998-02 PRODUÇÃO ANOS (1.15 CAPÍTULO 3 REPRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICAS 1 TABELAS É um quadro que resume um conjunto de observações. no seu rodapé.750 2002 2.000 t) 2. coluna indicadora – parte da tabela que especifica o conteúdo das linhas. d.) quando o valor é zero. o zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. que são a fonte. colocados. f. e. nas casas ou células da tabela devemos colocar: o um traço horizontal ( . corpo – conjunto de linhas e colunas que contêm informações sobre variável em estudo. Exemplo: PRODUÇÃO DE CAFÉ BRASIL . cronológicas.599 1. Exemplo: PRODUÇÃO DE FERTILIZANTES FOSFATADOS – BRASIL 1996-00 ANOS 1996 1997 1998 1999 2000 QUANTIDADE (t) 3.373. Exemplo: REBANHOS BRASILEIROS .2001 REGIÃO Norte Nordeste Sudeste Sul Centro-Oeste FONTE: IBGE QUANTIDADE (1.115 4.463 485. espaciais.810 937.813 FONTE: Associação Nacional para Difusão de Adubos e Corretivos Agrícolas.304 1. discriminados segundo regiões.448.1 Séries históricas.313 909 . em determinado local.570. 2.226 4.000 dúzias) 139.2001 ESPÉCIE Bovinos Bufalinos Eqüinos Asininos Muares Suínos Ovinos Caprinos Coelhos FONTE: IBGE QUANTIDADE (1.3 Séries específicas ou categóricas Descrevem os valores da variável. temporais ou marchas Descrevem os valores da variável. em determinado tempo e local.000 dúzias) 66. Exemplo: PRODUÇÃO DE OVOS DE GALINHA NO BRASIL .984 32. discriminados segundo intervalos de tempo variáveis.181 5.468 2. discriminados segundo especificações ou categorias.201 5.098 118.024. do local ou da espécie.121 20.16 2 SÉRIES ESTATÍSTICAS Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época.855 1. territoriais ou de localização Descrevem os valores da variável. em determinado instante.092 356.085 11.835 4.504. 2.2 Séries geográficas. 17 2.4 SÉRIES CONJUGADAS TABELA DE DUPLA ENTRADA Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Exemplo: REGIÃO Norte Nordeste Sudeste Sul Centro-Oeste Total Fonte: IBGE TELEFONES INSTALADOS - 1999-2001 1999 2000 373.312 403.712 1.440.531 1.567.006 8.435.308 8.892.409 2.106.145 2.192.762 803.013 849.401 13.158.309 13.905.290 2001 457.741 1.700.467 8.673.660 2.283.581 944.075 14.059.524 A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal. EXERCÍCIOS 1) Classifique as séries estatísticas: a) PRODUÇÃO DE BORRACHA NATURAL – 1991-93 ANOS TONELADAS 29.543 30.712 40.663 b) AVICULTURA BRASILEIRA 1992 ESPÉCIES Galinhas Galos, frangos, frangas e pintos Codornas FONTE: IBGE NÚMERO (1.000 cabeças) 204.160 435.465 2.488 1991 1992 1993 FONTE: IBGE c) EXPORTAÇÃO BRASILEIRA 1985-1990-1995 1985 1990 IMPORTADORES % % América Latina 13,0 13,4 EUA e Canadá 28,2 26,3 Europa 33,9 35,2 Ásia e Oceania 10,9 17,7 África e Oriente Médio 14,0 8,8 Fonte: MIC e SECEX 1995 % 25,6 22,2 20,7 15,4 5,5 2) Verificou-se, em 1993, o seguinte movimento de importação de mercadorias: 14.839.804 t, oriundas da Arábia Saudita, no valor de US$ 1.469.104.000; 10.547.889 t, dos Estados Unidos, no valor de US$ 6.034.946.000; e 561.024 t, do Japão, no valor de US$ 1.518.843.000. Confeccione a série correspondente e classifique-a, sabendo que os dados acima foram fornecidos pelo ministério da fazenda. 17 3 Gráficos Estatísticos A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos, permitindo que se chegue a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados, quando da elaboração de um gráfico. Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros. Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo. Diretrizes para a construção de um gráfico:        O título do gráfico deve ser o mais claro e completo possível. Quando necessário, deve-se acrescentar subtítulos; A orientação geral dos gráficos deve ser da esquerda para a direita; As quantidades devem ser representadas por grandezas lineares; Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0 (zero); Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar do leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame do gráfico; A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo para cima; Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam facilmente lidos, partindo da margem horizontal inferior ou da margem esquerda. Leitura e interpretação de um gráfico:      Declarar qual o fenômeno ou fenômenos representados, a região considerada, o período de tempo, a fonte dos dados, etc.; Examinar o tipo de gráfico escolhido, verificar se é o mais adequado, criticar a sua execução, no conjunto e nos detalhes; Analisar cada fenômeno separadamente, fazendo notar os pontos mais em evidência, o máximo e o mínimo, assim como as mudanças mais bruscas; Investigar se há uma “tendência geral” crescente ou decrescente ou, então, se o fato exposto é estacionário; Procurar descobrir a existência de possíveis ciclos periódicos, qual o período aproximado, etc. 18 Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas. 3.1 Diagramas São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser: Gráficos em linhas ou lineares. É um dos mais importantes gráficos; representa observações feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas séries históricas. Exemplo: Vendas de televisões de tubo em R$ 1000,00 nos anos de 2001 a 2007 da empresa LL da Amazônia Ltda, localizadas em Manaus. Vendas de TV da Empresa LL - Manaus Mil Reais 500 400 300 200 100 0 2001 2002 2003 2004 2005 2006 2007 Fonte: Fictícia Gráficos em Barras (ou em colunas). É a representação de uma série por meio de retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas).  Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados.  Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Se as legendas não são breves usa-se de preferência o gráfico em barras na horizontal. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. Exemplo: População urbana do Brasil por região de 1940 a 1980 (x 1000) . em um mesmo sistema de coordenadas. a variação de dois fenômenos. População Brasileira em Milhões 100 80 60 40 20 0 1940 Fonte: Fictícia 1950 1960 1970 Gráficos em colunas superpostas.19 Exemplo: População Brasileira nas décadas de 40 a 70 em milhões. Quando representamos. a parte interna da figura formada pelos gráficos desse fenômeno é denominada de área de excesso. quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas. Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 06 Superior 3.286 62. sete dados.681 29. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O total é representado pelo círculo.90 Médio 11. Este gráfico é construído com base em um círculo.201 100.º DE ALUNOS % Alfabetização 25. O gráfico em setores só deve ser empregado quando há. e é empregado sempre que desejamos ressaltar a participação do dado no total.20 Gráficos em setores.234 8.00 Fonte Fictícia Representação em barras Representação em setores .04 Total 40. Exemplo: Representar a série em gráficos de barras e gráfico de setor: Matrículas nos cursos da Cidade A 2009 CATEGORIA N. que fica dividido em tantos setores quantas são as partes. Obs: As séries temporais geralmente não são representadas por este tipo de gráfico. no máximo. 00) 12 13 14 12 15 19 17 18 14 16 12 18 Movimento Mensal de Compras de uma agência em 2006 Fonte: Dados Fictícios. séries que apresentam em seu desenvolvimento determinada periodicidade. . a variação da precipitação pluviométrica ao longo do ano. Meses Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Fonte: dados Fictícios Valores (R$ 1. ou da temperatura ao longo do dia. por exemplo. etc. Exemplo: Movimento Mensal de Compras de uma agência em 2006. isto é.000. em mil reais. o consumo de energia elétrica durante o mês ou o ano. como.21 Gráfico Polar É o gráfico ideal para representar séries temporais cíclicas. 3 Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. Veja o exemplo abaixo: . Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo. Os símbolos devem ser auto-explicativos. 3. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. e não de detalhes minuciosos. São usados nas representações gráficas das tabelas de dupla entrada. pois sua forma é atraente e sugestiva. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno.22 3.2 Estereogramas: São gráficos geométricos dispostos em três dimensões. pois representam volume. O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.23 3. Exemplo: População da Região Sul do Brasil – 1990 População da Região Sul do Brasil – 1990 Densidade populacional da Região Sul do Brasil .4 Cartogramas: São ilustrações relativas a cartas geográficas (mapas). 1 69.317 RIO GRANDE 84.293 1990 168.295 68.25 18.3 39.5 4) Escolha o melhor tipo de gráfico para representar os vários tipos de séries.844 PORTO ALEGRE 615.184 1991 165. Comércio e Turismo.059 1993 182.76 18.701 FONTE: Minstério da Saúde.666 58.86 c) IMUNIZAÇÕES . . d) COMÉRCIO EXTERIOR BRASIL .1 59.1988/1993 Anos Exportação Importação 1988 169.28 10.033 57.1 53.561 77. No de Transplantes DF 34 BA 38 ES 56 PE 56 CE 87 PR 181 RJ 181 MG 231 SP 756 FONTE: Assoc.1 65.095 57. Estados b) Área Terrestre do Brasil REGIÃO NORTE NORDESTE SUDESTE SUL CENTRO-OESTE FONTE: IBGE PERCENTUAL 45.997 SANTA MARIA 107.92 ANOS 1987 1988 1989 1990 1991 1992 FONTE: Agropalma QUANTIDADE (1.1997 MUNICÍPIO DOSES APLICADAS ERECHIM 51.24 EXERCÍCIOS 3) Faça a representação em linha dos dados contidos na série abaixo: PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ 1987.085 1989 177.278 1992 167.000 t) 39.DOSES APLICADAS POR MUNICÍPIO . a) Os dez Estados que fizeram maior número de Transplantes de rim em 98.813 FONTE: Ministério da Indústria.215 NOVO HAMBURGO 110.974 63.85 6. Brasileira de Transplante de Órgãos. 3 9. 78.7 Agosto 323. 8) Faça a representação gráfica em polar da série a seguir.8 Setembro 39.em milhões de km.9 4.8 9.7 Maio 418. 7) Estabelecimentos de ensino da região norte do Brasil em 1982.1 Novembro 83. classifique e faça uma representação gráfica. segundo o MEC.2 9) ENADE – 2006. Acre. em 1986 ocorreram.8 2.1999 Meses Precipitação (mm) Janeiro 174. respectivamente.887 – 20.473 – 23.564.9 Março 83.4 Julho 538.1 Junho 418.6 gramas de álcool por litro de sangue.5 6. O gráfico abaixo mostra o processo de absorção e eliminação do álcool quando um indivíduo bebe. Faça uma tabela para apresentar esses dados.473 – 21. são: 19.9 Abril 462.8 Fevereiro 36.9 3. 13.8 4.567 – 21. Faça uma tabela para apresentar esses dados. classifique e faça uma representação gráfica. em um curto espaço de tempo. 6) De acordo com Ministério da Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos. A região norte subdivide-se em: Rondônia. . Faça uma tabela para apresentar esses dados. classifique e faça uma representação gráfica.2 Área Atual de Florestas 0. Pará e Amapá e possuem um total de 29.598 – 22. 4.25 e) O estado das florestas do planeta e o que foi devastado pela ocupação humana .4 FONTE: World Resources Institute 5) De acordo com o IBGE (1988). assim distribuídos: 11712 pedestres. 10 e 9 estabelecimentos de ensino. 27306 casos de vítimas fatais. em acidentes de trânsito. A legislação de trânsito brasileira considera que o condutor de um veículo está dirigindo alcoolizado quando o teor alcoólico de seu sangue excede 0. de 1 a 4 latas de cerveja. Continente Oceania Ásia África Europa América do Sul América do Norte e Central Área Desmatada 0.6 6.3 2. Roraima. 7116 passageiros e 8478 condutores.5 10.7 Outubro 66. em que a fonte é fictícia: Precipitação pluviométrica de Santa Maria – RS . Amazonas.3 Dezembro 201.720 – 20. duas latas de cerveja.O álcool é absorvido pelo organismo muito mais lentamente do que é eliminado. no máximo. . apenas (B) I e II.Uma pessoa que vá dirigir imediatamente após a ingestão da bebida pode consumir. apenas (C) I e III. apenas (E) I.Se uma pessoa toma rapidamente quatro latas de cerveja. o álcool contido na bebida só é completamente eliminado após se passarem cerca de 7 horas da ingestão. apenas (D) II e III. III . II e III. I . II .26 Considere as afirmativas a seguir. Está(ão) correta(s) a(s) afirmativa(s) (A) II. Nas distribuições de freqüência. permanecendo constante o fato. local e tempo. de cada classe. A construção da distribuição de freqüência depende do tipo de dado com os quais se está lidando: contínuos ou discretos. de tal forma que se possa determinar a percentagem ou número. O histograma mostra a Pirâmide etária relativa de homens e mulheres nos anos de 1997 e 2007. É um tipo de apresentação que condensa uma coleção de dados conforme as freqüências ou repetições de seus valores. .27 CAPÍTULO 4 DISTRIBUIÇÃO DE FREQÜÊNCIA Distribuição de freqüência é uma tabela resumida na qual os dados são organizados em grupos de classe ou categorias convenientemente estabelecidas e numericamente ordenadas. em classe ou pontos. os dados são agrupados segundo um critério de magnitude. 4. DISTRIBUIÇÃO SEM INTERVALOS DE CLASSE Distriduições em que não há uma necessidade de ordenar a variável em estudo em intervalos. vejam a tabela primitiva (dados coletados sem ordenação). 2. bom. 3. 4. 2. 4. 0. 3. muito bom e ótimo. 2. Portanto podemos organizar esse dados em uma distribuição de frequencia sem intervalos de classe. 1. 1. 3. 3. 1. veja o exemplo: Exemplo 1: Na avaliação institucional do CIESA. 4. 2. 2. 4. 4. 1. 2. 4. 4. 2. ROL (ordenando os fenômenos) 0. . 2. 4. 2. 4. temos o item “auto-avaliação dos alunos” de uma determinada turma de Logística. Ruim Bom Bom Péssimo Ruim Bom Ruim Muito Bom Bom Muito Bom Muito Bom Ótimo Bom Bom Bom Muito Bom Muito Bom Ótimo Muito Bom Muito Bom Muito Bom Muito Bom Muito Bom Muito Bom Bom Ótimo Bom Bom Muito Bom Ótimo Ótimo Ótimo Podemos organizar esses dados (rol): Péssimo Bom Ruim Bom Ruim Bom Ruim Bom Com esses dados podemos construir uma distribuição de freqüência sem intervalos de classe: Conceito Péssimo Ruim Bom Muito Bom Ótimo Número de alunos 1 3 7 6 3 20 Exemplo 2: Número de Partos Produzidos em uma maternidade. 4. 3. 4. 1. 2 . 4. 4. 1. 1. 2.28 1. 4. 4. 1. Número de partos 0 1 2 3 4 Total Dias 2 6 8 4 10 30 . 2. 1. 2. ruim. 1. 1. 3. 1. 2. contagem diária durante um mês: 0. 0. 3. tem as seguintes opções péssimo. Digamos que um aluno ao fazer a avaliação institucional do CIESA. 2. 4. 2. 4. 4. 4. 1 TABELA PRIMITIVA E ROL Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos. já que exige muito espaço. 1 1 1 1 1 4 3 1 Estat. A tabela obtida após a ordenação dos dados recebe o nome de rol. podemos saber. A solução é o agrupamento dos valores em vários intervalos.2 DISTRIBUIÇÃO DE FREQÜÊNCIA Denominamos freqüência o número de vezes que o elemento fica relacionado a um determinado valor da variável. com relativa facilidade. qual a menor estatura (150 cm) e qual a maior (173 2. Obtemos.29 2. cujos elementos não foram numericamente organizados. resultando a seguinte tabela de valores: TABELA 1 ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm ) 166 162 155 154 160 161 152 161 161 168 163 156 150 163 160 172 162 156 155 153 160 173 155 157 165 160 169 156 167 155 151 158 164 164 170 158 160 168 164 161 A esse tipo de tabela. DISTRIBUIÇÃO DE FREQUENCIA COM INTERVALOS DE CLASSE Distribuições em que ordenamos a variável em estudo em intervalos. 150 151 152 153 154 155 156 157 Freq. TABELA 3 Estat. 2 5 4 2 2 3 1 1 Estat. que compõem uma amostra dos alunos de um colégio A. assim. denominamos tabela primitiva. 167 168 169 170 172 173 Total Freq. 158 160 161 162 163 164 165 166 Freq. 2. Agora. 1 2 1 1 1 1 40 O processo da tabela de freqüência dado é ainda inconveniente. uma tabela que recebe o nome de distribuição de freqüência. denominado: Distribuição de freqüência com intervalos de classe: TABELA 4 ESTATURA DE 40 ALUNOS DO COLÉGIO A . TABELA 2 ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm) 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 cm). 2 LIMITES DE CLASSE Determinamos limites de classe os extremos de cada classe.º de classes k = n. Intervalos de variações da variável. inclusive. classes são intervalos de variação de variável.30 Estaturas (cm) Freqüências 150 ├─ 154 4 154 ├─ 158 9 158 ├─ 162 11 162 ├─ 166 8 166 ├─ 170 5 170 ├─ 174 3 Total 40 Assim. estaremos agrupando os valores de variável em intervalos.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA COM CLASSE Vantagens – Ganhamos em simplicidade e visualização. i = índice n. e o aberto é excluído.1 CLASSE Classe de freqüência ou. Deste modo. exclusive.. No intervalo de 150 cm (incluindo) a 154 cm ( excluindo este valor ) na Tabela 2 existem 4 alunos. 2. Desvantagens – Perdemos em pormenores (detalhes) – Os valores não aparecem individualmente.3. Classe: Agrupamento dos valores da variável em intervalos. Representamos assim 150 ├─ 154. se um dos intervalos for. Li = limite inferior Ls = limite superior . diremos que nove alunos têm estaturas entre 154. simplesmente... preferimos chamar os intervalos de classes..3. 2. Representadas simbolicamente por i.º total de classes da distribuição.3.k (onde k é o número total de classes da distribuição). por exemplo. sendo que. e 158 cm. Atenção: o sinal ├─ significa que o número onde que está fechado é incluído na contagem. 154 ├─ 158 (é um intervalo fechado à esquerda e aberto à direita. 2. Ex. em Estatística.2. sendo i = 1. 3.3 AMPLITUDE TOTAL DA AMOSTRA ( AT ) É a diferença entre o valor máximo e o valor mínimo da amostra: AT= Xmáx – Xmin Xmáx = valor máximo da amostra Xmin = valor mínimo da amostra Ex. ou seja. AT = L(máx) – L(min) L (máx ) = Limite superior da última classe L (mín) = Limite inferior da primeira classe 2.6 PONTO MÉDIO DE UMA CLASSE Ponto que divide o intervalo de classe ao meio.5 AMPLITUDE TOTAL DA DISTRIBUIÇÃO DE CLASSE (AT) É a diferença entre o limite superior da última classe (máximo) e o limite inferior da primeira classe (mínimo). 2.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA É o número de observações correspondentes a essa classe ou a esse valor. Li  Ls xi = 2 2.4 AMPLITUDE DE UM INTERVALO DE CLASSE É a medida do intervalo que define a classe hi = Ls – Li 2.3. 2. Na tabela 2 a amplitude de variação amostral é de 173 – 150 = 23 cm. é o ponto que divide o intervalo de classe de classe em duas partes iguais.3.  fi = n .3. Soma de todas as freqüências.31 Amplitude: Medida do intervalo observado da variável.3. da classe ou da amostra. 000 fac 4 13 24 32 37 40 frac 0. dar a distribuição de freqüência das estaturas dos quarentas alunos do Colégio A a seguinte representação tabular técnica: TABELA 4.925 1. agora. 100 i Freqüência acumulada (fac) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: fac = f1 + f2 + … + fk Freqüência acumulada relativa (frac) de uma classe é a freqüência acumulada da classe. fr = f fi .200 0. podemos montar a seguinte tabela com as freqüências estudadas: i 1 2 3 4 5 6 Estaturas (cm) 150 ├─ 154 154 ├─ 158 158 ├─ 162 162 ├─ 166 166 ├─ 170 170 ├─ 174 TABELA 4.275 0. Freqüência relativa (fr) são os valores das razões entre as freqüências simples de cada classe e o somatório das freqüências.100 0.600 0. f frac = ac . 100  fi Considerando a Tabela 4.125 0.100 0.1 ESTATURA DE 40 ALUNOS DO COLÉGIO A i 1 2 3 4 5 6 Estaturas (cm) 150 ├─ 154 154 ├─ 158 158 ├─ 162 162 ├─ 166 166 ├─ 170 170 ├─ 174 L(máx ) ℓ (mín) AT fi 4 9 11 8 5 3 40 174 15024 hi 4 4 4 4 4 4 xi 152 156 160 164 168 172 ℓ2 =154 L5 =170 3 TIPOS DE FREQÜÊNCIAS PARA DISTRIBUIÇÃO COM CLASSES Freqüência simples ou absoluta (fi) são os valores que realmente representam o número de dados de cada classe.800 0. freqüência total.325 0. dividida pela freqüência total da distribuição.2 fi xi 4 152 9 156 11 160 8 164 5 168 3 172 40 fr 0.225 0.075 1.000 .32 Podemos. d. 4) Determinar a amplitude do intervalo de classes. 3) Definir o nº de classes. h= 5) Determinar os limites das classes. f.3(log n). Qual amplitude da distribuição (AT)? Qual o limite inferior da 5ª classe? Qual o limite superior da 2ª classe? Qual a amplitude do 6º intervalo de classe (hi )? fi = ? Quantas salas existem com 30 alunos inclusive e 38 exclusive? Quantas salas existem com 22 alunos inclusive e 46 exclusive? Quanto por cento de salas tem entre 30 alunos inclusive e 46 exclusive? . *Neste curso usaremos somente a metodologia (1).33 ROTEIRO PARA ELABORAÇÃO DA TABELA DE FREQUÊNCIA COM CLASSE 1) Transformar os dados Brutos em rol. c. g. para definir o número de classes. 38 46 16 23 52 i 1 2 3 4 5 6 Nº de alunos ├─ 14 ├─ 22 ├─ 30 ├─ 38 ├─ 46 ├─ 54 49 9 41 20 22 26 22 20 27 49 7 8 12 48 21 41 22 51 31 33 xi 52 24 12 26 51 47 16 19 52 16 fr 46 25 30 41 29 fac frac n AT . k No de salas ( fi ) Responda: a. 7) BOM SENSO. e. 2) Encontrar a Amplitude Amostral. 6) Construir a tabela de freqüência conforme as classes. k = 1 + 3. AA. Calcule as classes e Preencha a distribuição de freqüência: Foi contado o nº de alunos por sala de aula para dimensionarmos a Escola. EXERCÍCIO 1. h. para isso podemos usar as seguintes metodologia: a) O número de classe é determinado pela raiz quadrada do número de observações*: k = b) A regra de Sturges descrita da seguinte forma. b. de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. Portanto. À distribuição da tabela 4 corresponde ao seguinte histograma. cujas bases se localizam sobre o eixo horizontal. levantadas nos pontos correspondentes aos limites superiores (Li) dos intervalos de classe. sendo as freqüências (fi) marcadas sobre perpendiculares ao eixo horizontal. à distribuição da tabela 4 corresponde ao seguinte polígono de freqüência acumulada. levantadas pelos pontos médios (xi) dos intervalos de classe. POLÍGONO DE FREQÜÊNCIA É um gráfico em linha. À distribuição da tabela 4 corresponde ao seguinte polígono de freqüência. .34 4 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO HISTOGRAMA É formado por um conjunto de retângulos justapostos. POLÍGONO DE FREQÜÊNCIA ACUMULADA É traçado marcando-se as freqüências acumuladas (fac) sobre perpendiculares ao eixo horizontal. h) O polígono de freqüência. f) Qual a porcentagem de funconários que ganham salários com valores inferiores a US$163. O conjunto de dados amostrais a seguir fornece uma lista do número de minutos que 50 assinantes da internet gastaram durante sua conexão mais recente. (b) Faça o histograma. e) Qual a porcentagem de funcionários que ganham salários com valor igual ou superior a US$179. Considere os salários quinzenais de 100 funcionários da Empresa Yasmim Ltda (em US$): 151 -152 -154 -155 -158 -159 -159 -160 -161 -161 -161 -162 -163 -163 -163 -164 -165 -165 -165 -166 -166 166 -166 -167 -167 -167 -167 -167 -168 -168 -168 -168 -168 -168 -168 -168 -168 -168 -169 -169 -169 -169 169 -169 -169 -170 -170 -170 -170 -170 -170 -170 -171 -171 -171 -171 -172 -172 -172 -173 -173 -173 -174 174 -174 -175 -175 -175 -175 -176 -176 -176 --176 -177 -177 -177 -177 -178 -178 -178 -179 -179 -180 -180 180 -180 -181 -181 -181 -182 -182 -182 -183 -184 -185 -186 --187 -188 -190 -190 Pede-se determinar: a) A amplitude amostral. uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. durante um mês. d) Construir a tabela de distribuição de freqüências com as classes. 50 41 18 40 78 29 41 56 34 17 72 59 11 56 73 7 17 77 22 7 36 44 69 39 28 30 30 21 80 62 19 56 54 23 29 67 37 33 39 51 46 31 54 31 53 42 39 44 88 20 Determine: (a) Construa uma distribuição de freqüência que tenha sete classes. b) O número de classes. por uma firmacomercial: 14 -12 -11 -13 -14 -13 -12 -14 -13 -14 -11 -12 -12 -14 -10 -13 -15 -11 -15 -13 -16 -17 -14 -14 Forme uma distribuição de freqüências sem intervalos. c) A amplitude das classes. . i) Qual o ponto médio da 3ª classe. 4. A amostra abaixo apresenta as vendas diárias de um determinado aparelho elétrico. 3. obtendo os seguintes dados: 2 -0 -0 -4 -3 -0 -0 -1 -0 -0 -1 -1 -2 -1 -1 -1 -1 -1 -1 -0 -0 -0 -3 -0 -0 -0 -2 -0 -0 -1 -1 -2 -0 -2 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -1 -0 Determinar: a) o rol. Uma empresa automobilística selecionou ao acaso. O controle de qualidade de uma indústria selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. b) a tabela de distribuição de freqüência sem intervalos. Obteve os seguintes dados: 10 -15 -25 -21 -6 -23 -15 -21 -26 -32 -9 -14 -19 -20 -32 -18 -16 -26 -24 -20 -7 -18 -17 -28 -35 -22 -19 -39 -18 -21 -15 -18 -22 -20 -25 -28 -30 1-6 -12 -20 a) Monte a tabela de distribuição de freqüência com intervalos. c) qual a porcentagem de caixas que apresentam 2 ou mais peças defeituosas? 2. b) Faça uma análise dos resultados. g) O histograma.35 EXERCÍCIO 1. 5. d) as freqüências acumuladas (relativas em percentuais). 7. 9.36 6. d) as freqüências acumuladas relativas (em percentuais). .00 (exclusive)? d) Faça o histograma. (b) O histograma. c) as freqüências acumuladas. b) Quantos funcionários tem um salário semanal situado entre R$ 120. Um administrador fez uma pesquisa de satisfação em sua empresa de um determinado item e obteve os seguintes resultados: Ruim Péssimo Bom Muito Bom Bom Bom Bom Muito Bom Ruim Ruim Bom Ruim Muito Bom Muito Bom Bom Péssimo Muito Bom Ótimo Muito Bom Bom Determine.00 (inclusive) e R$ 160. Dada as notas dos alunos da disciplina de Estatística em uma turma no CIESA: 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 Construa uma tabela e determine: a)  f i .00 (exclusive)? c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180. b) as freqüências relativas (em percentuais). b) as freqüências relativas (em percentuais). foram os seguintes: 100 104 116 120 122 126 128 128 130 134 138 140 140 146 150 150 152 156 156 156 160 160 162 162 164 170 170 176 176 176 178 180 180 184 186 186 188 190 190 192 192 194 196 196 200 216 200 218 200 210 a) Construa uma distribuição de freqüências. com h = 20 e limite inferior para a primeira classe igual a 100. Um diâmetro foi medido 30 vezes. 8. tendo sido obtidos os seguintes resultados (em milímetros): Construa uma tabela sem intervalo de classe e determine: a)  f i . Os salários semanais de 50 funcionários de um hospital.00 (inclusive) e R$ 200. (a) Uma distribuição de freqüência. em reais. o polígono de freqüência e o polígono de freqüência acumulada. c) as freqüências acumuladas. 4 8. b) Qualitativas nominal.– – (Traço) Quando o dado for nulo. foram aleatoriamente selecionadas para verificação da presença de erro ou não. (SMV) O tipo de gráfico que procura demonstrar em figuras é: a) Gráfico de setores b) Ogiva de Galton c)Gráfico Pictórico d)Cartograma e) Gráfico Polar 11. (J.A. c) Apenas III é correta. c) Quantitativas discretas.A. Resposta: a)Estão certas 1 e 3 b)Estão certas 1 e 4 c)Estão certas 2 e 3 d)Estão certas 2 e 4 e) N. 3. . c) 5 |–| 10 compreende todos os valores entre 5 e 10.D.) Marque a afirmativa correta 1-…(Três pontos).é quando se dispõe do dado. 9. a correta é : a) 5 – 10 compreende todos os valores entre 5 e 10. dentre as 120 por elas mantidas. (SMV) Os intervalos de classe podem ser apresentados de várias maneiras. e) I. A variáveis é: a) Qualitativas ordinal. III. II.– – (Traço) Quando o dado existe. exclusive os extremos. número de defeitos por unidade. 3. e) 5 –| 10 compreende todos os valores entre 5 e 10. 4.D. exclusive os extremos. inclusive o 5 e exclusive o 10. d) Apenas I e III são correta.A. dentre as situações abaixo. inclusive os extremos. 12. estuda-se a variável. d) Quantitativas contínuas. e) N. (SMV) Da população.37 QUESTÕES OBJETIVAS DOS CAPÍTULOS: 2. d) 5 |– 10 compreende todos os valores entre 5 e 10. 16 contas. b) 5 – 10 compreende todos os valores entre 5 e 10. I. A variável observada é do tipo qualitativa ordinal. A população consiste de todas as contas mantidas pela firma. 2-…(Três pontos). 10. II e III são corretas.quando não se dispuser dos dados. A amostra consiste das 16 contas selecionadas Pode-se afirmar que: a) Apenas I é correta. aparelhos produzidos em uma linha de montagem. exclusive o 5 e inclusive o 10. (SMV) Para a realização de uma auditoria em uma firma. b) Apenas II é correta. (SMV) ENADE Das regiões estudadas. dentre os jovens que são assalariados do setor privado. de funcionários 14 16 10 07 03 50 É correto afirmar que. aquela que apresenta o maior percentual de jovens com carteira assinada. Quant. a) 60% dos funcionários recebem menos do que 6 salários mínimos.A. c) 5% dos funcionários recebem menos do que 3 salários mínimos.38 13. é: a) Belo Horizonte b) Recife c) Distrito Federal d) São Paulo e) Salvador .D. (SMV) Os dados abaixo. b) 20% dos funcionários recebem acima de 6 salários mínimos. 14. mostram a distribuição de freqüência d levantamento de dados sobre o salário de 50 funcionários de uma determinada empresa. d) 80% dos funcionários recebem de 6 a 8 salários mínimos. de salários mínimos 2 |– 4 4 |– 6 6 |– 8 8 |– 10 10|– 12 Quant. e) N. e 12 litros. di = x i – x Exemplo: d1 = 10 – 14 = – 4 d2 = 14 – 14 = 0 d3 = 13 – 14 = – 1 d4 = 15 – 14 = 1 d5 = 16 – 14 = 2 d6 = 18 – 14 = 4 d7 = 12 – 14 = – 2 PROPRIEDADE O somatório dos desvios em relação a média é igual a zero  xi  x  0 Do exemplo anterior vamos fazer o somatório:  xi  x  = –4 + 0 –1 +1 +2 +4 –2 = 0 . DADOS NÃO-AGRUPADOS Determinamos a média aritmética simples. 14. x = 7 7 Logo: x = 14 litros DESVIO EM RELAÇÃO À MÉDIA A diferença entre cada elemento de um conjunto de valores e a média aritmética. 16.39 CAPÍTULO 5 MEDIDAS DE POSIÇÃO 1. para produção média da semana: 10  14  13  15  16  18  12 98 = = 14. 15. temos. Exemplo: Sabendo-se que a produção leiteira diária da vaca A. 13. foi de 10. 18. MÉDIA ARITMÉTICA .x É o quociente da divisão da soma dos valores da variável pelo número deles:  xi x n Sendo xi os valores da variável e n o número de valores. durante a semana. 312 840 516 6. i 1 2 3 4 5 6 ESTATURAS (cm) 150 ├── 154 154 ├── 158 ├── 158 162 162 ├── 166 166 ├── 170 ├── 170 174 fi 4 9 11 8 5 3 40 xi 152 156 160 164 168 172 xifi 608 1.404 1. convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio.40 DADOS AGRUPADOS Sem intervalos de classe Consideramos a distribuição relativa a 34 famílias de quatro filhos. tomando para variável o número de filhos do sexo masculino. e determinamos a média aritmética ponderada por meio de fórmula:  x ifi x  fi onde xi é o ponto médio da classe.3 meninos Neste caso.  xifi x  fi xi 0 1 2 3 4 fi 2 6 10 12 4 34 xi fi 0 6 20 36 16 78 x= Com intervalos de classe 78  2. o que nos leva a calcular a média aritmética ponderada.440 x= 6440  161  40 x = 161 cm . elas funcionam como fatores de ponderação. como as freqüências são números indicadores da intensidade de cada valor da variável. Neste caso.3 34  x = 2.760 1. 9. tomando para variável o número de filhos do sexo masculino. 9. 7. 5. 4. de acordo com a definição.fant  2 = f . que não apresenta moda (amodal).41 2. ao contrario. 12. Podemos. a moda é facilmente reconhecida: basta. 7. entretanto. DADOS NÃO-AGRUPADOS Quando lidamos com valores não-agrupados. tem moda igual a 10. 4. DADOS AGRUPADOS Sem intervalos de classe Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos. temos duas modas: 4 e 7 (bimodal). 10. 10.fpost Sendo: f a freqüência simples da classe modal fant a freqüência simples da classe anterior à classe modal fant a freqüência simples da classe anterior à classe modal . 10. É o caso da série: 3. procurar o valor que mais se repete A série de dados : 7. Filhos do sexo masculino (xi) 0 1 2 3 4 Número de famílias (fi) 2 6 10 12 4  fi = 34 = 3. 7. então. o número de filhos modal é 3. 5. 8. A freqüência máxima (12) corresponde o valor da variável 3. que a série tem dois ou mais valores modais. 4. encontrar séries nas quais não exista valor modal. 3. 12.h 1   2 No qual: Li é o limite inferior da classe modal h é o intervalo de classe modal  1 = f . 15. A MODA (Mo) O valor que ocorre com maior freqüência em uma série de valores. 8. Mo Com intervalos de classe É o valor dominante que está compreendido entre os limites da classe modal Método para o cálculo da moda é dado pela fórmula de Czuber: Mo  Li  1 . 10. 13. Dizemos. nas quais nenhum apareça mais vezes que outros. isto é. 11. 13. Na série: 2. 8. pode haver dois ou mais valores de concentração. Em outros casos. Logo. Assim. 15. 13. Se. 18. 10. 16. por definição. 5. Em seguida. a série dada tiver um número par de termos. o primeiro passo a ser dado é o de ordenação dos valores: 2.6 = 159. 3. 6.1 DADOS NÃO-AGRUPADOS Série de valores: 5. 6.1 Sem intervalos de classe É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências.fant = 11 − 9 = 2  2 = f . tem para mediana a média aritmética entre 10 e 12. logo Li = 158 cm h = 4 cm f = 11  1 = f . 18.2 DADOS AGRUPADOS 3. 9. 12. 21. tomamos aquele número central que apresenta o mesmo número à direita e à esquerda.2. i 1 2 3 4 5 6 ESTATURAS (cm) 150 ├── 154 154 ├── 158 ├── 158 162 162 ├── 166 ├── 166 170 170 ├── 174 = fi 4 9 11 8 5 3 40 Para esta distribuição. Convencionou-se utilizar o ponto médio. então: Md = 10. 18.42 Exemplo: Calcular a moda usando a fórmula de Czuber. 2. 6. Temos.6 cm 23 3 A MEDIANA É outra medida de posição definida como o número que se encontra no centro de uma série de números. Logo: Md = 10  12 22 = = 11 2 2 3. 13. a mediana será. 15. 7.fpost = 11 − 8 = 3 Encontrando a moda: 2 Mo = 158   4 = 158 + 1. porém. estando estes dispostos segundo uma ordem. a série de valores ordenados: 2. 9. temos que a 3ª classe é a classe modal. 10. 13. É dada por n 2 . qualquer dos números compreendidos entre os dois valores centrais da série. 16. 10. 2 2 A nota mediana desta turma é 6.43 Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos. Md = 2 meninos. a partir do início da série. a mediana é Md = = 6. Sendo.5. Sendo: . que corresponde ao valor de 2 da variável. i 1 2 3 4 5 6 ESTATURAS (cm) 150 ├── 154 ├── 154 158 158 ├── 162 ├── 162 166 166 ├── 170 170 ├── 174 fi 4 9 11 8 5 3 40 fac 4 13 24 32 37 40 Temos : n 40 = = 20 2 2 Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4 (162 – 158). Logo.2 Com intervalos de classe Neste caso o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana.º lugar. a distância. Filhos do sexo masculino (xi) 0 1 2 3 4 Número de famílias (fi) 2 6 10 12 4 34 fac 2 8 18 30 34 Sendo: 34/ 2 = 17 A menor freqüência acumulada que supera esse valor é 18. devemos tomar. 3. a partir do limite inferior. tomando para variável o número de filhos do sexo masculino. vemos que este deve estar localizado na terceira classe (i = 3).5.2. Exemplo: A distribuição mostra a nota de uma disciplina de uma turma Nota (xi) 5 6 7 8 9 Número de alunos (fi) 3 5 4 3 1 16 fac 3 8 12 15 16 16 67 = 8 = fac2 . sendo este o valor mediano. 54 = 160. 4) Calcule a média aritmética. Notas na disciplina de Estatística Aplicada Notas fi 5 |-. 16. 5.67 c) Z = {1. 15. D = {4.9 03 9 |--10 02 3) Dados os conjuntos abaixo.h 2  Md = Li +  f md No qual: Li é o limite inferior da classe mediana. 8. a) X = {2. fant é a freqüência acumulada da classe anterior à classe mediana. 5. 13}. R: 4. 8. 10}. a mediana e a moda da distribuição: xi fi 2 3 4 5 5 8 7 6 10 2 Σfi = 24 20  13  4 = 158 + 2. 11. 12. 4. h é a amplitude do intervalo da classe mediana. 10. Temos: Md = 158 + Isto é: Exercícios 1) Encontre a média dos seguintes conjuntos de observações. 6. 8}. 7. 2. 4. R: 5.8 b) Y = {10. 4.5 d) T = {1. 16}. 3. R: 27. 8. 9}. 8}. 5. 10. 18. 1. 6. R: 17.54 11 Md = 160. 5. fmd é a freqüência simples da classe mediana. 5. 6. 9}. 20. 3. C = {10. 6.5 2) Encontre a média das notas na disciplina de Estatística Aplicada.8 12 8 |-. 25. A = {3. 15. 22.44 n    f ant . calcule a média aritmética. 15.7 15 7 |-. 100}.5 cm . 7. 3. mediana e moda. 7.6 18 6 |-. B = {6. 00 a 39. . a moda e a mediana (Nota. 6) O salário de 40 funcionários de um escritório está aritmética.45 5) Encontre a moda e a mediana das notas na disciplina de Estatística Aplicada.00 a 19.99 12 40. tendo sido obtidos os seguintes resultados (em milímetros): Construa uma tabela sem intervalo de classe e determine a média aritmética. .99 9 50.00 a 29.9 03 9 |--10 02 FONTE: Dados hipotéticos.00 a 69. Notas na disciplina de Estatística Aplicada Notas fi 5 |-.99 8 30.99 5 60. b) a moda. c) a mediana. Salários (R$) 400 ⌐ 500 500 ⌐ 600 600 ⌐ 700 700 ⌐ 800 800 ⌐ 900 900 ⌐ 1000 distribuído segundo o quadro. A tabela já foi montada no capítulo anterior): 8) Uma pesquisa sobre os gastos semanais com refeições realizados pelos funcionários de determinada empresa está consolidada na tabela de distribuição abaixo: Gastos semanais (R$) fi 10.00 a 59.99 6 20.8 12 8 |-. Calcule a média fi 12 15 8 3 1 1 Σ = 40 7) Um diâmetro foi medido 30 vezes.99 3 Determine: a) a média aritmética.00 a 49. a mediana e a moda.7 15 7 |-.6 18 6 |-. O terceiro quartil.    O primeiro quartil. Percentis Se dividirmos a série ordenada em cem partes. então basta estabelecer uma relação entre eles. as outras medidas de separatrizes que destacaremos são: quartis. separa a seqüência ordenada deixando 10% de seus valores à esquerda e 90% de seus valores à direita. que indicaremos por Q1. que indicaremos por P1. Decis Se dividirmos a série ordenada em dez partes. que indicaremos por Q3. cada uma ficará com seus 10% de seus elementos. o Q 2 é a Mediana da série. que indicaremos por Q2. que indicaremos por D1. separa a seqüência ordenada deixando 1% de seus valores à esquerda e 99% de seus valores à direita. De modo análogo são definidos os outros decis. Observamos que os quartis e decis são múltiplos dos percentis. De modo análogo são definidos os outros percentis. O segundo quartil. Desta forma. Os elementos que separam estes grupos são chamados de quartis. separa a seqüência ordenada deixando 25% de seus valores à esquerda e 75% de seus valores à direita. separa a seqüência ordenada deixando 50% de seus valores à esquerda e 50% de seus valores à direita. todas as medidas podem ser identificadas como percentis: . é também uma medida de separatriz. Os elementos que separam estes grupos são chamados de centis ou percentis. cada um deles contendo 50% dos valores da seqüência. decis e percentis. Portanto. cada uma ficará com seus 25% de seus elementos. Os elementos que separam estes grupos são chamados de decis. ou seja. a mediana que divide a seqüência ordenada em dois grupos.46 4 Medidas de Separatrizes São números que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade de elementos da série. cada uma ficará com 1% de seus elementos.   O primeiro decil.   O primeiro percentil. separa a seqüência ordenada deixando 75% de seus valores à esquerda e 25% de seus valores à direita. Além da mediana. Quartis Se dividirmos a série ordenada em quatro partes. n – número de elementos da série ( Σfi).n  f ant f h Pi = . ℓ* + 100 8 f* Temos. que calculamos anteriormente: Primeiro Quartil  Q1 = P25 25 . h . n 75  40 = =30 100 100 75 n  F(ant) 30  24  4 = 165 cm h * = 162 + Q3 = P25 = .. L . L + 100 Sendo: Pi – Percentil i (1. 2. f . .freqüência simples da classe que contém o percentil. Exemplo: Calcule os quartis da tabela abaixo: i 1 2 3 4 5 6 150 154 158 162 166 170 ESTATURAS (cm) ├── ├── ├── ├── ├── ├── fi 154 158 162 166 170 174 = 4 9 11 8 5 3 40 Fi 4 13  Q1 24 32  Q3 37 40 .limite inferior da classe que contém o percentil.amplitude do intervalo da classe. = =10 100 100 25. Dados agrupados com intervalos de classe Para obtermos a fórmula geral para o cálculo dos percentis. O quartil 2 = Md .1. n 25.7 cm h * =.40 Temos. fant – freqüência acumulada da classe anterior à classe que contém o percentil. vamos generalizar a fórmula de mediana: i . 99). 154 + Q1 = P25 = . 3.47 D1 = P10 D2 = P20 D3 = P30 D4 = P40 D5 = P50 D6 = P60 D7 = P70 D8 = P80 D9 = P90 Q1 = P25 Q2 = P50 Q3 = P75 4. ℓ* + 100 9 f* Terceiro Quartil  Q3 = P75 75 .n  F(ant) 10  4  4 = 156... . 48 Exercício 9) O salário de 40 funcionários de um escritório está distribuído segundo o quadro. Primeiro Decil e Nono Decil: Em um ensaio para o estudo da distribuição de um atributo financeiro (X). foram examinados 200 itens de natureza contábil do balanço de uma empresa. Q2 e Q3. Calcule a Q1. Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210 P (%) 5 15 40 70 85 95 100 . A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. determine os valores do Primeiro Quartil. Terceiro Quartil. Não existem observações coincidentes com os extremos das classes. Salários (R$) fi 400 ⌐ 500 12 500 ⌐ 600 15 600 ⌐ 700 8 700 ⌐ 800 3 800 ⌐ 900 1 900 ⌐ 1000 1 Σ = 40 10) Utilizando-se do enunciado abaixo. Esse exercício produziu a tabela de freqüências abaixo. 70. y e z: X: 70. por sua vez. O conjunto Y. Temos. Y: 68. 50. pois há menor diversificação entre cada um de seus valores e a média representativa. 71. 62 e 70.1 Dados não-agrupados A amplitude total é a diferença entre o maior e o menor valor observado: AT = x(max. Podemos dizer então que o conjunto X apresenta dispersão ou variabilidade menor que o conjunto Z. é mais homogêneo que o conjunto Z. pois sendo uma medida que depende apenas dos valores externos. obtemos:  x i  x = 350 = 70 x n 5  y i  y = 350 = 70 y 5 n zi   z = 350 = 70 z n 5 Vemos. 70. A utilização da amplitude total como medida de dispersão é muito limitada. 70. a Estatística recorre às medidas de dispersão ou de variabilidade. 45. Amplitude Total É a diferença entre o maior e o menor dos valores da série. Dispersão ou Variabilidade Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. 70. Calculando a média aritmética de cada um desses conjuntos. 52. 15. 2. que os três conjuntos apresentam a mesma média aritmética: 70. então. já que todos os valores são iguais à média. não sendo afetada pela dispersão dos valores internos. 2. Z: 5. Portanto. 70. para qualificar os valores de uma dada variável. ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição. 72.) – x(mín) Exemplo 2: Para os valores: 40. AT = 70 – 40 = 30  AT = 30 . Entretanto. é instável. 54. 48. 120. Exemplo 1: Consideremos os seguintes conjuntos de valores das variáveis x. 160.49 CAPÍTULO 6 MEDIDAS DE DISPERSÃO 1. 69. no controle de qualidade ou como uma medida de cálculo rápido. Sem intervalos de classe AT = x(max.50 Quando dizemos que a amplitude total dos valores é 30.) Exemplo 4: Considerando a distribuição abaixo: i 1 2 3 4 5 6 ESTATURAS (cm) 150 ├── 154 154 ├── 158 158 ├── 162 ├── 162 166 166 ├── 170 170 ├── 174 fi 4 9 11 8 5 3 fi =40 2 12 3 7 4 3 AT = 4 AT = 4 – 0 = 4  Temos: Logo: AT = 174 – 150 = 24 AT = 24 cm A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série.2. estamos afirmando alguma coisa do grau de sua concentração.) Exemplo 3: Considerando a tabela abaixo: xi 0 1 fi 2 6 Temos: 2.2. Relativamente aos três conjuntos de valores mencionados no início: ATx = 70 – 70 = 0 (dispersão nula) ATy = 72 – 68 = 4 ATz = 160 – 5 = 155 2. É evidente que.) – x(mín. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. e quando a compreensão popular é mais importante que a exatidão e a estabilidade. quanto maior a amplitude total.) – ℓ(mín.2. Com intervalos de classe Neste caso. descuidando do conjunto de valores intermediários. o que quase sempre invalida a idoneidade do resultado. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano. .2 Dados agrupados 2.1. a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe: AT = L(max. maior é a dispersão ou variabilidade dos valores da variável. devidos ao acaso. por isso mesmo. Variância e Desvio Padrão 3. por esse motivo usamos o quadrado dos desvios para definirmos a variância. em vez de n. ela é um número em unidade quadrada em relação à variável em questão. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. 2  xi  x  (da população)** 2   n Quando temos dados descritos de uma da amostra e não da população. o que faz delas índices de variabilidade bastante estáveis e. A variância e o desvio padrão são medidas que fogem a essa falha. A variância é uma medida que tem pouca utilidade como estatística descritiva. na sua maioria. obtém-se uma estatística melhor do parâmetro de população. é um inconveniente. Desvio padrão (s) O desvio-padrão é a medida mais usada na comparação de diferenças entre conjuntos de dados. * *Nota: Não trabalharemos com dados populacionais neste curso. a amplitude total é instável. que são. pois levam em consideração a totalidade dos valores da variável em estudo. Variância (s2) A variância leva em consideração os valores extremos e os valores intermediários. mais especificamente. é a média aritmética dos quadrados dos desvios*. utilizando-se o divisor (n – 1).51 3. A razão desse procedimento reside no fato de que. por ter grande precisão. expressa melhor os resultados obtidos. o denominador da expressão deverá ser igual a (n – 1). DESVIO PADRÃO = VARIÂNCIA Para dados amostrais: s  x i  x 2 n 1  x i  2  1  2  x i   (forma prática) ou s  n 1  n    Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. sob o ponto de vista prático. A variância relaciona os desvios em torno da média.1 Introdução Como já vimos. 2  xi  x  (amostra) 2 s  n 1  x i 2  (forma prática) 1  2 2  x i   ou s  n 1  n    Sendo a variância calculada a partir dos quadrados dos desvios. * Nota: Lembremos que  di = (xi – x ) = 0. porém é extremamente importante na inferência estatística e em combinações de amostras. mas é extremamente importante na inferência estatística e em combinações de amostras. ou. . por se deixar influenciar pelos valores extremos. O desvio padrão determina a dispersão dos valores em relação à média e é calculado por meio da raiz quadrada da variância. isto é. o que. os mais geralmente empregados. por isso. tem pouca utilidade na estatística descritiva. 48. 3.704 2. 62. o conjunto de valores da variável x: 40. 52. s  x i  2  = 1  2  x i   n 1  n    1  3712  20293   = 10.25 7 1  7  . no cálculo do desvio padrão. simplificações úteis. o desvio padrão fica multiplicado por essa constante: yi = c .844 4.2 Dados não-agrupados Exemplo 5: Tomemos.916 3.304 2.025 2. xi  sy = c .293 O desvio padrão populacional é. 54. dentre as quais destacamos: 1ª) Somando-se (ou subtraindo-se) uma constante a de todos os valores de uma variável. 45.52 Propriedades do desvio padrão O desvio padrão goza de algumas propriedades. como exemplo. o desvio padrão não se altera: yi = xi  c  sy = sx 2ª) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero).900  = 20. 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi2.600 2. Assim: xi 40 45 48 52 54 62 70  = 371 xi2 1. s x Essas propriedades nos permitem introduzir. 038.1 Sem intervalos de classe Como. uma coluna para os produtos fixi e outra para fixi2. na tabela dada. resultando a fórmula: 2 s  x  i  x fi 2 n 1 ou  fi x i 2  1  2  f i x i   s  n 1  n    2 s  f i x i 2  (forma prática) 1  2  f i x i   n 1  n    Exemplo 6: Consideremos a distribuição da tabela abaixo: xi fi 0 2 1 6 2 12 3 7 4 3 O modo mais prático para se obter o desvio padrão é abrir.440 fixi2 92.3.13 30  1  30  Exemplo 7: Tomemos como exemplo a amostra da distribuição da estatura de 40 alunos do colégio A. Assim: xi 0 1 2 3 4 fi 2 6 12 7 3  = 30 fixi 0 6 24 21 12  = 63 fixi2 0 6 48 63 48  = 165 O desvio padrão é:  f i x i 2  1  2  f i x i  = s n 1  n    3.53 3. temos a presença de freqüências.404 1.168 141.080  fixi .3. calcular o desvio padrão amostral I 1 2 3 4 5 6 Estaturas (cm) 150 ├─ 154 154 ├─ 158 158 ├─ 162 162 ├─ 166 166 ├─ 170 170 ├─ 174 fi 4 9 11 8 5 3 fi =40 xi 152 156 160 164 168 172 fixi 608 1.312 840 516  fixi = 6.752 2= 1. lembrando que para obter fixi2 basta multiplicar cada fixi pelo seu respectivo xi.760 1. devemos levá-las em consideração.600 215.3 Dados agrupados 3.024 281.416 219. neste caso.120 88.2 Com intervalos de classe 2 1  63  165   = 1. 64 40  1  40  n 1  n    Portanto. temos o seguinte coeficiente de variação: 5.0 kg Exercício 1) Calcule a amplitude total e o desvio padrão dos conjuntos de dados: a. ESTATURA PESO x 175 cm 68 kg s 5. 9. 3. 15. calcular os respectivos coeficientes de variação e compará-los. Assim.57 cm.64 cm 4 Coeficiente de variação (CV) O desvio padrão por si só não nos diz muita coisa. 7.54 Comecemos por abrir as colunas para x i (ponto médio). 5. Para contornar essas dificuldades e limitações. para fixi e para fixi2. quando expressas em unidades diferentes. 9 b. 14. o mesmo não pode ser dito. o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores. relativamente à sua dispersão. 2. Além disso. 19. 22. 3. 21.5% 161 Diz. se a média for igual a 20. no entanto. podemos caracterizar a dispersão dos dados em termos relativos a seu valor médio. medida essa denominada coeficiente de variação (CV). 20 c.57 CV = 100 = 3. para saber qual obteve a maior dispersão relativa. 20. s CV  100 x Exemplo 8: Para uma distribuição em que a média é 161 cm e s = 5. Assim: s 2  f i x i 2  = 1  6440  1  2  f i x i   1038080    = 5. s = 5. 1.se que uma distribuição tem:  Baixa dispersão: CV  15%  Média dispersão: 15% < CV < 30%  Alta dispersão: CV  30% Exemplo 9: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos. 10 . –6. –10.0 cm 2. um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200. 240. (c) a moda. 8) Considerando que foi extraída uma amostra aleatória simples de 10 alunos de uma grande escola.99 60.99 30. 9. 6) Para duas emissões de ações ordinárias da indústria eletrônica. (b) a mediana.99 Determine: (a) A média aritmética. 12. 180. Em relação ao nível do preço. 12.00. 205. 140.00 a 69. 180. (b) a mediana. Determine (a) A amplitude total e (b) O desvio padrão. (d) o desvio padrão. Para as ações B. há o seguinte registro de atendimentos de urgência em um hospital em Manaus.00 com um desvio padrão de R$ 5. o preço médio foi de R$ 50. Calcular (a) a média. 140. 10. em ordem crescente: 2. 10 e 6. (e) o coeficiente de variação. 140.00 a 59. a variância da amostra e o desvio padrão da amostra. 140. arredondados para o valor mais próximo e apresentados em ordem crescente: 140. 155.00 com um desvio padrão de R$ 3. . o preço médio diário.00 a 29.99 40. 190.00 a 49. 4.00 a 39.00.99 50. 15. temos a distribuição em classes: Idade (anos) 2 ├─ 6 ├─ 10 ├─ 14 ├─ 18 ├─ 22 fi 5 12 21 15 7 5) Uma pesquisa sobre os gastos semanais com refeições realizados pelos funcionários de determinada empresa está consolidada na tabela de distribuição abaixo: Gastos semanais (R$) 10. 10. 4. xi 0 1 2 3 4 fi 1 5 10 8 2 b) Em uma amostra contendo crianças e jovens. 3) A distribuição a seguir mostra como varia a idade de um grupo de jovens que participam de uma colônia de férias. 5. cuja variável em estudo é a nota obtida em Matemática. 165. durante um período de um mês. 140. no fechamento dos negócios. 140. Determine a média da amostra. qual dos tipos de ações é mais variável? fi 6 8 12 9 5 3 Exercício Complementar 7) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana. 230. 225. 200.55 2) O número de carros vendidos por cada um dos vendedores de um negócio de automóveis durante um mês particular. (c) O desvio padrão. 7. 14. para este grupo de salários. para as ações A. 6. obteve-se: 5. (c) a moda. 165.99 20.00 a 19. Idade (anos) 10 12 13 14 15 16 Número de Jovens 2 5 1 5 3 4 4) Calcule a amplitude e o desvio padrão das distribuições abaixo: a) Em um período de um mês. 7. (b) A variância. 10. foi de R$ 150. Determinar (a) a média. 8. 140. 8. (d) o desvio padrão. 155. 60 20 Total 50 11) Considerando que as três distribuições hipotéticas apresentam os valores indicados abaixo: DISTRIBUIÇÃO A B N = 200 N = 50 fx = 4000 fx = 500 fx2 = 85000 fx2 = 5450 a) Determine os indicadores: média aritmética. b) moda. 37. 18. com um desvio padrão de 8 kg.40 10 40 |-. para o tempo de auditoria necessário para esta amostra de registro. Salários semanais para 100 operários não especializados Salários semanais fi 140 |-. 158.) (fi) 10 |-.56 9) Dado os salários dos funcionários de uma determinada empresa. uma firma de contabilidade pública anota o tempo necessário para realizar a auditoria de 50 balanços contábeis. 10) Em conjunto com uma auditoria anual. (min. mediana. c. A variância.20 3 20 |-. 5.30 5 30 |-.50 12 50 |-. Amostra “B”: 132. 27.200 33 200 |-. 238. 215. b. c) o desvio padrão. Tempo de auditoria.160 7 160 |-. Calcular (a) a média. Determine para cada uma destas amostras: a) média aritmética. apresentou um peso médio de 78 kg.220 25 220 |-. d) qual dos processos apresenta maior variabilidade? Por quê? . 150. 12) A distribuição das alturas de um grupo de pessoas apresentou uma altura média de 182 cm e um desvio padrão de 15 cm.260 4 ∑fi =100 Calcule usando a definição: a. (b) o desvio padrão. enquanto que a distribuição dos pesos. O desvio padrão. Tempo necessário para a auditoria de balanços contábeis. variância. 16. Qual das duas distribuições apresentou maior dispersão? Por quê? 13) Considere as duas amostras abaixo: Amostra “A”: 23. 108. 114. Nº de balanços. desvio padrão e coeficiente de variação. 34. A média aritmética. 32. b) Baseado nos resultados encontrados mencione a distribuição que apresenta maior homogeneidade e a que apresenta maior heterogeneidade. 220. 97. 142.180 20 180 |-. 179. 11. 14.240 11 240 |-. Entretanto. predominam valores inferiores à Moda. ou assimetria à esquerda. Assimetria à direita (ou positiva) Em uma distribuição assimétrica positiva. mediana e moda. x = Md = Mo  Assimetria Toda distribuição deformada é sempre assimétrica. Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria. mais especificamente do polígono de freqüência ou do histograma. tem-se igualdade dos valores da média. tem-se: Mo < Md < x Mo Md x Assimetria à esquerda (ou negativa) Em uma distribuição assimétrica negativa. a assimetria pode dar-se na cauda esquerda ou na direita da curva de freqüências. MEDIDAS DE ASSIMETRIA Estas medidas referem-se à forma da curva de uma distribuição de freqüência. x < Md < Mo x Md Mo . ou assimetria à direita.57 CAPÍTULO 7 MEDIDAS DE ASSIMETRIA E CURTOSE 1.  Simetria Em uma distribuição simétrica. com os dados fracamente concen em torno de seu centro. Plano. A distribuição de referência (Distribuição Normal) é denominada MESOCÚRTICA (Meso = Meio. Para uma distribuição de freqüências. Alongado.263. Largo. Quando a distribuição apresenta uma curva de freqüência mais fechada (mais aguda em sua parte superior). As  0. C > 0. 3  ( x  Md ) s O valor em módulo do Coeficiente de Pearson indica a intensidade da assimetria. e o seu sinal indica a direção da assimetria. Esta medida quantifica a concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em uma distribuição de freqüências. Existem várias fórmulas para o cálculo do coeficiente de assimetria.263.  Platicúrtica: quando a distribuição apresenta uma curva de freqüência mais aberta. COEFICIENTE DE ASSIMETRIA DE PEARSON É uma medida de assimetria que não depende dos valores da variável em estudo.263.  Mesocúrtica: quando os dados estão razoavelmente concentrados em torno de seu centro. C < 0. As mais utilizadas são: 1. etc). etc). com os dados fortemente concentrados em torno de seu centro. ou seja. em função de ser a média uma medida não resistente. Assimetria Moderada Assimetria Forte Assimetria Negativa Assimetria Positiva Uma distribuição é classificada quanto ao grau de achatamento como:  Leptocúrtica: quando a distribuição apresenta uma curva de freqüência bastante fechada. o Coeficiente percentílico de curtose pode ser calculado conforme a fórmula abaixo: Q 3  Q1 C 2(P90  P10 ) Denominamos Curtose o grau de achatamento de uma distribuição em relação à Distribuição Normal. Quando a distribuição apresenta uma curva de freqüência mais aberta (mais achatada em sua parte superior). Magro. . ela é denominada LEPTOCÚRTICA (Lepto = Delgado. ser altamente sensível aos valores extremos da série de dados. ela é denominada PLATICÚRTICA (Plato = Chato.15  |As|  1 |As| > 1 As < 0 As > 0 2.58 Observar que a Média “puxa” a cauda da Distribuição para seu lado. e portanto serve para comparações entre distribuições diferentes. etc). C = 0.1. Central. MEDIDAS DE ACHATAMENTO OU CURTOSE A curtose ou achatamento é mais uma medida com a finalidade de complementar a caracterização da dispersão em uma distribuição. .......... s = . Md = .59 Exercício 1..9 e s = 2... Mo = . As = ...........12.. Md = ..... Mo = ... 2........ Distribuição B Peso (kg) 2 ├─ 6 6 ├─ 10 10 ├─ 14 14 ├─ 18 18 ├─ 22 fi 6 12 24 30 6 78 x = .... Distribuição A Peso (kg) Fi 2 ├─ 6 6 6 ├─ 10 12 10 ├─ 14 24 14 ├─ 18 12 18 ├─ 22 6 60 x = .. s = ...... As = .. As = ..... Uma distribuição de freqüência apresenta as seguintes medidas: x = 48.....1............. Mo = ... s = .... Calcule o coeficiente de assimetria....... fi 6 30 24 12 6 78 ..... Md = 47. Calcule o coeficiente de assimetria de cada distribuição. Distribuição C Peso (kg) 2 ├─ 6 6 ├─ 10 10 ├─ 14 14 ├─ 18 18 ├─ 22 x = ... Md = .... d) O valor da constante. .60 5 60|----. 7 4. Dentre as medidas de posição. obtida pelo candidato foi de 69. que por sua vez é menor que a mediana. aquela que apresenta sempre a mesma quantidade de elementos. 5. e) N.A. 6.A.D.60 3. d) a média é igual a moda e a mediana é nula.90 8 90|----100 3 Determine: a) A média aritmética. as seguintes notas com os respectivos pesos: Matéria Nota Peso Português 66 3 Contabilidade 63 3 Estatística X 2 Direito 79 2 A média aritmética ponderada.80 15 80|----. e) N. c) a média.70 10 70|----. nas diversas provas de um concurso. à sua esquerda e à sua direita é: a) A moda b) A mediana c) A média aritmética d) A variância e) N. Dada a distribuição de peso dos funcionários de uma determinada empresa: PESO (kg) FUNCIONÁRIOS 50|----. A nota que o candidato obteve em Estatística foi de: a) 66 b) 68 c) 70 d) 72 e) 74 6.D.A. que por sua vez é maior que a mediana. c) O coeficiente de assimetria. 7. d) a distribuição é simétrica? Justifique a sua resposta. b) A mediana. podemos afirmar que: a) a média é maior que a moda. b) a média é menor que a moda. A média de uma série de valores iguais a uma constante é: a) Zero. b) A unidade. c) Não é possível calcular. Numa curva simétrica. a moda e a mediana são medidas iguais. QUESTÕES OBJETIVAS DOS CAPÍTULOS: 5.3.D. (FISCAL DE TRIBUTOS DE MG-96) Um candidato obteve. com tais medidas a curtose é : a) Leptocúrtica b) Platicúrtica c) Mesocúrtica d) Assimétrica.00 b) 3.5cm.D. 5. A variância será: a) 3 b) 36 c) 18 d) 81 e) N. 3. e) N. 5.D.33 d) 1.61 8.00 e) N.D.2cm P90 = 49. A variância dessa amostra é de: a) 4. 3. Sabe-se que uma distribuição apresentou as seguintes medidas: Q1 = 24.2cm P10=20.00 c) 2.A. 9. .4cm Q3 = 41.A. O desvio padrão de um conjunto de dados é 9.A. 10. 11. (Controladoria de arrecadação RJ 2004 FJG) Os valores de uma amostra de cinco elementos são: 4. Talvez tenha aumentado o consumo de leite e carne. Em Administração. Mas. morbidez. diversos índices permitem avaliar a qualidade de vida. o problema for quantificar a inflação. o nível de criminalidade e o padrão de saúde das populações. o número índice é sinônimo de variação na variável de interesse. o conhecimento de número índices é indispensável como um instrumento útil ao exercício profissional. quando uma família nota que o preço do pão é o dobro do que era há 10 anos. Em Economia. Sociologia etc. como em muitas outras áreas. coeficiente de aprovação etc. Por exemplo. será necessário medir o crescimento dos preços dos vários produtos como um todo.62 CAPÍTULO 8 NÚMEROS ÍNDICES 1 INTRODUÇÃO Segundo Milone (2004):   Em Estatística. uma família pode incluir em sua observação itens como leite. as compras daquela família podem também ter se modificado ao longo dos anos. de custos de vida. de concentração dos mercados. em Engenharia. o índice é chamado índice simples. velocidade de vendas. por exemplo. Física. podemos citar. e outros ainda uma redução de preço. quer para a macro-economia. quer seus problemas estejam voltados para a micro-economia. Índices simples e compostos     1. lucratividade e endividamento possibilitam avaliar a saúde financeira das empresas. outros podem ter tido aumentos pequenos. quantidade e valor dos bens. carne. Se. há índices de preço. Por exemplo.1 Quando só um produto está em jogo. Enquanto que uma comparação que envolva um grupo de artigos é chamada de índice composto.). Medicina (índices de fertilidade. manteiga. está fazendo uso de certo tipo de Numero Índice de um só produto. de monopólio de empresas. índices de produção. de liquidez (corrente e seco). bem mais. Alguns desses artigos podem ter tido aumentos substanciais no preço. em Administração Pública.) e em educação (quociente de inteligência. além do pão. verduras e enlatados. natalidade. especialmente quando a moeda sofre uma desvalorização constante e quando o processo de desenvolvimento econômico acarreta mudanças contínuas nos hábitos dos consumidores. É grande a importância dos números índices para o administrador. nas chamadas ciências do comportamento (Psicologia. de desemprego. de bolsas de valores. No primeiro caso. por intermédio do índice geral de preços. a necessidade de se saber até que ponto o preço de determinado produto aumentou com relação aos preços dos demais produtos em um mesmo mercado. a permanência ou evasão escolar. etc.). Para o economista. Isto ocorrerá se tiver . provocando com isso modificações qualitativas e quantitativas na composição da produção nacional e de cada empresa individualmente. E há mais. por outro lado. mortalidade. de importação e exportação. A finalidade do índice composto é sintetizar a variação global de preços para estes tipos de produtos. p p0.00  p00 1.20 e em 2000 subiu para R$ 1. definiremos relativo de preço pela seguinte quantidade: p0.02 e p1999  R$1. com o de uma época chamada básica ou simplesmente base. valores que flutua em torno de 100.20 . Os demais apresentarão. quantidade e valor.63 aumentado o número de pessoas na família.00  00   1. Então:  Período base (0) = 1999  Período atual (t) = 2000 p 1. As três variáveis em que estudaremos: preço.t  t 100 p0 Exemplo: O preço de determinado artigo. podemos também fazê-lo em relação a quantidades. 2 ÍNDICES SIMPLES Um número índice simples avalia a variação relativa de um único item ou variável econômica entre dois períodos de tempo.t  t q0 . foi R$ 1.20 Esse resultado pode ser interpretado da seguinte maneira: que em 2000 houve um aumento de 15% (115-100) no preço do artigo. o relativo de preço seria: p99. portanto. q q0. Solução: O ano considerado base corresponderá sempre ao índice igual a 100.2 RELATIVOS DE QUANTIDADE Assim como podemos comparar os preços de bens.1 RELATIVOS DE PREÇOS Trata-se do número índice mais simples. Tomando-se por base o ano 1999.15 ou 115% p99 1. quer sejam elas produzidas. Relacionando-se o preço de um produto numa época chamada época atual ou época dada.38. com relação ao preço do mesmo artigo em 1999.20 Em 2000. por outro lado. Logo. sendo este último o resultado do produto do preço pela quantidade. como também variações de quantidades. pode ter diminuído.02   0. é preciso incluir não só variações de preço. Fazendo-se pt = preço numa época atual e p0 = preço na época-base. bastará multiplicarmos o quociente citado por 100. particularmente por questão de peso. determinar o preço relativo em 2000. teremos um relativo de preço. a fim de obter um quadro mais preciso da variação global. O consumo de manteiga.85 ou 85% p99 1. 2. 2.38 p99. em 1999. vendidas ou consumidas. o artigo em questão apresentou um preço de 15% (85-100) inferior ao de 1999. Se tivéssemos p2000  R$1.t  pt p0 Se quisermos expressar em termos percentuais o relativo de preço. 00. v p q v0.00. Ia. vendeu 800 unidades do mesmo artigo ao preço unitário de R$ 600.10  1.1  I1. 1 I a . 3 PROPRIEDADES DOS NÚMEROS ÍNDICES  Propriedade da identidade: O número índice deve ser igual à unidade quando a época dada (t) coincidir com a época básica (0). em março. será igual ao produto dos valores da série de índices cujas bases são as datas anteriores. então. Qual a quantidade relativa será. com um acréscimo de 5% relativamente a fevereiro.fev  Pfev.abr = 1. o valor das vendas foi 4% (96-100) inferior ao de 2000.t  q0.abr = Pjan.96 = 110. tem-se que para o ano 2000.88% . Assim. os resultados serão o inverso um do outro.b  I b. Em 2001.3 No ano de 2000 esta empresa aumentou sua produção em 50% (150−100) em relação a 1999.3   I t 1. Solução: jan-fev = 10%. em 2000. tomando-se o ano de 1999 como base? q 69 q99. o preço relativo é igual 1 ou 100%.96ou 96% v00 p00  q00 500 1000 Em 2001. com um acréscimo de 10% em relação a janeiro. caso seja tomado como base de comparação o ano de 2000.mar = 100% +5% = 105% Pmar.fev = 100% +10% = 110% Pfev.t  I 0. com base na primeira.abr = 100% − 4% = 96% Pjan.t  t  t t  p0. RELATIVOS DE VALOR Se p for o preço de determinado artigo em certa época e q a quantidade produzida ou consumida desse mesmo artigo na mesma época.  Propriedade da reversão do tempo: Ao se permutarem dois períodos.t Exemplo 4: Um artigo foi vendido.a  Propriedade cíclica: O valor do índice na última data. 1000 unidades de um artigo ao preço unitário de R$ 500. Calcular o acréscimo percentual de preço em abril com relação a janeiro.00  00   1. O valor relativo da venda em 2001 foi: v p q 600  800 v00. em abril com uma queda de 4% comparativamente a março.a = 1 Em que I representa um número índice simples qualquer.05  0. 2  I 2. fev-mar = 5%. em fevereiro.64 Exemplo: Uma empresa produziu 46 toneladas de aço em 1999 e 69 toneladas em 2000.t v0 p0  q0 Exemplo: Uma empresa vendeu.mar  Pmar. mar-abr = −4% Pjan.01  01  01 01   0.50 ou 150% q99 46 2. I 0. o produto p x q será denominado valor total de produção ou de consumo. 30% maior que em 2003. são os relativos de base móvel. Qual o índice de preço de 2002 (base) para 2004? R: 200 4) O salário de um empregado. em 2003 (data-base) era R$ 1. Qual o seu índice de salário e qual seu percentual de aumento no período? 3) Em 2002. em relação a dezembro de 2003 era de 101. em dezembro de 1997. Em 2004 esse mesmo produto foi vendido por R$ 1. respectivamente os preços de R$ 240. R$ 9. o preço de um produto era 35% mais baixo que em 2003 e.00.00.100. qual é o salário desse empregado em dezembro de 2003? 4 4. p 300  100 =125% p01. EXERCÍCIO 1) O preço de um produto. ou diárias). Se o índice de preços nesse mesmo mês. era de R$ 2. R$ 19. em dezembro de 2007.65 Houve um acréscimo de preço de 10.04  Portanto: p03 360  100 =120%  100  300 p02 p04 540  100 =150%  100  360 p03 Ano 2001 2002 2003 2004 Relativos --125 120 150 Fazemos uso dos elos de relativos quando queremos acompanhar os crescimentos (positivos ou negativos) anuais (ou mensais. em janeiro de 2004. Qual o relativo de preço e qual a variação porcentual de preço? 2) Pedro ganhava por dia. R$ 360 e 540.500. Exemplo: Um bem apresentou no período de 2001 a 2004. R$ 300. e.96.13. .00.02  02  100  240 p01 p02. em 2004. Vamos calcular os elos de relativos.200.03  p03.88% no período de janeiro a abril.1 NÚMEROS ÍNDICES DE LIGAÇÃO ELOS DE RELATIVOS (RELATIVOS DE LIGAÇÃO) Vários relativos formam elos quando cada um deles é calculado tomando como base o ano anterior.87. 03  03  100  240 p01 p 540  100 =225% p01.3 MUDANÇA DE BASE A mudança de uma série de número índices para uma outra base é feita dividindo-se cada índice da série original pelo número índice correspondente à nova base. Exemplo: Fazer a mudança de base do exemplo anterior. 4. para 2003. e exprimindo os resultados em porcentagens. quando não temos os valores e somente os índices. Seria a mesma coisa que calcular os índices do preço com base fixa de 2003 usando a tabela original. .2 RELATIVOS EM CADEIA O relativo em cadeia é o índice de base fixa: todos os relativos são calculados tomando-se uma determinada época como base. considerado significativo.01  01  100  240 p01 p 300  100 =125% p01. tomando como base fixa 2001. com os anos anteriores e os consecutivos. temos: p 240  100 =100% p01.02  02  100  240 p01 p 360  100 =150% p01. Ano 2001 2002 2003 2004 Preços Relativos 67 83 100 150 Isso sempre pode ser feito. Exemplo: Utilizando o exemplo anterior. Solução: Dividi-se os valores dos índices do preço da anterior pelo preços relativos a 2003.66 4.04  04  100  240 p01 Portanto: Ano Relativos do Preço 2001 100 2002 125 2003 150 2004 225 Fazemos uso dos relativos em cadeia quando desejamos comparar um determinado ano. b) Os relativos da quantidade com base em Janeiro (ou seja.51 Fev.956 2000 14. . 8.17 1.95 12.345 2004 1. vol. os relativos de base móvel). b. 7) A tabela abaixo apresenta os valores da arrecadação anual da Contribuição Provisória sobre Movimentação Financeira (CPMF).97 Maio 7.65 1.12 Determine: a) Os elos de relativos do preço (ou seja. os relativos de base fixa). O número-índice com base de comparação fixa em 2003.234 2003 1. entre 1999 e 2003. 6. no ano base dado. 6. Anos 1995 1996 1997 1998 Relativos 90 100 110 125 1999 135 2000 170 Pede-se: a) Determine os correspondentes relativos de base móvel. foi de 300 toneladas.196 2002 20. Exportação em milhões Ano de Dólares 2002 1.207 Fonte: Conjutura Econômica. Determine os índices tomando como base o ano de 2006.09 Mar. c) Determine a produção de cada ano. no 3 mar.63 2.368 2003 26. 58.546 2001 17. O número-índice com base de comparação móvel no ano imediatamente anterior.35 1. Ano Valor 1999 7. c. medidos em R$ milhões. sabendo que ela. b) Determine os correspondentes relativos com base em 1995. Responder: a.938 6) Dada a Tabela: Mês Quantidade Preço Valor Jan.83 12. c) Os relativos do valor com base em abril (ou seja.754 2008 1.56 22. O número-índice com base de comparação fixa em 1999. 7.09 2.97 12. 8) A seguir temos os relativos de base lixa da produção de um artigo. 2004.10 Abr.67 EXERCÍCIO 5) São dados os valores das exportações de um país em moeda local.13 15.975 2007 1.027 2005 1. os relativos de base fixa).825 2006 1. 1 Dados: fictícios a) Calcule os relativos para o bem auto-veículos. 10) Os preços e os Consumos. c) Calcule os relativos para o bem aço. . 'b".3 Cimento (milhões de t) 24.) 1. d) Determine os preços relativos de base móvel. tomando 1992 = 100. tomando 1991 = 100. e) Interprete os valores obtidos para o ano de 1999.1 25.2 13.9 27. d) Forme a tabela dos elos de relativo para o petróleo bruto.9 15.0 1.9 859.128.6 10. ANO 1996 1997 1998 1999 2000 2001 2002 2003 PREÇO 25 40 50 60 75 90 100 115 CONSUMO 20 25 30 15 35 40 50 55 Pede-se: a) Determine os preços relativos com base em 1996 b) Determine as quantidades relativas com base em 1996.2 780. b) Forme a tabela dos elos de relativo para o cimento. tiveram o seguinte comportamento através do tempo. c) Determine os valores relativos com base em 1996.4 15. nos itens 'a'. "c' e “d”.1 12.6 12.2 26.9 Petróleo bruto (milhões de m³) 9.165. de um certo bem.4 Aço (milhões de t) 13.68 9) Dada a tabela: BENS QUANTIDADE DE BENS (1991-94) 1991 1992 1993 1994 Auto-Veículos (mil unid. Os problemas envolvendo índices de preços e quantidades são mais complexos que a simples comparação dos relativos. Para a apuração dos referidos índices vamos usar o índice agregativo. Há a necessidade de comparação de várias séries. Os principais são: Índice agregativo simples: De preços:  Ip  Onde: Σp ti Σp 0i De Quantidade:  Iq  Σq ti Σq 0i Σp 0i : Soma de todos os preços no ano-base Σp it : Soma de todos os preços na época atual atual Σq 0i : Soma de todas as quantidades no ano-base Σq it : Soma de todas as quantidades na época OBSERVAÇÕES: É um índice de fácil aplicação. op. porém a variação de preços. cit.1 ÍNDICES AGREGATIVO SIMPLES DE PREÇO E QUANTIDADE Uma maneira de determinar o índice agregativo simples é calcular a média aritmética dos relativos. o açúcar e outros bens podem ser expressos em quilogramas ou toneladas. no cálculo do índice do custo de alimentação. porém apresentam algumas limitações: a) Não se leva em consideração a importância relativa dos itens. os tecidos. 5. foram demonstrados o preço ou quantidade de um só bem. linhas. exige um índice que possa sintetizar a variação dos preços de um conjunto de bens (agregado). pp. por exemplo. Para solução destes problemas criou-se um conjunto de índices. a carne. Nos itens acima. quando se trata de uma cesta de bens. em litros. em metros etc). 1 2 CRESPO (1998). 219-20 . b) Não há homogeneidade entre as unidades dos diversos bens (O arroz.69 5 ÍNDICES AGREGATIVOS SIMPLES Os índices agregativos é um índice de fácil aplicação. op. Assim. O leite. os refrigerantes. obtendo o índice médio de relativos1. 165 Vide MARTINS e DONAIRE (1993). seria atribuída ao arroz e ao “bacalhau do Noruega” a mesma importância 2. p. cit. t n Para Média Geométrica: De Preços G P 0.6 150.6) (média harmônica 100.t  i Σq 0.70 5.2 ÍNDICES MÉDIOS DOS RELATIVOS DE PREÇOS E QUANTIDADES Para o cálculo dos índices médios dos relativos. t Onde: Σp i0. t : relativo de quantidade na época atual do iésimo bem EXERCÍCIOS 11) Calcular os índices agregativos simples pela média aritmética e pela média harmônica para os dados abaixo (ano base 2000): ANO CIMENTO 2000 35 2001 42 2002 47 (média aritmética: 100.0 124. Veremos as médias aritmética e geométrica: Para Média aritmética: De Preços: De quantidades P0.0 124. geométrica ou harmônica. t p i 0. t : relativo de preço na época-base do i-ésimo bem Σq i0.0) .t  n i  q 0.6) (média harmônica 100. pode-se utilizar as médias aritmética.0 123. t n Q0.t  i Σp 0.0 123.7 155.t n De Quantidades: G Q 0.0) PEDRA 12 17 24 AREIA 40 45 53 12) Calcular os índices agregativos simples pela média aritmética e pela média harmônica para os dados abaixo (ano base 2000): ANO CIMENTO PEDRA AREIA 2000 35 12 40 2001 42 17 45 2002 47 24 53 (média aritmética: 100.7 155.6 150.  pt . bolos (em unidades) e o jornal. Se quisermos saber qual foi a variação global dos preços. Tomando-se o ano de 2000 e utilizando o Índice de Laspeyres de preço. como as quantidades se modificaram de 2000 a 2004.q0 p L0. Uma forma de conseguir isto é fazer as quantidades do ano corrente iguais às quantidades do ano base. além da fórmula a ser usada para interpretar as variações de preço e de quantidade dos bens. por isso a denominação método da época básica.t   p0 . para focalizarmos só preços.00 0.71 6 EMPREGO DE ÍNDICES (AGREGATIVOS) PONDERADOS Como vimos. poderemos imaginar as quantidades como tendo permanecido inalteradas. as variações nas quantidades devem ser eliminadas. Em outras palavras.10 1 0. por conseguinte. Assim. A ponderação proposta pelos métodos mais usados baseia-se na participação de cada bem no valor transacionado total e.25 1 Observe que tanto os preços. Conforme consta a tabela a seguir: Itens 2000 2004 Preço0 Quantidade0 Preçot Quantidadet Cogumelos 0. é feita. há variações nas quantidades compradas. usualmente. a) Índice de Preço de Laspeyres O problema de determinar variações de preço para um grupo de artigos é que. segundo dois critérios: peso fixo na época básica ou peso variável na época atual. além de variações nos preços. Dessa forma. há o problema do critério para a fixação dos pesos relativos de cada um deles.1. queremos saber até que ponto as variações de valor são devidas à variação de preço. em geral. No caso dos índices ponderados. temos: . sem precisarmos considerar variações de quantidades. sendo os fatores de ponderação determinados a partir de preços e de quantidades da época básica.10 4 0.08 6 Bolos 1.80 2 1. no Índice de Laspeyres. os índices simples apresentam algumas desvantagens. 6. em especial quando se refere à inexistência de pesos diferentes para cada utilidade que os compõe de acordo com sua importância relativa.5 Limões 0. limões (em unidades). a base de ponderação é a época básica.5 Jornais 0.q0 Onde: p0 pt q0 qt  é o preço de um item qualquer no período base  é o preço de um item qualquer no período “atual”  é a quantidade de um item qualquer no período base  é o quantidade de um item qualquer no período “atual” Exemplo: Um comprador noturno que adquire quatro itens: cogumelos (em kg).20 1. a única diferença será nos preços entre os dois anos.1 Índice de Laspeyres ou método da época básica O Índice de Laspeyres constitui uma média ponderada de relativos.00 1 2. 80  4  0.q  p . os preços da época básica são considerados os fatores de ponderação.00  1  0.10  4  1. Neste caso. assim. Outro processo seria utilizar pesos de algum período intermediário entre período base e o atual.00  1  0. e utilizando os preços como pesos do ano base.50  0.t  0  q0 .10  1 Esse índice sugere que. 6. no caso do índice de Laspeyres). mudam quando as épocas atuais mudarem. O índice agregativo de quantidade procura responder a seguinte ponderação. Como a época atual é variável.  qt .10  0. globalmente. quanto se gastará na época atual em relação ao que se gastou na época básica? Enquanto no índice de preço a diferença da importância gasta devia-se à variação nos preços.q00  1. no caso de ser difícil estimar as quantidades na época atual. o que onera substancialmente a pesquisa.00  1  0.80  2. p00  1. as variações de quantidades.  p . p00 O índice pode ser interpretado como indicativo de que as quantidades globais dos artigos em estudo. que são: se em cada uma de duas épocas forem adquiridas quantidades diferentes de determinadas mercadorias. os preços subiram 60%. mensais ou mesmo trimestrais. o índice de Paasche realça a baixa porque a ponderação é determinada pela época atual. Como um índice agregativo com ponderações variáveis. têm-se:  q04.0  0.80  6  0. diminuíram 23% (77-100).10  1  1. p 0 Lq .10 = 77% Lq .2 Índice de Paasche ou Método da Época Atual No Índice agregativo proposto por Paasche.25  1 0.04  p p 04 00 . os pesos.1.04  00 2  0.20  2.0  0. no índice de Paasche. a) Índice de Preço de Paasche P0pt  . adquiridos por aquele comprador. a ponderação é feita em função dos preços e quantidades do período atual. b) Índice de Quantidade de Laspeyres De modo análogo podemos calcular o índice de quantidade. uma desvantagem dos pesos do período atual é que eles devem ser revistos cada ano.08  4  2.q00 . o índice de quantidade de Laspeyres para ano o base 2000. mas aos mesmos preços (fixos na época básica. Esse fato torna proibitivo o emprego do índice de Paasche quando se deseja montar um índice ponderado para se fazerem comparações semanais.00  1  0.10  q00. uma vez que os preços permanecem constantes.q t 0 t t Observando a expressão anteriormente citada pode-se ver que os fatores de ponderação são as quantidades da época atual. . o caracterizando. no de quantidade ela se deve às variações nas quantidades adquiridas.72 p L00. Uma séria limitação ao uso do índice de preço de Paasche reside no fato de os pesos variarem em cada período.5  1. Entretanto. p0 Exemplo: Utilizando as mesmas informações da tabela do exemplo anterior. mantendo constantes os preços e isolando. os preços da época atual são considerados os fatores de ponderação. temos os preços e as quantidades consumidas em dois anos mostradas na tabela a seguir.5  0. Determine a variação de preços no período (a) pelo índice de Laspeyres (b) pelo índice de Paasche.20  1.00  0. globalmente.08% 0.  q . p04 04 Esse índice sugere que.80  1. EXERCÍCIOS 13) Calcular os índices de preços e de quantidade pelos métodos de Laspeyres e Paasche para os dados abaixo: (ano-base 2002) ITENS X Y Z 2002 2003 Preço quantidade preço quantidade 35 3 39 5 28 5 20 8 12 9 18 10 14) Numa sociedade em que há apenas três bens (denominados A. os preços subiram 47. P0pt  .p t 0 t t Exemplo: Utilizando os dados do exemplo anterior e usando 2000 como base.5  0. mas aos mesmos preços (fixos na época atual. no de quantidade ela se deve às variações nas quantidades adquiridas. p04 1. quanto se gastará na época atual em relação ao que se gastou na época básica? Enquanto no índice de preço a diferença da importância gasta devia-se à variação nos preços.00  0.10  6  1. q q .p  q . uma vez que os preços permanecem constantes.25  1 = =147. Neste caso.5  0. B e C). obtenha os índices de Paasche de preços e quantidades.73 b) Índice de Quantidade de Paasche O índice de Paasche de quantidade é definido por: P0qt  . 1999 ITENS A B C Preço 1 3 4 Quantidade 1000 1500 1000 2000 Preço Quantidade 2 500 4 1200 3 1200 . O índice agregativo de quantidade procura responder: se em cada uma das duas épocas forem adquiridas quantidades diferentes de determinadas mercadorias.08  6  2.10  1 00.5  0.08%. no caso do índice de Paasche). aproximadamente. ano 1994 1995 1996 1997 1998 1999 relativo 100 130 150 180 200 250 Pede-se: a) Determine os correspondentes relativos de base móvel. O índice nacional é obtido por ponderação dos regionais. Belo Horizonte.74 7 7. aproximadamente. Salvador.3 7. serviços e mão-de-obra.000 preços atualizados mensalmente. Belém. 7.m. utiliza bens e serviços. Pede-se: a) De que percentagem o valor total das vendas deste produto aumentou ou diminuiu nesse período? b) Se o valor total das vendas do produto em 2001 foi de 20 milhões de reais qual foi o valor total das vendas em 2003? . num total de 116 municípios. São utilizados.m.3) e do INCC (0. São pesquisados mais de 250 produtos. INPC. É a média ponderada do IPA (0. 300 endereços. do IPC (0. de acordo com o momento econômico. Porto Alegre. Rio de Janeiro. c) Determine os preços no período 1997/99 sabendo que no ano base dado ele foi de R$400. Recife. sistematicamente pesquisados. O índice para produtos sazonais é calculado por Paasche.2 IPA – Índice de Preços por Atacado: Utiliza. totalizando cerca de 10. assim como os respectivos pesos. em famílias com renda entre 1 e 8 s. (cesta de bens pesquisada em 1982/83). O cálculo do índice é feito por Laspeyres com base móvel.000 preços a pesquisar. Fortaleza. IPCA – Índice de Preços ao Consumidor Ampliado: Variante do INPC.4 EXERCÍCIOS COMPLEMENTARES DE NÚMEROS ÍNDICES 15) Considere os relativos de base fixa constantes da tabela seguinte. gerando cerca de 50. utiliza renda entre 1 e 40 s.1 Principais Índices Brasileiros: IPC – Índice de Preços ao Consumidor IPC/Fipe (São Paulo): É calculado com base em 4 conglomerados de. Goiânia e Brasília). 7. A ponderação é alterada sempre que ocorram mudanças significativas.Fundação Getúlio Vargas.m. São considerados 427 itens de materiais de construção. Utiliza a fórmula de Laspeyres de base móvel. ICV/Dieese (São Paulo): São utilizados aproximadamente 350 produtos.1). pesquisados em famílias paulistanas com renda mensal entre 1 e 30 s. 430 produtos. IGP – Índice Geral de Preços: Calculado pela FGV .00. aproximadamente.6). 16) O preço de um produto aumentou de 40% no período 2001/03. 350 produtos e 140.000 preços a pesquisar. É calculado pela média geométrica dos relativos (Divisia) e divulgado semanalmente. atualizados sistematicamente. Curitiba. São obtidos índices regionais. referentes aos preços da utilidade W. b) Determine os correspondentes relativos com base em 1996. enquanto que a quantidade vendida do mesmo nesse período diminuiu em 10%. oito e doze pavimentos. em reais. INCC – Índice Nacional da Construção Civil: É obtido com base nos preços e quantidades padrões consumidas na construção de casas térreas (em média 82 m²) e edifícios com quatro.Índice Nacional de Preços ao Consumidor: É calculado com base nos preços de 11 regiões metropolitanas (São Paulo. d) sabendo que em 1993 foram produzidas 5 milhões de toneladas do bem em questão determine o número de toneladas produzidas em 1999. 18) Considere os dados seguintes referentes aos preços e consumos de alguns produtos Produto Preço Consumo Preço Consumo 2000 2000 2003 2003 Carne (kg) 3. se desejássemos estimar um índice de custo de vida com os dados deste problema? 19) A tabela seguinte apresenta os relativos de base móvel referentes as quantidades produzidas de certo bem.0 40 5.5 10 1. 20) De quanto aumentou o consumo de um bem.8 90 (dz) Leite (l) 0. b) Índice Aritmético Simples de Preços c) Índice de Laspeyres d) Índice de Paasche. e) Qual dos dois índices Aritmético simples ou Paasche seria o mais indicado. b) interprete o relativo de base móvel de 1997.3 12 Pede-se: a) Usando como base 2000 determine os relativos de preço de cada bem para 2003. o que podemos afirmar sobre a variação dos preços desses bens através de critério de Fisher ? .98% e o de Laspeyres em 154. d) Calcule o índice de Paasche com base em 2000 e interprete o resultado.5 60 2. num período em que seu preço de venda teve um aumento de 80% e seu valor total vendido triplicou? 21) Se no estudo da estrutura de preços e consumos de alguns bens numa certa região constatou-se que no período de 1995 a 2000 o valor do índice de Paasche foi calculado em 157.53%. c) Calcule o índice aritmético simples de preços com base em 2000 e interprete o resultado. calcule e interprete o valor do a) Índice Agregativo Simples de Preços. Ano 1993 1994 1995 1996 1997 1998 1999 Relativos 110 115 120 110 105 130 120 Pede-se: a) obtenha os correspondentes relativos com base em 1995.75 17) Os dados seguintes apresentam a estrutura de preços e consumos de uns certos produtos: produto preço 2002 consumo preço 2003 consumo 2002 2003 A 10 18 20 15 B 12 10 18 12 C 8 15 13 14 D 20 5 25 10 E 35 7 42 13 Considerando 2002 como ano base. c) interprete o relativo de 1994 calculado no tem "a”. b) Usando como base 2000 determine os relativos de quantidade de cada bem para 2003. e) Índice de Fisher .0 35 Laranja 1. 76 CAPÍTULO 9 PROBABILIDADE 1 Histórico Os primeiros estudos matemáticos sobre probabilidades foram feitos pelos italianos Cardano (1501 . 2. tendo conhecimento desses estudos.1754). 3. o jogo é interrompido por seu oponente. mas. o francês Laplace (1749 . 2 Conceitos básicos de probabilidade 2. temos o espaço amostral: {(ca. o francês Pascal (1612 -1668) foi procurado por Chevalier de Méré amigo seu e jogador profissional.1827) e os Russos Tchebycheff (1821 . o primeiro livro sobre a Teoria das Probabilidades. . Experimento probabilístico Definição Um experimento probabilístico é uma ação ou um ensaio por meio do qual resultado específico (contagem. onde encontram-se inúmeros problemas de probabilidade resolvidos.co). biologia e vários outros campos do conhecimento. A conseqüência de um único ensaio em um experimento probabilístico é um resultado (ponto amostral). Pascal escreveu a seu amigo Fermat (1601 1665) expondo-lhe vários problemas. (co. coroa}. um jogador deve tentar o número 1. Exemplos de experimentos probabilísticos: a) No “lançamento de uma moeda”. 6}.1. mas o holandês Huygins (1629 . física. Atualmente. Como ele poderia ser indenizado?”. temos o espaço amostral: {1. química. passou a interessar-se e.1922). c) “Dois lançamentos sucessivos de uma moeda”.co). medidas e respostas) são obtidos. foi o ponto de partida para a moderna teoria das Probabilidades. As idéias centenárias de Cardano foram esquecidas. que lhe apresentou questões do tipo: “Em oito lances de um dado. em 1657. (ca. economia. 5. 4.1576) e Galileu Galilei (1564 . (co. temos o espaço amostral {cara.ca)}. Essa correspondência entre os dois. Dentre os matemáticos que contribuíram para a evolução dessa teoria destacam-se: o suíço Bernoulli (1654-1705). depois de três tentativas fracassadas.1894) e Markov (1856 . o francês Moivre (1667 . b) No “lançamento de um dado”. a Teoria das Probabilidades tem muita importância e várias aplicações em estatística. publicou “Sobre o raciocínio em jogo de dados”. sociologia. Em 1654. O conjunto de todos os resultados possíveis de um experimento probabilístico é o espaço amostral. Um evento consiste em um ou mais resultados e é um subconjunto do espaço amostral. Resolvido os problemas de Méré.1695).ca). Pascal e Fermat nada publicaram a respeito.1642) e tratavam dos jogos de dados. engenharia. Eventos Um evento de um experimento aleatório é qualquer subconjunto do espaço amostral desse experimento. denotado por A é dado por A = S – A.: ocorrência da face 3 no lançamento de um dado. Se E = Ø.3.77 d) No “nascimento de uma criança”.2.2. temos o espaço amostral: {feminino. 3.2. n(B) = 2 * Evento C: a face observada é um número múltiplo de 5. 4. C = {5}. Ex. Coroa é complementar de cara (e vice-versa). n(C) = 1 (evento unitário) * Evento D: a face obtida é um número menor que 7.: No lançamento de um dado sair a face 7. E é chamado de evento impossível. 4.2. ou seja.6).2. Evento complementar Para um evento A qualquer. n(F) = zero (evento impossível) 2. Evento Impossível: é aquele que não ocorre em qualquer realização do experimento. n(D) = 6 (evento certo) * Evento F: a face obtida é um número maior que 6. 6}.  Exemplo: No lançamento de um dado e a observação da face voltada para cima. o evento complementar é (ganhar. 4}. Se E = S. Exemplo: 1. Num jogo em que acontece um (empate). a ocorrência de um exclui a possibilidade de ocorrência do outro e vice-versa. Ex. ouros e copas é complementar do conjunto de espadas. A = {2. 4. Evento Certo: é aquele que ocorre em qualquer realização do experimento. F = { }. 5. 5 ou 6. e) No “resultado de uma partida de futebol” temos o espaço amostral: {vitória. empate. Ex. O conjunto de cartas de paus.1. derrota}. D = { 1.: no lançamento de um dado fatalmente sairá a face 1. Eventos unitário. 2.3. o evento complementar é (2. o complementar de A. O número de elementos de um evento E será representado por n(E). Numa jodada de um dado que sai o número (1). 2.5. temos os eventos: * Evento A: a face observada é um nº par. 2.  Evento mutuamente exclusivos Evento Mutuamente Exclusivo: Caracteriza-se quando dois ou mais eventos não podem ocorrer simultaneamente. 2. certo e impossível Dois ou mais eventos elementares de certo espaço amostral são ditos:   Evento Unitário: é formado por um único elemento do espaço amostral. perder). E é chamado de evento certo.4. 6}. O resultado da reunião de A e A é exatamente o espaço amostral. Exemplos: . n(A) = 3 * Evento B: a face observada é um quadrado perfeito. ou seja. 4. é um outro conjunto formado pelos elementos que pertencem a S e não pertencem a A. masculino}. 2. 3. 2. 3. B = {1. 1. Ex. Um evento impossível é o subconjunto vazio do espaço amostral. Solução: A ocorrência de A modifica a probabilidade da ocorrência de B. os eventos são independentes. Exemplos: Decida se os eventos são dependentes ou independentes 1.  Eventos não mutuamente exclusivos Caracteriza-se quando dois ou mais eventos podem ocorrer simultaneamente. Jogar uma moeda. co). sem reposição. 2. empírica e subjetiva. Probabilidade Clássica . ca). Eventualmente poderão esgotar todos os resultados possíveis. portanto.4.78 1. 3. co). portanto. (co. então não há sol. dizemos que eles são condicionados a outro evento A do mesmo experimento.  Evento Condicionado: Quando associados dois ou mais eventos a um experimento aleatório qualquer. e então selecionar uma dama do baralho (B). os eventos são dependentes. sendo a recíproca verdadeira. (ca.  Evento independente e condicionado Evento Independente: Dizemos que dois ou mais eventos são independentes quando não exercem ações recíprocas. ca)} Os resultados dos eventos são independentes de uma moeda para outra. Se o tempo está nublado. obter cara (A) e então jogar um dado de seis faces e obter um 6 (B). 3 Tipos de Probabilidade Há três tipos de probabilidade: clássica. 2. Caracteriza-se quando a ocorrência de um evento B qualquer dependa da ocorrência de outro evento A. A probabilidade de um evento E ocorrer é escrita como P(E) – lê-se “a probabilidade do evento E”. Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B. Selecionar um rei de um baralho comum (A). 2. de duas cartas vermelhas de um baralho completo. Importante!   Um evento certo é o próprio espaço amostral. não o recolocando. (co. Ex. comportando-se cada um de maneira que lhe é própria sem influenciar os demais. quando a ocorrência de um evento não for afetada pela ocorrência do outro.: retirada. nesse caso serão chamados de mutuamente excludentes e exaustivos. Caracteriza-se. então ela não é de ouro.: Consideremos o lançamento de duas moedas: Temos: S = {(ca. portanto. Se a carta é de copas.2. 3. No lançamento de um dado qual a probabilidade de obter um número maior que 6: S = { 1.5 = 50% A = { 2. 5. No lançamento de um dado qual a probabilidade de obter um número par: S = { 1. 4. 3. 4. 3. n(A) = 3 c. n(A) = 1 b. 4. 2.79 Definição A probabilidade clássica (ou teórica) é usada quando cada resultado no espaço amostral tem a mesma probabilidade de ocorrer. n(A) = 0 Exercícios: 1. 6 }. No lançamento de uma moeda qual a probabilidade de obter cara: S = { ca. B) Um número múltiplo de 3. B) A soma dos números igual a 9. 2. determine a probabilidade de se obter: A) Números iguais. 4. No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6: S = { 1. D) Um número maior que 6. co } .0 = 100% A = { 1. Probabilidade empírica e Lei dos Grandes números Definição A probabilidade empírica (ou estatística) baseia-se em observações obtidas em experimentos probabilísticos. n(S) = 6 P(A) = = 0. No lançamento simultâneo de dois dados e a observação das faces voltadas para cima. C) Um número menor que 7. 5.2. 3. Tambaqui e Tucunaré: Tipo de peixe Quantidade Matrinxã 13 Tambaqui 17 Tucunaré 10 . 5. n(S) = 2 P(A) = = 0. n(A) = 6 d. n(S) = 6 P(A) = = 1. frequência do evento E P E   frequência total Exemplo: Em um pequeno açude contém três tipos de peixes: Matrinxã. 4. n(S) = 6 P(A) = = 0 = 0% A = { }. 6 }. determine a probabilidade de se obter: A) Um número ímpar. 3. 2. 2. 2. 6 }.5 = 50% A = {ca} . 6 }. 6 }. 5. A probabilidade empírica de um evento E é a freqüência relativa desse evento. No lançamento de um dado e a observação da face voltada para cima. A probabilidade clássica para um evento E é dada por ou Exemplos: a.  . ou de um “palpite bem fundamentado”. O mapa de dispersão abaixo mostra o resultado de similar jogada da moeda 500 vezes.80 Total Qual a probabilidade de se pescar um Tambaqui? P(Tambaqui) = 40 17 = 0. 4 Propriedades da probabilidade  Uma probabilidade não pode ser negativa ou maior que 1. Uma conseqüência importante desse fato é que. Exemplo: Como exemplo dessa lei.25. 0  P(E)  1 A soma das probabilidades de todos os resultados de um espaço amostral é de 1 (100%). poderá obter a probabilidade do complemento do evento E. Veja os exemplos:  Dado o estado de saúde do paciente e a extensão dos ferimentos. Probabilidade subjetiva O terceiro tipo de probabilidade é a subjetiva. 3. Assim. a probabilidade empírica de um evento tende à sua probabilidade teórica (real).5.5% 40 Lei dos grandes números À medida que um experimento é repetido mais e mais vezes. à medida que o número de jogadas cresce. Observe que. se souber a probabilidade de um evento E. um médico pode sentir que esse paciente tem uma chance de 90% de se recuperar completamente. a probabilidade de um evento E está entre 0 e 1. A probabilidade subjetiva resulta da intuição.425 = 42. estimativa. que é de 0. suponha que você queira determinar a probabilidade de obter cara com uma moeda normal. a probabilidade de obter cara fica mais perto da probabilidade teórica.  Um analista de negócios pode predizer que a chance dos funcionários de uma determinada companhia entrarem em greve é de 0.3. 1 35 a 44 43.81 Probabilidade de Eventos Complementares Sabemos que um evento A pode ocorrer ou não. a) Obtenha a probabilidade de selecionar um número menor do que mil.3 45 a 64 53. qual será a probabilidade de a descendente ser (a) cor-de-rosa? (b) vermelha? (c) branca? . há quatro resultados possíveis igualmente prováveis para a estrutura genética da descendência: vermelho (RR).296. Sendo P(A) a probabilidade de que ele ocorra (sucesso) e P(Ā) a probabilidade de que ele não ocorra (insucesso).050. b) Não ter entre 18 a 20 anos.230 votaram em outro candidato ou em outra opção. para um mesmo evento existe sempre a relação: P(A) + P(Ā) = 1 Exemplo: Sabemos que a probabilidade de tirar o nº 4 no lançamento de um dado é igual 1/6. 4) Dada a distribuição de freqüência dos números de eleitores brasileiros (em milhões) de acordo com a idade.9 Obtenha a probabilidade de um eleitor escolhido ao acaso: a) Ter entre 21 e 24 anos. corde-rosa (WR) e branco (WW).7 65 ou mais 31. Retira-se uma bola ao acaso. d) Obtenha a probabilidade de selecionar um número não divisível por mil. 6 6 Exercícios 1) Uma caixa contém bolas numeradas de 1 a 15. b) Obtenha a probabilidade de selecionar um número maior do que mil.9 25 a 34 40. c) Obtenha a probabilidade de selecionar um número divisível por mil. 3) Determine a probabilidade. 5) Quando duas flores boca-de-leão cor-de-rosa (RW) são cruzadas.8 21 a 24 13. considerando uma companhia que seleciona funcionários ao acaso para um teste de drogas. qual a probabilidade de se obter uma bola cujo número seja múltiplo de 4? 2) Qual é a probabilidade de um eleitor amazonense escolhido ao acaso não ter votado em Amazonino Mendes na eleição de 2008?  Cerca de 1. se duas bocas-de-leão forem cruzadas.  Cerca de 1250.000 votaram em Amazonino Mendes. cor-de-rosa (RW). a probabilidade de não tirar o nº 4 no lançamento de um dado: P(Ā) = 1− P(A) 1 5 P(Ā) = 1 − = . Logo. A companhia usa um computador para selecionar aleatoriamente números de funcionários em um intervalo que vai de 1 a 6. Então. Idade dos eleitores em anos frequência (em milhões) 18 a 20 10. Assim. Duas cartas são selecionadas em seqüência em um baralho comum (52 duas cartas). dado que outro evento já ocorreu.1. dado A”. é denotada por P(B|A) – lida como “probabilidade de B. Exemplos: 1. A tabela abaixo mostra os resultados de um estudo no qual pesquisadores examinaram o QI de 102 crianças e a presença de um gene específico nelas.82 6) O diagrama mostra o número de trabalhadores (em milhares) por setor numa certa cidade. restou no baralho 51 cartas. Calcule a probabilidade de: a) Um trabalhador escolhido ao acaso estar empregado no setor de serviços.078. b) Um trabalhador escolhido ao acaso não estar empregado no setor de serviços. Assim. . Delas. consiste de 72 crianças. Assuma que o rei não seja recolocado. Probabilidade condicional Uma probabilidade condicional é a probabilidade de ocorrer um evento. 4  0. dado que a primeira foi um rei. portanto. quatro delas damas. Determine a probabilidade de a segunda ser uma dama. dado que ela tem o gene. A probabilidade condicional de o evento B ocorrer. dado que o evento A já ocorreu. O espaço amostral. Gene Gene não Total presente presente QI alto 33 19 52 QI normal 39 11 50 Total 72 30 102 Solução: Existem 72 crianças com o gene. P(B|A) = 51 2. 5 Probabilidade Condicional e a Regra da Multiplicação 5. (a) Obtenha a probabilidade de determinada criança ter um QI alto. 33 têm QI alto. Solução: Uma vez que a primeira carta foi um rei e não foi recolocada. 3. os eventos são independentes. 72 (b) Determine a probabilidade de uma criança não ter o gene. os eventos são dependentes (ou condicionados. Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B. portanto. Probabilidade de selecionar uma dama(de ocorre B após ter ocorrido A): P(B|A) = 2. portanto. Qual a probabilidade de selecionar um rei de um baralho comum (A).458. não o recolocando. (c) Determine a probabilidade de uma criança não ter o gene. Jogar uma moeda. Probabilidade de eventos independentes Como dois eventos são independentes se a ocorrência de um deles não afeta a probabilidade de ocorrência do outro. 5. e então selecionar uma dama do baralho (B). A regra da Multiplicação (e) . Solução: A ocorrência de A modifica a probabilidade da ocorrência de B. Probabilidade de ocorrer cara: P(A) = 1 2 1 . então P(B|A) = P(B) ou P(A|B) = P(A) Os eventos que não são independentes são dependentes (condicionados) Exemplos: 1. Probabilidade de selecionar um rei: P(A) = 4 52 4 51 . 6 Probabiliade de obter a face 6 (de ocorrer B após ter ocorrido A): P(B|A) = P(B) = 5. dado que ela tem um QI normal.2.83 P(B|A) = 33  0. obter cara (A) e então jogar um dado de seis faces e obter um 6 (B). Neste caso os eventos são dependentes e definidos pela fórmula: P (A e B) = P (A ∩ B) = P (A) . Eventos mutuamente exclusivos Na seção anterior vimos como obter a probabilidade de dois eventos. é chamada probabilidade condicional de B. A e B. Definição Dois eventos A e B serão mutuamente exclusivos se A e B não puderem ocorrer ao mesmo tempo. B: obter um 4.1. . B: escolher um estudante com especialidade em enfermagem. vamos obter a probabilidade de pelo menos um dos eventos ocorrer. P (A e B) = P (A ∩ B) = P (A) . P (B) 6 Regra da Adição 6. 2. A: escolher um estudante do sexo masculino. Probabilidades como essas são denotadas como P(A ou B) e dependem dos eventos serem mutuamente exclusivas. Explique seu raciocínio. P (BA) b) para eventos independentes: Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. 1. A e B são mutuamente exclusivos. Escolha um estudante. A: obter um 3. ou seja. Exemplos: Decida se os eventos são mutuamente exclusivos. ocorrerem em seqüência. Jogue um dado. Nesta seção. a probabilidade de B ocorrer: depois de A ter acontecido é definida por: P(BA).84 A probabilidade de dois eventos A e B ocorrerem em seqüência é: a) para eventos condicionados: Se A e B são dois eventos. A e B não são mutuamente exclusivos. B: O doador é do sexo feminino. Escolha um doador sanguíneo.85 3.2% 3. Em um pequeno açude contém três tipos de peixes: Matrinxã. Seleciona-se ao acaso uma peça. 6. Uma caixa contém 100 peças das quais 5 são defeituosas. que não é recolocada e. No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4: Solução: Os dois eventos são mutuamente exclusivos então: 1 1 2 1 P(nº 3 ou nº 4) = + = = 6 6 6 3 2. Joga-se um dado duas vezes. qual a probabilidade de se pescar ou a Matrinxã ou um Tucunaré? c) Em duas capturas (sem reposição). Tambaqui e Tucunaré: Tipo de peixe Quantidade Matrinxã 13 Tambaqui 17 Tucunaré 10 Total 40 a) Qual a probabilidade de se pescar um Tucunaré? b) Em uma captura. Qual a probabilidade de se obter a face 5 em ambas as jogadas? Resposta: 1/36 2. 2 3 1 4 2 P(nº menor do que ou nº ímpar) = + – = = ≈ 0. qual a probabilidade de se pescar uma matrinxã e um Tucunaré? d) Em duas capturas (com reposição). Qual a probabilidade de que ambas as peças retiradas sejam defeituosas? Resposta: 0.2. qual a probabilidade de se pescar uma matrinxã e um Tucunaré? .667. A: o doador é do tipo O. No lançamento de um dado qual a probabilidade de se tirar um número menor que 3 ou um número ímpar. 6 6 6 6 3 Exercícios 1. seleciona-se outra peça. Regra da Adição a) para eventos mutuamente exclusivos P (A ou B) = P (A U B) = P (A) + P (B) b) para eventos não mutuamente exclusivos P (A ou B) = P (A U B) = P (A) + P (B) – P (A ∩ B) Exemplos: 1. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Retirando-se uma bola. 2 pretas.55% 11. 13. Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. obtenha a probabilidade de tirar um 4 ou um às. 14. qual a probabilidade de sair um 6 ou um número ímpar. Sendo retirada uma peça. Em um lote de 12 peças. branca. 15. 6. Qual a probabilidade de que ambas sejam da cor branca?. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5 bolas verdes. qual a probabilidade de serem ambos naturais de outro estado? Resposta: 4. Ao selecionar uma carta de um baralho. 2 verdes. sem reposição. uma urna B contém: 5 bolas brancas. b) a probabilidade de essa peça não ser defeituosa. qual a probabilidade de ela ser branca ou vermelha? 10. 9. qual a probabilidade de que: a) Todas sejam boas. Uma caixa contém 3 bolas brancas. Uma urna A contém: 3 bolas brancas.86 4. preta e verde. R: 30% 7. 4 são defeituosas. obtenha a probabilidade de tirar um 4 ou um naipe de ouro. Ao selecionar uma carta de um baralho. R: 6/210 12. 4 verdes. Qual é a probabilidade de as três bolas retiradas da 1ª: 2ª e 3ª urnas serem. Em uma caixa há sete lâmpadas. Se dois dos jurados são selecionados aleatoriamente para uma entrevista. calcule: a) a probabilidade de essa peça ser defeituosa. Um banco de sangue registra o tipo sanguíneo e o fator Rh de doadores durante os últimos cinco dias conforme a tabela a seguir: . respectivamente. 3 pretas. 5. Retirando três lâmpadas ao acaso. Na jogada de um dado. uma urna C contém: 2 bolas brancas. Uma bola é retirada de cada urna. 4 pretas e 5 vermelhas. Resposta: 24% 8. R: 24/210 b) Todas sejam queimadas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. 4 pretas. 1 verde. Um júri consiste de nove pessoas naturais do local e três naturais de outros estados. sendo quatro boas e três queimadas. de 1 a 20. a probabilidade de todos errarem é igual a (A) 3% (B) 5% (C) 17% (D) 20% (E) 25% 20. 2/5 e 5/6. a probabilidade de não obtermos a bola número 7 é igual a (A) 2/2 (B) 9/10 (C) 1/10 (D) 9/11 (E) 1/5 18. Se retirarmos uma bola da urna. (UEM-PR) .Um número é escolhido ao acaso entre os 20 inteiros. Qual a probabilidade de que o produto dos números escolhidos seja ímpar? (A) 9/38 (B) 1/2 (C) 9/20 (D) 1/4 (E) 8/25 19.Uma urna tem 10 bolas idênticas numeradas de 1 a 10. respectivamente. (c) Doador ter tipo sangüíneo A ou B. verificou-se que ele não vota no candidato B.As probabilidades de três jogadores marcarem um gol cobrando um pênalti são. (d) Doador ter tipo sanguíneo B ou ser Rh negativo.87 Determine as seguintes probabilidades: (a) Doador ter tipo sangüíneo O. (b) Doador ser fator Rh positivo. 1/2. Se cada um bater um único pênalti. A probabilidade de o número escolhido seja primo ou quadrado perfeito (A) 1/5. (UniRio) . (UERJ) . .Escolhem-se ao acaso dois números distintos de 1 a 20. A probabilidade de que esse eleitor vote em branco é (A) 1/6 (B) 1/5 (C) 1/4 (D) 1/3 (E) 2/5 17.Um instituto de pesquisa colheu informações para saber as intenções de voto no segundo turno das eleições para governador do estado. (UF São Carlos) . Questões objetivas 16. (FUVEST) . Os dados estão indicados no quadro abaixo: Intenção de Voto Percentual Candidato A 26% Candidato B 40% Votos nulos 14% Votos Brancos 20% Escolhendo aleatoriamente um dos entrevistados. (Santa Casa-SP) .1%. 23. 10 são torcedores do São Paulo. (E) n. (D) 99. 24. (D) 7/12. uma peça dessa amostra.a. a probabilidade de ele ser torcedora do São Paulo ou do Palmeiras é (A) 40%. (UNESP) . (C) 7/36. escolhidas ao acaso. . ao acaso. A probabilidade de que ambas sejam brancas vale (A) 1/6. (D) 2/5.Num grupo de 60 pessoas. (B) 99. 3 bolas azuis e 3 bolas brancas.0%. sucessivamente e sem reposição. (CESGRANRIO) .2%. 21. Retirando-se. (C) 50%. sem reposição desta. (B) 25%.88 (B) 2/25. a probabilidade de ela ser perfeita é de (A) 99.Dois dados perfeitos e distinguíveis são lançados ao acaso. (E) 4/9. Duas bolas.Uma urna contém 4 bolas vermelhas. Escolhido ao acaso um elemento do grupo. 25. (C) 20/81. Qual é a probabilidade de retirarmos uma bola vermelha e. (E) 3/5. existem exatamente quatro defeituosas. (CESGRANRIO) . são sacadas dessa urna.d.Em uma amostra de 500 peças. (CESGRANRIO) .Uma urna contém 4 bolas brancas e 5 bolas pretas. (B) 1/18.3%. (B) 4/9. (D) 2/9. (C) 4/25. A probabilidade de que a soma dos resultados obtidos seja 3 ou 6 é (A) 7/18. (D) 30%. (E) 16/81.4%. 5 são torcedoras do Palmeiras e as demais são torcedoras do Corínthians. uma branca? (A) 1/15. (C) 99. 22. (E) 99. é necessário primeiro classificar adequadamente o grupamento e depois aplicar a fórmula correta. (C) 3/15. 1 Exemplos: 5! = 5. Pn = n! Exemplo: Três membros de uma organização social se ofereceram como voluntários.. Qual o número de maneiras pelas quais os três podem assumir tais cargos? P3 = 3!= 6 b) Permutação com Repetição Conjuntos com alguns elementos iguais entre si. sendo esse número um inteiro maior do que 1. (E) 50%. para o próximo ano. assumindo as funções de Presidente. 7. A probabilidade de ocorrer cara num lançamento dessa moeda é: (A) 40%. 26. 7 Análise Combinatória Quando a contagem direta do número de possibilidades é muito trabalhosa.1 Notação Fatorial: Define-se como fatorial de um número n (n!). Tesoureiro e Secretário. n! = n . Para tanto. (n−1) .3.4.2 Permutação Permutar é (re)ordenar os elementos de um conjunto numa seqüência previamente definida. . (B) 80%. (C) 25%.1 = 120 7! = 7..89 (B) 2/15.3. As permutações podem ser: a) Permutação sem Repetição Conjuntos com elementos distintos.Numa moeda viciada. . para compor a diretoria.4. Pnt1 t k  n! t ! Exemplo: Quantos anagramas distintos têm na palavra MISSISSIPI? . podemos nos valer da análise combinatória para determinar os números de casos favoráveis e/ou possíveis dos experimentos estudados. (D) 4/15. a probabilidade de ocorrer face cara num lançamento é igual a 4 vezes mais a probabilidade de ocorrer coroa.1 = 5040 7. (E) 10/15.5. (FEI-SP) . (D) 20%.6.2.2. 0001% P10 10! 7.2 = 32 = 9 Exercício de aplicação 1) Qual o número máximo formado pela empresa de Telefonia celular que você usa com em Manaus? 2) Qual o número máximo de CPF formado formados com 11 dígitos? Arranjo sem reposição: .1 = 24 b) CASTELO: P7 =7! = 5040 c) ARARA: 5! 120 = =10 P53.90 P 4 . 2 e 3.2 = 9 x 9 = 92 = 81 2) Quantos números de dois algarismos se podem formar com os dígitos 1.2 2) Em cada uma das dez bolas de uma urna está impressa uma letra da frase FELIZ NATAL. qual a chance de surgir a tal mensagem? 4 1 P = 2 . Arranjo com reposição: An. A3.r = nr Exercícios resolvidos 1) Calcule os arranjos com reposição: a) A9. por arranjo se entende o número total de permutações possíveis nos subconjuntos de ‘r’ elementos de um conjunto composto por ‘n’ elementos. quando o item selecionado é devolvido ao conjunto de origem antes do próximo sorteio.: Os anagramas são permutações (troca de lugar) das letras da palavra. Exercícios resolvidos 1) Encontre o anagrama de cada palavra abaixo: a) AMOR: P4 = 4! = 4.3. ou seja. Sorteadas as bolas uma a uma.3 Arranjo Quando a permutação é feita com apenas uma parte dos elementos do espaço amostral.2 = = 0.4  10 10! = 6300 4! 4! Obs.3 = 9 x 9 x 9 = 93 = 729 b) A9. fala-se em permutação com reposição. Permutar sem reposição significa extrair o elemento. avalia-lo e descarta-lo.2  3! 2! 6.2. um vice e um tesoureiro..r= Exercícios resolvidos 1) Calcule a seguinte combinação: C15.399 C 20.2.10.13 = = = 455 3!15  3! 3!.48 3) De 20 pessoas que se oferecem para doar sangue 15 possuem sangue tipo B.3 = 5! 5! 5. tomando-se ‘r’ de cada vez. A5.12! 15.r = n! n  r ! Exercícios resolvidos 1) Calcule os arranjos sem reposição: a) A9..2 = 9 x 8 = 72 2) Um grupo de Cinco pessoas.2! = = = 60 5  3! 2! 2! Observe que se utiliza um arranjo quando se quer formar grupos a partir de um conjunto maior em que a ordem é importante.14. 52 51 50 49 48 C13.3 P (3 sangue B) = = 0. Qual a probabilidade de..91 An.12! 3.3 .4.3 = 9 x 8 x 7 = 504 b) A9.1 2) Qual a probabilidade de tirarmos 5 cartas de espadas sem reposição de um baralho de 52 cartas: 13 12 11 10 09 Método tradicional: P(5 espadas) = x x x x = 0. Para se calcular o número de combinações possíveis de ‘n’ elementos. usa-se a expressão: Cn.3.13.14. C 52. Calcule quantas chapas podem ser formadas.0005.50.9 Técnica de contagem: P(5 espadas) = = = 0.5 13.3 = n! r ! n  r ! 15! 15. 7.12.51. escolhendo-se 3 pessoas desse grupo todas as 3 escolhidas tenham sangue tipo B: C15.49.11..0005.5 52.4 Combinação Quando as escolhas se distinguem só pela qualidade e não pela ordem dos elementos. deseja montar uma chapa eleitoral composta por um presidente. 2 C52.3. quantos códigos diferentes estão disponíveis? 2) Diretoria.3 P (2 ases) = 4.92 4) Qual a probabilidade de retirarmos 2 ases em uma amostra de 5 cartas retiradas de um baralho de 52 cartas: C  C 48.3 5) Qual a probabilidade de retirarmos 4 ases em uma amostra de 13 cartas retiradas de um baralho de 52 cartas: C  C 48. Exercícios (ver Larson pág.2! C5.9 P (4 ases) = 4. Os cargos são de presidente. secretário e tesoureiro.4. O código de acesso a um sistema de um carro consiste de 4 dígitos. vice-presidente. De quantas letras distinguíveis as letras da palavra estatística podem ser escritas? .3 = = = = 10 3! 5  3! 3! 2! 3! 2! Observe que se utiliza uma combinações quando se quer formar grupos a partir de um conjunto maior em que a ordem não é importante. Quantas combinações diferentes seriam possíveis para compor este trio? 5! 5! 5. 4 C52. De quantas maneiras os cargos podem ser preenchidos? 3) Letras. 120) 1) Sistema de segurança. Suponha que somente três destes diretores sejam convidados a representar a empresa num banquete.13 6) Cinco pessoas constituem a junta de diretores de uma empresa. Uma diretoria deve ser escolhida a partir de 15 candidatos. primeiro traça-se o sistema de eixos cartesianos. o objetivo principal é estabelecer relações que possibilitem predizer uma ou mais variáveis em termos de outras. Assim é que se fazem estudos para predizer:  As vendas futuras de um produto em função do seu preço. então os valores das variáveis sobre os respectivos eixos e marca-se um ponto para cada par de valores. devemos contentar-nos com a predição de médias ou valores esperados.  O consumo per capita de certos alimentos em função de seu valor nutritivo. 5. 4. Naturalmente. 2. A relação entre X e Y é linear. Estudaremos a Análise de Correlação Simples. o ideal seria que pudéssemos predizer uma quantidade exatamente em termos de outra. 3. Hipóteses: 1. . de X e de Y. 2 DIAGRAMA DE DISPERSÃO Para desenhar um diagrama de dispersão. Ambas são variáveis aleatórias. A análise de correlação mede o grau de relacionamento entre as variáveis. As duas distribuições. mas isso raramente é possível. Depois representa uma das variáveis no eixo “x” e a outra no eixo “y” colocam-se.  A despesa de uma família com médico e remédios em função de sua renda. As distribuições condicionais de Y dado X têm distribuição Normal. as variâncias das distribuições condicionais de Y dado X são todas iguais. Homocedasticidade.93 CAPÍTULO 10 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 INTRODUÇÃO Em muitas pesquisas estatísticas. Na maioria dos casos. a qual diz respeito à medida entre X e Y. têm distribuição Normal na população. formada por dez dos 98 alunos de uma classe da Universidade A e pelas notas obtidas por eles em Matemática e Estatística: Notas Matemática (x) Estatística (y) 5.0 7.0 6. .0 8.0 2.0 10.0 7.0 9. Figura 1 Atividade: Reproduzir esse diagrama de dispersão no “EXCEL”.0 7. Esse diagrama nos fornece uma grosseira idéia da correlação existente entre essas duas variáveis.0 6.0 6. obtemos uma nuvem de pontos que denominamos de diagrama de dispersão.0 3.0 8.0 4.0 9.0 8.0 5.0 Tabela 1 Representando os pares ordenados em um sistema cartesiano.94 EXEMPLO 1: Consideremos uma amostra aleatória.0 10.0 2.0 8. 2 COEFICIENTE DE CORRELAÇÃO LINEAR O objetivo do estudo da correlação é determinar a força do relacionamento entre duas observações emparelhadas. quando x cresce. em média y decresce. b. Não-linear se os pontos têm como "imagem" uma curva. nos limitaremos ao estudo de correlação linear com duas variáveis. diz-se que as duas variáveis têm correlação negativa. d. Assim. isto é. uma correlação é: a.1 CORRELAÇÃO POSITIVA E CORRELAÇÃO NEGATIVA Se as variáveis x e y crescem no mesmo sentido. não fornecendo uma “imagem” definida. y também cresce. Se as variáveis x e y variam em sentido contrário.95 3 CORRELAÇÃO LINEAR SIMPLES 3. . c. Linear negativa se os pontos têm como "imagem" uma reta descrescente. isto é. Linear positiva se os pontos do diagrama têm como "imagem" uma reta crescente. diz-se que as duas variáveis têm correlação positiva. Não há correlação linear se os pontos apresentarem-se dispersos. 3. quando x cresce. 6  r  1 . Observação importante: . n y   yi  2 i  2  (1) Onde: n é o número de observações e r é o coeficiente de correlação linear. ou não há correlação entre as variáveis. há uma correlação perfeita e positiva entre as variáveis.  Se r = 0. e podemos tirar algumas conclusões significativas sobre o comportamento das variáveis.  Se r = −1. o sentido dessa correlação (positivo ou negativo).  Se r = +1.  Se 0 < r < 0.6. há uma correlação perfeita e negativa entre as variáveis. há uma correlação muito fraca entre as variáveis.3. PROPRIEDADES    O valor de r está sempre entre o intervalo [−1. ainda. O valor de r não varia se todos os valores de qualquer uma das variáveis são convertidos para uma escala diferente. Não serve para medir a intensidade de um relacionamento não-linear. o instrumento empregado para a medida da correlação linear é o coeficiente de correlação.  Se 0. e não é viável tiramos conclusões sobre as variáveis em estudo. há uma correlação forte. de um relacionamento linear.3 INTERPRETAÇÃO DO COEFICIENTE DE CORRELAÇÃO LINEAR Como definimos. ou a relação que porventura exista não é linear. há uma correlação fraca entre as variáveis.96 DEFINIÇÃO A correlação é a medida padronizada da relação entre duas variáveis e é dada pela seguinte expressão: r n x n xi yi   xi  yi  2 2 i   xi  .(1).+1]. ou grau. r mede a intensidade.3  r < 0.  Se 0. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e. 3. veja a Eq. porque quando uma das variáveis cresce. . portanto observamos que há um alto grau de correlação entre as duas variáveis. Podemos dizer que duas variáveis X e Y estão correlacionadas. a correlação não implica que um causa o outro. na média eles simplesmente estão relacionados ou associados um com o outro.6  r  1 . xi yi xi yi xi 2 yi 2 5 6 30 25 36 8 9 72 64 81 7 8 56 49 64 10 10 100 100 100 6 5 30 36 25 7 7 49 49 49 9 8 72 81 64 3 4 12 9 16 8 6 48 64 36 2 2 4 4 4 65 65 473 481 475 r 10. Então. a outra . em média. pois encontra-se entre o intervalo 0. EXEMPLO 2: Encontre o coeficiente de correlação para os dados da tabela 1. também cresce.97 É um erro concluir que a Correlação implica em CAUSALIDADE ⇒pode haver uma variável oculta que afeta as variáveis em estudo que não está sendo levada em consideração.911. mas não que X causa Y ou Y causa X.475  65  2 2 10.481  65 10.65 r 505  0. notas de matemática e notas de estatística dos alunos tem correlação positiva.911 585  525 Interpretação do coeficiente de correlação linear desse exemplo: O coeficiente de correlação linear entre as varáveis é r = 0.473  65. ou seja. . As hipóteses gerais são: 1. Para nosso trabalho.. A equação de regressão é a fórmula algébrica pela qual se determina Y. é necessária a hipótese de que as distribuições condicionais de Y dado X são todas distribuídas normalmente para os valores da população. nos concentraremos em equações lineares com duas incógnitas. da forma ŷ = ax + b onde b é o intercepto-y ( valor de y para o qual x = 0) e a é o coeficiente angular da reta (ou seja.. mas também porque. as relações entre grandezas conhecidas (variáveis dependentes) e grandezas que devem ser determinadas (variáveis independentes). seriam difíceis de descrever em termos matemáticos. Sempre que possível procuramos expressar. homocedasticidade – as variâncias das distribuições condicionais de Y dado X são todas iguais.98 4 REGRESSÃO LINEAR SIMPLES As equações lineares são úteis e importantes não só porque muitas relações têm efetivamente esta forma.). A Análise de Regressão Múltipla diz respeito à predição de Y por mais de uma variável X ( x 1. Y é uma variável aleatória obtida de uma amostra. . Se em conjunto com a análise de regressão.. A Análise de Regressão Simples diz respeito à predição de Y por uma única variável X. constituem boas aproximações de relações que. utiliza-se a estimação por intervalo. 3. 2. a variação de y que acompanha um aumento de uma unidade em x). Y e X estão associadas linearmente. x2. em termos de uma equação matemática. em geral. O objetivo principal da análise de regressão é predizer o valor da variável dependente Y dado que seja conhecido o valor da variável independente X. de outro modo. escrita como ŷ = ax + b onde ŷ é o valor estimado de y. usá-la somente dentro dos limites de valores disponíveis. Como verificamos que há um alto grau de correlação entre as variáveis do exemplo 1. o resultado na realidade é uma estimativa da verdadeira função de regressão. Assim. dado um valor determinado da outra variável.99 Na prática. Usar a equação de regressão somente quando indicar correlação linear significativa. Observação importante As equações de regressão podem ser úteis para PREDIZER o valor de uma variável. EXEMPLO 3. na equação. vamos obter a reta ajustada. a melhor estimativa de uma variável é sua média. ao fazermos o uso de uma amostra para obtermos os parâmetros. E. os valores de a e b costumam ser estimados com base em dados através das expressões: n xi   xi  b  y  ax 2 a n xi yi   xi  yi  2 (2)  Onde: x é a média dos valores de xi  x    x   n   i  e y é a média dos valores de yi  y    y   n   i Portanto. Observado os dados e. as equações (2). podemos introduzir. calculando os correspondentes valores preditos de y. . uma vez estimada a equação da reta. são os parâmetros da reta estimada. valores de x. Quando não há correlação linear significativa. 65.8632 585 10.3 Portanto.100 xi 5 8 7 10 6 7 9 3 8 2 65 O coeficiente angular: a= 10. de um aluno que obteve 4 em matemática? Ao substituir x = 4.481  65 2 yi 6 9 8 10 5 7 8 4 6 2 65 xi. para esse grupo de estudantes um aluno que obtém nota 4 em matemática.  0.65 505   0. na reta estimada obtemos: ˆ y  0.4  0. estima-se que obtenha 4.8632 x  0. tais como.3 em estatística.yi 30 72 56 100 30 49 72 12 48 4 473 xi2 25 64 49 100 36 49 81 9 64 4 481 O intercepto: b 65 65  0. Exercícios .8892 Com a reta estimada podemos fazer previsões.473 .8632.8892 = 4.8632.8892 10 10 A equação da reta estimada: ˆ y  0. Qual a nota estimada de estatística. ŷ = ax + b.6 184 2.4 225 1.5 15 .4 180 1.0 220 2.86? Justifique sua resposta.62 201 2.5 7. Calcule o coeficiente de correlação (analise o resultado para prosseguir o outro item). a.89 142 1. xi 45 10 47 37 47 8 45 yi 90 25 45 23 52 95 48 III.0 9. I. xi 13 33 45 56 60 70 80 yi 2. Qual dos valores a seguir pode não representar um coeficiente de correlação? (a) r = 0.15 5.0 186 2.54 220 1. fazendo somente uma analise gráfica.0 9. Correlação.59 154 0.75 ou r = 0. Correlação. Os dados estão dispostos na tabela abaixo. Um administrador de marketing conduz um estudo para determinar se existe uma relação linear entre o dinheiro gasto em propagandas e as vendas de uma companhia. Esboce o diagrama de dispersão das variáveis. Organize os dados em um mapa de dispersão e descreva o tipo de correlação. 2. Os dados estão dispostos na tabela abaixo. Peso (kg) (x) Água (litros) (y) 102 1.98 124 2.101 1. Determine a reta ajustada.2 215 4.92 (b) r = 1.73 (d) r = – 0. b. Qual é o valor de r que indica uma correlação mais forte: r = 0.6 240 1. Correlação.47 119 0. Dada duas variáveis x (independente) e y (dependente). xi 1 2 3 4 5 6 yi 70 50 40 30 20 10 II.05 3.42 141 1.5 11.6 184 2. Uma estudante de enfermagem conduz um estudo para determinar se existe uma relação entre o peso de uma pessoa (em quilogramas) e o consumo diário de água (em litros). Correlação. Gastos com propaganda em milhões de reais (x) Vendas da empresa em Milhões de reais (y) 2. c. (a) Posicione os dados em um mapa de dispersão e (b) Com apenas uma análise do gráfico verifique se existe uma correlação linear negativa ou positiva ou se não existe uma correlação linear. Para cada caso faça uma análise de regressão linear simples.05 (c) r = –0.0 13. Um dos diretores da firma ficou intrigado com o fato da equação sugerir que uma família com renda de 3 s. i. A pesquisa levou à seguinte equação ŷ = −1.). onde ŷ representa a despesa mensal estimada com mercadorias (através do modelo) e x a renda mensal líquida expressa em salários mínimos. Estimar despesas com mercadorias para famílias com renda de 20 a 35 s. . A tabela mostrada relaciona os números x de azulejos e os custos y (em dólares) de sua ajustagem e colocação.m. O diagrama de dispersão. O coeficiente de correlação linear.2 + 0. b. não gaste nada em mercadorias. qual o valor do computador? Exercícios Avaliativos 8. Um aluno de economia se interessa em estudar a depreciação de um uma marca de computador com uma determinada configuração. c. b. X y 1 5 2 8 3 11 5 17 6 20 Semestres (xi) 1 2 3 4 5 6 Valor (yi) 4500 3800 2700 1900 1200 1000 Determine: a. c. 7. e analise o grau de correlação. veja os dados obtidos: Anos (xi) Janeiro de 2001 Julho de 2001 Janeiro de 2002 Julho de 2002 Janeiro de 2003 Junho de 2003 Determine: a. a. O diagrama de dispersão. A equação da reta ajustada. A equação da reta ajustada.m.m. ii.4x. Uma cadeia de supermercado financiou um estudo dos gastos realizados por famílias de 4 pessoas com renda líquida entre 8 e 20 salários mínimos (s. c. Estimar despesas com mercadorias para famílias de cinco pessoas. Qual a sua explicação.102 6. e analise o grau de correlação. No sétimo semestre. b. d. Estime a despesa mensal de uma família com renda de 15 salários mínimos. O coeficiente de correlação linear. Explique por que a equação acima não poderia ser usada nos seguintes casos. 000) e faturamento (US$ 1. Estimar o grau no exame obtido por um estudante que dedicou 30 horas fora de classe.103 ˆ d. d. c. O diagrama de dispersão. 11. Certa empresa.00. Determine o coeficiente de correlação. 20 64 16 61 34 84 23 70 27 88 32 92 18 72 22 77 . A tabela apresenta dados de amostra referentes ao número de horas de estudo fora de classe para determinados alunos de um curso de estatística. Para x = 4. c. obteve a tabela: Preço em reais (xi) Demanda (yi) 18 150 22 125 30 97 36 70 39 56 43 46 50 38 1 19 2 32 4 44 6 40 10 52 14 53 20 54 a. d. Estabeleça a equação da reta ajustada. Esboce o diagrama de dispersão. e analise o grau de correlação. Gastos com publicidade(xi) Faturamento(yi) Determine: a. bem como os graus obtidos em um exame aplicado no fim do curso. Determine a função da reta de regressão linear. Estime a demanda para o preço de R$ 40. estudando a variação da demanda de seu produto em relação à variação de preço de venda. 9.000. Dados sobre os gastos com publicidade (US$ 1. b. O coeficiente de correlação linear. c.00. Sabendo que os gastos com publicidade foi de US$ 7. o valor predito de y.000) para o Four Seasons Restaurant são apresentados a seguir. b. Esboce o diagrama de dispersão. b. Determine o coeficiente de correlação. Quanto espera-se ganhar o Four Seasons Restaurant? 10. A equação da reta ajustada. Horas de estudo (x) Grau no exame (y) a. ache y . d. Determine o coeficiente de correlação. Determine a equação da reta de regressão linear. Os dados emparelhados que se seguem consistem no perímetro torácico (em polegadas) e dos pesos (em libras) de uma amostra de ursos machos. b.6 3500 3.9 3100 b. Esboce o diagrama de dispersão. 13. supondo que um vendedor tenha nove anos de experiência. Média das Notas 2. Esboce o diagrama de dispersão. b) Determine o coeficiente de correlação. d) Estimar as vendas anuais. Supondo que a nota de um estudante de bacharelado em administração com ênfase em sistemas de informação seja 8. c. d. Um gerente de vendas reuniu os seguintes dados considerando os anos de experiência e as vendas anuais. Anos de experiência 1 3 Vendas anuais (US$1. Os dados a seguir são a média das notas x e salários mensais y de estudantes que obtiveram bacharelado em administração com ênfase em sistemas de informação. o peso predito. 54 416 49 348 41 262 49 360 44 332 19 34 ˆ d.4 3100 3. 68 132 64 108 62 102 65 115 66 128 b. Para um urso com perímetro torácico de 52 in. classificados por idade de máquina em meses. 4 92 4 102 6 103 8 111 10 119 10 123 11 117 13 136 . Determine o coeficiente de correlação. Estime qual será seu salário mensal. 15.104 12.2 3000 3.0. Determine a equação da reta de regressão linear. 16.5 3400 2.6 Salário Mensal (US$) 2800 a. Estimar o peso de uma mulher. ache y . 14. Determine o coeficiente de correlação. Esboce o diagrama de dispersão.000) 80 97 a) Esboce o diagrama de dispersão. d. Os dados seguintes foram obtidos da altura (polegadas) e do peso (libras) de mulheres nadadoras. c. Determine a função da reta de regressão linear. Tórax (x) 26 45 Peso (y) 90 344 a. c) Determine a equação da reta de regressão linear. A tabela abaixo relata os custos de manutenção por hora. c. 3. Altura Peso a. que possui 67 polegadas. 8 2.0 4.0 10.0 8.0 7.2 42 26.0 1. (e) Com base nos itens anteriores tire conclusões sobre a eficiência do instrumento.105 Idade (meses) 6 15 Custos médios (R$) 9.0 6.0 6.0 10. Pepper 40.0 1. c) Determine a função da reta de regressão linear. (b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Para isto.6 219.9 Mountain Dew 29.8 8.0 4.0 10. b) Determine o coeficiente de correlação. obtendo: X Y 2.2 Pepsi-Cola 92.1 2.0 6. 24 19.3 33 19. Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado.3 1929.6 7.5 4.0 4.5 Dr.2 8. (d) Obtenha a reta de regressão da variável Y em função de X.5 a) Esboce o diagrama de dispersão. Os dados seguintes mostram o gasto com mídia (milhões de dólares) e as vendas de caixas (milhões) para sete grandes marcas de refrigerantes.6 Coca-Cola Light 60.0 535.7 541. sabendo que foi gasto 80 milhões de dólares com mídia.4 Sprite 55. 18. Como essa reta pode ser útil na avaliação do instrumento? (c) Calcule o coeficiente de correlação entre as variáveis X e Y.2 4.1 (a) Construa o diagrama de dispersão para esses dados.0 2.4 811.9 4.7 10.0 6. 17. d) Faça uma previsão de custo para uma máquina de 45 meses.4 1384. 20 de outubro de 1997 b) Determine o coeficiente de correlação.2 536. Marca Gastos com mídia (US$) Vendas de caixas (US$) Coca-Cola 131.6 10.5 8.7 16.2 6.0 9.0 6. ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y).5 Fonte: Superbrands ’98.9 c) Determinar equação da reta dos custos sobre a idade. d) Estimar as vendas.0 7.Up 11. . 0 53.0 73.0 84.0 49.0 (a) Construa o diagrama de dispersão e interprete-o.0 87.0 68.0 105.0 45.0 43.0 76.0 56.0 100.0 100.0 Idade (X) 71.0 80.0 65.0 73. (d) Considerando a reta estimada dada no item (c).0 64.0 78.0 97.0 45.0 67.0 116.0 76.0 91.0 78.0 58. estime a massa muscular média de mulheres com 50 anos.0 73. . (b) Calcule o coeficiente de correlação linear entre X e Y. e observou em cada uma delas a idade (X) e a massa muscular (Y).0 65.0 78. Massa muscular (Y) 82.106 19.0 56. É esperado que a massa muscular de uma pessoa diminua com a idade. (c) Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular (dependente) e X: idade (independente).0 68. com idade entre 40 e 79 anos.0 77. Para estudar essa relação.0 68.0 73. uma nutricionista selecionou 18 mulheres. 0 50.0 40.0 20.0 50.0 40.0 30. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias. (c) Obtenha a equação de regressão do gasto com alimentação em função da renda familiar.0 50.107 20. (d) Qual o significado prático do valor da inclinação da reta de regressão do item (c)? .0 35.0 8.0 40.0 10.0 25.0 40. Renda Familiar (X) 3 5 10 10 20 20 20 30 40 50 60 70 70 80 100 100 100 120 120 140 150 180 180 200 200 Gasto com Alimentação (Y) 1.0 12.0 60.0 (a) Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X).0 40.0 30.0 25. (b) Calcular o coeficiente de correlação entre essas variáveis.0 20.0 15.5 2.0 7.0 10.0 6. 2005. RJ. LARSON. 2008. e FOX.Para Os Cursos De: Economia. MEDEIROS. Editora Bookman. Administração e Contabilidade. Ermes da Silva Et al. Mário. Editora Campus. 2007. J.108 Bibliografia CRESPO. C. John e SIMON. 5ª edição. Estatística Aplicada.Economia. James A. 2005. TRIOLA. Editora LTC. Pearson Prentice Hall. P. Antônio Arnot. 9ª edição. 4ª Edição. Estatística para Ciências Sociais.. A. . Editora Saraiva. Ron e FARBER. Estatística Usando Excel. 2ª edição. São Paulo. W. Estatística Fácil. Administração E Ciências Contábeis. Freund. 2006 BUSSAB. Laponi. São Paulo: Atlas. MORETTIN. 9ª edição. 2005. . 2002. 2002. Estatística 1 . 9ª Edição. Estatística Aplicada . Introdução a Estatística. Estatística Básica. FREUND. . Ed. Pearson-Prentice hall. São Paulo. São Paulo. Betsy. O. LEVIN Jack.
Copyright © 2025 DOKUMEN.SITE Inc.