Unknown Parameter Value

March 26, 2018 | Author: derp_509 | Category: Histogram, Statistics, Data, Probability Distribution, Descriptive Statistics


Comments



Description

ESTATÍSTICA DESCRITIVA CAPÍTULO 1 - DISTRIBUIÇÃO DE FREQÜÊNCIASBIBLIOGRAFIA CONSULTADA: 1. ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estatística Aplicada à Administração e Economia. 2.ed. São Paulo: Pioneira Thomson Learning, 2002. 2. BUSSAB, W. O. & MORETIN, P. Métodos Quantitativos: Estatística Básica. 5.ed. São Paulo: Saraiva, 2002. 3. MARTINS, G. A. Estatística Geral e Aplicada. 2.ed. São Paulo: Atlas, 2002. 4. MARTINS, G. A. & DONAIRE, D. Princípios de Estatística. 4.ed. São Paulo: Atlas, 1995. 5. MEDEIROS, E. S. e colaboradores. Estatística para os Cursos de Economia, Administração e Ciências Contábeis. vol. 1 e 2. 3.ed. São Paulo: Atlas, 1999. 6. STEVENSON, W. J. Estatística Aplicada à Administração. 3.ed. São Paulo: Harbra Harper How do Brasil, 2001. 7. TRIOLA, M.F. Introdução à Estatística. 10.ed. Rio de Janeiro: LTC, 2008. 1. INTRODUÇÃO DEFINIÇÃO: O QUE É ESTATÍSTICA? É a ciência que fornece métodos e processos quantitativos para planejamento, coleta, organização, descrição, análise e interpretação de dados. Particularmente em administração, economia e ciências contábeis, uma grande razão para entender estatística é dar aos tomadores de decisão um melhor entendimento/controle do ambiente administrativo, possibilitando decisões objetivas, previsões precisas e transmissão da mensagem desejada de forma eficaz. PARTE DA NOMENCLATURA UTILIZADA EM ESTATÍSTICA: • • • • • • • • • Dados estatísticos são fatos ou números que são coletados, organizados em tabelas e/ou gráficos, analisados e interpretados. Dados brutos são uma seqüência de fatos ou valores numéricos não organizados, obtidos diretamente da observação de um fenômeno. Rol é uma seqüência ordenada (crescente ou decrescente) de dados brutos. Elementos são as entidades sobre as quais os dados são coletados. Variável é a característica de interesse para os elementos. Dados qualitativos consistem em rótulos ou nomes para uma característica de um elemento, podendo ser não-numéricos ou numéricos. Dados quantitativos consistem em números que representam contagens ou medidas. População ou universo é o conjunto de todos os elementos de interesse em um determinado estudo. Amostra é um subconjunto da população. 1 Exemplos: População: dados estatísticos da população brasileira levantados pelo IBGE no censo demográfico realizado a cada 10 anos. Amostra: dados obtidos em testes após a fabricação de um pequeno número de peças antes de se iniciar sua fabricação em grande escala. Quando a população é muito grande, a Estatística recorre a uma amostra. Entretanto, a AMOSTRA DEVE REPRESENTAR EFETIVAMENTE A POPULAÇÃO. ESTUDOS ESTATÍSTICOS Muitas vezes, os dados necessários para uma aplicação particular não estão disponíveis através de fontes existentes. Em tais casos, os dados freqüentemente podem ser obtidos realizando-se um estudo estatístico. Os estudos estatísticos podem ser experimentais ou observacionais. Em um estudo experimental, identifica-se inicialmente o elemento de interesse. Então, variáveis relacionadas a esse elemento são identificadas e controladas de modo que os dados que influenciam a variável possam ser obtidos. Por exemplo, uma empresa farmacêutica quer entender como uma nova droga afeta a pressão sangüínea. A pressão sangüínea é a variável de interesse no estudo. O nível de dosagem da nova droga é outra variável que se sabe ter efeito causal sobre a pressão sangüínea. Para obter os dados sobre o efeito da nova droga, seleciona-se uma amostra de indivíduos. O nível de dosagem é controlado com diferentes grupos de indivíduos recebendo diferentes dosagens. Os dados sobre a pressão sangüínea são coletados para cada grupo. A análise estatística dos dados experimentais pode ajudar a determinar como a nova droga afeta a pressão sangüínea. Nos estudos observacionais, não existe qualquer tentativa de controlar as variáveis de interesse. Por exemplo, em um levantamento de entrevista pessoal, primeiro identificam-se as questões de pesquisa. Então um questionário é concebido e ministrado à amostra de indivíduos. Alguns restaurantes usam estudos observacionais para obter dados sobre a opinião de seus clientes sobre a qualidade dos alimentos, do serviço, do ambiente, da higiene, etc. As categorias de respostas como excelente, bom, satisfatório e insatisfatório, fornecem os dados que torna possível aos analisadores avaliar a qualidade do restaurante. HÁ DUAS ÁREAS PRINCIPAIS NA ESTATÍSTICA Estatística Descritiva: é uma das etapas que tem por objetivos o planejamento, a coleta, a organização e descrição de dados. Utiliza números, tabelas ou gráficos para descrever fatos (análise exploratória de dados). Exemplo: pesquisa sobre a votação em cada candidato em época de eleição - planejamento, coleta, organização e descrição de somente 2% dos votos (amostra). Inferência Estatística: é a etapa em que os dados amostrais são analisados e interpretados para se fazer estimativas e testar hipóteses sobre as características da população. Portanto, através da análise de uma amostra da população procura-se medir, inferir ou estimaras leis de comportamento da população da qual a amostra foi retirada. Exemplo: a partir da organização de 2% das intenções de voto da população, infere-se a porcentagem de votos em cada candidato para toda a população. A coleta, organização e descrição dos dados estão a cargo da Estatística Descritiva. A análise e interpretação desses dados ficam a cargo da Estatística Inferencial. 2 FASES DO MÉTODO ESTATÍSTICO 1.1 A coleta, a organização e a descrição de dados Após o planejamento e a devida determinação de características notáveis ou mensuráveis, ou seja, da variável de interesse do elemento que se quer pesquisar, dá-se início à coleta dos dados numéricos necessária à sua descrição. Por mais diversa que seja a finalidade, os dados devem ser apresentados sob a forma adequada de tabelas chamadas de tabelas de distribuições de freqüências ou por gráficos, tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 1.2 A análise e a interpretação de dados O objetivo da análise e a interpretação de dados é tirar conclusões sobre a população, a partir de informações fornecidas por parte representativa dessa população (amostra), ou seja, consiste em obter-se e generalizar-se conclusões, a partir de resultados particulares. VARIÁVEIS A análise estatística apropriada de uma determinada variável depende de sua natureza. É importante conhecer a natureza da variável, pois para cada tipo de variável, há uma técnica mais apropriada para se resumir as informações e otimizar a análise. As variáveis são classificadas como Variáveis Qualitativas e Variáveis Quantitativas. • Variáveis Qualitativas: apresentam uma qualidade ou atributo da variável. Ex.: sexo (masculino, feminino), estado civil (solteiro, casado, viúvo, divorciado), grau de escolaridade (1o grau, 2ograu, superior, etc). Dentre as variáveis qualitativas existe uma segunda classificação: nominais ⇒ variáveis sem ordenação (sexo: masculino, feminino) e ordinais ⇒ variáveis que devem respeitar ordem estabelecida (grau de escolaridade: 1o grau, 2o grau, superior, etc). Variáveis Quantitativas: apresentam números resultantes de uma contagem ou de uma medida. Ex.: número de filhos, nível salarial, idade, etc. As variáveis quantitativas podem ser: discretas ⇒ quando os possíveis valores são provenientes de uma contagem, portanto, seus valores são expressos por números inteiros (número de filhos, número de empregados de uma empresa, etc) e contínuas ⇒ quando os possíveis valores são provenientes de uma medição, portanto, essa variável pode assumir qualquer valor em certo intervalo da reta real, ou seja, números inteiros e decimais (peso, altura, idade, nota de alunos, lucro de empresas, etc). • Referindo-se ao conjunto de dados na Tabela 1, abaixo, como mais um exemplo, cada empresa é um elemento. Como são 25 empresas, existem 25 elementos no conjunto de dados. Os dados relativos à variável Bolsa de Valores (NYSE, AMEX e OTC) são rótulos usados para identificar onde as ações são comercializadas. Assim, os dados são qualitativos e a Bolsa de Valores é uma variável qualitativa. O Símbolo no Painel Eletrônico é também uma variável qualitativa e os valores de dados AWRD, CHK, CRG, etc são os rótulos usados para identificar a empresa correspondente. A variável Número de Negócios Realizados Anualmente é uma variável quantitativa discreta, pois essa variável só pode assumir valores inteiros. As variáveis Vendas Anuais, Preço da Ação e Relação Preço/Ganhos são variáveis quantitativas contínuas já que podem assumir quaisquer valores do conjunto dos números reais ℜ . Para propósitos de análise estatística, a diferença importante e relevante entre dados qualitativos e quantitativos é que as operações aritméticas comuns só tem significado com dados quantitativos. Por exemplo, com dados quantitativos, os valores de dados podem ser adicionados e divididos pelo número total de dados para calcular seu valor médio. Essa média tem significado e, em geral, é facilmente interpretada. No entanto, quando dados qualitativos são registrados como valores numéricos, tais operações aritméticas fornecem resultados sem nenhum significado. 3 130 10.998 109.4 254.365 30.0 13.954 114.000 8.7 28.2 26.5 90.401 121.6 88.0 67.870 345.500 10.688 15.990 118.2 26.5 16. Bolsa de Valores Símbolo do Painel Eletrônico AWRD CHK CRG EDT FEP GNTIY GPO HOTT HGC ICUI J KNTK LARS LUMI MOIL MDII MKA NHHC TEAM OCAD OROA OVRL PIAM PLEN PRWW N de Negócios Realizados Anualmente 63.384 689.7 27.750 39.2 4.4 2.313 7.981 261.9 78.375 10.875 11.500 44.3 29. Maynard Oil Mechanical Dynamics Metrika Systems National Home Health National Tech Team OrCad OroAmerica Overland Data PIA Merchandising Plenum Publishing Premier Research OTC NYSE NYSE AMEX NYSE OTC NYSE OTC AMEX OTC NYSE OTC OTC OTC OTC OTC AMEX OTC OTC OTC OTC OTC OTC OTC OTC 22.002 200.489 o Vendas Anuais (US$ milhões) 15.250 Empresa Relação Preço/Ganhos Award Software Chesapeak Energy Craig Corporation Edisto Resources Franklin Elect.8 66.5 123.211 147.432 499.Tabela 1 – Conjunto de dados contendo informações financeiras referentes a 25 empresas.7 38.4 Fonte: Stock Investor Pro.8 10.2 15.750 6.1 23.5 28.4 24.563 15.125 7.7 255.334 1.750 6.2 34.1 21.750 8.877 115.7 17.3 30. 4 . American Association of Individual Investors.000 7.9 164.367 310.500 10.500 7.6 60.7 7.5 12.678 378.1 52.7 32.458 123.8 17.000 9.3 16.880 17.5 71.5 6. Lumisys.0 15.7 7.1 15.0 18.375 5.456 246. 31 de agosto de 1997.7 27. TABELA DE DISTRIBUIÇÃO DE FREQÜÊNCIAS Uma distribuição de freqüência é um sumário tabular de dados que mostra a freqüência (ou o número) de observações em cada uma das diversas classes não sobrepostas.0 11.786 64.1 27.2 48.6 14.2 11.115.688 12. O objetivo da distribuição de freqüências é reduzir a quantidade de dados.880 5.7 7.5 Preço da Ação (US$) 11. Inc.123.698 85.875 9.934 130.004 256.237 1. Inc. 2.890 229.156 545. Pbls Gentia Software Giant Group Hot Topic Hudson General ICU Medical Jackpot Enterprises Kentek Information Larscom.250 5. a totalidade de seus 20 funcionários tem o 1o grau.00 Fonte: Dados fictícios Tabela 3 – Freqüência absoluta e freqüência relativa percentual dos 2000 funcionários da empresa GAMA. pois um mesmo valor pode apresentar diferentes significados dependendo do número total de observações.67 Total 36 100. Apesar de a freqüência absoluta ser a mesma nas duas empresas.1. Na empresa BETA. Para tornar os dados comparativos utiliza-se a proporção (freqüência relativa) ou a freqüência relativa percentual. n = ∑ fi i • Freqüência Relativa (ou proporção) (fri) ⇒ proporção de cada realização em relação ao total. segundo o grau de escolaridade.00 3o grau 330 16.50 2o grau 1020 51. f ri = fi n É mais usual exprimir a freqüência relativa em porcentagem (freqüência relativa percentual): f ri = fi × 100 n A freqüência absoluta não é comparativa. Grau de Freqüência Freqüência relativa escolaridade Absoluta fi percentual fri (%) 1o grau 12 33. A DISTRIBUIÇÃO DE FREQÜÊNCIAS • • Freqüência Absoluta (fi) ⇒ número de vezes em que cada resultado aparece no conjunto de dados. metade dos funcionários. pois os totais de empregados são diferentes nos dois casos. Total de observações (n) ⇒ a soma das freqüências absolutas. o significado desse número é bem diferente. possui o 1o grau. ou seja 20. Grau de Freqüência Freqüência relativa escolaridade Absoluta fi percentual fri (%) 1o grau 650 32.50 Total 2000 100.00 o 3 grau 6 16. pois reduzimos as freqüências a um mesmo total (no caso 100).00 Fonte: Dados fictícios Não podemos comparar diretamente as colunas das freqüências absolutas das tabelas 2 e 3.33 2o grau 18 50. Mas. 5 . Exemplo para a variável qualitativa grau de escolaridade: Na empresa ALFA.2. segundo o grau de escolaridade. Exemplos: Tabela 2 – Freqüência absoluta e freqüência relativa percentual de 36 funcionários do departamento de recursos humanos da empresa GAMA. as colunas de porcentagens são comparáveis. freqüentemente.67% dos funcionários possuem 3o grau. 6 . 83.00 30 83.33 12 33. 30 funcionários possuem até 2o grau.67 36 100. na qual além de outras informações.2. freqüência relativa percentual.33% dos funcionários possuem somente o 1o grau. é apresentada a variável quantitativa discreta Número de Filhos de 36 funcionários do departamento de recursos humanos da empresa GAMA. Fi = f1 + f 2 + . • Freqüência acumulada (Fi ou Fac) ⇒ soma da freqüência absoluta de um elemento com as freqüências absolutas dos elementos que o antecedem. freqüência acumulada e freqüência acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa GAMA. No caso das variáveis quantitativas discretas. abaixo. segundo a variável qualitativa Grau de Escolaridade. 50. Fi = Com esses dados a Tabela 2 se torna: Fi n Tabela 4 – Freqüência absoluta. a representação em tabelas é muito útil..FRi (%) 1o grau 12 33. 16. + f i • Freqüência acumulada relativa (FRi) ⇒ divisão da freqüência acumulada de um elemento pelo número total de elementos da série. como exemplo: 12 funcionários não possuem 2o e 3o graus. é difícil de interpretar diretamente na forma em que é reunido.33% dos funcionários não possuem 3o grau. apresentados na Tabela 4.Além das freqüências absoluta e relativa pode-se tabular a freqüência acumulada.00% dos funcionários possuem 2o grau.00 Total 36 100. Observe na Tabela 5.. utiliza-se a distribuição de freqüências. DISTRIBUIÇÃO DE FREQÜÊNCIAS – VARIÁVEL QUANTITATIVA DISCRETA Um conjunto de dados.33 2o grau 18 50. Grau de Freqüência Freqüência relativa Freqüência Freqüência Acumulada escolaridade Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa .33 o 3 grau 6 16. pois fornece meios de organizar e resumir os dados de modo que padrões sejam revelados e os dados sejam mais facilmente interpretados. Para sintetizar dados.00 --------Fonte: Dados fictícios Análise de alguns valores provenientes da distribuição de frequências. 2. 33. 71 15. salário. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Estado Civil Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Solteiro Casado Solteiro Solteiro Casado Casado Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Casado Casado Solteiro Casado Casado Casado Solteiro Casado Casado Solteiro Casado Casado Grau de escolaridade 1º Grau 1º Grau 1º Grau 2º Grau 1º Grau 1º Grau 1º Grau 1º Grau 2º Grau 2º Grau 2º Grau 1º Grau 2º Grau 1º Grau 2º Grau 2º Grau 2º Grau 1º Grau Superior 2º Grau 2º Grau 2º Grau 1º Grau Superior 2º Grau 2º Grau 1º Grau 2º Grau 2º Grau 2º Grau Superior 2º Grau Superior Superior 2º Grau Superior No de filhos 0 1 2 0 0 0 0 0 1 0 2 0 0 3 0 0 1 2 0 0 0 2 2 0 2 2 0 0 5 2 0 1 3 0 2 3 Salário (x Sal.95 9.85 14. localizada na cidade de São Paulo.74 8. Min. 7 .75 19.39 7.26 6. no de filhos.77 9.23 13.79 13.59 12.12 8.00 4.13 9.22 16.90 Idade (anos) 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 Região de Procedência Interior Capital Capital Outro Estado Outro Estado Interior Interior Capital Capital Outro Estado Interior Capital Outro Estado Outro Estado Interior Outro Estado Capital Outro Estado Interior Interior Outro Estado Capital Outro Estado Outro Estado Interior Outro Estado Outro Estado Interior Interior Capital Outro Estado Interior Capital Capital Capital Interior Fonte: Dados fictícios Para agrupar os dados da variável quantitativa discreta Número de Filhos basta proceder à contagem para cada um dos valores diferentes da variável em estudo e construir a tabela de distribuição de freqüências.) 4. grau de escolaridade.25 5. idade e procedência de 36 funcionários do departamento de recursos humanos da empresa GAMA.61 17.76 11.35 9.66 6.06 11.44 8.26 18.00 12.80 10.Tabela 5 – Informações sobre estado civil.60 13.73 6.59 7.56 5.40 21.53 10.46 8.99 16.86 7.69 14. Tabela 6 – Freqüência absoluta, freqüência relativa percentual, freqüência acumulada e freqüência acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa GAMA, segundo a variável quantitativa discreta Número de Filhos. No de Freqüência Freqüência relativa Freqüência Freqüência Acumulada filhos Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 0 19 52,78 19 52,78 1 4 11,11 23 63,89 2 9 25,00 32 88,89 3 3 8,33 35 97,22 5 1 2,78 36 100,00 Total 36 100,00 --------- 2.3. DISTRIBUIÇÃO DE FREQÜÊNCIAS – VARIÁVEL CONTÍNUA (COM INTERVALOS DE CLASSE) Um dos objetivos de se construir a distribuição de freqüências é resumir o conjunto de dados. No caso de variáveis contínuas, não se pode construir a distribuição de freqüências listando os resultados um a um, pois não havendo observações iguais, não há redução dos dados em uma tabela. Desta forma, é interessante agrupar os resultados em classes não sobrepostas, calculadas de forma mais elaborada. Para agrupar os dados de uma variável contínua em classes, é necessário adotar classes de mesma amplitude, sempre que possível, e: 1. Determinar a extensão (amplitude) total dos dados a tabelar; 2. Determinar o número de classes não sobrepostas; 3. Determinar a extensão (amplitude) de cada classe; 4. Determinar os limites de classe. • Amplitude total de uma seqüência (At) ⇒ diferença entre o maior e o menor elemento de uma seqüência. Representa o comprimento total da seqüência. A t = x max − x min • Número de Classes (k) ⇒ existem vários critérios para se calcular o número de classes k. O mais utilizado é a fórmula empírica: k = n , onde n é o número de elementos observados. • Amplitude de classe (h) ⇒ é determinada por: h= At k Neste ponto, é importante observar que o número de classes deve ser determinado adequadamente. Quando se adota um grande número de classes não há redução dos dados, enquanto que para um número pequeno de classes as informações podem ser perdidas. Sugere-se o uso de 5 a 15 classes com a mesma amplitude. Exemplo: A partir da Tabela 5, computando as freqüências absolutas de cada classe para a variável quantitativa contínua salários, é possível construir a tabela de freqüências. Pode-se observar que estão tabelados 36 salários que vão de 4,00 até 21,90 salários mínimos. Portanto, calcula-se: Número de classes: Amplitude total: k = n = 36 = 6 A t = x max − x min = 21,90 – 4,00 = 17,90 8 Amplitude de cada classe: h= At k = 17,90 = 2,98 ≅ 3 6 Tabela 7 – Freqüência absoluta, freqüência relativa percentual, freqüência acumulada e freqüência acumulada percentual dos 36 funcionários do departamento de recursos humanos da empresa GAMA, segundo a variável quantitativa contínua Salário. Classes de salário Freqüência Freqüência relativa Freqüência Freqüência Acumulada (x salário mínimo) Absoluta fi percentual fri (%) Acumulada Fi = Fac Relativa - FRi (%) 4,00 a 7,00 7 19,44 7 19,44 7,00 a 10,00 11 30,56 18 50,00 10,00 a 13,00 6 16,67 24 66,67 13,00 a 16,00 6 16,67 30 83,34 16,00 a 19,00 4 11,11 34 94,45 19,00 a 22,00 2 5,55 36 100,00 Total 36 100,00 Análise de alguns valores oriundos da distribuição de freqüências, apresentados na Tabela 7, como exemplo: 11 funcionários recebem salários entre 7,00 e 10,00 s.m. 16,67% dos funcionários, o que equivale a 6 funcionários, recebem salários entre 10,00 e 13,00 s.m. 5,55% dos funcionários, o que equivale a 2 funcionários apenas, recebem os maiores salários, que situam-se entre 19,00 e 22,00 s.m. 11,11% dos funcionários recebem salários entre 16,00 e 19,00 s.m. 30 funcionários recebem menos que 16,00 s.m. ou salários entre 4,00 e 16,00 s.m. 6 funcionários recebem pelo menos 16,00 s.m. 66,67% dos funcionários recebem menos que 13,00 s.m. 33,33% dos funcionários recebem pelo menos 13,00 s.m.. 9 LISTA 1 - Exercícios para fixação 1. Declare se cada uma das seguintes variáveis é qualitativa (nominal ou ordinal) ou quantitativa (discreta ou contínua): a) Idade b) Gênero c) Marca de Automóveis d) Número de pessoas favoráveis à pena de morte e) Vendas anuais (em milhões de reais) de uma empresa brasileira f) Tamanho de camisetas (PP, P, M, G, GG) g) Lucro por ação de uma empresa h) Método de pagamento (à vista, com cheque, com cartão de crédito, etc) i) Vida útil de lâmpadas j) Sexo dos filhos de um casal k) Produção anual de automóveis marca FORD em uma capital l) Número de ações negociadas na BOVESPA m) Salário dos funcionários de uma empresa pública n) Índice de liquidez das indústrias da cidade de Bauru o) Classe social dos habitantes de um município p) Produção anual de café do Estado de São Paulo q) Grau de escolaridade dos funcionários de uma empresa privada r) Peso de lutadores de boxe na categoria “Peso Pena” s) Número de livros existentes na biblioteca de uma universidade t) Altura de jovens selecionados para se tornarem jogadores de vôlei u) Consumo mensal de energia elétrica (em kWh) em um condomínio v) Patente militar w) Ocupação profissional x) Cargos hierárquicos em uma empresa y) Espessura de folhas de papel z) Número de acidentes de trânsito 2. Na tabela abaixo, é mostrada a remuneração dos altos executivos CEOS (Chief Executive Officer), a classificação por setor, as vendas anuais e os dados de avaliação da remuneração dos CEOS versus o retorno dos acionistas para 10 empresas. Uma avaliação 1 da remuneração dos CEOS versus o retorno dos acionistas indica que a empresa está no grupo de empresas que tem a melhor relação. Uma avaliação 2 indica que a empresa é similar às empresas que tem uma relação muito boa, mas não a melhor. Empresas com a pior relação têm uma avaliação 5. Remuneração dos Remuneração dos Vendas Empresa Setor Altos Executivos Altos Executivos vs. (US$ milhões) (US$ 1000) Retorno dos Acionistas Bankers Trust 8.925 Bancário 9.565 3 Coca Cola General Mills LSI Logic Motorola Readers Digest Sears Sprint Walgreen Wells Fargo 2.437 1.410 696 1.847 1.490 3.414 3.344 1.490 2.861 Bebidas Alimentação Eletrônico Eletrônico Gráfico Varejo Telecomunicações Varejo Bancário 18.546 5.567 1.239 27.973 2.968 38.236 14.045 12.140 8.723 5 1 2 4 3 4 4 2 3 Fonte: Business Week, 21 de abril de 1997. 10 844 6. Unisys Westvaco Woolworth a) b) c) d) e) f) Vendas (US$ milhões) 10.847 8.157.427. Tyson Foods Hewlett-Packard Intel Northrup Seagate Tech. Complete as tabelas: a) xi 0 1 2 3 4 5 6 7 Total b) fi 1 4 3 2 1 25 15 fri (%) 15 xi 20 25 30 35 40 45 50 Total fi 45 30 60 30 10 300 11 fri (%) 5 .586. a) Construa uma distribuição de freqüência adotando essa amostra de 200 alunos de todas as escolas aleatoriamente.0 580.272 9.0 5. 2000 alunos e a escola D. 2500 alunos.3 49.0 2.0 87.420 20. A pesquisa foi aplicada a 200 jovens.7 Código do Setor 8 19 19 12 15 2 11 10 22 48 Fonte: Fortune. Empresa Banc One CPC Intl. Quantos elementos existem nesse conjunto de dados? Qual é a população? Quantas variáveis existem no conjunto de dados? Quais variáveis são qualitativas e quais são quantitativas? Que porcentagem de empresas teve um lucro acima de US$ 100 milhões? Que porcentagem de empresas tem código de setor 8? 5. 28 de abril de 1997.588 6.075 8.371 3. a escola B.454 38.0 234. b) Qual é a escola com menor freqüência absoluta? Quantos alunos foram pesquisados nessa escola? c) Qual é a escola com maior freqüência relativa? Qual a porcentagem de alunos pesquisados nessa escola? d) Qual o número de alunos pesquisados na escola D? 6. escolhidos ao acaso. Os dados para uma amostra de empresas da Fortune 500 estão na tabela abaixo. Suponha que um psicólogo queira fazer uma pesquisa sobre o comportamento do jovem de 11 a 14 anos em quatro escolas: A. a escola C. todos nessa faixa etária.7 212.092 Lucros (US$ milhões) 1.0 213.a) b) c) d) e) Quantos elementos existem nesse conjunto de dados? Quantas variáveis existem nesse conjunto de dados? Quais variáveis são qualitativas e quais variáveis são quantitativas? Que porcentagem das empresas pertence ao setor bancário? Que porcentagem das empresas recebeu um valor 3 na avaliação da remuneração dos CEOS versus o retorno dos acionistas? 4. A escola A tem 1500 alunos. B. 4000 alunos. C e D.071 8. A revista Fortune fornece dados sobre a classificação das 500 maiores corporações industriais dos Estados Unidos em termos de vendas e de lucros.2 168. O controle de qualidade selecionou 50 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. construa a distribuição de freqüências para variável discreta e responda: a) Qual a porcentagem de caixas com 2 peças defeituosas? b) Qual a porcentagem de caixas com menos que 2 peças defeituosas? c) Qual a porcentagem de caixas com pelo menos 2 peças defeituosas? d) Qual a porcentagem de caixas com mais que 2 peças defeituosas? e) Qual o número de caixas com 3 peças defeituosas? f) Qual o número de caixas com pelo menos 3 peças defeituosas? g) Qual o número de caixas com menos que 3 peças defeituosas? h) Qual o número de caixas em que não há peças defeituosas? 10. revelou os seguintes valores: 18 17 18 20 21 19 20 18 17 19 20 18 19 18 19 21 18 19 18 18 19 19 21 20 17 19 19 18 18 19 18 21 18 19 19 20 19 18 19 20 18 19 19 18 20 20 18 19 18 18 a) Agrupe por freqüência estes dados para variável quantitativa discreta idade completa dos calouros. Qual a porcentagem de dias em que ocorreram menos que 10 erros? Qual a porcentagem de dias em que ocorreram pelo menos 15 erros? Qual a porcentagem de dias em que ocorreram mais que 12 erros? Qual o número de dias em que ocorreram 11 erros? Qual o número de dias em que ocorreram menos que 7 erros? Qual o número de dias em que ocorreram pelo menos 7 erros? 8. Elabore o rol. b) Qual a porcentagem de calouros com pelo menos 20 anos? c) Quantos calouros têm menos que 20 anos? d) Quantos calouros têm mais que 18 anos? 9. Uma indústria embala peças em caixas com 100 unidades. Resuma os dados em uma tabela de freqüências. Contou-se o número de erros de impressão de um jornal durante 40 dias. obtendo-se os seguintes resultados: 8 10 10 5 12 11 14 12 12 10 12 6 8 7 7 5 14 12 16 15 7 10 12 18 15 6 12 8 9 11 16 15 5 12 6 7 14 10 12 8 a) b) c) d) e) f) g) h) i) Classifique o tipo de variável que se quer analisar estatisticamente. Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 1 5 2 5 5 6 4 2 6 2 3 3 5 2 6 3 1 2 4 4 5 3 5 6 3 1 5 1 1 6 3 4 3 5 2 6 4 6 2 6 3 2 5 4 5 4 6 1 3 12 .7. Uma pesquisa sobre a idade completa (cheia) dos alunos de uma classe de calouros de uma faculdade. Obteve os seguintes dados: 2 0 0 4 3 0 0 1 0 0 1 1 2 1 1 1 1 1 1 0 0 0 3 0 0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 4 1 2 Agrupe estes dados por freqüência. Complete os dados que faltam na distribuição de freqüências: a) b) fi fri (%) Classes Classes 0a 8 10 0 a 2 8 a 16 10 2 a 4 16 a 24 14 4 a 6 24 a 32 9 32 a 40 8 a 10 Total 40 10 a 12 14 a 16 Total fi 2 9 13 fri (%) 4 8 16 12 3 14.4 4.6 6.9 4.8 6.8 5.3 2. A tabela abaixo apresenta as vendas diárias de um determinado aparelho por uma empresa comercial: 14 12 11 13 14 12 14 13 14 11 12 14 10 13 15 15 13 16 17 14 a) Construa a distribuição de freqüências para a variável discreta.a) Construa uma distribuição de freqüências para a variável discreta.8 5.5 4.5 7. A SP Transportes Aéreos aceita reservas de vôo por telefone.5 2. 13 .8 7. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: No de acidentes 0 1 2 3 4 5 6 7 No de motoristas 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram acidentes.7 7. b) Qual a porcentagem de vezes que ocorreu face par? c) Qual a porcentagem de vezes que ocorreu a face 5? d) Qual o número de vezes que ocorreu face ímpar? e) Qual o número de vezes em que ocorreram números primos*? * Definição de número primo = números que possuem apenas dois divisores: o próprio número e o número 1.3 Determinar: a) A amplitude total At.4 5. 13.5 5. c) O número de motoristas que sofreram menos de 3 acidentes. d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes. (Exceção: número 1). e) A porcentagem de motoristas que sofreram no máximo 2 acidentes.0 10.8 4.8 4.5 8. b) O número de motoristas que sofreram pelo menos 4 acidentes.1 9.3 11. b) Em quantos dias as vendas foram superiores a 13 unidades? c) Qual a porcentagem de dias com vendas inferiores a 12 unidades? d) Em quantos dias as vendas foram inferiores a 15 unidades? e) Qual a porcentagem de dias com vendas de no mínimo 10 unidades? elétrico. 13 12 11 14 12. o número de classes k e a amplitude de cada classe h.6 10.5 3.0 minutos.9 3. 2.5 10. 11. Os seguintes dados mostram a duração das chamadas (em minutos) para uma amostra de 30 reservas feitas por telefone.2 4.0 3. durante um mês.5 5.6 4. b) A distribuição de freqüências para a variável contínua.9 11. c) A porcentagem de ligações com duração menor que 8. 5 5.0 8. b) A porcentagem de funcionários que ganham pelo menos 4 salários mínimos.0 0.0 6.5 (inclusive) e 7.d) O número de ligações com pelo menos 4. adotando 9 classes com amplitudes idênticas e responda: a) Qual a porcentagem de meses em que o consumo foi pelo menos 10. c) A porcentagem de funcionários que ganham 2 ou mais salários mínimos.5 3.0 (inclusive) e 8.5 4.5 3.0 minutos de duração.5 7. 15.0 4. e) O número de alunos que tiraram nota maior ou igual a 6. e) A amplitude da 4ª classe. e) A porcentagem de ligações com duração entre 4. g) O limite inferior da 4ª classe. d) O número de alunos que tiraram nota menor que 7.fi 25 30 13 12 80 Determinar: a) A porcentagem de funcionários que ganham menos que 4 salários mínimos.5 6.0 4.5 4.0 5. 16.0 8. f) A porcentagem de alunos que tiraram nota entre 4.0 2.5 5.5 Determinar: a) A amplitude total At. f) O número de ligações com duração maior ou igual a 8.0 5. As notas de 32 estudantes de uma classe são dadas abaixo: 6.0 4.0 1.0 2. f) O limite superior da 2ª classe. O departamento de pessoal de certa empresa fez um levantamento dos salários dos 80 funcionários do setor administrativo.0 5.0.000 kWh? b) Qual a porcentagem de meses em que o consumo ficou entre 9.0 minutos. g) O limite superior da 2a classe. b) A distribuição de freqüências para a variável contínua.0 5.5 2. 17.0 6.0 (exclusive) minutos. Os dados abaixo referem-se ao consumo residencial: 9520 8720 7760 8720 7440 7920 7200 8880 6880 7520 7200 7760 7680 7680 7440 7760 8880 8240 8240 7840 6640 6960 8480 8880 6720 7760 6880 7760 7120 7120 7360 9360 mensal de energia elétrica (kWh) em um condomínio 7840 8880 8480 8480 8880 8880 8320 8240 8560 7920 8320 9440 8480 8320 8560 8480 8480 10320 8560 8560 8800 8560 8560 13840 9360 9360 9600 12960 13280 13200 12800 8960 12480 11200 11360 12960 14560 13200 12480 14000 Construa a distribuição de freqüências para esses dados.000 e 11.0 5.0 6.0 7. obtendo os resultados da tabela de distribuição de freqüências dada abaixo: Faixa salarial (em no de salários mínimos) 0 a 2 2 a 4 4 a 6 6 a 8 TOTAL Freqüência absoluta . i) O ponto médio da 3a classe.5 7.0 1. h) O limite inferior da 4a classe. c) A porcentagem de alunos que tiraram nota menor que 4.000 kWh (exclusive)? c) Qual a porcentagem de meses em que o consumo foi inferior a 13.5.0 4. d) A porcentagem de funcionários que ganham entre 2 (inclusive) e 6 (exclusive) salários mínimos.5 0.5.5 (exclusive). o número de classes k e a amplitude de cada classe h.000 kWh? 14 . 000 kWh? e) Qual o número de meses em que o consumo foi inferior a 10.93 2.29 1. calcule: a) Qual a porcentagem de folhas com espessuras iguais ou superiores a 2.54 1. A tabela abaixo mostra parte dos dados coletados nessa pesquisa.71 1.06 1.000.200.38 1.06 1.95 2.00 1. Depois.15 1.87 2.17 3.25 2.02 3. 20.18 1.20 2.18 1.92 2.000 kWh? 18.01 1.00 a) b) c) d) e) Determine o salário médio de cada uma das 5 classes.45 3.00 a a a a a No de funcionários (fi) 2 6 10 5 2 1. o número recomendado de classes. Os pesos (em kg) dos 40 alunos de uma classe são dados abaixo: 69 65 60 95 57 76 81 49 72 60 71 53 54 49 67 65 92 74 63 62 68 59 64 60 72 66 53 55 58 83 73 74 64 70 81 96 62 45 50 75 Coloque os dados numa tabela de freqüências que contenha as freqüências absolutas.89 2.36 1.400.11 1.17 2.00 1.00. Determine o número de funcionários que recebem salários iguais ou superiores a R$ 1.05 1.600.19 2.00 1.96 2.00.72 2.400.18 1.06 2.08 3.86 3.04 1.96 2.24 1.62 2.12 1.64 2.66 1.91 1.87 1.00.00 1.59 1.18 2.04 3.00.75 3.94 2.40 1.99 2. a amplitude das classes. a freqüência absoluta das classes.62 1.35 2.08 1. porcentagens acumuladas crescentes e pontos médios das classes.14 2.43 2.03 1.98 3.12 3.400. Construa a distribuição de freqüências para a série abaixo.600.18 2.58 3.03 2.09 2.74 1.00 1.76 1. Uma pesquisa feita em São Luís – MA.96 1.800. fr i (%) Fac FR i (%) Classe 1 2 3 4 5 Salários R$ (xi) 1.51 Pede-se: A amplitude total.56 3.18 2.25 2.19 2.89 2.11 1.84 2.200.09 1. Determine o número de funcionários que recebem salários inferiores a R$ 1.200.96 2.04 1.96 2.00 1.80 mm (inclusive) e 2. mapeou os tipos de reservatório onde esse mosquito era encontrado.18 3. 15 . Calcule a porcentagem de funcionários que ganham salários pelo menos de R$1.26 3. de 2000 a 2002.00 2.00 1. 19. a freqüência relativa das classes e a freqüência acumulada das classes.01 2.17 1.76 2. A tabela abaixo representa a distribuição das espessuras (em mm) de 100 folhas de tabaco: 2. O Aedes aegypti é vetor transmissor da dengue.82 1. Calcule a porcentagem de funcionários que recebem salário no mínimo de R$ 1.00 mm? b) Qual o número de folhas com espessuras inferiores a 2.800.01 2.99 2.78 1.12 2.00 mm? c) Qual o número de folhas com espessuras entre 1.49 1.69 1.800.24 3. que representa uma amostra dos salários (em R$) de 25 funcionários selecionados em uma empresa.94 2.20 mm (exclusive)? d) Qual a porcentagem de folhas com espessuras inferiores a 2. freqüências relativas.60 mm? 21.000.59 2.d) Qual o número de meses em que o consumo foi igual ou superior a 8.97 2.34 2.15 1.22 1.01 1.24 2.36 2.600.42 3.33 1.56 2.83 3. Paulo.A adesão ao sistema de internet por banda larga ocorre.O uso de internet em casa se distribui igualmente entre as classes A. Os principais motivos alegados por 30.000 e menor que 20. II . Está correto. em junho. B e C. estão listados na tabela abaixo: JUSTIFICATIVAS PARA ATRASO NO PAGAMENTO DO CREDIÁRIO A compra era para outra pessoa 18% Salário atrasado 17% Estar sem dinheiro 12% Perda do emprego 12% Gastou o dinheiro com outras coisas 8% Esquecimento ou falta de tempo 5% a) Qual a frequência relativa das pessoas que apresentaram outras justificativas? b) Quais as frequências absolutas para cada tipo de devedor? 23. um número total de mosquitos: a) menor que 5. Japão. analise os possíveis motivos para a liderança do Brasil no tempo de uso da internet.000. pesquisados em uma região metropolitana.000 e menor que 10. e) maior que 20. III .O país tem uma estrutura populacional com maior percentual de jovens do que os países da Europa e os EUA. o que se afirma em: a) I b) II c) III d) I e II e) II e III 16 . O país ficou à frente de nações como a França.000 devedores. (Adaptado. o que demonstra iniciativas de inclusão digital.000. Estados Unidos e Espanha. porque essa tecnologia promove a mudança de comportamento dos usuários.000.000. b) maior que 5. I . d) maior que 15. Folha de S. apenas.000. Os brasileiros tiveram.Se mantido o percentual de redução da população total de Aedes aegypti observada de 2001 para 2002.000 e menor que 15. 2005) 2005 - Com base na tabela e no texto acima. c) maior que 10. 22. teria sido encontrado. o maior tempo de navegação residencial na internet entre onze países monitorados pelo Ibope/NetRatings: média mensal de 16 horas e 54 minutos por pessoa. ao justificarem atrasos no pagamento do crediário. em 2003. de linhas. 2002. A escala de freqüências é colocada no eixo vertical. tanto de variáveis discretas como de variáveis contínuas. & WILLIAMS. & DONAIRE D. Além disso. 2. 17 . pode ser interpretada mais facilmente quando os valores dessas variáveis são apresentados em forma de gráficos. 1995.ed.1. Rio de Janeiro: LTC. & Batalha. INTRODUÇÃO No item anterior mostrou-se a utilidade das tabelas como instrumento de apresentação e análise de dados estatísticos. Estatística usando o Excel. uma vez que através deles. histogramas e polígonos de freqüência. São Paulo: Campus. A principal vantagem de um gráfico sobre uma tabela é que ele permite conseguir uma visualização imediata da distribuição dos valores observados.ed.ed. os fatos essenciais e as relações que poderiam ser difíceis de reconhecer em massas de dados estatísticos podem ser observados mais claramente através dos gráficos. A. São Paulo: Atlas. freqüências relativas ou freqüências relativas percentuais. Estatística para os Cursos de Economia.C. G. A.R. A) GRÁFICO DE COLUNAS OU BARRAS SIMPLES Um gráfico de colunas é um dispositivo gráfico para retratar os dados qualitativos ou quantitativos discretos que foram sintetizados em uma distribuição de freqüências absolutas. 10. 5. São Paulo: Pioneira Thomson Learning.A. H. 6. Exemplo: Na tabela abaixo. 2. D. 4a ed. Estatística Aplicada à Administração e Economia. LAPPONI. Introdução à Estatística. ANDERSON. os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis. São Paulo: Cultura. 2. 4. de colunas. TRIOLA. MEDEIROS. M. 4.F. No eixo horizontal do gráfico são especificados os rótulos usados para cada classe.1999.S.ed.ed. E.J.. Amazônia: contradições no paraíso ecológico. Princípios de Estatística. 3. A apresentação gráfica é um complemento importante da apresentação tabular. MARTINS. Estatística Geral e Aplicada. 3. A estatística utiliza vários tipos de gráficos: de barras. 1999. SWEENEY. Uma das maneiras mais concisas de se apresentar os dados estatísticos de uma tabela é através de gráficos.CAPÍTULO 2 .REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS BIBLIOGRAFIA CONSULTADA: 1. São Paulo: Atlas. T. 2005. DIFERENTES TIPOS DE REPRESENTAÇÕES GRÁFICAS DE SÉRIES ESTATÍSTICAS A distribuição de freqüências. J. vol. D. Silva e colaboradores. 2002. G. são apresentados dados de uma distribuição ocupacional na região amazônica de uma amostra de 180 trabalhadores.L. Ocupação Trabalho não qualificado Artesanato Serviços burocráticos Gerencial Freqüência Absoluta 65 52 34 29 Fonte: Hanan. 2008. de setores. B. Os gráficos propiciam uma idéia preliminar mais satisfatória da concentração e dispersão de valores.H. São Paulo: Atlas. Administração e Ciências Contábeis. MARTINS. a variável qualitativa Ocupação na região amazônica.Representando-se. Exemplo: Na tabela abaixo. Região Freqüência Relativa (%) Sudeste 4 Centro-Oeste 7 Norte 20 Sul 69 Fonte: Revista de Silvicultura. a variável quantitativa Produção de Madeira por região brasileira. com colunas simples. A diferença entre o gráfico de colunas e de barras é que no eixo vertical do gráfico de barras são especificados os rótulos usados para cada classe e a escala de freqüências é colocada no eixo horizontal. variáveis qualitativas ou quantitativas discretas. dez 1999. têm-se: SUL REGIÃO BRASILEIRA NORTE CENTRO-OESTE SUDESTE 0 10 20 30 40 50 60 70 80 PRODUÇÃO DE MADEIRA Freqüência Relativa (%) 18 . com barras simples. graficamente. têm-se: 80 FREQÜÊNCIA ABSOLUTA 70 60 Artesanato 50 40 30 20 10 0 Trabalho Não Qualificado Serviços Burocráticos Gerencial OCUPAÇÃO Um gráfico de barras simples serve para retratar o mesmo tipo de variável que o gráfico de colunas simples. graficamente. são apresentados dados da produção nacional de madeira por região brasileira em porcentagem. Representando-se. ou seja. 000 0 2001 2002 2003 2004 2005 ANOS C) GRÁFICO DE SETORES O gráfico de setores ou pizza é um dispositivo gráfico comumente usado para apresentar as distribuições de freqüência relativa.000 8.000 2005 15. têm-se: 16.000 12.000 2004 15.000 2. edição 51. dados qualitativos. a variável quantitativa Quantidade de Lixo em dois bairros da cidade de São Paulo.00 Fonte: Revista Bares e Restaurantes.60 Coca-cola light 11 39. Este gráfico serve para retratar.40 Total 100 360. principalmente. Exemplo: Na tabela abaixo está indicada a quantidade de lixo gerado em dois bairros da periferia da cidade de São Paulo. Refrigerante Mais Vendido Freqüência Relativa fri (%) Ângulo (graus) Coca-cola 38 136.000 10.000 6. para facilitar a comparação entre eles.000 4.B) GRÁFICO DE COLUNAS OU BARRAS MÚLTIPLAS É a representação gráfica em que os retângulos referentes a determinado dado são dispostos um ao lado do outro.000 2002 12.60 Sprite 9 32. é apresentada a distribuição dos cinco refrigerantes mais vendidos no país.000 QUANTIDADE DE LIXO (1000 ton) 14.000 14.60 Pepsi-cola 16 57. graficamente.000 2003 13. Educação e Cidadania.000 6. Sua construção é feita com base em um círculo que é dividido em setores com áreas proporcionais às freqüências das diversas categorias.Revista Digital de Ambiente.000 Fonte: Envolverde . set 2006.000 11.80 Guaraná Antarctica 26 93. evidenciando suas diferenças. Brasil. Serve para retratar os dados qualitativos ou quantitativos discretos. abr 2006. Representando-se.000 12. 19 . Exemplo: Na tabela abaixo.000 11. Quantidade de Lixo (freqüência absoluta) Anos Bairro A (1000 ton) Bairro B (1000 ton) 2001 8. com colunas duplas. Para que o ângulo correspondente a cada setor seja determinado. 20 . Este gráfico serve para retratar dados quantitativos. Representando-se. têm-se: SPRITE 9% COCA-COLA LIGHT 11% COCA-COLA 38% PEPSI-COLA 16% GUARANÁ ANTARCTICA 26% D) GRÁFICO DE LINHA É uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. os ângulos dos outros setores. Anos 1997 1998 1999 2000 2001 2002 2003 2004 2005 Produção Brasileira de Petróleo (milhões de litros) (freqüência absoluta) 65920 66845 69738 71844 75014 84434 87024 86197 89587 Fonte: Ministério de Minas e Energia. está indicada a variável quantitativa discreta Produção Brasileira de Petróleo de 2000 a 2004. Neste tipo de gráfico se utiliza uma linha poligonal para representar a série estatística. graficamente. É útil para se visualizar a variação de uma grandeza em relação à outra. analogamente. 2007. com um gráfico de setores. utiliza-se regra de três simples: 100 38 3600 x ⇒ x= 38. a variável qualitativa Refrigerante Mais Vendido no país. Exemplo: Na tabela abaixo.360 = 136.80° 100 Determina-se. 53 16.62 8.75 14.02 1997 1998 1999 2000 2001 2002 2003 2004 2005 Fonte: Embrapa . que é o gráfico em linhas correspondente às séries em estudo. Neste tipo de gráfico se utiliza linhas poligonais para representar as séries estatísticas.56 12. Este gráfico serve para retratar dados quantitativos. 21 . dois a dois. ligam-se esses pontos. que é o gráfico em linha correspondente à série em estudo. todos os pontos da série usando os pares ordenados.23 15.Ministério da Agricultura.73 12.98 3.61 2. Anos Oferta e Demanda de Etanol no Brasil (bilhões de litros) (freqüência absoluta) Oferta Demanda 15.12 3.05 15.51 14. graficamente. para cada uma das variáveis. por segmentos de reta. 92 PRODUÇÃO DE PETRÓLEO NO BRASIL (bilhões de litros) 88 84 80 76 72 68 64 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 ANO E) GRÁFICO DE LINHAS MÚLTIPLAS É uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas.50 5. duas linhas poligonais (podem ser múltiplas). estão indicadas as variáveis quantitativas Oferta e Demanda de Etanol no Brasil de 1997 a 2005. dois a dois. por segmentos de reta. todos os pontos das séries usando os pares ordenados.81 11.49 7.38 12.10 13. Exemplo: Na tabela abaixo.Determinados. gerando. É útil para comparar a variação de uma grandeza em relação à outra. o que gera uma linha poligonal.02 10. o ano no eixo horizontal e as quantidades no eixo vertical. Pecuária e Abastecimento. nesse caso. Determinados. graficamente. o ano no eixo horizontal e as quantidades no eixo vertical. 2007. ligam-se esses pontos. Exemplo: Na tabela abaixo está indicado o número de famílias brasileiras de acordo com o número de salários mínimos que cada uma delas tem como renda familiar mensal. Renda Familiar Mensal Número de Salários Mínimos Número de Famílias (milhões) (freqüência absoluta) 13200 15000 6900 3800 4000 3250 1560 1300 900 500 0 a1 1a 2 2a3 3a 4 4a5 5a6 6a7 7a8 8a9 9 a 10 Fonte: IBGE.OFERTA e DEMANDA DE ETANOL NO BRASIL (bilhões de litros) 16 14 12 10 8 6 4 2 0 1996 OFERTA DEMANDA 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 ANO F) HISTOGRAMAS Representação gráfica da distribuição de freqüências somente de variável contínua. O histograma é uma representação gráfica formada por retângulos justapostos. 22 . Os dados agrupados em intervalos de classe podem ser representados graficamente por meio de um histograma. cujas bases se apóiam no eixo horizontal. 2005. A altura de cada retângulo deve ser proporcional à freqüência correspondente a cada classe e o ponto médio da base de cada retângulo deve coincidir com o ponto médio do respectivo intervalo de classe. Representando-se. graficamente. têm-se: 16000 NÚMERO DE FAMÍLIAS (MILHÕES) 14000 12000 10000 8000 6000 4000 2000 0 1 2 3 4 5 6 7 8 RENDA FAMILIAR MENSAL (SALÁRIOS MÍNIMOS) 9 10 23 . por meio de um histograma. a variável quantitativa contínua Renda Familiar Mensal no país. segundo o número de faltas mensais. colunas simples. 4).917 Nordeste 5. linha. barras simples.381 Fonte: www. c) Histograma.147. barras simples.271. colunas simples. polígono de freqüência. 0 160 1 120 2 90 3 70 4 40 5 20 6 10 3. denominam-se: GRÁFICO 1 16000 80 GRÁFICO 2 FREQÜÊNCIA ABSOLUTA 70 60 50 40 30 20 10 0 Gerencial Serviços Burocráticos Artesanato Trabalho Não Qualificado NÚMERO DE FAMÍLIAS (MILHÕES) 14000 12000 10000 8000 6000 4000 2000 0 1 2 3 4 5 6 7 8 RENDA FAMILIAR MENSAL (SALÁRIOS MÍNIMOS) 9 10 OCUPAÇÃO GRÁFICO 3 100000 GRÁFICO 4 SUL PRODUÇÃO DE PETRÓLEO (mil m ) 3 80000 REGIÃO BRASILEIRA NORTE 60000 40000 CENTRO-OESTE 20000 SUDESTE 0 2000 2001 2002 2003 2004 0 10 20 30 40 50 60 70 80 ANO PRODUÇÃO DE MADEIRA Freqüência Relativa (%) a) Colunas simples. na ordem em que são apresentados (1. Representar graficamente a distribuição de freqüências da empresa Delta. No de faltas do mês No de operários (freqüência absoluta) Fonte: Dados hipotéticos. colunas simples.767 Centro-Oeste 1.778 Sudeste 6. barras simples.045. Estes quatro gráficos.117.132 Sul 2.LISTA 2 . Construir um gráfico de colunas simples segundo os dados abaixo: Número de alunos matriculados de 5a a 8a séries em 2002 por região brasileira Região No de Alunos Norte 1. barras simples. como um gráfico de colunas simples para variável discreta.187.Exercícios para fixação 1. e) Colunas múltiplas. d) Histograma.gov. barras múltiplas. linha.br 24 . histograma. 2. polígono de freqüência. diagrama de dispersão. 2.inep. b) Colunas múltiplas. colunas simples. 3. 5.Cidades mais visitadas em 2003 Cidade Porcentagem (freqüência relativa) Rio de Janeiro 22.4. a) Estimativa da safra de grãos em 2004 por região brasileira Região Porcentagem (freqüência relativa) Norte 3 Nordeste 8 Sudeste 15 Centro-Oeste 33 Sul 41 Fonte: IBGE.1 Direito 18.4 Fonte: Centro de Pesquisas Confiança. Construir um gráfico de barras simples segundo os dados abaixo: Turistas estrangeiros no Brasil . 2004. b) Profissão preferida no vestibular 2003 em universidades particulares Profissão Porcentagem (freqüência relativa) Administração 21.4 Odontologia 14.8 Engenharia 13.5 Pedagogia 3.60 São Paulo 3.10 Outras 0. c) Número de veículos motorizados registrados em Santa Vitória/MG Tipo de Veículo Quantidade (freqüência absoluta) Carro de passageiro 585 Minivan 75 Caminhão de 2 eixos 60 Caminhão de Multieixo 30 Moto 315 Barco a motor 15 Fonte: Dados hipotéticos.20 Fortaleza 48. 2005.60 Recife 8.00 Salvador 17. 25 . Construir um gráfico de setores para os dados tabelados em cada um dos itens abaixo.60 Fonte: Embratur.0 Outros 18.8 Medicina 10. 2005. gov.59 81.4 57. MEDALHAS Prata 2 3 3 1 1 4 3 3 1 0 0 Modalidades Vela Atletismo Judô Vôlei Tiro Esportivo Vôlei de Praia Natação Futebol Basquete Boxe Hipismo Fonte: COB.3 4.br 9.25 83. Em todas as Olimpíadas que participou até 2004. Construir um gráfico de barras múltiplas para representar a evolução ao longo das décadas da população urbana e rural brasileira.fcc.9 Fonte: www.41 24.org.br Urbana 36.6. 2005. Construir um gráfico de linhas duplas segundo os dados abaixo: Participação de homens e mulheres no mercado de trabalho (%) Homens Mulheres 71.2 28.4 Anos 1975 1985 1995 2005 Fonte: www.75 16.59 75.gov.06 32.01 Rural 63. o Brasil conquistou medalhas em apenas 11 modalidades.08 55.conab.16 45.99 7.84 54. Construir um gráfico de colunas múltiplas para representar essas modalidades e o número de medalhas conquistadas em cada uma delas.3 3.6 40.ibge.4 4.41 18.6 42.5 33.8 66.br 26 .94 67.92 44. População (%) Anos 1950 1960 1970 1980 1990 2000 2005 Fonte: www. Construir um gráfico de linha segundo os dados abaixo: Anos 2000 2001 2002 2003 2004 2005 Produção de Feijão (milhões de toneladas) 4.3 3.9 4.5 59. Ouro 6 3 2 2 1 2 0 0 0 0 1 Bronze 6 7 7 2 1 1 6 1 4 1 2 8. Fac. em quilogramas.0 a 2. b) Qual é o número de alunos com notas menores que 4. fri (%). Construir o histograma correspondente a essa distribuição.0 Total 50 100 Fonte: Registro da Maternidade São Bento.0 a 3.0 a 1.0 23 46 3.0? 27 .5 a 2. Massa (kg) No de bebês % de bebês 2 4 1. em horas. de uma amostra de 50 bebês nascidos na Maternidade São Bento no período de 30 dias. fri (%) 38% 20% 20% 12% 10% 0 2 4 6 8 10 notas a) Construa a tabela de distribuição de freqüências para as notas representadas no histograma acima (com fi. 11. Duração (horas) 300 a 400 400 a 500 500 a 600 600 a 700 700 a 800 800 a 900 900 a 1000 Total Fonte: Dados hipotéticos.5 5 10 3. O histograma abaixo representa a distribuição das notas de português dos 600 alunos de uma escola num determinado mês.5 a 4.0? c) Qual é o número de alunos com notas entre 8.5 2 4 1.5 14 28 2. de 260 lâmpadas de certa indústria na cidade de Jacareí.0 4 8 2. Os dados abaixo representam a vida útil. Construa o histograma que represente os valores da freqüência relativa. Os dados abaixo representam a massa. 2003.10. FRi (%) e pontos médios das classes).0 e 10.5 a 3. No de lâmpadas 12 28 36 48 60 50 26 260 12. diariamente.200 toneladas de plástico.800 toneladas são provenientes de outros materiais. Tipo A 108 o Tipo B X o Tipo AB 36 o Tipo O 162 o 15. Para resumirem os dados encontrados.000 toneladas de lixo por dia (www. 70 Produção de Soja no Estado de São Paulo (mil toneladas) 60 50 40 30 20 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 ANO 28 . a produção de soja do estado de São Paulo entre os anos de 1997 e 2005 (Brasil Pesquisas.br). 7. Calcule o número de frascos que contém sangue tipo B.200 toneladas de metais. Calcule o decréscimo percentual entre os anos de 2000 e 2001 e o acréscimo percentual entre os anos de 2001 e 2002. 2006). Observe os gráficos de setores abaixo e indique qual é o mais adequado para representar essas informações.org.800 toneladas de vidro e 148. indicaram os ângulos de alguns desses setores circulares. os estudantes construíram um gráfico de setores e. 60.13.000 toneladas são de papel. O gráfico abaixo representa. em milhares de toneladas. Do lixo produzido no Brasil. A B C D 14. como é mostrado na figura abaixo (Hospital São Bento). no lugar das porcentagens. totalizando 240. 19. Um grupo de estudantes de enfermagem fez uma pesquisa sobre o tipo de sangue contido nos 540 frascos de um banco de sangue de certo hospital. 4.cempre. que representa a distribuição estatística de espécies em diferentes faixas de pH. A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina. o percentual dos jogadores dos quatro clubes que concluíram o Ensino Médio é de aproximadamente: a) 14% b) 48% c) 54% d) 60% e) 68% 18. previdência e outros. incluindo o pH nos ambientes. O Gráfico I representa os valores de pH dos cinco ambientes. como mostra a pesquisa abaixo. Um estudo caracterizou cinco ambientes aquáticos. educação. Gráfico I Gráfico II Utilizando o Gráfico II. nomeados de A a E. De acordo com esses dados. 29 . em uma região.16. medindo parâmetros físico-químicos de cada um deles. pode-se esperar um maior número de espécies no ambiente: a) A b) B c) C d) D e) E 17. No gráfico abaixo pode-se observar como são divididos os 188 bilhões de reais do orçamento da União entre os setores de saúde. realizada com os jogadores profissionais dos quatro principais clubes de futebol do Rio de Janeiro. respectivamente: X Manejamento de lixo Controle de despejo industrial Manejamento de lixo Controle de emissão de gases Controle de despejo industrial Y Esgotamento sanitário Manejamento de lixo Esgotamento sanitário Controle de despejo industrial Manejamento de lixo Z Controle de emissão de gases Controle de emissão de gases Controle de despejo industrial Esgotamento sanitário Esgotamento sanitário a) b) c) d) e) 20. a: a) 121% b) 69% c) 65% d) 61% e) 50% 19. há uma desigualdade salarial entre os sexos. a primeira medida de combate à poluição em cada uma delas seria. ( ) 30 . o aumento percentual para o setor de saúde seria igual. aproximadamente. Y e Z. X Y Z Considerando a queixa principal dos cidadãos de cada cidade. Nos gráficos de setores abaixo estão representadas as porcentagens de reclamações sobre cada tipo de poluição ambiental.Se os 46 bilhões gastos com a previdência fossem totalmente repassados aos demais setores de modo que 50% fossem destinados à saúde. De acordo com o gráfico. foram indagados quanto aos tipos de poluição que mais afligiam as suas áreas urbanas. ( ) b) A desigualdade salarial entre os sexos é maior entre os negros. 40% à educação e 10% aos outros setores. O gráfico abaixo mostra uma triste realidade brasileira: a desigualdade racial associada à renda do trabalhador. aqui chamadas de X. Moradores de três cidades. julgue as sentenças abaixo como verdadeiras (V) ou falsas (F): a) Além da desigualdade racial. ( ) d) Para que um homem negro recebesse. No gráfico de colunas abaixo. o mesmo valor que uma mulher não-negra. b) O aeroporto do Galeão registrou acréscimo de mais de 40% nos pousos e decolagens de 2004 a setembro de 2006. classifique em V ou F cada sentença seguinte: 31 . c) Houve. independentemente do sexo. o total anual de 2006 ultrapassaria 220 mil vôos. é correto afirmar que: No total de pousos e decolagens em alguns aeroportos do país entre 2003 e setembro de 2006 Dados: Infraero a) Até setembro de 2006. 22. houve mais de 300 mil pousos e decolagens em aeroportos de São Paulo. ( ) e) Para que uma mulher negra recebesse. por hora. por hora. ( ) 21. Com base no gráfico abaixo. o salário dos negros é metade do salário dos não-negros. e) O aeroporto de Congonhas registrou uma taxa de variação percentual menor que 2% nos pousos e decolagens no período de 2003 a 2005. redução de mais de 6 mil pousos e decolagens de 2004 a 2005. seu rendimento por hora deveria aumentar 50%. d) Se a média mensal de pousos e decolagens registrada em Congonhas até setembro de 2006 se mantivesse até o final do ano. o mesmo valor que uma mulher não-negra. está representado o número de rádio emissoras por região brasileira no ano 2000. seu rendimento por hora deveria aumentar aproximadamente 100%.c) Em média. Analisando-o. no aeroporto de Brasília. processamento das informações recolhidas e comunicação dos resultados à sociedade. A grande inovação tecnológica dos Censos 2007 foi a utilização de 82 mil computadores de mão (PDA`s). O gráfico a seguir mostra as variações do IPCA de quatro capitais brasileiras no mês de maio de 2008.a) Se esse conjunto de dados fosse representado em um gráfico de setores. ( ) b) Na região Centro-Oeste há 2.7 milhões de pessoas. eles possibilitaram a exata localização dos recenseadores nas áreas de coleta (setores censitários). ( ) c) O número de rádio emissoras na região Sudeste é 60% maior que na região Nordeste. d) Vestuário. ( ) d) Na região Norte há. recenseando 108. b) Artigos de residência.27% das rádios emissoras brasileiras. com rendimentos mensais compreendidos entre um e quarenta salários mínimos. 5. As vantagens foram inúmeras. Esse número equivale a 60% da população estimada. cobriu 5. em substituição aos tradicionais questionários de papel. e) Habitação. apenas. em português). principalmente no que diz respeito à rapidez e agilidade nas entrevistas. utiliza-se. iniciada no dia 16 de abril. o Índice Nacional de Preços ao Consumidor Amplo (IPCA). Com base no gráfico qual foi o item determinante para a inflação de maio de 2008? a) Alimentação e bebidas. Os resultados da pesquisa estão representados no gráfico de setores a seguir: 32 . o correspondente a 97% dos municípios brasileiros.435 municípios com até 170 mil habitantes. residente em 30 milhões de domicílios (57% do existente no país). c) Transportes.73% das rádio emissoras de todo o país. o ângulo correspondente à região Sul seria menor que 90º. 24. entre outros. ( ) e) Nas regiões Sul e Sudeste estão mais de 60% das rádio emissoras de todo o país. ( ) 23. Para o cálculo da inflação. Dotados de equipamentos de GPS (Sistema de Posicionamento Global. “ Fonte: IBGE. Essa operação envolveu mais de 90 mil pessoas em todo o país. “A Contagem da População. que toma como base os gastos das famílias residentes nas áreas urbanas. Considerando que. d) nos anos 2000-2001.Observando o gráfico de setores podemos afirmar que: a) a maior população se concentra na região sul. mas reduziu nas décadas posteriores. segundo o último censo. a área de Mata Atlântica preservada em relação ao período de 1990-1992 foi de 34. que mostra o número de pessoas com 5 anos ou mais de idade não-alfabetizadas nas cinco regiões do Brasil. 180. aproximadamente. a porcentagem de pessoas não-alfabetizadas no Brasil é igual a: a) 88% b) 78 % c) 68% d) 12% e) 10% 33 . O analfabetismo é um problema social que atinge parte da população brasileira. Examinando o gráfico da área de vegetação natural remanescente (em mil km2) pode-se inferir que: a) a Mata Atlântica teve sua área devastada em 50% entre 1963 e 1973.400 habitantes. que mostrou resultados de décadas de transformações da Mata Atlântica.6%. 26. Em um estudo feito pelo Instituto Florestal. c) a menor população se concentra na região sudeste. b) a vegetação natural da Mata Atlântica aumentou antes da década de 60. Observe o gráfico de colunas abaixo. e) nos anos 2000-2001. e) a maior população se concentra na região norte. b) a menor população se concentra na região centro-oeste. obtido pelo IBGE em 2003. a população brasileira era de. d) a menor população se concentra na região nordeste. foi possível acompanhar a evolução de ecossistemas paulistas desde 1962. Desse estudo publicou-se o Inventário Florestal de São Paulo.762. 25. a área preservada da Mata Atlântica é maior do que a registrada no período de 1990-1992. c) a devastação da Mata Atlântica remanescente vem sendo contida desde a década de 60. ed. organizar e sumarizar os números. 5. LAPPONI. E. S. J. decis. 2002. São Paulo: Harbra Harper How do Brasil. Considerando este mês como uma população estatística de interesse. Rio de Janeiro: LTC.1 MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL) A) DADOS BRUTOS OU ROL A. etc. STEVENSON. 10.ed.CAPÍTULO 3 . 3. 7. 6. 2002. 9. & CLARK. D. Estatística usando o Excel. 11. 4. 12. 4. J. 12. São Paulo: Saraiva. D. MEDEIROS. J. DOWNING. Vol.A. 2005. 17. 3. G. Administração e Ciências Contábeis. 1 e 2. 2002. 2. 12. variância. Um conjunto de números pode reduzir-se a uma ou a algumas medidas numéricas que resumem todo o conjunto. W. São Paulo: Atlas. BUSSAB. São Paulo: Saraiva. MARTINS. A.MEDIDAS QUANTITATIVAS BIBLIOGRAFIA CONSULTADA: 1. 11. & DONAIRE. 8. Métodos Quantitativos: Estatística Básica. 12. 3. Estatística Aplicada à Administração. empregam-se as seguintes medidas: 1.ed. Estatística para os Cursos de Economia. Introdução à Estatística. São Paulo: Campus. Estatística Aplicada. 9. 14. 1999.1 Média Aritmética ⇒ Notação: x Calcula-se a média aritmética efetuando-se a soma das observações dividida pelo número total de observações. & WILLIAMS. D. 1. SWEENEY.ed. D.3 Medidas de dispersão (dispersão de números) = amplitude total.2 Medidas Separatrizes = quartis. e colaboradores. 2001. Para interpretar os dados corretamente é necessário.J. 5. 4. O. o número médio de unidades vendidas é: x= 8 + 11 + 12 + 5 + 14 + 12 + 8 + 11 + 16 + 12 + 12 + 17 + 7 + 9 + 11 = 11 15 34 .C. TRIOLA. & MORETIN. 2. 1.F. P. M.. x = i =1 n ∑ xi n Exemplo 1: Durante um determinado mês de verão. Estatística Geral e Aplicada. INTRODUÇÃO Os métodos estatísticos envolvem a análise e a interpretação de dados numéricos. 7. 16. T. Usualmente. 2. 8.1 Medidas de posição (tendência central) = média aritmética simples e ponderada. MARTINS. primeiramente. Princípios de Estatística. A. São Paulo: Atlas. 5.R. os quinze vendedores de uma empresa de calefação central e ar condicionado venderam os seguintes números de ar condicionado central: 8. W. percentis.ed.ed. São Paulo: Pioneira Thomson Learning. 1. 11. mediana e moda. ANDERSON. São Paulo: Atlas.ed. G. 1. 2008. desvio padrão e coeficiente de variação.ed. 2002. 1995. Estatística Aplicada à Administração e Economia. 0. 8. são: 1o bimestre . utilizando o seguinte critério: Se n é ímpar – O rol admite um termo central que ocupa a posição n +1 .peso 3. colocadas em ordem crescente (rol): 5.0. 12. O aluno obteve as seguintes notas em Estatística: 6.peso 3. ou seja. a média dos elementos que ocupam no rol as posições n 2 e n + 1. 44. 64. 14.0 2+ 2+3+3 10 ~ x Colocados os dados brutos em ordem crescente ou decrescente (ROL). respectivamente. para o exemplo 2: x= A. A fórmula para o cálculo é: x = i =1n ∑ fi i =1 ∑ x i . 4o bimestre .f i n onde xi é a observação de ordem i e fi é o peso da observação de ordem i. 12. 3o bimestre .peso 2. Sua característica principal é dividir um conjunto ordenado de dados em dois grupos iguais. 59.peso 2. 51. 12. 38.0 + 2 × 8. 38. 11. 40. 2 Exemplo 4: O gerente de uma pizzaria mantém o controle das vendas dos diversos tipos de pizza.0 e 5.3 Mediana ⇒ Notação: 2 × 6. 9. 12. a 8a posição. 46.0 + 3 × 5. Suponha que ele tenha observado os seguintes valores de vendas diárias em ordem crescente (rol) do tipo calabresa durante o período de quatorze dias: 37. 16. a média aritmética desses dois 44 + 46 ~ x= = 45 2 35 . 2o bimestre . a metade terá valores inferiores à mediana e a outra metade terá valores superiores à mediana. a mediana é o elemento que ocupa a posição central. 2 Exemplo 3: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de aparelhos de ar condicionado. n + 1 15 + 1 = = 8 . em cada bimestre.0 70 = = 7. 11. portanto. ou 2 2 ~ x = 11 Se n é par – Utiliza-se como mediana. a mediana desse conjunto de dados é igual a 11. determina-se o número n de elementos do rol. 56.0. 9. 61. 39. 7. As posições centrais desse conjunto de dados são: n 14 = = 7 (7a 2 2 posição) ⇒ 44 e n 14 +1= +1= 8 2 2 elementos: (8a posição) ⇒ 46. 17. Portanto. 48. O elemento central desse conjunto de dados ocupa a posição seja. 8.2 Média Aritmética Ponderada ⇒ Notação: x Exemplo 2: Considere a situação em que um professor informe que os pesos das notas bimestrais. a média aritmética das duas observações centrais. 43.0 + 3 × 9. 11. A mediana é. Portanto. O cálculo da média ponderada deve levar em conta os pesos desiguais dos bimestres. Para se calcular a mediana.A. 8. Em tal caso. o procedimento para se determinar a mediana é o seguinte: 1. com o objetivo de estudar a possibilidade de colocação de um semáforo no citado cruzamento. a mediana é a média aritmética das duas observações centrais. mas igual. A moda para esse conjunto de dados é o valor que ocorre com maior freqüência. 11. portanto. 12. 7. onde n é o número total de observações. 9. A seguir. 14. O departamento de trânsito da cidade de São Paulo coletou o número de acidentes ocorridos em certo cruzamento de ruas na zona oeste. média. deve-se utilizar a média aritmética ponderada. 5. 2. Exemplo 6: Sem perda de informação. foi determinado o número médio de acidentes. 17.f i i =1 n n = i =1 ∑ x i . Ordenar os valores (Rol). Exemplo 5: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de aparelhos de ar condicionado: 8. a) Para um número ímpar n de observações. 12. 11. 16. • Muitas distribuições que surgem na prática são razoavelmente simétricas com a maioria dos valores concentrada próximo ao centro. freqüência.1 Média x de uma distribuição de freqüências Se os dados são provenientes de uma variável discreta. todos eles são chamados de moda.4 Moda ⇒ Notação: x*. 3.f i n n ∑ fi com fi sendo a freqüência da i-ésima classe e i =1 ∑ f i = n . b) Para um número par n de observações. OBSERVAÇÕES: • Se mais de um valor ocorre com maior.Portanto. B) VARIÁVEIS DISCRETAS B. por 25 dias úteis do mês de março. ou seja. 12. considerando as freqüências absolutas fi como sendo as ponderações dos elementos xi correspondentes. moda e mediana estão muito próximas umas das outras ou são até coincidentes. 11. x* = 12. Verificar se há um número ímpar ou par de observações. 12. 8. Deve-se. utilizar a fórmula da média ponderada para determinar a média de uma distribuição de freqüências: x= i =1 n ∑ x i . • Uma distribuição com duas modas é chamada de distribuição bimodal. A. a mediana é o valor central. com os dados apresentados na tabela abaixo: 36 . É o valor (observação) que ocorre com maior freqüência num conjunto de dados. pelas freqüências acumuladas. No de acidentes xi 0 5 10 15 20 25 30 Total Solução: Como n = 25 (ímpar).6 ≅ 13 acidentes/dia 25 B. ordem = n +1 2 Exemplo 7: Determinando a mediana do conjunto de dados do Exemplo 6. provenientes de uma variável discreta. encontra-se a posição da mediana. eles já estão naturalmente ordenados. estão apresentados em tabelas. fi 0 20 50 150 40 25 30 315 x = i =1 ∑ x i . portanto: ~ x = 15 acidentes/dia 37 .f i n n = 315 = 12. abre-se a coluna de Fac e. ordem = n +1 2 n 2 e n = par ⇒ a mediana será a média aritmética entre os elementos centrais. basta verificar se o número de elementos da série é ímpar ou par. Como a mediana é o elemento que ocupa a posição central do conjunto ordenado de dados. Após calcular a posição da mediana.2 Mediana ~ x de uma distribuição de freqüências Se os dados. O valor xi que é o elemento central corresponde à mediana. • • n = ímpar ⇒ a mediana será o elemento central. Neste exemplo.No de acidentes xi 0 5 10 15 20 25 30 Total Solução: No de dias fi 2 4 5 10 2 1 1 n = 25 xi. o elemento central é No de dias fi 2 4 5 10 2 1 1 n = 25 Freqüência Acumulada Fac=Fi 2 6 11 21 (13o elemento) 23 24 25 -------------------------------- n + 1 25 + 1 = = 13 2 2 (13o elemento). ou seja. a identificação da moda é facilitada pela simples observação do elemento que se apresenta com maior freqüência. O controle de qualidade selecionou 50 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. nesse caso.5 2 peças defeituosas/caixa B. x* = 15. obteve a seguinte distribuição de freqüências: No de peças defeituosas xi 0 1 2 3 4 Total No de caixas fi 15 10 12 8 5 n = 50 Freqüência Acumulada Fac=Fi 15 25 (25o elemento) 37 (26o elemento) 45 50 -------------------------------- Solução: Observando a coluna das freqüências acumuladas. A seguir.3 Moda x* de uma distribuição de freqüências É o valor que ocorre com maior freqüência na distribuição.Exemplo 8: Uma indústria metalúrgica embala peças em caixas com 100 unidades. pois esse valor aparece com maior freqüência nesta distribuição (10 vezes). No de acidentes xi 0 5 10 15 20 25 30 Total Solução: Por observação. Exemplo 9: Determinando a moda do conjunto de dados do Exemplo 6. os elementos centrais são: n 50 = = 25 (25o elemento) ⇒ 1 peça defeituosa/caixa 2 2 n 50 +1= + 1 = 26 (26o elemento) ⇒ 2 peças defeituosas/caixa 2 2 A mediana é. a moda é 15. sendo n = 50 (par). No de dias fi 2 4 5 10 2 1 1 n = 25 38 . Para distribuições sem agrupamento de classes. a média aritmética desses dois elementos: 1+ 2 ~ x= = 1. 00 37.C) VARIÁVEL CONTÍNUA C.700.900.00 a a a a a 1. ~ x = I Md onde: n   − ∑ Fac. identifica-se a classe que contém a mediana (classe da 3.1 Média x de uma distribuição de freqüências Se os dados apresentados são classificados como variável contínua. ant = soma das freqüências anteriores à classe da mediana.2 Mediana de uma distribuição de freqüências Se os dados apresentados são classificados como variável contínua. obtem-se: Classe 1 2 3 4 5 Salários (em R$) 1. deve-se utilizar para o cálculo da mediana. não se preocupe se n é par ou ímpar).00 10 1.200.00 7.00 3.800.00 15.100. fMd = freqüência absoluta da classe da mediana. n = número total de elementos.00 reais/funcionário 25 C.500.600. ∑ Fac.f i n n = 37. Calcula-se a ordem n 2 (como a variável é contínua. Solução: x = i =1 ~ x ∑ x i .000.fi 2. o procedimento a seguir.500.00 1.00 1.800.00 Obs.600. 2.00 1.00 1. Exemplo 10: Com perda de informação. h = amplitude da classe da mediana. Pela freqüência acumulada Fac. ant . 39 . 1.00 1. Então. consideram-se as freqüências absolutas das classes como sendo as ponderações dos pontos médios destas classes. Os salários (em R$) de 25 funcionários selecionados em uma empresa estão representados na tabela abaixo.00 1.00 2 n = 25 xi. deve-se utilizar para o cálculo da média.400.00 2 1.000.00 1. Nesse caso.h 2  + f Md IMd = limite inferior da classe da mediana.800.200.: Os pontos médios das classes (xi) são determinados tomando-se a média aritmética entre o extremo inferior e superior de cada classe.800.000.400.00 8. Determinando o salário médio dessa distribuição.00 Total Ponto médio da classe No de funcionários xi fi 1.00 2.00 6 1.300.300 = 1.492.200. a média aritmética ponderada. utiliza-se a fórmula: ~ x ).00 5 1.300. a classe da mediana é a 3a classe. como moda de Pearson.00 a 1.000.Exemplo 11: Determinando a mediana da situação apresentada no Exemplo 10. moda de King.600. a freqüência absoluta da classe posterior.00 n = número total de elementos = 25 ∑ Fac.00 2  ~ x = 1400.00 1. Classe 1 2 3 4 5 Salários (em R$) 1. Será dado destaque à moda de Czuber.400.00 1. moda de Czuber.490.00 1. 3o passo: Aplica-se a fórmula: ~ x = I Md Neste caso: n   − ∑ Fac.400. ant .400.00 1. Neste caso. para se determinar a moda. 2o passo: Identifica-se a classe da mediana pela Fac.00.200. ant = soma das freqüências anteriores à classe da mediana = 8 h = amplitude da classe da mediana = 200. 1. o que leva a um valor mais preciso para a moda de uma variável contínua.000.800. a freqüência absoluta da classe anterior.600.00 10 reais/funcionário C.00 fMd = freqüência absoluta da classe da mediana = 10 Ou seja:  25   − 8 .00 Total a a a a a 1.00 +  = 1. entre outros.400.h 2  + f Md IMd = limite inferior da classe da mediana = 1. Como n = 25. pode-se optar por vários procedimentos.00 No de funcionários fi 2 6 10 5 2 25 Fac 2 8 18 (classe da ~ x) 23 25 -------------------------- Solução: 1o passo: Calcula-se n 25 .3 Moda x* de uma distribuição de freqüências Se os dados apresentados são classificados como variável contínua. além da freqüência absoluta da classe modal.h 2f Mo − (f ant + f post ) 40 .00 1. A fórmula de Czuber é a seguinte: x* = I Mo + (f Mo − f ant ).00 1.5 ≅ 13 2 2 (13a posição). em sua fórmula.00 1. ou seja.200. MODA DE CZUBER CZUBER levou em consideração. têm-se = 12.200.800.00 2.600. 00 Total a a a a a 1. Nesses casos.10 − (6 + 5) Observação Importante: Ocorrem.400. 41 .00 fMo = freqüência absoluta da classe modal = 10 fant = freqüência absoluta da classe anterior à classe modal = 6 fpost = freqüência absoluta da classe posterior à classe modal = 5 h = amplitude do intervalo de classe = 200. Exemplo 12: Determinando a moda de Czuber para a situação apresentada no Exemplo 10.00 2.200.00 = 1. a distribuição é bimodal (duas modas) ou de modas múltiplas.400.00 1. IMo = limite inferior da classe modal = 1. respectivamente.00 1.400. fant = freqüência absoluta da classe anterior à classe modal.00 1. fpost = freqüência absoluta da classe posterior à classe modal.00 1.00 Ou seja: x* = 1.89 reais/funcionário 2.600.000.600.00 1.800.000. algumas vezes. já que esta é a classe de maior freqüência. a classe modal é a terceira classe.400.onde: IMo = limite inferior da classe modal.00 No de funcionários fi 2 6 10 5 2 25 Solução: Por observação.488.00 1. fMo = freqüência absoluta da classe modal. dois ou mais picos distintos de igual freqüência nos dados. h = amplitude do intervalo de classe. Neste caso.200.200.00 + (10 − 6).00 1. Classe 1 2 3 4 5 Salários (em R$) 1.800. ant . ou seja. As fórmulas para a determinação dos quartis Q1 e Q3 são semelhantes àquelas usadas para o cálculo da mediana. Q3 = 3o quartil. é também uma medida separatriz. A mediana. decis e percentis. quartis. 42 . cada um deles contendo 50% dos valores da seqüência. para dados agrupados em classes. por exemplo. D. composto por 50% dos elementos. apenas.h 4  + f Q1 Q3 = IQ3  3n   − ∑ Fac.2 MEDIDAS SEPARATRIZES São números reais que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade de elementos da série. neste capítulo.1.1 Quartis Os quartis dividem um conjunto de dados em quatro partes iguais. ant . Q2 = 2o quartil. Os quartis serão utilizados. composto por 75% dos elementos. Determinação de Q1: 1o Passo: Calcula-se a posição Determinação de Q3: 2o Passo: Identifica-se a classe de Q1 pela Fac 3o Passo: Aplica-se a fórmula: n 4 1o Passo: Calcula-se a posição 2o Passo: Identifica-se a classe de Q3 pela Fac 3o Passo: Aplica-se a fórmula: 3n 4 Q1 = I Q1 onde: n   − ∑ Fac. Além da mediana. que divide a seqüência ordenada em dois grupos. coincide com a mediana. ant = soma das freqüências anteriores à classe Qi. como pode ser visto esquematicamente: 0% 25% 50% 75% 100% Q1 Q2 = ~ x Q3 Q1 = 1o quartil.h 4  + f Q3 lQi = limite inferior da classe Qi n = número total de elementos h = amplitude de classe fQi = freqüência absoluta da classe Qi ∑ Fac. composto por 25% dos elementos. serão destacadas outras medidas separatrizes. 4. Os decis serão utilizados. 2.5 minutos.52  − 32 . onde i =1. 1o Passo: Calcula-se a posição i. 6. para dados agrupados em classes.h 4  + f Q3 25% ⇒ 0% 10 34 ~ x 52. obtem-se: Classe Tempo de auditoria No de balanços (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 32 52 (classe de Q3) ----------------------Fac 18 (classe de Q1) Solução: Q1 = ? 1o Passo: Q3 = ? n 52 = = 13 4 4 (13a posição) 3n 3. Determinando os valores do 1o e 3o quartis (Q1 e Q3).10  4  = 52.10 4  = 34 minutos/balanço Q1 = 29 +  10  3.5 59 Interpretação: 25% dos balanços são realizados em até 34 minutos e 75% dos balanços são realizados em até 52. 5. 8.5 minutos/balanço Q 3 = 49 +  20 50% 75% 100% Q3 = IQ3  3n   − ∑ Fac.h 4  + f Q1 ⇒  52   − 8 .Exemplo 13: Em conjunto com uma auditoria anual. 9 10 43 2o Passo: Identifica-se a classe de Di pela Fac .n . identifica-se as classes de Q1 e Q3 3o Passo: Uso das fórmulas: Q1 = I Q1 n   − ∑ Fac. uma empresa de contabilidade pública anota o tempo necessário para realizar a auditoria de 52 balanços contábeis.2 DECIS Os decis dividem um conjunto de dados em dez partes iguais. 7. O procedimento para a determinação dos decis é semelhante àquele usados para o cálculo dos quartis. ant . 3. apenas. ant .52 = = 39 4 4 (39a posição) 2o Passo: Pela Fac. tal como indicado na tabela abaixo. D. ant .80 ≅ 21 (21a posição) 10 2o Passo: Identifica-se a classe de D4 pela Fac 3o Passo: Aplica-se a fórmula: D4 = ID 4  4. 99 100 44 . 3. 98. D.3o Passo: Aplica-se a fórmula: Di = I Di  i. Classe Tempo de auditoria No de balanços (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 18 32 (classe de D4) 52 ----------------------Fac Solução: 1o Passo: Calcula-se a posição 4. 5..52  − 18 .3 PERCENTIS Os percentis dividem um conjunto de dados em cem partes iguais.n  − ∑ Fac. Os decis serão utilizados.10  10  = 41 minutos/balanço D 4 = 39 +  14 Interpretação: 40% dos balanços são realizados em até 41 minutos e 60% dos balanços. para dados agrupados em classes. 4. onde i = 1. são realizados em tempos acima de 41 minutos. .h  10  + f D4 ⇒  4.n   − ∑ Fac. ant .52 = 20. portanto.h 10  + f Di onde: lDi = limite inferior da classe Di n = número total de elementos h = amplitude de classe fDi = freqüência absoluta da classe Di ∑ Fac. apenas. 1o Passo: Calcula-se a posição i.. O procedimento para a determinação dos decis é semelhante àquele usados para o cálculo dos quartis.n . 97.ant = soma das freqüências anteriores à classe Di Exemplo 14: Determinando o valor do 4o decil (D4) para a situação apresentada no Exemplo 13. 2.. 64 ≅ 43 100 (43a posição) 2o Passo: Identifica-se a classe de P82 pela Fac 3o Passo: Aplica-se a fórmula: P82 = I P82  82.32 minutos.52 = 42.10  100  = 54. são realizados em tempos acima de 54.32 minutos e 18% dos balanços.h  100  + f Pi lPi = limite inferior da classe Pi n = número total de elementos h = amplitude de classe fPi = freqüência absoluta da classe Pi ∑ Fac. portanto.52  − 32 . ant .n  − ∑ Fac. 45 .2o Passo: Identifica-se a classe Pi pela Fac 3o Passo: Aplica-se a fórmula: Pi = I Pi onde:  i.h  100  + f P82 ⇒  82.n  − ∑ Fac.32 P82 = 49 +  20 minutos/balanço Interpretação: 82% dos balanços são realizados em até 54.ant = soma das freqüências anteriores à classe Pi Exemplo 15: Determinando o valor do 82o percentil (P33) para a situação apresentada no Exemplo 13. ant . Classe Tempo de auditoria No de balanços (em minutos) fi 1 3 3 9 a 19 2 5 8 19 a 29 3 4 5 29 a 39 39 a 49 49 a 59 Total 10 14 20 52 18 32 52 (classe de P82) ----------------------Fac Solução: 1o Passo: Calcula-se a posição 82. Na seqüência Z existem muitos valores muito afastados do valor 10 e. 17 As três séries têm uma característica comum. Na série X todos os dados são iguais a 10 e. que é o valor da média. 46 . 11. que são. descuidando do conjunto de valores intermediários. o que faz dessas medidas. 10. 9. serão estudadas a amplitude total. apresentam grande concentração em torno de 10. devidos ao acaso. 15. a amplitude total é instável por ser influenciada por valores extremos. em X os dados estão totalmente concentrados na média 10 e. 10. índices de dispersão bastante estáveis. ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e sua medida de posição. 10. pode-se dizer que o conjunto X apresenta uma dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z. Solução: A T = 30 − 0 = 30 acidentes Exemplo 17: Determinando a amplitude total para a variável contínua (salários) descrita no Exemplo 10.2 VARIÂNCIA E DESVIO PADRÃO reais Como comentado. 8. 10. o desvio padrão e o coeficiente de variação. 5. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. pois levam em consideração a totalidade dos valores da variável em estudo. 11. Essa média é 10 para as três séries. Em resumo. Em Z há fraca concentração de valores em torno da média e grande dispersão de dados. a Estatística recorre às medidas de dispersão ou de variabilidade. 10. A média 10 representa razoavelmente bem a série. 12. 10. na sua maioria. Exemplo 16: Determinando a amplitude total para a variável discreta (no de acidentes) descrita no Exemplo 6. portanto. elas diferem entre si com relação ao agrupamento dos dados em torno dessa média. ou seja. Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. portanto.1. não há dispersão de dados.1 AMPLITUDE TOTAL A amplitude total é a diferença entre o maior e o menor valor observado: A T = x máx − x mín A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série. a média 10 não representa muito bem a série. mas estão próximos dela. 14. 10. 10. 16. 9. Solução: A T = 2000 − 1000 = 1000 E. a média representa muito bem essa série. 10. 10. 4. 10. Em Y existe forte concentração de dados em torno da média e fraca dispersão. para qualificar os valores de uma dada variável. 6.3 MEDIDAS DE DISPERSÃO Considere as seguintes séries de dados: X : 10. e por isso mesmo. Entretanto. 13 Z : 3. 10 Y : 7. portanto. a variância. Na seqüência Y vê-se que vários dados diferem da média. Portanto. E. 10. Dessas medidas. os mais empregados. A variância e o desvio padrão são medidas que não possuem essa falha. o que quase sempre invalida a idoneidade do resultado. Solução: Para facilitar o cálculo da variância e do desvio padrão. imaginou-se uma medida que tem utilidade e interpretação práticas. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. sob o ponto de vista prático é um inconveniente. Por isso mesmo. ∑ ( x i − x )2 .fi n −1 Variância amostral Sendo a variância calculada a partir dos quadrados dos desvios.fi n Variância populacional s2 (x) = onde n = ∑ fi . a média dos quadrados dos desvios.09 acidentes/dia.09 Portanto. o desvio padrão amostral é 7.25 = 7.52 231. porém.206 = = 50.fi 1.76 1206. determinando. porém é extremamente importante na inferência estatística e em combinações de amostras.A variância baseia-se nos desvios em torno da média. o que. para o cálculo da variância é mais interessante o uso das fórmulas: σ 2 ( x) = ∑ ( x i − x ) 2 . 47 . logo s = 50. ela é um número em unidade quadrada em relação à variável em questão. definido como a raiz quadrada do valor da variância.25.60 109.52 153.fi 317. usando x = 12. s = s 2 .25 25 − 1 ∑ fi − 1 Portanto a variância amostral é 50.04 33.80 57. monta-se a tabela abaixo. denominada desvio padrão.76 302. A variância é uma medida que tem pouca utilidade como estatística descritiva.60 acidentes/dia: No de acidentes xi 0 5 10 15 20 25 30 Total No de dias fi 2 4 5 10 2 1 1 25 (x i − x ) 2 . ou seja: σ( x ) = σ 2 s( x ) = s 2 Desvio padrão populacional Desvio padrão amostral Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. Assim.00 s2 (x) = 2 ∑ ( x i − x ) . Exemplo 18: Determinando a variância amostral e o respectivo desvio padrão para a variável discreta descrita no Exemplo 6. logo s = 44.800.00 1.00 1. 48 .200. usando x = 1.3 COEFICIENTE DE VARIAÇÃO O desvio padrão por si só não representa muita coisa. E.500.400 2 ∑ ( x i − x ) . portanto.928 1.300.97 por funcionário.33.00 1. Solução: Para facilitar o cálculo da variância e do desvio padrão.33 25 − 1 ∑ fi − 1 Portanto a variância amostral é 44.400.00 Total Ponto médio da classe (xi) 1.97 . o desvio padrão amostral é R$ 211.600.00 e o respectivo desvio padrão calculado no exemplo acima é igual a R$ 211. medida essa denominada coeficiente de variação (CV): σ CV = . monta-se a tabela abaixo.100 = 14.21% do valor médio e que.320 332.00 reais/funcionário: Classe 1 2 3 4 5 Salários (em R$) 1.00 1. um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cuja média é 200.00 1.21% 1.fi 307. pode-se caracterizar o desvio padrão dos dados em termos relativos a sua média.00 1.400 2 s (x) = = = 44.492.00 No de funcionários fi 2 6 10 5 2 25 (x i − x ) 2 .000.933.184 640 216.100 x ou s CV = . se a média for 20.00 1.97.800.492.492.97 Portanto.600.100. Assim.933.933. mas.328 221.078.700.900.00 1.200.00 Interpretação: Esse resultado indica que o desvio padrão representa 14.33 = 211.00 2. há uma grande dispersão de valores salariais em torno do salário médio dos funcionários dessa empresa. o mesmo não pode ser dito. s = s 2 .00 a a a a a 1.000.400. cuja média calculada é igual a R$ 1. Solução: CV = 211.00 1.078.100 x Exemplo 20: Determinando o coeficiente de variação para a variável contínua descrita no Exemplo 10.fi 1.Exemplo 19: Determinando a variância amostral e o respectivo desvio padrão para a variável contínua descrita no Exemplo 10. Para contornar essa limitação.00 1.00 1. 9.53. 165. 140. 155. 7.64. 58.1.00. 70. 69.50. 49 . 12.40. As taxas de juros recebidas por 10 ações escolhidas ao acaso na BOVESPA durante um trimestre foram (em porcentagem): 2. 2. o número mediano e o número modal. Qual é a média salarial diária de todo o grupo? 8.10. Determinar a média. 8. 2.57. A média aritmética das moças foi 9. a mediana e a moda para esse grupo de salários.25. escolheu-se o mês de setembro. 2.90.25.2. foram: 8. 4.25. 230. 140. Calcule a média. 57. 12. 5. 165. 5.62. 10. Calcule a nota média. Um grupo de 64 pessoas.35. 180. ordenados em ordem crescente: R$ 5. encontrando-se o seguinte número de peças defeituosas por veículo: No de peças defeituosas 0 1 2 3 4 No de veículos (fi) 25 20 3 1 1 Construa um gráfico de colunas simples para esta distribuição e calcule o número médio de peças defeituosas por veículo.59.00 e 7 ganham R$ 120. 6. 10 ganham R$ 60. 2. Qual foi a média de toda a turma nessa prova? 7. encontrando-se os seguintes números: No de acidentes 0 1 2 3 4 No de dias (fi) 5 9 12 3 1 Construa um gráfico de barras simples para esta distribuição e calcule o número médio diário de acidentes em setembro.61.45. 55. Para se estimar o número de acidentes diários em um grande estacionamento durante um período de um mês.10. Para uma amostra de 15 clientes de um pequeno mercado. 10. 155. 68 e 53. é formado por sub-grupos que tem salários diários com as seguintes características: 12 pessoas ganham R$ 50.00. 140. 7. 64.64.55. 180.2 e a dos rapazes foi 7.09 e 14.LISTA 3 – Exercícios para fixação 1. 240. Para se estimar o número de peças defeituosas de um veículo. 8. 2. 140.00. Considere uma amostra com os valores de 53. 20 ganham R$ 25.7 e 7. 6. 2. Calcule a taxa de juros média e a taxa de juros mediana. 2. 190. 140. 9. que trabalha em uma empresa. 6. arredondados para o valor do real mais próximo e apresentados em ordem crescente: R$ 140. Numa turma com 20 moças e 50 rapazes foi aplicada uma prova de Estatística. 15 ganham R$ 90.60. 53.63.8. 9. em seis provas de um concurso.25. foram observados os seguintes montantes de vendas. 225. a mediana e a moda para esses valores de vendas. Calcular a média.00. 57.55. 200. 140. 2.71. 3. Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante certa semana.2. 2. a mediana e a moda. o número mediano e o número modal.4.8. 2. 205. a nota mediana e a nota modal. 6. 6. 140. escolheu-se uma amostra de 50 veículos. 8. 13.10. As notas de um candidato. No de dias para entrega de pedidos de compra 7 10 12 15 20 30 45 No de produtos comprados (fi) 50 150 200 400 1. 11.200 2. Compare os três valores obtidos e discuta esses resultados. Vendas semanais (em salários mínimos) 30 a 35 35 a 40 40 a 45 45 a 50 50 a 55 55 a 60 60 a 65 65 a 70 No de vendedores (fi) 2 10 18 50 70 30 18 2 Calcule a média. foi feita a seguinte pergunta: "Quantas das últimas quatro edições você leu ou folheou?" A seguinte distribuição de freqüências sintetiza uma amostra de 500 respostas: Edição lida 0 1 2 3 4 No de assinantes (fi) 15 10 40 85 350 a) Qual é o número médio de edições lidas por um assinante da revista "Fortune"? b) Qual é o número mediano? c) Qual é o número modal? d) Compare os três valores obtidos nos itens anteriores e discuta esses resultados. de vendedores de gêneros alimentícios. o número mediano e o número modal.000 Calcule o número médio de dias para entregas de pedidos de compra.10. Em um levantamento entre os assinantes da revista "Fortune". 50 .000 4. em classes de salários mínimos. a mediana e a moda de Czuber para esse conjunto de dados. 12. Na tabela abaixo se observa o número de dias necessários para entregas de pedidos de compra para a Dawson Supply Distribuidores em relação ao número médio de produtos comprados. Os dados abaixo representam uma amostra das vendas semanais. fez um levantamento do consumo de seu principal produto em vários supermercados. os animais apresentaram um aumento de peso. 15.000 1. a tabela: No de unidades consumidas 0 1. Interprete os resultados obtidos. mediano e modal deste produto por supermercado pesquisado.000 6.000 4.000 5. mostrou que após um mês em que a ração normal foi substituída pela nova ração. A tabela abaixo apresenta os resultados de 30 análises de uma substância química (em porcentagem) presente em amostras de água coletadas num rio de São Paulo. Calcule a média. Interprete os resultados obtidos. em termos de ganho de peso.000 3.000 No de supermercados ( f i ) 10 50 200 320 150 30 Determine o consumo médio.000 2. Interprete os resultados obtidos. segundo a distribuição. a mediana e a moda para uma amostra das alturas de 70 alunos de uma escola.000 3. Substância Química (%) No de análises (fi) 3 0 a 16 5 16 a 32 7 32 a 48 9 48 a 64 4 64 a 80 2 80 a 96 Calcule a média. o aumento mediano e o aumento modal. Uma empresa de âmbito nacional.000 4. obtendo em determinado mês. Uma pesquisa para determinar a eficiência de uma nova ração para animais. Alturas (cm) 150 a 160 160 a 170 170 a 180 180 a 190 190 a 200 200 a 210 No de alunos ( f i ) 2 15 18 18 16 1 16.13. fornecedora de supermercados. a mediana e a moda de Czuber para esse conjunto de dados e interprete os resultados obtidos.000 2. 51 . 14. dada na tabela abaixo: Aumento de peso (em kg) 0 2 4 6 8 10 a a a a a a 2 4 6 8 10 12 N o de animais (fi) 5 7 20 16 7 5 Calcule o aumento médio de peso por animal.000 5. 7. Para a série 5. 18. Interprete os resultados obtidos. 20% consomem entre 2 e 3 litros e o restante das famílias consome entre 3 e 4 litros. O departamento de recursos humanos de uma empresa fez um levantamento dos salários de uma amostra de 120 funcionários do setor de logística. verificou-se que 20% das famílias consomem até 1 litro de leite por dia.00 700. 9. 19. a) Construa a distribuição de freqüências. c) Determine o desvio padrão populacional. 7.00 800. que representa uma amostra das notas de Estatística dos alunos de uma classe de certa universidade. interpretando os resultados obtidos em termos de coeficiente de variação.17. Calcule a variância dos salários do setor de logística e o desvio padrão correspondente. a moda e o desvio padrão de x.000.00 600. 9. 9.00 6 Calcule o salário médio dos funcionários do setor de logística. Calcule o salário mediano.00 900. a mediana. 8. 5. b) Calcule a variância populacional. 5. 7. 6. a família será beneficiada? 52 . 5. 8. a partir de que número de litros. 6. 7. c) Todo aluno que tiver nota situada entre as 10% mais altas receberá um prêmio.00 700. 6.00 500. tem distribuição dada pela tabela abaixo: Notas de Estatística No de alunos xi (ponto médio) xi. 8. Estudando-se o consumo diário de leite em certa região. 8.00 1. f) Se o distribuidor de leite da região deseja oferecer um desconto no preço do litro de leite para 25% das famílias que consomem o maior número de litros. 7. 8. Calcule a amplitude total. Calcule a moda de Czuber. 7.00 800. b) Construa o histograma para essa situação. 8.fi Fac 3 0 a2 12 2 a4 18 4a6 12 6a8 3 8 a 10 Total a) Complete a tabela.00 No de funcionários (fi) 12 30 42 24 6 900.00 a) b) c) d) e) 600. 7. 8. 6.fi (x i − x ) 2 (x i − x ) 2 .00 500. 9. c) Qual o consumo médio diário de leite por família? d) E o consumo mediano? e) Qual o desvio padrão? Interprete o resultado obtido em relação à média. 5. 9. 7. 7. 7. obtendo os seguintes resultados: Salários (R$) 400. Para uma amostra de 100 famílias: a) Escreva estas informações na forma de uma distribuição de freqüências. 6. A variável x. 6. 5. b) Calcule a média. A partir de que nota o aluno não necessitará de recuperação? 20. A partir de que nota o aluno fará jus ao prêmio? d) Todo aluno que tiver nota situada entre as 45% mais baixas fará recuperação. 50% das famílias consomem entre 1 e 2 litros. 6. 000 a 90. qual é a estimativa do número total de litros de gasolina que serão vendidos? c) Calcule a mediana e a moda. a partir de que valor exportado as empresas terão isenção? 23.000 50.000 30. a partir de que número de litros o cliente será premiado? 22. A tabela abaixo apresenta a distribuição das exportações de empresas de equipamentos eletrônicos em 2004. Um banco decidiu diminuir as taxas bancárias para 10% de seus correntistas (pessoas físicas) que tenham os maiores saldos em uma de suas agências bancárias no interior do Paraná.000 a 100. Um posto de gasolina registrou a seguinte distribuição de freqüências para o número de litros de gasolina vendido por carro em uma amostra de 680 carros.000 40.000 No de contas correntes ( f i ) 50 100 80 10 10 Pergunta-se: A partir de que saldo o correntista terá redução de taxas bancárias? 53 .000 80. Volume Exportado (em US$ milhões) 50. fez um levantamento desses saldos.000 a 70.000 a 60. analise e responda: a) Se o governo. para incrementar as exportações. Para isto.000 70. d) Se o proprietário do posto de gasolina deseja oferecer um brinde para 5% dos clientes que colocarem o maior número de litros de gasolina em seu tanque.000 10. para incrementar as exportações. Interprete o resultado obtido.000 No de empresas (fi) 5 10 20 10 5 Para essa distribuição de freqüências.000 40.21. der isenção fiscal às empresas que estejam entre as 7% com melhor desempenho em relação ao volume exportado.000 20.000 90. obtendo a tabela: Saldos (R$) 0 10.000 60.000 a 80.000 30.000 20. a partir de que valor exportado as empresas terão esses incentivos? b) Se o governo. Gasolina (em litros) 0 a 8 8 a 16 16 a 24 24 a 32 32 a 40 40 a 48 TOTAL No de carros (fi) 74 192 280 105 23 6 680 a) Calcule a média e o desvio padrão para esses dados agrupados. b) Se o posto de gasolina espera atender cerca de 120 carros em determinado dia. por correntista. der incentivos fiscais à metade das empresas que tenham melhor desempenho em relação ao volume exportado. 8.8 6. se ele está disposto a trocar 4% das peças? 25.9 3.6 19.6 14.4 6.4 8. d) Qual é o tempo médio de utilização do computador pessoal? e) Qual é o desvio padrão? Interprete o resultado obtido em termos de coeficiente de variação.0 22.24.000 No de peças ( f i ) 6 42 86 127 74 15 Se o fabricante deseja estabelecer uma garantia mínima para o número de horas de vida útil dessa peça.1 8.000 3.3 12.000 2.0 horas? b3) Qual a % de pessoas que utilizam o computador pessoal no máximo por 24.000 4.0 horas (exclusive)? b4) Qual o número de pessoas que utilizam o computador pessoal por mais de 8. freqüência acumulada e freqüência acumulada relativa (%) – Calcule a amplitude de classe ideal para responder às próximas questões iniciando de 0.0 horas (inclusive)? c) Construa um histograma de freqüências absolutas para esta distribuição.0 15.000 3.6 12. freqüência relativa (%). f) Qual é o tempo mediano de utilização do computador pessoal? Interprete o resultado obtido.2 7.000 1.2 7.0 horas? b2) Qual o número de pessoas que utilizam o computador pessoal pelo menos por 20.8 7.2 8. O relatório Nielsen de Tecnologia Doméstica (20/02/2003) relatou o uso de tecnologia doméstica por pessoas com 12 anos ou mais.1 7.2 9. Os dados abaixo são as horas de uso do computador pessoal durante uma semana para uma amostra de 50 pessoas.3 11. a partir de quantas horas esses usuários serão premiados? 54 . b) Responda: b1) Qual a % de pessoas que utilizam o computador pessoal por menos de 12.2 6. g) Qual é o tempo modal de utilização do computador pessoal? h) Se determinado site der um prêmio a 2% dos usuários que o visitarem por mais vezes.9 14.8 4.2 20.9 11.6 8.0.8 27.4 12. trocando a peça que não apresentar este número mínimo de horas.2 8.6 24.4 11.5 6.5 7.4 6.0 11.8 10.8 11.000 2.0 17.2 6.0 9.3 20.000 6.4 8.000 5.8 12.2 25.000 5. qual é a garantia.6 0. Uma amostra do tempo de vida útil de uma peça automotiva forneceu a seguinte distribuição: Vida útil (horas) 0 1.5 18.2 21.2 a) Sintetize os dados construindo uma tabela de distribuição de freqüências – freqüência absoluta.2 5.8 8.4 3.4 11.000 4. enquanto que. 2001. T. x3. D.R. & CLARK..5 1. & WILLIAMS. D. São Paulo: Universidade Paulista. 2..5 3.ed. 3. W. J. é plotado no eixo horizontal.M. Apostila de Estatística..S. 1995.ed. x2. 5. J. São Paulo: Atlas.. no caso a distância rodoviária. xn) que influenciam o comportamento de y.. São Paulo: Harbra Harper How do Brasil. xn) através da análise de regressão. conforme a tabela abaixo. 55 . DOWNING.0 1. NOBRE. É uma equação que descreve a relação em termos matemáticos. 2002. a variável dependente do modelo.REGRESSÃO LINEAR E CORRELAÇÃO BIBLIOGRAFIA CONSULTADA: 1.CAPÍTULO 4 . Princípios de Estatística. Seja y uma variável de interesse e cujo comportamento futuro deseja-se prever. D.0 3. SWEENEY. x2..0 Uma boa maneira de determinar se há relação entre a distância rodoviária percorrida e o tempo de entrega do carregamento é traçar um gráfico.. Estatística Aplicada à Administração. 2007. 3. São Paulo: Saraiva. A Estatística oferece meios de se chegar à relação entre a variável dependente (y) e as variáveis independentes (x1. x3.J. STEVENSON. Na REGRESSÃO a variável y é chamada de variável dependente e a variável x de variável independente. REGRESSÃO LINEAR E CORRELAÇÃO REGRESSÃO LINEAR SIMPLES: Método de análise da relação entre uma variável independente e uma variável dependente.0 5.A. J. CORRELAÇÃO: Mede o grau de relação entre as duas variáveis. Será estudado o modelo: y = ax +b (ajuste de uma reta). É fácil identificar uma série de variáveis xi (x1. A.0 2. São Paulo: Pioneira Thomson Learning. Carregamento Distância Rodoviária (km) x 1 825 2 215 3 1070 4 550 5 480 6 920 7 1350 8 325 9 670 10 1215 Tempo de entrega (dias) y 3.0 4. Estatística Aplicada. 2. Estatística Aplicada à Administração e Economia. 4. G. É interessante plotar um diagrama. 2002.ed. DIAGRAMA DE DISPERSÃO Exemplo 1: Suponha que um analista toma uma amostra aleatória de 10 carregamentos por caminhão feitos por uma companhia e anota a distância em quilômetros e o tempo de entrega em dias (arredondado para o meio dia mais próximo). & DONAIRE D. 4. ANDERSON. x... no qual cada ponto plotado representa um par observado de valores para as variáveis dependente e independente.0 4. O valor da variável independente.5 1. MARTINS. tão próxima quanto possível. dos pontos assinalados no diagrama de dispersão. é apropriado ao caso. Para cada observação será marcado um ponto.x + b. Isto é. é possível calcular os parâmetros a e b pela aplicação das seguintes fórmulas: a= n∑ xy − ∑ x. Exemplo 2: Determinando a equação de regressão de mínimos quadrados para os dados apresentados no Exemplo 1. é plotado no eixo vertical. Portanto. cujos coeficientes. Segundo esse método. é necessário calcular-se os valores de a e b de forma que a reta passe.MÉTODO DOS MÍNIMOS QUADRADOS Estabelecido o modelo y = a.x . deseja-se minimizar a discrepância total entre os pontos marcados e a reta.x + b permite predizer o valor de y a partir de um determinado valor de x. no caso o tempo de entrega. Assim. Este tipo de gráfico é chamado diagrama de dispersão (ver figura abaixo). 56 .o valor da variável dependente. y = = média dos yi n n b = y − a. n n A equação ajustada y = a. 6 5 Tempo de Entrega (dias) 4 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 Distância Rodoviária (km) Pelo diagrama acima. a análise de regressão linear.∑ y n∑ x 2 − ( ∑ x ) 2 ∑x ∑y = média dos xi. serão determinados. onde n = número de observações. x= b= ∑y ∑x − a. O melhor método para a determinação dos parâmetros a e b é o Método dos Mínimos Quadrados. a e b. AJUSTE DE UMA RETA . parece que os pontos seguem uma relação linear. y. 0 6. 6 5 Tempo de Entrega (dias) 4 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 Distância Rodoviária (km) 57 .225 7. que está traçada no diagrama de dispersão do Exemplo 1. y = a.0 26.0 n = 10 ∑ x.625 448.0 = 0.300 x.5 1.0 480.370.144. é necessário calcular a e b. logo b = 2.5 215.∑ x 2 − ( ∑ x ) 2 ∑ x 2 = 7104300 = 10 × 26370.0 2.0036.075.y 2.0 6.5 3. é conveniente a construção da tabela: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Total Solução: Distância (km) x 825 215 1070 550 480 920 1350 325 670 1215 7.5 1.∑ xy − ∑ x.0 4.0 2. conforme a figura abaixo.0 1.887.0035851× 762.0035851 ∑ x 7620 = = 762.85 n 10 b = y − a.5 x2 680.400 846.0 5.∑ y n.0 487.1182 ≅ 0.Neste caso.400 1.0 n 10 ∑ y 28.010.822.5 y= = = 2.12 é a reta ajustada.x .0 4.0 − 7620 × 28.5 2.075.0 28.760.100.625 46.476.12 x= Portanto.0 1.0 3.620 Tempo de entrega (dias) y 3.x + 0.280.5 10 × 7104300 − (7620 )2 = 0.500 105.0 4.225 1.900 1.0 ∑ x = 7620 ∑ y = 28.5 a= n.x + b ⇒ y = 0.y = 26370.900 302.500 230. Para isso.85 − 0.104. 350 km. medir o grau de ajuste dos valores em torno de uma reta. é utilizado o coeficiente de correlação de Pearson. onde n é o número de observações. x e y.1000 + 0.00 → Relacionamento linear positivo.72 dias Logo.0036. desde que as viagens não ultrapassem 1. Os valores do coeficiente de correlação r estão sempre entre –1 e +1. 58 . todos os pontos dados estão numa linha reta que tem inclinação negativa (função linear decrescente).12 = 0. pode-se estimar o tempo de entrega de um carregamento para qualquer distância. que é a distância máxima para a qual essa equação de regressão foi estimada. Este coeficiente de correlação é dado por: r= n ∑ xy − (∑ x )(∑ y) [n ∑ x 2 − (∑ x ) 2 ][n ∑ y 2 − (∑ y) 2 ] . o tempo de entrega para um carregamento pela distância rodoviária de 1. Estas afirmações podem ser observadas abaixo.x + 0.000 km. por exemplo. por exemplo. Um valor -1 indica que as duas variáveis x e y estão perfeitamente relacionadas de forma linear negativa. 80 70 60 50 40 30 20 10 0 0 5 10 15 20 25 30 35 40 y x r = +1.000 km é igual a 3. o cálculo é o seguinte: y = 0. todos os pontos dados estão numa linha reta que tem inclinação positiva (função linear crescente). Um valor +1 indica que as duas variáveis x e y estão perfeitamente relacionadas de forma linear positiva. Isto é. Valores do coeficiente de correlação próximos a zero indicam que x e y não estão linearmente relacionados.72 dias. perfeito.0036. Isto é. Para avaliar o coeficiente de correlação linear entre duas variáveis.12 = 3.Usando a equação de regressão desenvolvida acima. COEFICIENTE DE CORRELAÇÃO É a medida que descreve o grau da associação linear entre duas variáveis aleatórias contínuas. Para a distância de 1. pelas configurações dos diagramas de dispersão para diferentes valores de r. ou seja. moderado.70 → Relacionamento linear positivo. 100 80 60 y 40 20 0 0 5 10 15 20 25 30 35 40 x r = 0 → Ausência de relacionamento linear 50 40 30 20 10 0 -10 -20 -30 0 5 10 15 20 25 30 35 40 y x r = -1. perfeito 59 .80 70 60 50 40 y 30 20 10 0 -10 0 5 10 15 20 25 30 35 x r ≅ 0.00 → Relacionamento linear negativo. 00 4. é y = 0.5 1.x + 0.0 5.00 20.400 1.0 ∑ x = 7620 2 ∑ y = 99.144.5 3.100.0 2.0 4.225 1.010. com coeficiente de correlação igual a 95%.5 215.Exemplo 3: Determinando o coeficiente de correlação linear de Pearson para os dados apresentados no Exemplo 1.625 46.0 4.25 2.0 1.0 2.0 480.900 1.5 2.0036.r ⇒ y ajustado ⇒ x >< y ⇒ r (coeficiente de correlação linear) g y RCL 1 RCL 2 RCL 3 ⇒ n ⇒ Σx ⇒ Σ x2 RCL 4 RCL 5 RCL 6 ⇒ Σy ⇒ Σ y2 ⇒ Σ x.075.280.75 ∑ x 2 = 7104300 ∑ y = 28.y 60 .887.00 99.104.760.0 − 7620 × 28.620 Tempo de entrega (dias) y 3.075.476.0 487.0 28.95 49033.0 3.0 26.500 230. para o cálculo de r: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Total Solução: Distância (km) x 825 215 1070 550 480 920 1350 325 670 1215 7. Reapresentando a tabela com o cálculo de y2.0 6.300 y2 12.5 r= n∑ xy − ( ∑ x )( ∑ y ) [n∑ x 2 − ( ∑ x )2 ].5 1.225 7.500 105.0 16.25 9.0 1.0 4.9489 ≅ 0.370.75 x.12 .y = 26370.25 1.00 1.y 2. como visto no Exemplo 2.0 6.822.5 x2 680.00 25.00 9.0 n = 10 ∑ x.900 302. necessário neste caso.67 ou = 10 × 26370.400 846.625 448.75 − (28.[n∑ y 2 − (∑ y )2 ] 46530 = 0.5 [10 × 7104300 − (7620) 2 ] × [10 × 99. Lembrete: HP-12C (Regressão Linear): y ⇒ enter x ⇒ Σ+ ˆ . o que representa uma excelente relação linear entre as variáveis x e y.5)2 ] r = 95% r= A equação da reta ajustada. Numa amostra de cinco operários de uma dada empresa. d) Calcule o coeficiente de correlação e interprete seu significado.5734.9 9 10. Na tabela abaixo são apresentados os custos de manutenção por hora classificados pela idade da máquina em meses. Tempo após construção (anos) x 5 7 10 13 20 Valor do aluguel (mil reais) y 6 5 4 3 2 a) Para esse conjunto de dados.0 8 11. b) Qual a previsão de vendas dessa companhia para o 11o mês? 5. c) Determine o coeficiente de correlação e interprete o seu significado. 4.0 4 8. foram observadas duas variáveis: X: anos de experiência em um dado cargo e Y: tempo gasto na execução de certa tarefa relacionada com esse cargo. b) Calcular o coeficiente de correlação e interpretar seu significado.52 mil reais? 2.9865.6 7 11. 33 19.7 3 6.8 a) Faça o diagrama de dispersão. Discuta a correlação dessas variáveis se: a) O coeficiente de correlação linear determinado foi de 0. b) Determine a equação da reta. desde a construção) de cinco casas. e) Qual será o valor do aluguel para uma casa com 16 anos de idade? f) Qual será a idade de uma casa cujo aluguel é 4.50 19. está querendo analisar a relação que existe entre o investimento em propaganda e o valor das vendas da empresa. O diretor de vendas de uma rede de varejo com vendas a nível nacional. Na tabela abaixo está representado o valor total de vendas (em milhões de reais) de uma companhia por 10 meses consecutivos. 61 .90 3. determine a equação da reta pelo método dos mínimos quadrados e plote-a no diagrama de dispersão. b) Se uma reta parecer apropriada.30 a) Determinar a reta de regressão.LISTA 4 – Exercícios para fixação 1.6 10 10.2 6 8. Se uma reta parecer apropriada. O objetivo é ter uma equação matemática que permita realizar projeções e estimativas de vendas entre a variável dependente vendas e a variável independente investimento em propaganda.0 2 6.20 42 26. c) Represente graficamente a reta obtida no diagrama de dispersão. c) Fazer uma previsão de custo para uma máquina de 20 meses. Na tabela abaixo estão indicados o valor y do aluguel (em mil reais) e a idade x (em anos. faça o diagrama de dispersão. x y 1 5. determine os coeficientes a e b da reta pelo método dos mínimos quadrados e escreva a equação da reta.7 5 6.70 16. Idade x (meses) 6 15 24 Custos y ($) 9. d) Faça uma projeção dos valores de vendas para investimento de 600 milhões de reais. O departamento de vendas da rede relacionou os dados levantados na tabela abaixo: Investimento anual (milhões de reais) Vendas anuais (milhões de reais) 32 430 21 330 37 470 12 190 17 270 24 480 a) Construa o diagrama de dispersão. b) O coeficiente de correlação linear determinado foi de 0. Na tabela abaixo estão apresentados o número de anúncios publicados e o correspondente número de carros vendidos por 6 companhias.0 6.0 40. Renda familiar (salários mínimos) 3 5 10 20 30 50 70 100 150 200 Gasto com alimentação (salários mínimos) 1.0 a) Ajustar uma reta aos dados (atenção: modificar a variável x para x = 0. Os dados abaixo correspondem às variáveis renda familiar (em salários mínimos) e gasto com alimentação (em salários mínimos) em amostra de 10 famílias.5 2.). como você argumentaria com a Companhia F para que ela aumentasse o número de anúncios.0 2002 23. Um jornal quer verificar a eficácia de seus anúncios na venda de carros usados. aumentando. c) Estimar a produção de aço para 2005. O que ele sugere? b) Calcule o coeficiente de correlação e interprete seu significado. suas vendas? 9.0 25. c) Ajuste a reta de regressão e interprete o significado dos coeficientes. portanto.3 2003 28.0 a) Construa o diagrama de dispersão. c) Ajuste a reta de regressão e interprete o significado dos coeficientes. que usaram apenas este jornal como veículo de propaganda. 1. Companhia Anúncios Vendas A 74 139 B 45 108 C 48 98 D 36 76 E 27 62 F 16 57 a) Construa o diagrama de dispersão.6..0 10.0 20.0 15. como por exemplo.7 2004 35.5 2001 19. b) Calcular o coeficiente de correlação. d) Qual a previsão do gasto com alimentação para uma família com renda de 17 salários mínimos? e) Qual a previsão do gasto com alimentação para uma família com excepcional renda.0 80. 1. Na tabela seguinte estão indicadas as porcentagens de mulheres que trabalham em cada companhia e as porcentagens de cargos de gerência ocupados por mulheres nessas companhias... O que ele sugere? b) Calcule o coeficiente de correlação e interprete seu significado. Na tabela abaixo é apresentada a produção de aço de uma indústria no período de 2000 a 2004: Ano (x) Produção de Aço (y) (toneladas) 2000 17. d) Com base nos resultados anteriores.0 60. 7.000 salários mínimos? Você acha este valor razoável? Por quê? 8. Companhia Federated Department Stores Kroger Marriot McDonald's Sears Porcentagem de mulheres 72 47 51 57 55 Porcentagem de mulheres gerentes 61 16 32 46 36 62 . 2. utilizando Análise de Regressão. Como esse valor previsto se compara aos 36% da Sears. Na tabela a seguir estão indicadas as quantidades produzidas mensalmente de televisores da marca SHAWN e os respectivos custos totais de produção. b) O valor mais provável dos custos fixos. b) Analisando o gráfico obtido. Os dados abaixo se referem às variáveis gastos com publicidade (em mil reais) e faturamento (em mil reais) para o Kuriuwa Hotel na cidade de Monte Verde. Quantidade produzida Custo Total (R$) 10 100 11 112 12 119 13 130 14 139 15 142 a) Construir o diagrama de dispersão. é possível afirmar que o sistema se comporta de forma aproximadamente linear? c) Os pontos apresentam um comportamento crescente ou decrescente? d) Determine a equação da reta que melhor se ajusta a esses dados.a) Construa o diagrama de dispersão. e) Determine o valor mais provável dos custos fixos. f) Determine o custo estimado para a produção de 16 bolas. c) O valor do custo estimado para a produção de 12 televisores. 63 . 12. e) Faça uma previsão da porcentagem de cargos de gerência ocupados por mulheres em uma companhia onde 55% são mulheres. c) Ajuste uma reta aos dados pelo método dos mínimos quadrados e trace a reta no diagrama de dispersão. Quantidade produzida Custo Total (R$) 1 100 2 120 3 130 4 140 5 150 6 160 7 170 8 180 9 190 10 200 Pede-se estabelecer pela Análise de Regressão: a) A reta que melhor se ajusta a esses dados. b) Qual a previsão de faturamento do hotel se forem gastos R$ 8 mil em publicidade? c) Qual a previsão de gastos com publicidade no caso de se pretender um faturamento de R$ 50 mil? d) Calcule o coeficiente de correlação e interprete seu significado. uma companhia onde 55% dos funcionários são mulheres? 10. b) Calcule o coeficiente de correlação e interprete seu significado. A tabela abaixo indica a quantidade de bolas de futebol de salão produzidas mensalmente e os respectivos custos totais de produção. d) Faça uma previsão da porcentagem de cargos de gerência ocupados por mulheres em uma companhia que tem 60% de funcionários do sexo feminino. Gastos com publicidade (mil reais) 1 2 4 6 10 14 Faturamento (mil reais) 20 32 40 44 52 54 a) Ajuste uma reta aos dados pelo método dos mínimos quadrados. MG. 11. 9% Determine o coeficiente de correlação linear. 64 . Considere uma carteira AB. Uma pesquisa sobre a oferta de mercado de um produto Y levou à seguinte escala de demanda: Preço p (R$/unidade) Quantidade ofertada q (unidades) 47 34 65 75 80 120 100 130 120 170 a) Representar graficamente os dados apresentados. pode ser utilizada também para medir a diversificação de uma carteira de ativos. composta de 50% dos ativos X e 50% dos ativos Y.6% Taxa de Retorno (%) Fevereiro Março 4.1% 2.6% Com base no coeficiente de correlação linear.7% 3. 14.5% Taxa de Retorno (%) Fevereiro Março 3.4% 4.1% Abril 2. c) representar graficamente a reta de regressão no mesmo sistema de coordenadas do item a.5% 3. Um levantamento das taxas de retorno desses ativos nos últimos quatro meses é apresentado na tabela abaixo: Ativo X Y Janeiro 6. como medida da relação entre séries de números que representam qualquer tipo de dados. b) identificar o modelo linear (ou seja. determinar a equação da reta) que melhor se ajusta à escala de demanda do produto X. O coeficiente de correlação. b) identificar o modelo linear (ou seja. Considere a carteira XY.800 50 1.4% 1.0% 1. Uma pesquisa sobre a demanda de mercado de um produto X levou à seguinte escala de demanda: Preço p (R$/unidade) Quantidade demandada q (unidades) 20 3. Um levantamento das taxas de retorno desses ativos nos últimos quatro meses é apresentado na tabela abaixo: Ativo A B Janeiro 2.8% 1. c) representar graficamente a reta de regressão no mesmo sistema de coordenadas do item a. O risco de uma carteira de ativos pode ser reduzido pela combinação de ativos negativamente correlacionados ou de baixa correlação positiva.8% Abril 5. faça um comentário a respeito do risco dessa carteira de ativos. composta de 50% de ativos A e 50% de ativos B.1% 2. determinar a equação da reta) que melhor se ajusta à escala de oferta do produto Y.7% 1. 15.600 40 1.550 30 2.000 60 500 a) representar graficamente os dados apresentados.8% 3. O que pode ser comentado a respeito do risco dessa carteira de ativos? 16.13.
Copyright © 2025 DOKUMEN.SITE Inc.