Estatistica I 2014 A

May 28, 2018 | Author: Jorge Inaba | Category: Median, Mode (Statistics), Average, Histogram, Probability Distribution


Comments



Description

ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N.FRIBURGO Prof. Inaba CONTEÚDO 1. CONCEITOS BÁSICOS ............................................................................................................................................................... 3 INTRODUÇÃO .............................................................................................................................................................................. 3 MÉTODO ESTATÍSTICO ........................................................................................................................................................... 3 A ESTATÍSTICA ................................................................................................................................................................ ........... 3 ETAPAS DA PESQUISA: FASES DO MÉTODO ESTATÍSTICO .................................................................................... 3 DEFINIÇÕES BÁSICAS DA ESTATÍSTICA ......................................................................................................................... 4 VARIÁVEL ..................................................................................................................................................................................... 5 EXERCÍCIO .................................................................................................................................................................................... 6 2. FORMAS DE ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS ................................................................................... 7 SÉRIES ESTATÍSTICAS E GRÁFICOS ESTATÍSTICOS .................................................................................................. 7 DISTRIBUIÇÃO DE FREQUÊNCIA ..................................................................................................................................... 12 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO ............................................................................................ 15 Exercício ................................................................................................................................................................ ..................... 17 3. MEDIDAS DE TENDÊNCIA CENTRAL ............................................................................................................................. 18 Introdução ................................................................................................................................................................ ................. 18 MÉDIA ARITMÉTICA ( x ) .................................................................................................................................................. 18 Moda ............................................................................................................................................................................................ 19 SEPARATRIZES ................................................................................................................................................................ ........ 19 Mediana ...................................................................................................................................................................................... 20 EXERCÍCIO ................................................................................................................................................................................. 22 4. MEDIDAS DE DISPERSÃO E DE ASSIMETRIA ............................................................................................................. 23 Desvio Médio(DM) ................................................................................................................................................................. 23 VARIANÇA ................................................................................................................................................................................. 24 DESVIO PADRÃO ..................................................................................................................................................................... 24 COEFICIENTE DE VARIAÇÃO ............................................................................................................................................. 24 COEFICIENTE DE ASSIMETRIA DE PEARSON ............................................................................................................ 24 EXERCÍCIO ................................................................................................................................................................................. 25 5. PROBABILIDADE ................................................................................................................................................................ .... 26 INTRODUÇÃO ................................................................................................................................................................ ........... 26 CLASSIFICAÇÃO DE ALGUNS EVENTOS ........................................................................................................................ 26 ENFOQUES DA PROBABILIDADE ..................................................................................................................................... 27 EXERCÍCIO ................................................................................................................................................................ ................. 31 PROBABILIDADE CONDICIONAL E TEORMA DE BAYES ....................................................................................... 32 1 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba INDEPENDÊNCIA ENTRE EVENTOS ............................................................................................................................... 33 EXERCÍCIO ................................................................................................................................................................................. 36 6. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS ............................................................... 37 NOÇÃO DE VARIÁVEL ALEATÓRIA ................................................................................................................................. 37 7. DISTRIBUIÇÃO DE PROBABILIDADE DISCRETA....................................................................................................... 39 ESPERANÇA MATEMÁTICA OU MÉDIA......................................................................................................................... 39 VARIÂNCIA ................................................................................................................................................................................ 39 DESVIO PADRÃO ..................................................................................................................................................................... 39 EXERCÍCIO ................................................................................................................................................................................. 41 DISTRIBUIÇÃO BINOMIAL .................................................................................................................................................. 42 DISTRIBUIÇÃO DE POISSON .............................................................................................................................................. 45 EXERCÍCIO ................................................................................................................................................................................. 47 DISTRIBUIÇÃO GEOMÉTRICA ........................................................................................................................................... 49 DISTRIBUIÇÃO DE PASCAL (Distribuição binomial negativa) ............................................................................ 50 DISTRIBUIÇÃO HIPERGEOMÉTRICA .............................................................................................................................. 51 DISTRIBUIÇÃO MULTINOMIAL ........................................................................................................................................ 54 Exercício ..................................................................................................................................................................................... 56 8. DISTRIBUIÇÕES CONTÍNUAS ............................................................................................................................................ 57 DISTRIBUIÇÃO UNIFORME ................................................................................................................................................ 57 DISTRIBUIÇÃO NORMAL ..................................................................................................................................................... 59 EXERCÍCIO ................................................................................................................................................................ ................. 65 DIDTRIBUIÇÃO EXPONENCIAL ........................................................................................................................................ 66 EXERCÍCIO ................................................................................................................................................................ ................. 68 2 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 1. CONCEITOS BÁSICOS INTRODUÇÃO ESTATÍSTICA: ramo da matemática aplicada. ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos. Faziam "estatísticas". IDADE MÉDIA: as informações eram tabuladas com finalidades tributárias e bélicas. SEC. XVI: surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos. SEC. XVIII: a estatística com feição científica é batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem às primeiras representações gráficas e os cálculos de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar "O estudo de como se chegar à conclusão sobre uma população, partindo da observação de partes dessa população (amostra)". MÉTODO ESTATÍSTICO MÉTODO: é um meio mais eficaz para atingir determinada meta. MÉTODOS CIENTÍFICOS: destacamos o método experimental e o método estatístico. MÉTODO EXPERIMENTAL: consistem em manter constante todas as causas, menos uma, que é a que sofre variação para se observar seus efeitos, caso existam. E: Estudos da Química, Física, etc. MÉTODO ESTATÍSTICO: diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. A ESTATÍSTICA É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade. ETAPAS DA PESQUISA: FASES DO MÉTODO ESTATÍSTICO 1º - DEFINIÇÃO DO PROBLEMA: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. 2º - PLANEJAMENTO: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc. 3 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 3º - COLETA DE DADOS: Fase operacional. É o registro sistemático de dados, com um objetivo determinado. Dados primários: quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE. Dados secundários: quando são publicados pro outra organização. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição. Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A coleta direta pode ser: contínua (registros de nascimento, óbitos, casamentos, etc.), periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de dengue). Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização. 4º - APURAÇÃO DOS DADOS: Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados. 5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se excluem mutuamente. A apresentação tabular, ou seja, é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. 6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Na estatística indutiva a interpretação dos dados se fundamenta na teoria da probabilidade. DEFINIÇÕES BÁSICAS DA ESTATÍSTICA FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja possível da aplicação do método estatístico. São divididos em três grupos: Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade na Grande Vitória, O preço médio da cerveja no Espírito Santo, etc. Fenômenos individuais: são aqueles que irão compor os fenômenos de massa. Ex: cada nascimento na Grande Vitória, cada preço de cerveja no Espírito Santo, etc. Fenômenos de multidão: quando a s características observadas para a massa não se verificam para o particular. DADO ESTATÍSTICO: é um dado numérico e é considerada a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. 4 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os alunos do 2º ano da FACEV têm em média 1,70 metros de estatura. ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra. ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. Exemplo de classificação dicotômica do atributo: A classificação dos alunos da UCAM quanto ao sexo. atributo: sexo..........................classe: alunos da UCAM dicotomia: duas subclasses (masculino e feminino) Exemplo de classificação policotômica do atributo: Alunos da UCAM quanto ao estado civil. atributo: estado civil...............classe: alunos da UCAM dicotomia: mais de duas subclasses (solteiro, casado, divorciado, viúvo, etc.). VARIÁVEL É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. VARIÁVEL QUALITATIVA: Quando seus valores são expressos por atributos: sexo, cor da pele, etc. VARIÁVEL QUANTITATIVA: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numérica, trata-se, portanto da estatística de variável e se dividem em: VARIÁVEL DISCRETA OU DESCONTÍNUA: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18, abr = 30, mai = 35 , jun = 36. VARIÁVEL CONTÍNUA: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar à temperatura atual do seu corpo. 5 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas): 1. Cor dos olhos das alunas... Resp:qualitativa 2. Índice de liquidez nas indústrias Friburguense... Resp:quantitativa contínua 3. Produção de café no Brasil... Resp:quantitativa contínua 4. Número de defeitos em aparelhos de TV... Resp:quantitativa discreta 5. Comprimento dos pregos produzidos por uma empresa... Resp:quantitativa contínua 6. O ponto obtido em cada jogada de um dado... Resp:quantitativa discreta 6 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. FORMAS DE ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS SÉRIES ESTATÍSTICAS E GRÁFICOS ESTATÍSTICOS TABELAS Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas obedece à Resolução no 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE). Elementos de uma tabela Título: O título deve responder as seguintes questões: O que? (Assunto a ser representado (Fato)); Onde? (O lugar onde ocorreu o fenômeno (local)); Quando? (A época em que se verificou o fenômeno (tempo)). Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que contém uma sequência horizontal de informações. Colunas: parte do corpo que contém uma sequência vertical de informações. Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos pelas colunas numéricas. Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. 7 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar: • um traço horizontal (-) quando o valor é zero; • três pontos (...) quando não temos os dados; • zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada; • um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor. Obs.: O lado direito e esquerdo de uma tabela oficial deve ser aberto. SÉRIE ESTATÍSTICA É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Daí pode inferir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Séries Homógrafas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. Exemplo: ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 2002 PERÍODO UNIDADES VENDIDAS * JAN/96 20 FEV/96 10 TOTAL 30 * Em mil unidades b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. 8 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 2002 FILIAIS UNIDADES VENDIDAS * São Paulo 1 3 Rio de Janeiro 1 7 TOTAL 3 0 * Em mil unidades c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 2002 MARCA UNIDADES VENDIDAS * FIAT 18 GM 12 TOTAL 30 * Em mil unidades SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal. ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 2002 FILIAIS Janeiro/96 Fevereiro/96 São Paulo 10 3 Rio de Janeiro 12 5 TOTAL 22 8 * Em mil unidades 9 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba GRÁFICOS ESTATÍSTICOS São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Tem como características o uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Gráficos de informação: São gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes. Gráficos de análise: São gráficos que se prestam melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise frequentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico. O uso indevido de Gráficos pode trazer uma ideia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas. Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas. 1 - Diagramas: São gráficos geométricos dispostos em duas ou três dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser : Gráficos em barras horizontais Gráficos em barras verticais (colunas) Quando as legendas não são breves usam-se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. Gráficos em barras ou colunas superpostas Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. Gráficos em linhas ou lineares São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desse fenômeno é denominada de área de excesso. Gráficos em setores Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores 10 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Obs.: As séries temporais geralmente não são representadas por este tipo de gráfico. Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser autoexplicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo: Estereogramas: São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. 11 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DISTRIBUIÇÃO DE FREQUÊNCIA É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL:É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Diagrama de ramo-e-folhas Um gráfico usado para mostrar a forma da distribuição de um conjunto de dados quantitativos é o diagrama de ramo-e-folhas, desenvolvido pelo estatístico John Tukey. Para a construção desse gráfico, cada observação do conjunto de dados é “quebrada” em duas partes. Uma dessas partes é a folha, que deve ser formada por apenas um algarismo, e os algarismos restantes formam o galho. Como numa árvore, as folhas são “penduradas” no galho apropriado. Para construir o diagrama, traça-se uma linha vertical para separar os galhos das folhas. À esquerda dessa linha escrevem-se os diferentes ramos, um em cada linha horizontal, e escrevem-se as folhas no respectivo galho. Ex. 4 1 1 1 2 2 3 4 5 6 6 5 0 0 1 2 4 7 8 8 6 0 0 Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: Dados Frequência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20 12 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Classes Frequências (fi) 41 45 7 45 49 3 49 53 4 53 57 1 57 61 5 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (com intervalos de classe): CLASSE: são os intervalos de variação da variável e é simbolizada por i. Ex: na tabela anterior, temos 5 classes e 49 53 é a 3ª classe, onde i=3. LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número, limite superior de classe (Li). Ex: em 49 53... l3= 49 e L3= 53. O símbolo representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não pertence à classe 3 e sim a classe 4 representada por 53 57. AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuição de frequência com classes iguais, o hi será igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19. Obs.: AT sempre será maior ou igual que AA. PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 53 o ponto médio x3 = (53+49)/2 = 51, ou seja, x3=(l3+L3)/2. Frequências simples ou absolutas(fi): são os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição. Frequências relativas(fri): são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %). 13 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Frequência simples acumulada de uma classe(Fi): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Frequência relativa acumulada de uma classe(Fri): é a frequência acumulada da classe, dividida pela frequência total da distribuição. Exemplo Classes fi xi fri Fi Fri 50 54 4 52 0,100 4 0,100 54 58 9 56 0,225 13 0,325 58 62 11 60 0,275 24 0,600 62 66 8 64 0,200 32 0,800 66 70 5 68 0,125 37 0,925 70 74 3 72 0,075 40 1,000 Total 40 Número de Classes(i) Corresponde à quantidade de classes, nas quais serão agrupados os elementos do rol. A fórmula oficial para determinar i, é a fórmula de Sturges, que é a seguinte: i = 1 + 3,333...log(n), onde n corresponde ao número de elementos do rol. Para facilitar, pode-se adotar um valor para l, geralmente entre 5 e 20. Em alguns casos (25 ≤ n ≤ 200) utiliza-se i = raiz quadrada de n. 14 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Histograma, Polígono de frequência e Polígono de frequência acumulada. Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas), as frequências. Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas. Polígono: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantado pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior a primeira e da posterior à última, da distribuição. Exemplo Dada à distribuição, construir o histograma e o polígono. Classes fi xi 50 54 4 52 54 58 9 56 58 62 11 60 62 66 8 64 66 70 5 68 70 74 3 72 Total 40 15 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Histograma de frequencies Polígono de frequencies Obs: uma distribuição de frequência sem intervalos de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva frequência. 16 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1. As notas obtidas por 50 alunos de uma classe foram: 1,0 2,0 3,0 4,0 5,0 6,0 6,0 7,0 8,0 7,0 2,0 3,0 3,0 4,0 5,0 6,0 6,0 8,0 8,0 7,0 2,0 3,0 3,0 4,0 5,0 6,0 6,0 8,0 9,0 7,0 2,0 3,0 4,0 5,0 5,0 6,0 6,0 8,0 9,0 7,0 2,0 3,0 4,0 5,0 5,0 6,0 7,0 8,0 9,0 7,0 a) Dispor as notas em um rol b) Determinar a amplitude amostral c) Construir uma distribuição de frequência com 5 classes que tenham a mesma amplitude com l1 = 0 e L5 = 10. d) Construir uma distribuição de frequência, aplicando a regra de Sturges. 17 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 3. MEDIDAS DE TENDÊNCIA CENTRAL INTRODUÇÃO São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência centrais mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática. As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis. MÉDIA ARITMÉTICA ( x ) A média aritmética, ou média, de um conjunto de n números x1, x2, ... , xn é definida por: Com intervalos de classe. = i i i f f x ∑ ∑ , xi é o ponto médio da classe. Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados. Pode-se mostrar que quando a distribuição dos dados é "normal", então a melhor medida de localização do centro, é a média. Sendo a Distribuição Normal uma das distribuições mais importantes e que surge com mais frequência nas aplicações, (esse fato justifica a grande utilização da média). A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual à zero. A média tem outra característica, que torna a sua utilização vantajosa em certas aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média. Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida. x= x n i 1 n ∑ x 18 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba MODA Define-se moda como sendo: o valor que surge com mais frequência se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal. Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana. Cálculo da moda de uma distribuição com intervalos de classe. CLASSE MODAL: classe que apresenta maior frequência. Moda = Mo = l* + 2 1 1 +∆ ∆ ∆ . h* Onde: l* : limite inferior da classe modal. h* : amplitude da classe modal. ∆1 : diferença entre a frequência da classe modal e a frequência da classe anterior. ∆2 : diferença entre a frequência da classe modal e a frequência da classe posterior. SEPARATRIZES QUARTIS, DECIS E PERCENTIS Quartis São os valores de uma série que a dividem em quatro partes iguais. Primeiro quartil (Q1) : 25 % dos elementos Segundo quartil (Q2) = mediana : 50 % dos elementos Terceiro quartil (Q3) : 75 % dos elementos 19 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Decis São os valores que dividem a série em 10 partes iguais. D1 = 10 %, D2 = 20 %,..., D9 = 90 % Percentis São os valores que dividem a série em 100 partes iguais.(Pi ) Ex: P1 = 1 %, P20 = 20 %, P72 = 72 %, etc. Podemos utilizar a seguinte fórmula para determinar os decis, quartis e percentis. Pi = lp + P . P P i h f F - f 100 ∑ i CLASSE PERCENTIS : Classe correspondente à frequência acumulada imediatamente superior a ∑ i f 100 i . lp : limite inferior da classe percentis fP : frequência da classe percentis Fp : frequência acumulada imediatamente anterior à da casse percentis. hp : amplitude do intervalo da classe percentis. MEDIANA A mediana, é uma medida de localização do centro da distribuição dos dados, definida do seguinte modo: Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana. Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n é ímpar, a mediana é o elemento médio. Se n é par, a mediana é a semissoma dos dois elementos médios. Para dados agrupados Mediana = Med = P50 Como medida de localização, a mediana é mais robusta do que a média, pois não é tão sensível aos dados. 1- Quando a distribuição é simétrica, a média e a mediana coincidem. 2- A mediana não é tão sensível, como a média, às observações que são muito maiores ou muito menores do que as restantes. Por outro lado a média reflete o valor de todas as observações. 20 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Como já vimos a média ao contrário da mediana, é uma medida muito influenciada por valores "muito grandes" ou "muito pequenos", mesmo que estes valores surjam em pequeno número na amostra. Estes valores são os responsáveis pela má utilização da média em muitas situações em que teria mais significado utilizar a mediana. A partir do exposto, deduzimos que se a distribuição dos dados: 1. for aproximadamente simétrica, a média aproxima-se da mediana; 2. for enviesada para a direita, a média tende a ser maior que a mediana; 3. for enviesada para a esquerda, a média tende a ser inferior à mediana. 21 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1) Seja a distribuição: Idade(anos) fi 10 14 15 14 18 28 18 22 40 22 26 30 26 30 20 30 34 15 34 38 10 38 42 5 Determine: a) a média b) a medida que deixa 50 % dos elementos c) a moda d) o 3 0 decil e) a medida que deixa 1/4 dos elementos f) qual porcentagem de pessoas maiores de 21 anos 2) Seja a distribuição de salários descritos No de salários mínimos fi 1 2 28 2 3 32 3 4 20 4 5 6 5 6 4 7 8 2 Determine: a) qual o n o de salários mínimo acima do qual estão situados os 10 % melhores remunerados? b) qual o no de salários mínimo abaixo do qual se encontram os 15 % piores remunerados? c) acima de quantos salários mínimos estão os 18 operários mais bem pagos? d) abaixo de quantos salários se situam os 36 operários piores remunerados? 22 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 4. MEDIDAS DE DISPERSÃO E DE ASSIMETRIA Servem para verificarmos a representatividade das medidas de posição, pois é muito comum encontrarmos séries que, apesar de terem a mesma média, são compostas de maneira distinta. Amplitude Total(AT) AT = x máx - x mín = L máx - l mín DESVIO MÉDIO(DM) O desvio médio de um conjunto de n números x 1 , x 2 , x 3 ,...,x n , é definida por: DM = |x - x| n i ∑ Ex: Determinar o desvio media do conjunto de números 2, 3, 6, 8, 11. Se x 1 ,x 2 ,x 3 ,...,x n ocorrem com as frequências f 1 ,f 2 ,f 3 ,...,f n respectivamente, o desvio médio poder ser indicado da seguinte forma: DM = f |x - x| f i i i ∑ ∑ , x i é o ponto médio Ex: Determinar o desvio médio da tabela abaixo: Estaturas(cm) f i 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 23 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba VARIANÇA Variância populacional: VAR(P) = σ 2 = Σ Σ Σ Σ Σ Σ (x - x) f f = 1 f x f - ( x f ) f i 2 i i i i 2 i i i 2 i ⋅       Variância amostral: VAR(A) = s 2 =         Σ Σ Σ Σ Σ ⋅ Σ i 2 i i i i i i i 2 i f ) f x ( - f x 1 - f 1 = 1 - f f ) x - (x 2 DESVIO PADRÃO Desvio padrão populacional : σ = ) (P VAR = σ 2 Desvio padrão amostral : s = ) (A VAR = 2 s COEFICIENTE DE VARIAÇÃO CV = x x = CV OU s σ Obs: Para efeitos práticos, costumam-se considerar que CV superior a 50% indica alto grau de dispersão e, consequentemente pequena representatividade da média. Para valores inferiores a 50 %, a média será tanto mais representativa quanto menor for o valor de seu CV. COEFICIENTE DE ASSIMETRIA DE PEARSON = ̅− ou = ̅ − Se < 0, a distribuição é assimétrica a esquerda ou negativa. Se > 0, a distribuição é assimétrica à direita ou positiva. Se = 0 a distribuição é simétrica. 24 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1).Uma amostra de 20 trabalhadores na produção de uma pequena companhia apresentou os seguintes salários para um dado mês, estando os valores arredondados para o dólar mais próximo e colocado em ordem crescente: 140; 140; 140; 140; 140; 140; 140; 140; 155; 155; 165; 165; 180; 180; 190; 200; 205; 225; 230; 240. Determinar: a). A amplitude total b). Desvio médio. c). Variância e desvio Padrão. d). O coeficiente de variação e interpretação. e). Coeficiente de assimetria e interpretação. 2). Na tabela estão produzidos os dados de acidentes por mil homens/hora. N o médio de acidentes N o de firmas 1,5 1,8 3 1,8 2,1 12 2,1 2,4 14 2,4 2,7 9 2,7 3,0 7 3,0 3,3 5 Determinar: a). A amplitude dos 90 % centrais. b). A variância e o desvio padrão. c). Desvio médio. d). Coeficiente de variação. e). Coeficiente de assimetria e interpretação. 25 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 5. PROBABILIDADE INTRODUÇÃO 1. EXPERIMENTOS EXPERIMENTO DETERMINÍSTICO: Os experimentos determinísticos são governados por leis conhecidas que dão informações corretas sobre o fenômeno em estudo, ou seja os seus resultados podem ser determinados antes de sua realização. Ex: Abandonar uma moeda acima da superfície de uma mesa e descrever o seu movimento. EXPERIMENTO ALEATÓRIO: O seu resultado não pode ser determinado antes de realizá -lo. Ex: Abandonar uma moeda acima da superfície de uma mesa para anotar a face que ficará voltada para cima. 2. ESPAÇO AMOSTRAL - EVENTOS ESPAÇO AMOSTRAL (Ω): O conjunto formado por todos os resultados possíveis de um experimento aleatório. Ex: Se lançamos um dado e observamos a face superior, temos o espaço amostral Ω ={1, 2, 3, 4, 5, 6}. EVENTOS: Um subconjunto qualquer do espaço amostral. CLASSIFICAÇÃO DE ALGUNS EVENTOS EVENTO CERTO: O próprio espaço amostral EVENTO IMPOSSÍVEL: o subconjunto vazio do espaço amostral EVENTO ELEMENTAR: o subconjunto unitário do espaço amostral 26 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba COMBINAÇÃO DE EVENTOS: forma novos eventos, tais como: EVENTO UNIÃO, EVENTO INTERSECÇÃO ou EVENTO COMPLEMENTAR. Se A intersecção B é um conjunto vazio eles são chamados de MUTUAMENTE EXCLUSIVOS. ENFOQUES DA PROBABILIDADE Historicamente, três diferentes abordagens foram desenvolvidas para definir probabilidade e para determinar a medida de probabilidade: o enfoque clássico, o da frequência relativa e o subjetivo. Enfoque clássico: Seja A um evento, i.e., A ⊂ Ω e Ω um conjunto finito de resultados equiprováveis. É evidente que podemos atribuir uma medida de probabilidade, da seguinte forma: P A n A n ( ) ( ) ( ) . = = Ω número de resultados favoráveis a A número de resultados possíveis Exemplos: 1. No lançamento de uma moeda (honesta), o espaço amostral = {ca, co} é equiprovável, i.e., P(ca) = 2 1 e P(co) = 2 1 2. No lançamento de um dado (honesto) e observação do número de pontos da face superior, determine: a) O espaço amostral. b) Os eventos: A: ocorrência de número par. B: ocorrência de número ímpar. C: ocorrência de número maior que 6. 27 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba D: ocorrência de número primo. c) Determine a probabilidade de cada evento acima. Enfoque da frequência relativa (empírico): Um comportamento de bastante interesse diz respeito à frequência de ocorrência de um evento associado a uma experiência. Assuma que se tenha observado um fenômeno N vezes. Destas N vezes, anota-se o número de vezes que um evento A tenha ocorrido. Representa-se n(A) este número. A razão n A N ( ) é denominada frequência relativa de ocorrência de A para as N observações efetuadas. É um fato observado experimentalmente que quando N cresce, a frequência relativa tende muitas vezes a estabilizar-se em torno de um determinado valor. Seria então possível pensar em definir a probabilidade associada a um dado evento como P A n A N N ( ) lim ( ) = →∞ Ainda que P(A) deva modelar a frequência relativa, matematicamente não seria aceitável tomar a expressão acima como definição de P(A). Isto ocorre simplesmente porque para uma dada experiência, qualquer que seja o número N de repetições realizadas, N nunca será suficientemente grande, para que possa ser calculada exatamente. Exemplo: Antes de incluir a cobertura para certos tipos de problemas dentais em apólices de seguro-saúde para empregados adultos, uma companhia de seguros deseja determinar a probabilidade de ocorrer tais problemas, para estabelecer, de acordo com ela, a taxa de seguro. Portanto, o estatístico coleta dados para 10 000 adultos nas faixas apropriadas de idade e observa que 100 pessoas tiveram o problema dental particular durante o ano passado. Determine a probabilidade de ocorrência do problema dental particular. Enfoque subjetivo: Existem numerosas situações em que nem os resultados possíveis são equiprováveis, nem dispomos de dados históricos. Deve-se fazer uma atribuição subjetiva de probabilidade baseadas num certo grau de crença. Por exemplo, você se apaixonará na próxima semana? Que nota receberá em seu 28 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba próximo exame? Um enfermo se recuperará completamente? Em tais casos, deve-se decidir qual é a probabilidade do evento em condições dadas. A probabilidade subjetiva é, então, o resultado de um esforço para quantificar nossa crença a respeito de algo. Advogados e médicos utilizam esse processo com razoável êxito, embora ele possa apresentar certas desvantagens. Entre estas podemos mencionar: 1. As estimativas subjetivas são em geral difíceis de defender quando postas em dúvidas. 2. A tendenciosidade pode ser um fator. Não só noções preconcebidas sobre o que deveria ocorrer, como também o desejo de que ocorra determinado evento, podem distorcer a objetividade. E é muito difícil eliminar essa tendenciosidade, porque em geral ela é subconsciente. No entanto, o treinamento, a experiência e a atitude profissional podem auxiliar a eliminá-la. Não vamos nos preocupar, doravante, com o problema de como definir probabilidade para cada experimento. Simplesmente, vamos admitir que existem as probabilidades em certa classe de eventos e adotar o chamado tratamento axiomático, da seguinte maneira. A medida de probabilidade P é uma função definida que deve obedecer a três axiomas que se seguem. i). 1 ) ( 0 ≤ ≤ A P ii). 1 ) ( = Ω P iii). Se ) ( ) ( ) ( , então B P A P B A P B A + = ∪ ∅ = ∩ Genericamente teríamos: Se ( ) ∑ ∞ = ∞ = =       ≠ = ∅ = ∩ 1 1 : então ), ( ,... 2 , 1 , ; i i i i j i A P A P j i j i A A  OBS: Esta definição não exclui a utilização dos enfoques abordados. Propriedades 1. ( ) ( ) A P A P − =1 2. ( ) 0 = ∅ P 3. ( ) ( ) ( ) ( ) B A P B P A P B A P ∩ − + = ∪ 29 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXEMPLO De 300 estudantes de administração, 100 são matriculados em Contabilidade e 80 em Estatística. Estes dados incluem 30 estudantes que estão matriculados em ambas as disciplinas. a) Elaborar um diagrama para descrever estes eventos. b) Qual a probabilidade de que um estudante aleatoriamente escolhido esteja matriculado em Contabilidade e Estatística? c) Qual a probabilidade de que um estudante aleatoriamente escolhido esteja matriculado em Contabilidade ou Estatística? d) Qual a probabilidade de que um estudante aleatoriamente escolhido esteja matriculado somente em Contabilidade ou somente em Estatística? 30 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1).De 100 pessoas que solicitaram emprego de programador de computadores, durante o ano passado, em uma grande empresa, 40 possuíam experiência anterior e 30 possuíam um certificado profissional. Vinte dos candidatos possuíam tanto experiência anterior como certificado profissional e foram incluídos nas contagens dos dois grupos. a).Elaborar um diagrama de Venn para descrever estes eventos graficamente. b).Qual a probabilidade de que um candidato aleatoriamente escolhido tenha experiência ou certificado. c).Qual a probabilidade de que um candidato aleatoriamente escolhido tenha experiência ou certificado, mas não ambos? 2. De 12 contas de um arquivo, quatro contém um erro na contabilização do saldo da conta. Se um auditor seleciona aleatoriamente uma conta, qual a probabilidade de que não contenha erro? 3. Sejam A e B mutuamente excludentes, P(A) = 0,31 e P(B) = 0,29. a). Determine P(A ou B) b). Determine P(A e B) 4. Durante uma dada semana, as probabilidades de que uma certa ação ordinária aumente sua cotação, ou permaneça constante, ou diminua, foram estimadas, respectivamente, em 0,3; 0,2 e 0,5. Qual a probabilidade de que: a). A cotação desta ação aumente ou permaneça constante? b). A cotação da ação se altere durante a semana? 5. Numa amostra de 40 prisioneiros, 10 acusam pressão arterial elevada. Estime a probabilidade de outro prisioneiro, quando examinado, também acusar pressão alta. Qual a chance de ele não ter pressão alta. 6. Numa urna estão 10 bolas brancas, 8 verdes e 2 pretas. Se uma bola é retirada ao acaso, calcular a probabilidade de: a). ser bola verde. b). ser bola preta. c). ser bola branca ou preta. 7. Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4 apresentam defeitos. a) Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma defeituosa? b) Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar duas defeituosas? 8. Calcular a probabilidade de um piloto de automóveis vencer uma dada corrida, onde as suas chances, segundo os entendidos, são de “3 para 2”. 31 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba PROBABILIDADE CONDICIONAL E TEORMA DE BAYES Dados dois eventos A e B, com P(A) > 0, chama-se probabilidade condicional de B dado A e se escreve P(B|A) à expressão ( ) ( ) ( ) A P B A P A B P ∩ = | → ( ) ( ) ( ) B A P A P B A P | = ∩ Representados no diagrama de Venn: Se A e B são desenhados de modo que as áreas de A, B e A ∩ B sejam proporcionais às suas probabilidades, então P(B|A) é a proporção do evento A ocupada pelo evento B. Exemplo: 1).De 100 pessoas que solicitaram emprego de programador de computadores, durante o ano passado, em uma grande empresa, 40 possuíam experiência anterior e 30 possuíam um certificado profissional. Vinte dos candidatos possuíam tanto experiência anterior como certificado profissional e foram incluídos nas contagens dos dois grupos. a). Determinar a probabilidade condicional de que um candidato aleatoriamente escolhido tenha um certificado, dado que ele tenha alguma experiência anterior. b). Determinar a probabilidade condicional de que um candidato aleatoriamente escolhido tenha alguma experiência anterior, dado que ele tenha um certificado. 32 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. Numa urna há 5 bolas brancas, numeradas de 1 a 5, e 8 bolas azuis numeradas de 1 a 8. Uma bola é retirada ao acaso. a). Sabendo que foi retirada bola azul, dar a probabilidade de ter sido sorteado número ímpar. b). Sabendo que foi sorteado o número 3, dar a probabilidade de ter sido retirada bola azul. c). Sabendo que foi sorteado um número par, dar a probabilidade de ter sido retirada bola branca. INDEPENDÊNCIA ENTRE EVENTOS Dois eventos A e B são estatisticamente independente quando ( ) P A B P A P B ∩ = ⋅ ( ) ( ) A noção de independência é particularmente importante quando P A P B ( ) ( ) > > 0 0 e . Nestas condições resulta imediatamente da definição de probabilidade condicional que cada uma das condições seguintes é equivalente a P B A P B ( | ) ( ) = E P A B P A ( | ) ( ) = 33 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba É interessante observar primeiramente que se P(A) e P(B) são estritamente positivos e A e B são mutuamente exclusivos, então os eventos A e B não são estatisticamente independentes. Com efeito, sendo A B ∩ = ∅ tem-se ( ) P A B ∩ = 0 e portanto, P B A P B ( | ) ( ) = ≠ 0 Por outro lado, se os eventos A e B são independentes e mutuamente exclusivos, então pelo menos um dos eventos tem probabilidade nula. Para ilustrar a distinção entre eventos mutuamente exclusivos e independentes considera-se o seguinte exemplo. Exemplo: 1. Considere o lançamento de um dado, cujo espaço amostral associado é Ω = {, , , , , } 12 3456 e os eventos A: "ocorrência de número menor que 3". e B: "ocorrência de número par". Assumindo que as 6 faces do dado são equiprováveis, tem-se: 1o A = {1, 2} 3 1 6 2 ) ( = = A P 2o B = {2, 4, 6}, 2 1 6 3 ) ( = = B P 3o A∩B ={2}, ( ) 6 1 = ∩B A P 4o 3 1 ) ( ) ( ) | ( 2 1 6 1 = = ∩ = B P B A P B A P resultando que A e B são estatisticamente independentes (P(A|B) = P(A). 2. Uma firma exploradora de petróleo perfura um poço quando acha que há pelo menos 25% de chance de encontrar petróleo. Ela perfura quatro poços, aos quais atribui as probabilidades 0,3; 0,4; 0,7 e 0,8. Determine a probabilidade de nenhum dos poços produzirem petróleo, com base nas estimativas da firma. 3. Dois estudantes tentam resolver um mesmo problema. A probabilidade de A resolver o problema é 2/5; a probabilidade de B resolver o problema é 1/2. Calcular a probabilidade de A e B resolverem o problema. 34 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 4. A probabilidade de que um determinado homem viva mais 10 anos a partir de hoje é 1/3; a probabilidade de que uma determinada mulher viva mais 10 anos a partir de hoje é 1/4. Calcular a probabilidade de os dois estarem vivos daqui a 10 anos. 5. Uma caixa A contém 7 peças das quais 3 são defeituosas e outra caixa B contém 5 peças das quais 2 são defeituosas. Duas peças são retirados uma de cada caixa. a) qual a probabilidade de serem ambas defeituosas b) Qual a probabilidade de serem ambas não defeituosas 35 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1. Dois diferentes departamentos de produção que fazem parte de uma grande empresa são: Produtos Marítimos e Produtos para Oficinas. A probabilidade de que a divisão de Produtos Marítimos tenha, no corrente ano fiscal, uma margem de lucros de no mínimo 10% é estimada em 0,30; a probabilidade de que a divisão de Equipamentos para Oficinas tenha uma margem de lucro de pelo menos 10 % é 0,20; e a probabilidade de que ambas as divisões tenham uma margem de lucro de no mínimo 10 % é 0,06. Determinar a probabilidade de que a divisão de Equipamentos para Oficinas tenha uma margem de lucro no mínimo de 10 % dado que a divisão de Produtos Marítimos tenha alcançado tal nível de lucro. 2. Em geral a probabilidade de que um possível cliente faça uma compra quando procurado por um vendedor é 0,40. Se um vendedor seleciona do arquivo, aleatoriamente, três clientes e faz contato com os mesmos, qual a probabilidade de que os três façam compras? 3. As falhas de diferentes máquinas são independentes umas das outras. Se há 4 máquinas, e se suas probabilidades de falha são 1%, 2%, 5% e 10% em determinado dia, calcule as probabilidades: a). De todas falharem em determinado dia. b). De nenhuma falhar. 4. A probabilidade de que as vendas de automóveis aumentem no próximo mês é estimada em 0,40. A probabilidade de que aumentem as vendas de peças de reposição é estimada em 0,50. A probabilidade de que ambas as vendas aumentem é estimada em 0,10. Qual probabilidade de que: a). Aumente as vendas de automóveis durante o mês dado, que foi informado que as vendas de reposição aumentaram? b). Aumentem as vendas de reposição, dado que se sabe que aumentaram as vendas de automóveis? 5. Durante um período particular, tiveram elevadas suas cotações de mercado 80% das ações emitidas por uma empresa. Se um investidor escolhe aleatoriamente duas ações, qual a probabilidade de que ambas as ações tivessem suas cotações aumentadas durante o período. 6. Em 25% das vezes Gonzaga chega em casa tarde para jantar. Por outro lado o jantar atrasa 10% das vezes. Se não há qualquer relacionamento entre os atrasos de Gonzaga e os atrasos do jantar, qual a probabilidade de ocorrerem ambos os atrasos? 36 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 6. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS NOÇÃO DE VARIÁVEL ALEATÓRIA Exemplo- Selecionamos, ao acaso, um aluno do curso de Administração e medimos a sua altura. Os alunos do departamento do curso de administração são o nosso espaço amostral Ω e cada aluno é um acontecimento elementar wi, i=1,...,n ao qual associamos um valor numérico, a sua altura. A correspondência wi → X( wi) é uma função de domínio Ω e cujo contradomínio é ] 0, +∞[ e X(wi) é a variável aleatória. Se A for o acontecimento "alunos de Administração com altura inferior a 1,70m", então X(A) = ]0;1,70[ . Definição: Uma variável aleatória é um valor numérico determinado pelo resultado de um experimento (é uma quantidade resultante de um experimento aleatório que, por acaso, pode assumir diversos valores). Exemplo: Considere um experimento aleatório no qual uma moeda é jogada 3 vezes. Seja X o número de caras. Seja ca o resultado cara e co o resultado coroa. O espaço amostral para este experimento será: cococo, cococa, cocaco, cocaca, cacoco, cacoca, cacaco, cacaca. Assim, os possíveis valores de X (número de caras) serão: X = 0, 1, 2, 3. 37 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba UMA VARIÁVEL ALEATÓRIA PODE SE DISCRETA OU CONTÍNUA. VARIÁVEL ALEATÓRIA DISCRETA Definição: Uma variável aleatória discreta é uma variável que pode assumir somente certos valores claramente separados (em descontinuidade) resultantes, por exemplo, de uma contagem de algum item de interesse. Exemplo: Seja X o número de caras quando uma moeda é jogada 3 vezes. Aqui os valores de X são 0,1,2 ou 3 (são claramente separados, em descontinuidade). Nota: uma variável aleatória discreta não precisa necessariamente assumir apenas valores inteiros. Poderia, por exemplo, ser uma variável que apresentasse os seguintes valores: 0, 23/7 , 72/25, etc. A condição que deve ser cumprida é seus valores sejam descontínuos. VARIÁVEL ALEATÓRIA CONTÍNUA Definição: Uma variável aleatória contínua é uma variável que pode assumir um número infinitamente grande de valores (com certas limitações práticas). Exemplo: (a) Peso de um estudante (b) comprimento de um carro 38 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 7. DISTRIBUIÇÃO DE PROBABILIDADE DISCRETA Uma Distribuição de Probabilidade é uma lista de todos os resultados de um experimento e suas probabilidades associadas. De forma mais rigorosa, é uma função matemática em que o domínio são os valores possíveis de uma variável aleatória e a imagem são as suas probabilidades associadas. A distribuição de probabilidade satisfaz as condições: ( ) ( ) 1 e 1 0 = = ≤ = < ∑ i i x X P x X P Exemplo: Considere o número de caras em duas jogadas de uma moeda. Determine a distribuição de probabilidade. Exercício de aprendizagem Considere o número de coroas em três jogadas de uma moeda. Determine a distribuição de probabilidade. ESPERANÇA MATEMÁTICA OU MÉDIA Se uma variável aleatória X toma os valores x1, x2, x3, ..., xn, com as probabilidades correspondentes, P(x1), P(x2), P(x3), ..., P(xn), então o seu valor esperado, E(X), é: ( ) E X x P x i i i n ( ) = = ∑ 1 Observe que, E(X) é a média ponderada dos possíveis valores de X, cada um ponderado por sua probabilidade. Portanto E(X) será denotado por x, ou simplesmente por ou E. VARIÂNCIA Mede o "espalhamento" ou dispersão de X ( ) ( ) ( ) ( ) ( ) ∑ ∑ − − − = = = = 2 2 1 2 2 2 ou ) ( µ µ σ µ i i n i i x P x X E x P i X VAR x DESVIO PADRÃO ) (X VAR = σ Exemplo. 1. Um investidor julga que tem 0,40 de probabilidade de ganhar $25000 e 0,60 de probabilidade de perder $15000 num investimento. Determine seu ganho esperado, a variância e o desvio padrão. 39 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. Um empreiteiro faz as seguintes estimativas: De acordo com essas estimativas, determine o prazo esperado para execução da obra, a variância e o desvio padrão. Prazo de execução Probabilidade 15 dias 20 dias 25 dias 0,30 0,20 0,50 40 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1. Determine a distribuição de probabilidade de meninos e meninas em famílias com 3 filhos, admitindo iguais as probabilidades de menino e menina. Faça o gráfico da distribuição. E determine a esperança. 2. O número de caminhões que chegam, por hora, a um depósito segue a distribuição da tabela. Número de caminhões 0 1 2 3 4 5 6 Probabilidade P(x) 0,05 0,10 0,15 0,25 0,30 0,10 0,05 Calcular: a). O número esperado de chegadas por hora. b). A variança. 3.A tabela fornece a probabilidade de que um sistema de computação fique fora de operação um dado número de períodos por dia durante a fase inicial de instalação do sistema. Número de períodos 4 5 6 7 8 9 Probabilidade P(x) 0,01 0,08 0,29 0,42 0,14 0,06 Calcular: a). O número esperado de vezes que o computador fique fora de operação por dia. b). Variança desta distribuição de probabilidade. 4. Um proprietário de carro deseja vender seu carro e está estudando a possibilidade de gastar $50 em propaganda. Se for de 0,5 a probabilidade de que ele o venda pelo preço estipulado de $750 sem propaganda e de 0,9 a probabilidade de que ele o venda com propaganda, deve ou não deve fazer propaganda? Suponha que se não o vender por $750 ele o venderá a um amigo por $650. 5. Um indivíduo que deseja obter uma concessão para a venda de sorvetes num acontecimento esportivo pode esperar lucrar R$ 30 000,00 com a venda de sorvetes se o dia for ensolarado, mas só R$ 15 000,00 se o dia estiver encoberto e R$ 5 000,00 se chover. As probabilidades respectivas para esses eventos são 0,6; 0,3 e 0,1. a). Qual o lucro esperado? b). Se ele fizer um seguro no valor de R$ 20 000,00 contra a chuva e o custo do seguro for de R$ 4 500,00, qual será o lucro esperado? 6. Um empresário pergunta se valerá a pena fazer um seguro contra chuva, por ocasião de determinado acontecimento esportivo que ele está empresando. Se não chover espera obter R$ 5 000,00 de renda, por ocasião da festa, mas só R$ 1 000,00 se chover. Uma apólice de seguro de R$ 3 500,00 lhe custará R$ 1 500,00. Determine a probabilidade p de chuva, de tal modo que sua expectativa seja a mesma, faça ele seguro ou não. 41 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DISTRIBUIÇÃO BINOMIAL Consideremos um experimento no qual cada uma das ocorrências possíveis pode ser classificada como resultando ou não na ocorrência de um evento A. Se resultar na ocorrência de A, será classificado como sucesso; caso contrário, como fracasso. A palavra sucesso é usada como modo conveniente de descrever a ocorrência de um evento, mas não implica que tal ocorrência seja necessariamente desejada. O experimento será repetido certo número de vezes, e este número será simbolizado pela letra n. Será introduzida uma variável aleatória x que representa o número de sucessos, i.e., ocorrências de A, obtidas nas n repetições do experimento. Uma distribuição com este tipo de variável aleatória chama-se distribuição binomial. A distribuição binomial é uma distribuição discreta de probabilidade, aplicável sempre que o processo de amostragem é do tipo: 1. Há n observações ou provas idênticas. 2. Cada prova tem dois resultados possíveis, um chamado "sucesso" e o outro "fracasso". 3. As probabilidades p de sucesso e q de fracasso permanecem constantes em todas as provas 4. As séries de observações, são constituídas de eventos independentes. A fórmula para se determinar a probabilidade de um certo número de sucessos X em uma distribuição binomial é: () = � � − Propriedades 1. Média → µ 2. Variância → 2 = 3. Desvio Padrão → 2 = � 4. Coeficiente de assimetria → = 1−1 Exemplos: 1. A probabilidade de que um presumível cliente aleatoriamente escolhido faça uma compra é 0,20.Se um vendedor visita seis presumíveis clientes, qual a probabilidade que ele fará exatamente 4 vendas? 42 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. Um fabricante de mesa de bilhar suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita é correta, determine a probabilidade de que, uma amostra de 9 mesas: a). Haja ao menos uma defeituosa. b). Não haja nenhuma defeituosa. c). Haja entre 2 e 5 defeituosa. Exercício de aprendizagem 1. Devido as taxas de juros, uma firma informa que 30% de suas contas a receber de outras firmas comerciais se encontram vencidas. Se um contador escolhe aleatoriamente uma amostra de 5 contas, determinar a probabilidade de cada um dos seguintes eventos usando a fórmula de probabilidades binomiais: a).Nenhuma das contas estar vencidas. b).Exatamente duas contas estão vencidas. c).A maioria das contas estão vencidas. d).Exatamente 20% das contas estão vencidas. 43 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. Estatísticas do tráfego revelam que 25% dos veículos interceptados numa auto-estrada não passam no teste de segurança. De 16 veículos interceptados, determine a probabilidade de: a). 2 ou mais não passarem. b). menos de 2 não passarem. c). 15 ou mais não passarem. 3. Pesquisa médica indica que 20% das população em geral sofre de efeitos colaterais negativos com o uso de uma nova droga.Se um médico receita o produto a quatro pacientes, qual é a probabilidade de: a). Nenhum sofrer efeito colateral. b). Todos sofrerem efeitos colaterais. c). Ao menos um sofrer efeitos colaterais. 44 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DISTRIBUIÇÃO DE POISSON A distribuição de Poisson exerce por si mesma um papel extremamente importante, porque ela representa um modelo probabilístico adequado para um grande número de fenômenos observáveis. A distribuição de Poisson é útil para descrever as probabilidades do número de ocorrência num campo ou intervalo contínuo (em geral tempo ou espaço). () = − () ! Propriedades: 1. Média → µ = λt 2. Variância → 2 = 3. Desvio padrão → = √ 3. Coeficiente de assimetria → = 1 Ex: defeitos por cm 2 , acidentes por dia, clientes por hora, chamadas telefônicas por minuto, vacas por acre, etc. A utilização da distribuição de Poisson baseia-se nas seguintes hipóteses: 1. A probabilidade de ocorrência é a mesma em todo campo de observação. 2. A probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero. 3. O número de ocorrência em qualquer intervalo é independente do número de ocorrência em outros intervalos. Se uma variável aleatória é descrita por uma distribuição de Poisson, então a probabilidade de observar qualquer número dado de ocorrência por unidade de medida é dado por: Exemplos: 1. As chamadas de emergência chegam a uma delegacia de polícia à razão de 4 por hora no, período de 1 às 6 da manhã em dias úteis, e podem ser aproximadas por uma distribuição de Poisson. a). Quantas chamadas de emergência são esperadas num período de 30 minutos? b). Qual a probabilidade de nenhuma chamada num período de 30 minutos? c). Qual a probabilidade de ao menos duas chamadas num período de 30 minutos? 45 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. Chegam caminhões a um depósito à razão de 2,8 caminhões/hora. Determine: a). A probabilidade de chegarem 2 ou mais caminhões num período de 30 minutos. b). A probabilidade de chegarem menos de 4 num período de 1 hora. c). A probabilidade de chegarem entre 2 e 6 caminhões num período de 2 horas. Exercício de aprendizagem 1. Os clientes chegam a uma loja à razão de 6,5/hora (Poisson). Determine a probabilidade de que durante qualquer hora: a). Não chegue nenhum cliente. b). Chegue ao menos 1 cliente. c). Exatamente 6 clientes. 2. Uma mesa telefônica recebe chamadas à razão de 4,6 chamadas/minuto.Determine a probabilidade de cada uma das ocorrências abaixo, num intervalo de 1 minuto. a). Exatamente 2 chamadas. b). Ao menos duas chamadas. c). De 2 a 4 chamadas. 3. Cada rolo de lâminas de aço de 500 metros contém em média, 2 imperfeições.Tal imperfeição prejudica o uso, no produto final, daquele segmento da lâmina. Qual a probabilidade de que um segmento específico de 100 metros não contenha nenhuma imperfeição? 46 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1. O número de rádios vendidos por dia por uma firma tem distribuição aproximada de Poisson com média 1,5. Determine a probabilidade de a firma vender ao menos 4 rádios: a). Num período de 2 dias. b). Num período de 3 dias. c). Num período de 4 dias. 2. Os estudantes de um colégio, 41% fumam cigarro. Escolhem-se seis ao acaso para darem sua opinião sobre o fumo. a). Determine a probabilidade de nenhum dos seis ser fumante. b). Determine a probabilidade de todos os seis fumarem. c). Determine a probabilidade de ao menos a metade dos seis ser fumante. 3. Os defeitos em rolos de filmes coloridos ocorrem à razão de 0,1 defeito/rolo,e a distribuição dos defeitos é a de Poisson. Determine a probabilidade de um rolo em particular conter um ou mais defeitos. 4. Os registros de uma pequena companhia indicam que 40% das faturas por ela emitidas são pagas após o vencimento. De 14 faturas expedidas, determine a probabilidade de: a). Nenhuma ser paga com atraso. b). No máximo duas serem pagas com atraso. c). Ao menos 3 serem pagas com atraso. 5. Os acidentes numa grande fábrica tem aproximadamente a distribuição de Poisson, com média de 3 acidentes/mês. Determine a probabilidade de que, em dado mês, haja: a). Nenhum acidente. b). 1 acidente. c). 3 ou 4 acidentes. 6. Doze por cento dos que reservam lugar num voo sistematicamente faltam ao embarque.O avião comporta 15 passageiros. a). Determine a probabilidade de que todos os 15 que reservaram lugar compareçam ao embarque. b). Se houve 16 pedidos de reserva, determine a probabilidade de: I. De uma pessoa ficar de fora. II. De nenhuma pessoa ficar de fora. III. De mais de uma ficar de fora. 7. A demanda de certa peça de reposição foi estimada em ser distribuída de acordo com Poisson com uma demanda esperada de 3,0 por mês: 47 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba a). Qual a probabilidade de que não se verifique qualquer demanda num mês. b). Qual a probabilidade de que se verifique mais de uma demanda por mês. 8. Em média, 5 pessoas por hora realizam transações em um setor de "serviços especiais" de um banco comercial. Supondo que a chegada de tais pessoas estão distribuída de maneira independente e de forma igual em todo período de interesse, qual a probabilidade de que mais de 3 pessoas queiram fazer transações no setor de "serviços especiais" durante 1 hora? 9. Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá, no máximo, dois itens defeituosos. Se a caixa contém 20 peças e a experiência mostra que este processo de fabricação produz 2% de itens defeituosos, qual a probabilidade de que uma caixa satisfaça a garantia? 10. Em cada dois dias, em média, chega uma navio em determinado porto. Qual a probabilidade de que dois ou mais navios chegarão em um dia escolhido aleatoriamente. 11. Uma companhia de seguros estã considerando a inclusão da cobertura de uma doença relativamente rara na área geral de seguros médicos. A probabilidade de que um indivíduo selecionado aleatoriamente venha a contrair a doença é 0,001, sendo que 3 000 pessoas são incluídas no grupo segurado. a). Qual o número esperado de pessoas, no grupo, que terão a doença? b). Qual a probabilidade de que nenhuma das 3 000 pessoas do grupo contraia a doença? 12. Se X tiver uma distribuição de Poisson, e se P(X=0) = 0,2, calcular P(X>2). 48 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DISTRIBUIÇÃO GEOMÉTRICA Suponha-se um experimento, no qual estamos interessados apenas na ocorrência ou não de um determinado evento, como, por exemplo, o sexo do filho de uma determinada mulher ser feminino. E, assim como na distribuição binomial, que esse experimento seja repetido um número n de vezes, que em cada repetição seja independente das demais e que a probabilidade de sucesso p em cada repetição seja constante. Suponha-se que o experimento seja repetido até que ocorra o primeiro sucesso (o sexo do filho seja feminino). Então a variável aleatória: X = número de tentativas até que se obtenha o primeiro sucesso, seguirá uma distribuição geométrica, com parâmetro p (probabilidade de sucesso) . Simbolicamente X ∼ G(p). Função de Probabilidade Como o experimento será repetido até que se obtenha o primeiro sucesso, e considerando que esse ocorra na k-ésima repetição, deverão ocorrer k -1 fracassos antes que o experimento seja encerrado. Assim, a probabilidade de que a variável aleatória X = número de repetições até se obter o primeiro sucesso é: () = −1 com p = probabilidade de “sucesso"; q = 1 - p = probabilidade de “fracasso" Parâmetros característicos () = 1 () = 2 Ex. 1. Um casal com problemas para engravidar, recorreu a uma técnica de inseminação artificial no intuito de conseguir o primeiro filho. A eficiência da referida técnica é de 0,20 e o custo de cada inseminação U$2000,00. a) Qual a probabilidade de que o casal obtenha êxito na terceira tentativa? b) Qual o custo esperado deste casal para obter o primeiro filho? 49 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 2. Bob é o jogador de basquete da faculdade. Ele é um lançador de arremessos livres 70%. Isto significa que sua probabilidade de acertar um arremesso livre é 0,70. Durante uma partida, qual é a probabilidade que Bob acerte seu primeiro arremesso livre no seu quinto arremesso? DISTRIBUIÇÃO DE PASCAL (DISTRIBUIÇÃO BINOMIAL NEGATIVA) Nas mesmas condições em que foi definida a distribuição geométrica, e considerando que o experimento será repetido até que se obtenha o r-ésimo sucesso, então a variável X � número de tentativas até se obter o r-ésimo sucesso seguirá a distribuição binomial negativa. Um experimento binomial negativo é um experimento estatístico que tem as seguintes propriedades: • O experimento consiste de x tentativas repetidas. • Cada tentativa pode resultar em apenas dois resultados possíveis. Podemos chamar um destes resultados de sucesso e o outro de fracasso. • A probabilidade de sucesso, denotada por p, é a mesma em cada tentativa. • As tentativas são independentes; isto é, o resultado de uma tentativa não afeta o resultado das outras tentativas. • O experimento continua até que r sucessos sejam observados, onde r é especificado antecipadamente. Considere o seguinte experimento estatístico. Você lança uma moeda repetidamente e conta o número de vezes que sai cara como resultado. Você continua lançando a moeda até que tenha saído 5 vezes cara. Este é um experimento binomial negativo porque: • O experimento consiste de tentativas repetidas. Lançamos uma moeda repetidamente até que cara tenha saído 5 vezes. • Cada tentativa pode resultar em apenas dois resultados possíveis – cara ou coroa. • A probabilidade de sucesso é constante – 0,5 em cada tentativa. • As tentativas são independentes; isto é, obter cara numa tentativa não afeta se obteremos cara nas outras tentativas. • O experimento continua até que um número fixo de sucessos tenha ocorrido; neste caso,5 caras. NOTAÇÃO A seguinte notação é útil, quando falamos a respeito da probabilidade binomial negativa: • K: O número de tentativas exigido para se produzir r sucessos num experimento binomial negativo. • r: O número de sucessos no experimento binomial negativo. • p: A probabilidade de sucesso numa tentativa individual. • q: A probabilidade de fracasso numa tentativa individual. (Isto é igual a 1 – p). 50 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba • b*(k;r,p): Probabilidade binomial negativa - a probabilidade que um experimento binomial negativo de x tentativas resulte em r sucessos na k-ésima tentativa, quando a probabilidade de sucesso na tentativa individual é p. • () () : O número de combinações de n coisas, tomando r coisas de cada vez. Função de Probabilidade Para que o r-ésimo sucesso ocorra na k-ésima tentativa é necessário que ocorra um sucesso nesta tentativa (repetição do experimento) e que tenham ocorridos (r – 1) sucessos nas (k – 1) repetições anteriores. Dado que a probabilidade de ocorrência de sucesso, numa dada repetição do experimento é dada por p e a probabilidade de ocorrerem r – 1 sucessos em k - 1 repetições, sendo estes dois eventos independentes, a probabilidade de que o r-ésimo sucesso ocorra na k-ésima repetição do experimento é dada por: ∗ (; , ) = . � (−1) (−1) −1 (−1)−(−1) � = (−1) (−1) − ; ≥ Onde; p = probabilidade de “sucesso”; q = 1 - p = probabilidade de “fracasso” Parâmetros característicos: () = () = 2 Ex. Bob é o jogador de basquete da faculdade. Ele é um lançador de arremessos livres 70%. Isto significa que sua probabilidade de acertar um arremesso livre é 0,70. Durante uma partida, qual é a probabilidade que Bob acerte seu terceiro arremesso livre no seu quinto arremesso? DISTRIBUIÇÃO HIPERGEOMÉTRICA Um experimento hipergeométrico é um experimento estatístico que tem as seguintes propriedades: • Uma amostra de tamanho n é selecionada aleatoriamente sem reposição de uma população de N itens. • Na população, k itens podem ser classificados como sucessos e N – k itens podem ser classificados como fracassos. Considere o seguinte experimento estatístico. Você tem uma urna de 10 bolinhas de gude – 5 vermelhas e 5 verdes. Você seleciona aleatoriamente 2 bolinhas de gude sem reposição e conta o número de bolinhas vermelhas que você selecionou. Este seria um experimento hipergeométrico. 51 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Note que não será um experimento binomial. Um experimento binomial exige que a probabilidade de sucesso seja constante em cada tentativa. Com o experimento acima, a probabilidade de um sucesso muda em cada tentativa. No início, a probabilidade de selecionar uma bolinha vermelha é 5/10. Se você selecionar uma bolinha vermelha na primeira tentativa, a probabilidade de selecionar uma bolinha vermelha na segunda tentativa é 4/9. E se você selecionar uma bolinha verde na primeira tentativa, a probabilidade de selecionar uma bolinha vermelha na segunda tentativa é 5/9. Note ainda que se você selecionou as bolinhas com reposição, a probabilidade de sucesso não mudaria. Ela seria 5/10 em cada tentativa. Então, este seria um experimento binomial. NOTAÇÃO A seguinte notação é útil, quando falamos a respeito da probabilidade hipergeométrica e distribuições hipergeométricas: • k: O número de itens na população que são classificados como sucessos. • n: O número de itens na amostra. • X: O número de itens na amostra que são classificados como sucessos. • () () : O número de combinações de k coisas, tomando x coisas de cada vez. • h(x;N,n,k): Probabilidade hipergeométrica - a probabilidade que um experimento hipergeométrico de n tentativas resulte em exatamente x sucessos, quando população consistir de N itens, k dos quais são classificados como sucessos. Função de Probabilidade Uma variável aleatória hipergeométrica X é o número de sucessos que resulta de um experimento hipergeométrico. A distribuição de probabilidades de uma variável aleatória hipergeométrica é chamada função distribuição hipergeométrica. ℎ(; , , ) = (−) (−) Parâmetros característicos: Fazendo = e − = tem-se () = . () = . . . − −1 Ex. 1. No fichário de um hospital, estão arquivados os prontuários dos de 20 pacientes, que deram entrada no OS apresentando algum problema cardíaco. Destes 5 sofreram infarto. Retirando-se uma amostra ao acaso de 3 destes prontuários, qual a probabilidade de que dois deles sejam de pacientes que sofreram infarto? 52 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Solução: 2. Suponha que selecionemos aleatoriamente 5 cartas baralho sem reposição de um de um maço ordinário de jogo de baralho. Qual é a probabilidade de obter exatamente 2 cartas de baralho vermelhas (isto é, copas ou ouros)? 3. Quando é feita amostragem de população finita sem reposição, a distribuição binomial não pode ser usada porque os eventos não são independentes. Daí então a distribuição hipergeométrica é usada. Esta é dada por ℎé = � − − �� � � � Distribuição hipergeométrica Ela mede o número de sucessos X numa amostra de tamanho n extraída aleatoriamente e sem reposição de uma população de tamanho N, da qual Xt itens têm a característica de denotar sucesso. a. Usando a fórmula, determine a probabilidade de extrair 2 homens numa amostra de 6 selecionada aleatoriamente sem reposição de um grupo de 10 pessoas, 5 das quais são homens. Solução b. Qual resultado teria sido se tivéssemos (incorretamente) usado a distribuição binomial? Solução 53 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DISTRIBUIÇÃO MULTINOMIAL Um experimento multinomial é um experimento estatístico que tem as seguintes propriedades: • O experimento consiste de n tentativas repetidas. • Cada tentativa tem um número discreto resultados possíveis. • Em qualquer tentativa dada, a probabilidade de que um particular resultado ocorrerá é constante. • As tentativas são independentes; isto é, o resultado de uma tentativa não afeta o resultado das outras tentativas. Considere o seguinte experimento estatístico. Você lança dois dados, três vezes e registra o resultado de cada lançamento. Este é um experimento multinomial, porque: • O experimento consiste de tentativas repetidas. Lançamos o dado 3 vezes. • Cada tentativa pode resultar num número discreto de resultados – 2 até 12. • A probabilidade de qualquer resultado é constante; ela não muda de um lançamento para o próximo. • As tentativas são independentes; isto é, obter um resultado particular numa tentativa não afeta o resultado das outras tentativas. Nota: Um experimento binomial é um caso especial de um experimento multinomial. Aqui está a principal diferença. Com um experimento binomial, cada tentativa pode resultar em dois – e somente dois – resultados possíveis. Com um experimento multinomial, cada tentativa pode ter dois ou mais resultados possíveis. Função de Probabilidade Uma distribuição multinomial é a função distribuição de probabilidade dos resultados de um experimento multinomial. A fórmula multinomial define a probabilidade de qualquer resultado de um experimento multinomial. Suponha um experimento multinomial que consiste de n tentativas, e cada tentativa pode resultar em quaisquer dos k resultados possíveis: E1, E2, ..., Ek. Suponha, além disso, que cada resultado possível possa ocorrer com probabilidades p1, p2, p3, ..., pk. Então a probabilidade p que E1 ocorra n1 vezes, E2 ocorra n2 vezes, ..., e Ek ocorra nk vezes é: = � ! 1 ! 2 ! … ! � . � 1 1 . 2 2 … � Onde n = n1 + n2 + ... + nk Os exemplos abaixo ilustram como usar a fórmula multinomial para calcular a probabilidade de um resultado de um experimento multinomial. Ex. 1. Suponha uma carta de baralho sendo extraída aleatoriamente de um maço de jogo de baralho, e depois então devolvida ao maço. Este exercício é repetido 5 vezes. Qual é a probabilidade de se extraírem 1 espada, 1 copa, 1 ouros e 2 paus? 54 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Solução: 2. Suponha que temos um vaso com 10 bolinhas de gude – 2 bolinhas vermelhas, 3 bolinhas verdes e 5 bolinhas azuis. Selecionamos 4 bolinhas aleatoriamente do vaso, com reposição. Qual é a probabilidade de selecionar 2 bolinhas verdes e 2 bolinhas azuis? 55 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO Geométrica 1. A probabilidade de que haja alguma falha no lançamento de uma nave espacial é 10%. Qual é a probabilidade de que para lançar a nave seja necessário: a) 2 tentativas? b) no máximo 3 tentativas? c) Calcule o número esperado de tentativas de lançamento da nave espacial. Calcule também a variância e o desvio padrão do número de tentativas de lançamento. 2. A probabilidade de que uma droga apresente reação positiva é 0,4. Qual a probabilidade de que menos de 5 reações negativas ocorram antes da primeira positiva? 3. Suponha que a probabilidade de um componente de computador ser defeituoso é de 0,2. Numa mesa de testes, uma batelada é posta à prova, um a um. Determine a probabilidade do primeiro defeito encontrado ocorrer no sétimo componente testado. Hipergeométrica 4. Numa Loteria, um apostador escolhe 6 números de 1 a 54. Qual a probabilidade dele acertar 5 números? 5. Entre os 16 programadores de uma empresa, 12 são do sexo masculino. A empresa decide sortear 5 programadores para fazer um curso avançado de programação. Qual é a probabilidade dos 5 sorteados serem do sexo masculino? Multinomial 6. Um experimento de genética envolve 6 genótipos mutuamente excludentes identificados por A, B, C, D, E e F, todos igualmente prováveis. Testados 20 indivíduos, determine a probabilidade de obter exatamente: 5 A; 4 B; 3 C; 2 D; 3 E; 3 F 7. Na inspeção de qualidade de um produto são utilizadas quatro categorias para classificação: conforme, aproveitável, reciclável e refugado. As probabilidades de pertencer a cada um dos grupos são, respectivamente: p1 = 0,70 , p2 = 0,15 , p3 = 0,10 e p3 = 0,05. Em um lote de 10 unidades, qual a probabilidade de se encontrar seis unidades conformes, duas aproveitáveis, uma reciclável e uma refugada? Pascal 8. Joga-se um dado equilibrado. Qual é a probabilidade de serem necessários 10 lançamentos até a terceira ocorrência de um seis? 9. Deseja-se produzir 5 peças boas, em uma máquina que dá 20% de peças defeituosas. Qual é a probabilidade de ser necessário fabricar 8 peças para se conseguir as 5 peças boas? 56 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba 8. DISTRIBUIÇÕES CONTÍNUAS Variável aleatória contínua é aquela que pode assumir inúmeros valores num intervalo de números reais e é medida numa escala contínua. Por exemplo, uma variável aleatória contínua deve ser definida entre os números reais 0 e 1, ou números reais não negativos ou, para algumas distribuições, qualquer número real. A temperatura, a pressão, a precipitação ou qualquer elemento medido numa escala contínua é uma variável aleatória contínua. Existem duas funções associadas a cada variável contínua X: a função densidade de probabilidade, simbolizada por f(X), e a função cumulativa de probabilidade, ou função de distribuição de probabilidade representada por F(X). A função f(X) é aquela cuja integral de X = a até X = b (b ≥ a) dá a probabilidade de que X assuma valores compreendidos no intervalo (a, b), ou seja, ( ≤ ≤ ) = � () A função cumulativa de probabilidade F(b) é tal que: () = ( ≤ ) = � () −∞ Qualquer função definida no campo real só pode ser considerada como uma função densidade de probabilidade se forem satisfeitas as seguintes condições: () ≥ 0 Para todo X e () = � () = 1 ∞ −∞ A probabilidade de que a variável X assuma valores no intervalo (a, b) é dada por: ( ≤ ≤ ) = � () = () −() e a probabilidade de que a variável contínua X assuma um valor em particular, b, por exemplo, é: ( ≤ ≤ ) = � () = () −() = 0 Há muitas distribuições teóricas contínuas. Algumas das mais usadas aqui são: distribuição normal, distribuição gamma, distribuição de valores extremos e distribuição exponencial. Neste material vamos tratar dos modelos probabilísticos citados, que têm importância prática na investigação científica, abordando as formas das funções densidade de probabilidade, bem como a esperança e a variância. DISTRIBUIÇÃO UNIFORME Uma distribuição de variável aleatória contínua é a distribuição uniforme cuja função densidade de probabilidade é constante dentro de um intervalo de valores da variável aleatória X. 57 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba A variável aleatória X tem distribuição uniforme de probabilidades no intervalo (a, b) se a função densidade f(x) for: () = 1 − , com as seguintes condições b ≥ a e a ≤ x ≤ b. A representação gráfica da distribuição uniforme é um retângulo com base definida pelos valores a e b que estabelecem os limites de valores possíveis da variável aleatória X, Da definição da distribuição uniforme deduzimos: • A área do retângulo é igual a 1, pois a base é (b – a) e a altura 1/(b – a). • A probabilidade da variável aleatória X ser igual ou maior que a e, ao mesmo tempo, menor ou igual a b é igual a 1 ou 100% A média e a variância da variável aleatória X com distribuição uniforme de probabilidades no intervalo (a, b) são: Média: = + 2 Variância: 2 = (−) 2 12 Ex. 1. A variável aleatória X tem distribuição uniforme no intervalo (50, 200). Calcular a média e o desvio padrão. Solução 2. Continuando o Exemplo 1, qual a probabilidade de um valor da variável X se encontrar entre 110 e 150? 58 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DISTRIBUIÇÃO NORMAL Uma variável aleatória contínua inclui, em seus resultados, valores tanto inteiros como não inteiros, não pode ser adequadamente por uma distribuição discreta. As distribuições normais ocupam posição importantíssima tanto na estatística teórica como na aplicada, por várias razões. Uma delas é que, com bastante frequência, elas representam, com boa aproximação, as distribuições de frequência observadas de muitos fenômenos naturais e físicos. Outra razão é que as normais servem como aproximação de probabilidades binomiais, quando n é grande. Todavia, o motivo mais importante da proeminência da distribuição normal é que as distribuições tanto das médias como das proporções em grandes amostras tendem a ser distribuídas normalmente, o que tem relevante implicação na amostragem. Definição. A variável aleatória X, que tome todos os valores reais , tem uma distribuição normal (ou Gaussiana) se sua função distribuição de probabilidade for da forma ∞ < < −∞ =       − − x e x f x , 2 1 ) ( 2 2 1 σ µ π σ . Os parâmetros µ e σ devem satisfazer às condições , . Características da distribuição normal: i). ∫ ∞ ∞ = ≥ + - 1 ) ( e 0 ) ( dx x f x f ii). No aspecto gráfico ) (x f representa a bem conhecida curva forma de sino, mostrada na figura. Visto que f depende de x somente através da expressão ( ) 2 µ − x , torna-se evidente que o gráfico de f será simétrico em relação a µ . −∞ < < ∞ x −∞ < < ∞ x σ > 0 59 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba O parâmetro também pode ser interpretado geometricamente. Observa-se que para µ = x , o gráfico é descendente, de concavidade para baixo. Quando ±∞ → x , 0 ) ( → x f , assintoticamente. Visto que 0 ) ( ≥ x f para todo x, isto significa que, para valores grandes de x (positivos ou negativos), o gráfico tem concavidade para cima. O ponto no qual a concavidade muda de é denominado ponto de inflexão e que será localizado pela resolução da equação f"(x) = 0. Ao fazer isso verificamos que os pontos de inflexão ocorrem para σ µ ± = x . Isto é, σ unidades para direita e para esquerda de µ o gráfico muda de concavidade. Por isso, se σ for relativamente grande, o gráfico tende a ser achatado, enquanto se σ for pequeno, o gráfico tende a ser bastante pontiagudo. iii). A área sob a curva normal entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos. Isto é, dx e b X a P b a x ∫       − − = ≤ ≤ 2 2 1 2 1 ) ( σ µ π σ Esta integral não pode ser calculada pelos caminhos comuns. No entanto, métodos de integração numérica podem ser empregados para calcularem integrais da forma acima, verdadeiramente estes valores têm sido tabelados. OBS: É essencial reconhecer que uma distribuição normal é uma distribuição teórica. Para mensurações físicas grupadas numa distribuição de frequência, é uma distribuição ideal; nenhum conjunto de valores efetivos se adaptará exatamente a ela. Assim é que, por exemplo, os valores reais não variam entre . Não obstante, tais deficiências são amplamente contrabalançadas pela facilidade de utilização da distribuição normal na obtenção de probabilidades, e pelo fato de que a referida distribuição ainda constitui uma boa aproximação de dados reais. Assim, quando se diz que uma variável aleatória (física) é distribuída normalmente, a afirmação deve ser interpretada como uma implicação de que a distribuição de frequência de seus resultados possíveis pode ser satisfatoriamente bem aproximada pela distribuição normal de probabilidades. Portanto, a curva normal é um modelo. Distribuição Normal Padronizada A distribuição normal constitui, na realidade, uma família infinitamente grande de distribuições - uma para cada combinação possível de média e desvio padrão. Conseqüentemente, seria inútil procurar elaborar tabelas que atendessem a todas as necessidades. O problema de lidar com uma família x f(x) =µ x −∞ + ∞ e 60 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba infinita de distribuições normais pode ser completamente evitado desde que se trabalhe com valores relativos, ao invés de valores reais. Isto equivale a tomar a média como ponto de referência (origem) e o desvio padrão como medida de afastamento a contar daquele ponto (unidade de medida). Esta nova escala é comumente conhecida como escala z, i.e., z é variável padronizada correspondente a X. Algebricamente, pode-se escrever → z número de desvios padrões a contar da média → X valor arbitrário → µ a média da distribuição normal → σ o desvio padrão O cálculo da probabilidade em um intervalo b z a ≤ ≤ é: dz e b z a P b a z ∫ − = ≤ ≤ 2 2 1 2 1 ) ( π σ que é a área sob a curva normal padronizada de a até b. Felizmente dz e A b z P b z b ∫ − = = ≤ ≤ 0 2 2 1 0 2 1 ) 0 ( π σ estão tabelados. Exemplos: 1). Se a expressão "área" se refere à área sob a curva normal padronizada, determine o valor ou os valores de z tais que:(para cada caso faça a interpretação gráfica) a) área entre 0 e z igual a 0,3770 z X = − µ σ 61 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba b) área à esquerda de z igual a 0,8621 c) área entre 1,5 e z igual a 0,0217 2).Dado que uma população com média 25 e desvio padrão 2 tem distribuição normal, determine o valor de z para o valor da população igual a 23. 3).Uma distribuição normal tem média 50 e desvio padrão 5.Que percentagem da população está em cada um dos seguintes intervalos: a) de 56 a 60 b) de 40 a 65 c) de 45 a 65 Exercício de aprendizagem 1). Uma população normal tem média 50 e desvio padrão 3.Determine os valores correspondentes aos seguintes valores de z: a) 0,10 62 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba b) -2,53 2). Um fornecedor de ferro alega que seu produto apresenta resistência à tensão aproximadamente normal com média de 50 000 psi e variância de 8100. Supondo verdadeira a hipótese, que resultado da mensuração dará resultado: a) superior a 50 000 psi b) inferior a 49 550 psi c) entre 13 500 psi e 50 000 psi 3. Suponhamos que a altura dos estudantes do sexo masculino de certa universidade seja uma variável normal, com 1,69m de média e desvio padrão 0,03. Determine: a). A porcentagem de alunos de altura superior a 1,72m b). A probabilidade de que um aluno escolhido aleatoriamente tenha altura entre 1,66m e 1,72m. 63 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba c). A probabilidade de que um aluno escolhido aleatoriamente tenha altura inferior a 1,63m. 64 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1. Dado que uma população com média 25 e desvio padrão 2 tem distribuição normal, determine os valores de z para os seguintes valores da população: a) 23,5 b) 24,0 c) 25,2 d) 25,5 2. Uma população normal tem média 50 e desvio padrão 3. Determine os valores correspondentes aos seguintes valores de z: a) 2,00 b) 0,75 c) -3,00 d) -3,20 3. Uma distribuição normal tem média 50 e desvio padrão 5. Que percentagem da população está em cada um dos seguintes intervalos: a) de 40 a 50 b) de 49 a 50 c) de 40 a 45 4. Suponha que a renda média de uma grande comunidade possa se razoavelmente aproximada por uma distribuição normal com média $1500 e desvio padrão de $300. a) Que percentagem da população terá renda superior a $1860? b) Numa amostra de 50 assalariados, quantos podemos esperar que tenham menos de $1050 de renda? 5. O processo de empacotamento em uma companhia de cereais foi ajustado de maneira que uma média de 13,0Kg de cereal é colocado em cada saco. É claro que nem todos os sacos têm precisamente 13,0Kg devido a fontes aleatórias de variabilidade. O desvio padrão do peso líquido é 0,1Kg, e sabe-se que a distribuição dos pesos segue uma distribuição normal. Determinar a probabilidade de que um saco escolhido aleatoriamente contenha entre 13,0 e 13,2Kg de cereal. Ilustrar a proporção da área sob a curva normal que está associada com o valor da probabilidade. 6. Para a situação descrita no problema 5 faça o que se pede: a).Calcular a probabilidade de que o peso exceda 13,25Kg e ilustrar a proporção da área sob a curva normal. b).Calcular a probabilidade de que o peso de cereal esteja entre 12,8 e 13,1Kg e ilustrar a proporção da área sob a curva normal que é relevante neste caso 7. O tempo necessário, em uma oficina, para o conserto da transmissão de um tipo de automóvel é normalmente distribuído com média igual a 45min. e desvio padrão 8,0min. O mecânico planeja começar o conserto do carro de um cliente 10 min. após o carro ter sido deixado na oficina, comunicando o cliente que o carro estará pronto em um tempo total de 1hora. a).Qual a probabilidade de que o mecânico esteja enganado? b).Qual a previsão de tempo de trabalho para que haja 90% de probabilidade de que o conserto da transmissão se efetue dentro do prazo previsto? 65 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba DIDTRIBUIÇÃO EXPONENCIAL A distribuição exponencial é geralmente aplicada à dados com forte assimetria3 como aqueles cujo histograma tem a forma da figura abaixo, ou seja, de J invertido. Quando os serviços prestados por uma empresa para clientes externos ou internos são de duração variável é esta distribuição a indicada para analisar esses experimentos, por exemplo, a duração do atendimento do caixa de um banco ou de postos de saúde, o tempo de operação sem interrupção de um equipamento, etc. Esta é uma distribuição que se caracteriza por ter uma função de taxa de falha constante. A distribuição exponencial é a única com esta propriedade. Ela é considerada uma das mais simples em termos matemáticos. Esta distribuição tem sido usada extensivamente como um modelo para o tempo de vida de certos produtos e materiais. Ela descreve adequadamente o tempo de vida de óleos isolantes e dielétricos, entre outros. A variável aleatória X tem distribuição Exponencial com parâmetro λ, λ>0, se tiver função densidade de probabilidade dada por: () = � − ≥ 0 0 < 0 Em que o parâmetro λ>0 é o tempo médio de vida e t é um tempo de falha. O parâmetro deve ter a mesma unidade do tempo da falha t. Isto é, se x é medido em horas, λ também será medido em horas. A função distribuição F(t) é dada por () = ∫ () 0 = � 1 − − ≥ 0 0 < 0 Para o cálculo das probabilidades podemos usar as seguintes fórmulas ( > ) = − 0 e ( ≤ ) = 1 − − 0 Parâmetros característicos Média: = 1 Variância: 2 = 1 2 66 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba Ex. 1. O tempo até a falha do ventilador de motores a diesel tem uma distribuição Exponencial com parâmetro λ = 1 28700 horas. Qual a probabilidade de um destes ventiladores falhar nas primeiras 24000 horas de funcionamento? Solução: 2. Suponha que em determinado período do dia, o tempo médio de atendimento em um caixa de banco seja de 5 minutos. Admitindo que o tempo para atendimento tenha distribuição exponencial, determine a probabilidade de um cliente: a) esperar mais do que 5 minutos. b) esperar menos do que 5 minutos. 67 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba EXERCÍCIO 1. Uma lâmpada tem a duração de acordo com a densidade de probabilidade a seguir () = � 0, < 0 1 1000 − 1000 , ≥ 0 Determine: a) a probabilidade de que uma lâmpada qualquer queime antes de 1.000 horas; b) a probabilidade de que uma lâmpada qualquer queime depois de sua duração média; c) o desvio padrão da distribuição. 2. O tempo de atendimento numa oficina é aproximadamente exponencial com média de quatro minutos. Qual é a probabilidade de: a) espera superior a quatro minutos? b) espera inferior a cinco minutos? c) espera de exatamente quatro minutos? 3. Sabemos que o intervalo entre ocorrências sucessivas de uma doença contagiosa é uma variável aleatória que tem distribuição exponencial com média de 100 dias. Qual é a probabilidade de não se ter registro de incidência da doença por pelo menos 200 dias a partir da data em que o último caso for registrado? 4. Se ocorrem 3 chuvas catastróficas com duração de 1 hora a cada 10 anos, qual a probabilidade de que leve menos de 1 ano até a próxima ocorrência? 5. Dados históricos de terremotos em San Francisco, Ca, mostram que no período de 1836 – 1916, ocorreram 16 terremotos de grande intensidade. Se a ocorrência de terremotos desta intensidade segue uma distribuição de Poisson, qual a probabilidade de ocorrerem terremotos nos próximos dois anos? 68 ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba ESTATÍSTICA I - UNIVERSIDADE CANDIDO MENDES – N. FRIBURGO Prof. Inaba TABELA: ÁREAS NA CAUDA DIREITA SOB A DISTRIBUIÇÃO NORMAL PADRONIZADA z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 69
Copyright © 2024 DOKUMEN.SITE Inc.