ESTATÍSTICA DESCRITIVA1 ESTATÍSTICA DESCRITIVA Etapa inicial da análise utilizada para descrever, organizar e resumir os dados coletados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística. 2 ESTATÍSTICA DESCRITIVA O que fazer com as observações que coletamos? Primeira Etapa: Resumo dos dados = Estatística descritiva 3 Variável: Qualquer característica associada a uma população. Classificação das variáveis: NOMINAL QUALITATIVA ORDINAL classe social, grau de instrução sexo, cor dos olhos CONTÍNUA QUANTITATIVA DISCRETA peso, altura, salário, idade número de filhos, número de carros 4 População: População estatística ou universo estatístico é o conjunto de entes portadores de pelo menos uma característica em comum. os estudantes constituem uma população com uma característica em comum: são os que estudam. Por exemplo. Amostra é um subconjunto finito de uma população 5 . EXERCÍCIOS Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas): a) Cor dos cabelos b) Número de filhos c) Comprimento de peças produzidas por certa máquina 6 . Dados Brutos: são os dados originais que ainda não foram numericamente organizados após a coleta. Frequência: é a quantidade de vezes que um mesmo valor de um dado é repetido. 7 .DISTRIBUIÇÃO DE FREQUENCIA Uma distribuição de freqüência é um método de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe. Rol: é a ordenação dos valores obtidos em ordem crescente ou descrente de grandeza numérica ou qualitativa. . ou ainda que se encontram acima ou abaixo de determinada idade.DADOS BRUTOS Faixa etária de crianças de um acampamento X 6 8 9 11 12 10 11 10 6 11 9 12 8 12 4 14 5 6 11 10 7 9 7 15 7 4 13 14 13 13 10 9 8 12 13 7 Dificulta estabelecer em torno de qual valor tendem a se concentrar as idades das crianças. ROL 4 6 8 10 10 4 7 8 10 4 7 8 12 12 13 13 11 13 5 7 9 10 11 12 12 14 6 7 9 11 13 14 6 8 9 15 Dados organizados . FREQUÊNCIA Idade 4 5 6 7 8 9 10 11 12 13 14 15 Frequência 3 1 3 4 4 4 4 3 4 4 2 1 . ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Classes: caso as colunas da tabela de distribuiçao de frequência contenham muitos valores elencados. podemos reduzir a quantidade desses valores elencados agrupando-os em intervalos. Esses agrupamentos de valores num intervalo de abragência são chamados de classes . CLASSES Idade 4I-6 6l-8 8l-10 10l-12 12l-14 Frequência 4 7 8 7 8 14l-16 3 . Ex: 4 l. Limite superior (Li): o número maior é o limite superior da classe (4l-6) em que L1 = 6. l.: este simbolo estabelece inclusão e exclusão para os valores limites de um dado intervalo de classe. .6 = indica inclusão do limite inferior (4) e exclusão do limite superior (6).LIMITES DE CLASSE Limite inferior (li): o número menor é o limite inferior da classe (4l-6) em que l1 = 4. h5= 14 – 12 = 2 anos. .AMPLITUDE DE CLASSES (HI) A amplitude de um intervalo de classe (hi) é a diferença entre o limite superior e inferior de uma classe: hi = Li – li h1= 6 – 4 = 2 anos. h2= 8 – 6 = 2 anos. h4= 12 – 10 = 2 anos. h3= 10 – 8 = 2 anos. h6= 16 – 14 = 2 anos. AMPLITUDE DO INTERVALO DE CLASSE Amplitude do intervalo de Classe (h): É o comprimento da classe. sendo geralmente definida como a diferença entre os limites superior e inferior ou: 15 . Xi = li + Li/2 Ponto médio da primeira classe: x1 = 4+6/2 = 5.PONTO MÉDIO DE UMA CLASSE (XI) Ponto médio de uma classe (xi) é o ponto que . . por situar-se numa posição média da distribuição de valores do intervalo de classe. divide o intervalo em duas partes iguais. 3 log10(500) = 1 + 3.3(2. REGRA DE STURGES para determinação do número de classes: Essa regra estabelece que o número de classes é igual a: k = 1 + 3.607 k=7 17 .699) = 6.3log10(50) = 1 + 3.907 k = 9.3(1.3 log10 n. onde k = número de classes e n = nº total de observações Exemplos: a) Se o número de observações for 500: n = 500.N. k = 1 + 3. é representado por k.699) = 9. DE CLASSES O número de classes em uma distribuição de freqüências.907 ou arredondando k=10 b) Se n = 50: k = 1 + 3. TIPOS DE FREQUÊNCIA Frequência simples ou absoluta (fi): é o número de observações de um valor individual (ou de uma classe). Frequência Quantidade de crianças por faixa etária 4 7 8 7 8 3 Idade 4I-6 6l-8 8l-10 10l-12 12l-14 14l-16 Frequência Simples ou Absoluta . Frequência (fi) 4 7 8 7 8 3 37 Idade 4I-6 6l-8 8l-10 10l-12 12l-14 14l-16 Total Fr = fi/∑fi *100 Fr2= 7/37*100 = 18.9% esta classe representa . o que facilita a observação.Frequência relativa (fr): representa a proporção de observações de um valor (ou de uma classe) em relação ao número total de observações. Idade 4I-6 6l-8 8l-10 10l-12 12l-14 14l-16 Total Frequência (fi) 4 7 8 7 8 3 37 . F4 = f1 + f2 + f3 + f4 = 4 + 7 + 8 + 7 = 26 F4 =26 Existem 30 crianças abaixo de 12 anos.Frequência acumulada (Fi): é a soma de todas as frequências abaixo do limite superior de uma classe considerada. TABELA DE DADOS Idade 4I-6 6l-8 8l-10 10l-12 fi 7 8 8 7 xi 5 7 9 11 fr (%) 18.6 21.6 18.2 2.8 36 37 .9 Fi 7 15 23 30 Fri 12l-14 14l-16 Total 6 1 37 12 15 16.9 21. EXERCÍCIOS Tabular os seguintes dados. Elaborar um gráfico com as classes criadas com suas respectivas frequência relativa. calcular os pontos médios. 28 32 45 30 30 21 23 20 54 55 55 46 49 49 45 45 61 61 63 65 25 27 27 49 46 34 32 29 66 54 53 50 50 25 25 55 55 57 57 59 45 44 48 48 48 41 41 35 28 40 40 49 47 36 39 39 56 60 33 35 62 65 23 26 24 33 37 38 29 37 38 42 31 33 26 37 44 37 37 32 26 26 36 47 43 42 30 30 . elaborar classes. calcular as respectivas frequências. 2) Observe a distribuição de frequência: 23 .EXERCÍCIOS 1)Os resultados do lançamento de um dado 20 vezes foram: 656 343 5241 4561 312415 Forme uma distribuição de frequência sem intervalos de classe. Percentis MEDIDAS DE DISPERSÃO: Amplitude. Coeficiente de Variação. Moda. 24 . Média. Variância.VARIÁVEIS QUANTITATIVAS MEDIDAS DE POSIÇÃO: Mínimo. Máximo. Mediana. Desvio Padrão. 5.MEDIDAS DE POSIÇÃO •Máximo (max): a maior observação •Mínimo (min): a menor observação •Moda (mo): é o valor (ou atributo) que ocorre com maior freqüência. Dados: 4. 4 max = 8 min = 4 mo = 4 25 . 4. 8. 6. 5. 8 25378 x 5 5 x i 1 n i n 26 ..•Média: x1 x2 x3 . 3.. 7. xn x n Dados: 2. 5. • Mediana: A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados. Posição da mediana: n+1 2 27 . 8. 1. 3. 2.Exemplos: Dados: 2. 6 n = 6 (par) Dados ordenados: 1 2 4 6 8 9 Md Md = (4 + 6) / 2 = 5 28 . 8 Posição da Mediana n = 5 (ímpar) Md=6 Dados ordenados: 2 3 6 7 8 Dados: 4. 6. 7. 9. min Para os grupos anteriores.Medidas de Dispersão Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados •Amplitude (A): A = máx . A = 8 Grupo 3. A = 4 Grupo 2. temos: Grupo 1. A = 0 29 . (x n x ) 2 n (xi x )2 2 Variância s n 1 n 1 i 1 •Desvio padrão: Desvio Padrão s Variância 30 ..•Variância: (x1 x )2 (x 2 x )2 .. 58 G2: s2 = 10 s = 3.Cálculo para os grupos: G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2 4 s2 = 10/4= 2.16 G3: s2 = 0 s = 0 31 .5 s = 1. 5(5)2 = 2.5 4 32 .Fórmula alternativa: S 2 Xi i 1 n 2 nX 2 ( n 1) Em G1: Xi2 = 9 + 16 + 25 + 36 +49 = 135 S2 = 135 . elimina o efeito da magnitude dos dados .é uma medida de dispersão relativa .exprime a variabilidade em relação à média s CV 100% x 33 .• Coeficiente de Variação (CV) . aproximadamente.5% 12% Conclusão: Os alunos são.Exemplo 3: Altura e peso de alunos Média Altura 1. duas vezes mais dispersos quanto ao peso do que quanto à altura. 34 . de Variação 5.063m 6kg Coef.143m Peso 50 kg Desvio Padrão 0. Exemplo 4: Altura (em cm) de uma amostra de recémnascidos e de uma amostra de adolescentes Média Recém-nascidos Adolescentes Desvio padrão 6 16 Coef. . de variação 12% 10% 50 160 Conclusão: Em relação às médias. as alturas dos adolescentes e dos recém-nascidos apresentam 35 variabilidade quase iguais. .Medidas de Posição – Tendência Central Exercício: Inspecionaram-se quinze rádios antes da remessa e os números de defeito por unidade são apresentados no quadro abaixo: 1 0 3 Números de defeito por rádio 4 0 2 2 3 0 1 1 1 1 0 1 Encontre a média. a variância e o desvio-padrão do número de defeitos. a moda. a mediana. do interior de Minas Gerais. A amostra é de 30 residências e as primeiras informações seguem no Quadro 1 : 37 . cujo intuito é saber o número de pessoas por residência.EXERCÍCIOS Uma pesquisa foi realizada numa cidade. 7.0.EXERCICIOS Dada uma amostra das notas dos alunos da disciplina de estatistica.0.5. 6. 6.5. 5.5.1. 8. 7.0. calcule a media aritmetica: {5.0} Dão-se a seguir o número de cães perdidos que foram capturados e encaminhados a um abrigo de animais em 20 dias: 4 6 8 4 2 6 4 3 4 9 5 8 5 3 5 7 6 3 8 6 Calcule a média de cães capturados por dia Calcule a Moda Calcule a Mediana Calcule o desvio-padrão 38 . 5. moda.9 Calcule média.Médias e Desvio-padrão . Marca A (R$ 3.9 34.2 33. como é de preferência de sua clientela.5 32.7 35.5 35.7 33.4 33. desvio-padrão e .7 38. coeficiente de variação mediana.5 31.10/l) Marca C (R$ 3.1 35.2 35.9 34.2 34.50/l) Marca B (R$ 4. Ele consultou alguns fornecedores e obteve as seguintes informações: Teor alcoólico de três tipos de aguardente pesquisadas. No entanto.65/l) 38.5 36.Exercícios Um comerciante está interessado em comprar 100 garrafas de cachaça para o seu estabelecimento. é necessário que a cachaça escolhida apresente um teor alcoólico de no mínimo 33% em volume. qual delas eu deveria comprar? .Vamos supor que eu quero comprar uma lâmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida útil de suas lâmpadas e eles me fornecem os seguintes dados: Fabricante A (h) 730 710 705 720 765 750 Fabricante B (h) 1000 687 700 850 587 710 Supondo que as duas lâmpadas custam o mesmo valor. MÉDIA EM DADOS AGRUPADOS 41 . MÉDIA EM DADOS AGRUPADOS 42 . MEDIANA EM DADOS AGRUPADOS 43 . MEDIANA EM DADOS AGRUPADOS 44 . 45 . EXERCÍCIO Ache a média e mediana da seguinte distribuição de notas de 500 alunos de um teste de estatística: Nota 10-24 25-39 40-54 55-69 70-84 85-99 Total Número de Estudantes 44 70 92 147 115 32 500 46 . EXERCÍCIO Ache a média e mediana da seguinte distribuição de idades dos membros do sindicato: Idade 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 Total Freqüência 18 42 78 115 178 107 88 52 30 11 719 47 .