Trabalho Semi Final

Questão 02• Dados da questão: Quad. 1 114,7 144,7 119,1 113,7 108,9 96,7 87,6 132,4 Quad. 2 144, 173,4 154,2 154,7 125,9 119,5 155,7 213,9 156,2 159,0 7 Quad.3 153, 192,5 145,5 168,8 141,5 141,2 189,6 178,4 208,6 1 Letra a)• Comandos do R: > q1 <- c(114.7, 144.7, 119.1, 113.7, 108.9, 96.7, 87.6, 132.4) > q2 <- c(144.7, 173.4, 154.2, 154.7, 125.9, 119.5, 155.7, 213.9, 156.2, 159) > q3 <- c(153.1, 192.5, 145.5, 168.8, 141.5, 141.2, 189.6, 178.4, 208.6) > boxplot(q1, q2, q3, xlab = "quadrimestre", ylab = "índice") • Resultado obtido: • Comentário(s): Dos 3 quadrimestres observados o 3º deles foi o que mostrou maior volume de vendas e uma maior variação nas mesmas enquanto que o 1º foi o que teve o menor número de vendas e também menor variação. Letra b)• Comandos do R: > q1.m <- c(mean(q1), sd(q1), 100 * sd(q1)/mean(q1)) > q2.m <- c(mean(q2), sd(q2), 100 * sd(q2)/mean(q2)) > q3.m <- c(mean(q3), sd(q3), 100 * sd(q3)/mean(q3)) > names(q1.m) <- names(q2.m) <- names(q3.m) <- c("Média", "Desvio padrão", "CV") • Resultados obtidos: > q1.m Média 114.72500 Desvio padrão 18.22751 CV 15.88800 Média 155.72000 Desvio padrão 25.89379 CV 16.62843 Média 168.80000 Desvio padrão 24.91726 CV 14.76141 > q2.m > q3.m • Comentário(s): A média de vendas do 1º Quadrimestre é a menor entre os 3, assim como seu desvio padrão. O 2º Quadrimestre é o que possui maiores desvio padrão e coeficiente de variação. E o 3º Quadrimestre é o que apresenta maior média e menor coeficiente de variação. Questão 03 Letra a)• Dados para a questão: Matriz fornecida: • 1 3 5 7 2 4 6 8 10 20 30 40 Comandos, resultados e comentários: > dadosmat<-matrix(scan("matriz_exemplo.txt"),nrow=4,ncol=3,byrow=T) Read 12 items > dadosmat [,1] [,2] [,3] [1,] 1 2 10 [2,] 3 4 20 [3,] 5 6 30 [4,] 7 8 40 Esses comandos leêm e imprimem a matriz exemplo, contendo 3 colunas e 4 linhas. > apply(dadosmat,1,mean) [1] 4.333333 9.000000 13.666667 18.333333 Calcula e imprime a média das linhas 1,2,3 e 4 respectivamente. > apply(dadosmat,2,mean) [1] 4 5 25 Calcula e imprime a média das colunas 1,2 e 3 respectivamente. > apply(dadosmat,1,sd) [1] 4.932883 9.539392 14.153916 18.770544 Calcula e imprime o desvio padrão das linhas 1,2,3 e 4 respectivamente. > apply(dadosmat,2,sd) [1] 2.581989 2.581989 12.909944 Calcula e imprime o desvio padrão das colunas 1,2 e 3 respectivamente. • Diferença entre apply e tapply: enquanto o comando apply aplica uma função a um determinado vetor, o tapply, constrói uma tabela relacionando o cálculo da função escolhida com uma outra variável. Letra b)• Comandos e resultados: > sample(x=1:5, size=4, replace = FALSE) [1] 1 4 2 3 > sample(x=1:60, size=6, replace = FALSE) [1] 51 15 59 11 16 13 • Comentário(s): A primeira linha de comandos sorteia 4 números aleatoriamente entre 1 e 5, neste caso o número 5 não foi sorteado. A segunda linha de comandos sorteia aleatoriamente 6 números entre 1 e 60. • Dados para a questão: Lado A: Lado B: • >choose(60,6) [1] 50063860 >choose(6,6)*1.75 [1] 1.75 >choose(7,6)*1.75 [1] 12.25 >choose(8,6)*1.75 [1] 49 >choose(9,6)*1.75 [1] 147 >choose(10,6)*1.75 [1] 367.5 >choose(11,6)*1.75 [1] 808.5 >choose(12,6)*1.75 [1] 1617 >choose(13,6)*1.75 [1] 3003 >choose(14,6)*1.75 [1] 5255.25 >choose(15,6)*1.75 [1] 8758.75 Comentário(s): O lado A representa a quantidade de combinações possíveis quando se tem 60 valores e escolhe-se, aleatoriamente, 6 valores; o lado B por sua vez representa a quantidade de combinações possíveis entre valores que variam de 6 a 15 elementos tomados de 6 a 6 multiplicados por 1.75. 66 6.46 8.26 6.30 Ano 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 Mes 3 10 5 10 7 0 0 4 10 6 6 11 5 2 5 8 7 7 8 4 9 2 0 1 5 0 7 8 6 10 5 4 7 7 11 2 Regiao 1 2 2 3 3 1 1 2 2 3 1 2 3 3 1 3 2 3 1 1 3 2 3 3 1 3 3 1 1 2 3 1 2 2 2 1 .85 14.71 15.40 23.59 7.61 17.75 19.00 4.86 7.35 9.00 12.59 12.76 11.26 18.25 5.23 13. • Letra a)Comandos.95 9.74 8.txt".44 8.read.79 13.69 14.73 6.Questão 04 • Dados para a questão: arquivo fornecido pelo professor “exemplo_milsa.99 16.12 8.header=T) > milsa ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Civil 1 2 2 1 1 2 1 1 2 1 2 1 1 2 2 1 2 2 1 1 2 1 1 2 2 2 1 2 2 2 1 2 2 1 2 2 Instrucao 1 1 1 2 1 1 1 1 2 2 2 1 2 1 2 2 2 1 3 2 2 2 1 3 2 2 1 2 2 2 3 2 3 3 2 3 Filhos NA 1 2 NA NA 0 NA NA 1 NA 2 NA NA 3 0 NA 1 2 NA NA 1 NA NA 0 2 2 NA 0 5 2 NA 1 3 NA 2 3 Salário 4.56 5.53 10.table("exemplo_milsa.06 11.txt”.22 16.80 10.13 9.39 7.77 9. resultados e comentários: > milsa <.60 13. 26 40 7 Outro 6 Casado 1oGrau 0 6.06 30 9 Outro 22 Solteiro 2oGrau NA 11. label=c("Capital". As linhas de .76 37 4 Interior 21 Casado 2oGrau 1 11.35 38 8 Outro 17 Casado 2oGrau 1 9.99 35 10 Capital 31 Solteiro Superior NA 16.13 30 5 Interior 16 Solteiro 2oGrau NA 9.factor(milsa$regiao.85 46 7 Outro 28 Casado 2oGrau 0 14.69 29 8 Interior 29 Casado 2oGrau 5 14. "Interior".12 33 6 Interior 12 Solteiro 1oGrau NA 8.3)) > milsa ID Civil Instrucao Filhos Salário Ano Mes Regiao 1 Solteiro 1oGrau NA 4. "Superior").46 27 11 Capital 13 Solteiro 2oGrau NA 8. lev=1:3) > milsa$regiao <.53 25 8 Interior 20 Solteiro 2oGrau NA 10.60 35 0 Outro 27 Solteiro 1oGrau NA 13.71 40 6 Interior 30 Casado 2oGrau 2 15.40 48 11 Capital 36 Casado Superior 3 23.22 31 5 Outro 32 Casado 2oGrau 1 16.86 41 0 Interior 8 Solteiro 1oGrau NA 7.1. label=c("1oGrau".56 32 10 Capital 3 Casado 1oGrau 2 5. levels=1:2) > milsa$instrucao <.80 39 7 Outro 19 Solteiro Superior NA 10.79 26 1 Outro 25 Casado 2oGrau 2 13.00 26 3 Interior 2 Casado 1oGrau 1 4.73 20 10 Outro 5 Solteiro 1oGrau NA 6.26 43 7 Capital 34 Solteiro Superior NA 18.61 36 4 Interior 33 Casado Superior 3 17. "2oGrau". lev=c(2.77 31 7 Capital 18 Casado 1oGrau 2 9.As duas linhas de comando lêem e imprimem o conteúdo do arquivo “exemplo_milsa.30 42 2 Interior Por meio de tabulação é possível codificar respostas para informações qualitativas (nominal ou ordinal) transformando-as em quantitativas.59 34 2 Capital 23 Solteiro 1oGrau NA 12. "Casado").00 41 0 Outro 24 Casado Superior 0 12.factor(milsa$instrucao.74 37 5 Outro 14 Casado 1oGrau 3 8. > milsa$civil <.75 33 7 Capital 35 Casado 2oGrau 2 19.factor(milsa$civil.39 43 4 Capital 9 Casado 2oGrau 1 7.txt” sem fazer alteração ao arquivo ou qualquer tipo de cálculo.44 23 6 Outro 11 Casado 2oGrau 2 8.66 28 0 Interior 7 Solteiro 1oGrau NA 6. label=c("Solteiro".59 34 10 Capital 10 Solteiro 2oGrau NA 7. "Outro").25 36 5 Capital 4 Solteiro 2oGrau NA 5.95 44 2 Outro 15 Casado 2oGrau 0 9.23 32 5 Interior 26 Casado 2oGrau 2 13. 333333 Superior 8. . levando em consideração o total de entrevistados.50 60. da mesma forma em “Instrução” 1.00 Superior 18. > tabela2=table(milsa$civil. resultados e comentários: > tabela1=table(milsa$civil) > tabela1 Solteiro 16 Casado 20 Agrupamento dos dados de “Civil” em uma tabela simples com o número de solteiros e casados. “Interior”. “Capital” e “Outro” substituíram.vector(table(milsa$civil))*100 > tabela3 Solteiro Casado 1oGrau 43. > tabela3=tabela2/sum(tabela2)*100 > tabela3 Solteiro Casado 1oGrau 19.75 25. 2oGrau” e “Superior”. esses comandos calculam e imprimem a percentagem equivalente de cada valor encontrado. Em “Civil” trocou-se 1 e 2 por “Solteiro” e “Casado”.888889 2oGrau 16.333333 8.00 2oGrau 37.666667 33.comando acima retornam ao arquivo milsa e atribui significados aos códigos utilizados no armazenamento dos dados e os imprime. só que dessa vez considerou-se o total oferecido pela tabela1. os comandos em questão relacionam duas informações. respectivamente.75 15. os comandos em questão calculam e imprimem a porcentagem linha a linha.00 Ainda com informações da tabela2. por fim em “Regiao”. • Letra b)Comandos. 1.444444 13.2 e 3 foram substituídos por “1oGrau”. respectivamente. milsa$instrucao) > tabela2 Solteiro Casado 1oGrau 7 5 2oGrau 6 12 Superior 3 3 Com os dados agrupados do número de solteiros e casados. > tabela3=tabela2/as.333333 Utilizando as informações reorganizadas da tabela2. neste caso “Civil” e “Instrução”.2 e 3. header=TRUE.quote="\"". esses comandos calculam porcentagem dos elementos coluna a coluna.66667 2oGrau 33. ncol=nc. pode-se concluir qual o cálculo realizado. Embora não tenha sido usada a função pré-determinada para desviopadrão. nrow=nl.00000 50. milsa$instrucao. > tabela5=tapply(milsa$salario.delim(file="base_mg. > tabela7 1oGrau 37.72604 2oGrau 32. 2.502438 Cálculo e impressão do desvio padrão dos valores da tabela5. mean) > tabela6=tapply(milsa$salario.33333 66. byrow=T) > tabela4=tabela2/auxtab2*100 > tabela4 Solteiro Casado 1oGrau 58. sd) > tabela7=tabela6/tabela5*100 > tabela5 1oGrau 7.33333 41.> nl=nrow(tabela2) > nc=ncol(tabela2) > somcol=apply(tabela2.956464 2oGrau 3.836667 2oGrau 11. o comando tapply retoma os valores das células selecionadas e aplica a cada uma delas (não-vazias) a função prédeterminada. Letra c)• Comandos. milsa$instrucao. resultados e comentários: > dados=read. sum) > auxtab2=matrix(somcol. observando a linha de comando da tabela7.475000 Cálculo e impressão da média de salário de acordo com o grau de instrução.dec=".715144 Superior 4. Como visto anteriormente (questão 3.32891 Cálculo e impressão do coeficiente de variação do salário de acordo com a instrução.66667 Superior 50. > tabela6 1oGrau 2.22620 Superior 27. item A).txt".sep="\t".00000 Tendo como tabela auxiliar a tabela 2.528333 Superior 16.") > res2=dados . txt” essas linhas de comando calculam e exibem as densidades populacionais e o IDH de cada região. FUN="mean") > nomes=as.levels=1:10) > res6=data.269267 13.102590 44.8256646 0.7019242 0. e atribuem nomes às mesmas.frame(REPLAN.229456 33.353231 50.2]) > res6 [1.7529608 0.7291348 0.4]/res2[.8202857 0.IDHM=res5[.8372571 Tendo como base os dados do arquivo “base_mg.1]. by=list(RegiaoPlanejamento=dados$nomeregiao).8198258 0.8349677 0.7291348 0.] [7.141374 IDHM 0.character(res4[.c(2.] [5. by=list(RegiaoPlanejamento=dados$nomeregiao).8256646 0.364799 5.233441 169.269267 13.8349677 0.] [8. .7915986 0.] [6.res6[.label=nomes. FUN="mean") > res5=aggregate(res3$idh2000.] [4.471937 18.2].1]) > res6=cbind(res4[.8372571 Esses comandos exibem as densidades populacionais e o IDH por região.> res3=cbind(res2.308768 17.8195263 0.3]) > res4=aggregate(res3$denpop.102590 44.] [9.] 1 2 3 4 5 6 7 8 9 10 DENPOP 15.] [10.471937 18.7019242 0.229456 33.655959 48.] [2.denpop=res2[.8195263 0.7915986 0.141374 IDHM 0.364799 5.1].233441 169.] [3.DENPOP=res4[.3)]) > res6 1 2 3 4 5 6 7 8 9 10 REPLAN Alto Parnaiba Central Centro Oeste de Minas Jequitinhonha/Mucuri Mata Noroeste de Minas Norte de Minas Rio Doce Sul de Minas Triângulo DENPOP 15.8198258 0.7529608 0.353231 50.655959 48.8202857 0.308768 17. > REPLAN=factor(res6[. 05*50.100). resultados e comentários: > posrow=barplot(VADeaths.8) legend("topright".c(VADeaths[.col=c("#4 C4C4C".VADeaths[.bty="n".4]+0. .V ADeaths[.digits=0).1]+0.VADeaths[.fill=c("#4C 4C4C"."#CCCCCC"."#E6E6E6")) abline(h=0) Cria o mesmo gráfico anterior."#888888".05*50.2]+0."#CCCCCC".beside=T.plot=T.beside=T) Cria um gráfico de barras.rownames(VADeaths).cex=0."#AEAEAE"."#888888". >barplot(VADeaths.ylim=c(0.05*50.05*50).Letra e)• Comandos."#AEAEAE".labels=round(VA Deaths.3]+0."#E6E6E6") )text(posrow. 41.labels=nomes) .")".# Fazendo um gráfico de setores simples: > torcidas=c(0.0. sep="") > pie(torcidas.11."América". 0. # Formatando o gráfico de setores: > cores=gray(0:25/25) > escol5=c(1."Ipatinga".05.25) > cores5=cores[escol5] > nomes=c("Atlético". 0.07."Cruzeiro"."América".8. "%".digits=0)."Outras") > nomes<-paste(nomes."Cruzeiro".22."Outras") > pie(torcidas) # cores padrões Cria um gráfico de setores utilizando cores padronizadas para cada time.18. 0.col=cores5." (".02) > names(torcidas)=c("Atlético"."Ipatinga".cex=0.round(torcidas*100.45. 0 8 1. porém com cores em escala de cinza.table(file="altura_peso.69 51.5 15 1.header=T) > dados Altura Peso 1 1.0 18 1.0 11 1.85 80.55 48.5 2 1.0 22 1.5 20 1.6 .64 47.Cria o mesmo gráfico anterior.62 57.65 63.65 58.63 47.0 3 1.2 19 1.0 7 1.0 9 1.58 55.76 60. Questão 05 • Dados para a questão: arquivo fornecido pelo professor “altura_peso.70 58.66 54.5 21 1.5 16 1.57 49.60 54.txt”.60 60. resultados e comentários: > dados<-read.4 17 1.80 85.0 25 1.5 23 1.8 10 1.9 5 1.70 60.68 52.txt".69 55.0 6 1.64 58.2 24 1.72 70.8 4 1. • Comandos.82 66.60 58.85 72.78 68.0 13 1.0 14 1.0 12 1. txt”.26 27 28 29 30 1.0 59.57 1.65 57.0 52.62 1.0 63. > plot(dados$Altura.pch=19.0 49.0 Imprime as informações contidas no arquivo “altura_peso.dados$Peso.dados$Peso) Gráfico de dispersão altura x peso.54 1. > plot(dados$Altura.col="blue") .62 1. Mesmo gráfico.col="blue") Comparando com o primeiro gráfico da questão.dados$Peso. . > plot(dados$Altura. as bolinhas mudaram de cor. foram de pretas para azuis. porém com os pontos azuis.pch=22. 38. ">30"). 2)) > dimnames(data)=list(c("F". 30. 42.Questão 06 • Dados para a questão: Duração (dias) Abaixo de 35 anos Feminino Masculino 1-7 8-30 Mais de 30 • 36 48 30 48 42 43 Acima de 35 anos Feminino Masculino 44 38 42 43 49 36 Comandos e resultado: > freqs=c(36. 44. 43. c("1-7". . c("<35". 43. 49. 48. dim = c(2. 36) > data=array(freqs. <35 F M 1-7 36 48 8-30 48 42 >30 30 43 . "8-30". "M"). ">35")) > data . 48. 42. 3. 1] F 36 M 48 Imprime uma matriz que indica somente a distribuição de freqüência para desempregados com menos de 35 anos e com período de 1 a 7 dias. 1] F M 1-7 36 48 8-30 48 42 >30 30 43 Imprime a matriz que indica a distribuição de freqüências para menores de 35 anos. • Mudanças: comandos. >35 F M 1-7 44 43 8-30 38 49 >30 42 36 • Comentário(s): Imprime duas matrizes indicando as tabelas de freqüência em classes dos trabalhadores desempregados. > data[1. . . > data[. 1. > data[. ] 1-7 8-30 >30 <35 36 48 30 >35 44 38 42 Imprime uma matriz que indica a distribuição de freqüência para desempregados do sexo feminino. ] F M <35 36 48 >35 44 43 Imprime somente a primeira coluna de cada matriz. resultados e comentários: > data[. divididos por sexo. somente as distribuições de freqüência para faixa de duração de desemprego de 1 a 7 dias. uma para menores de 35 anos e uma para maiores de 35 anos. . ou seja.1.. . e o período de desemprego. • Perguntas: a).1. > sum(data[2. 1 . ] <35 36 >35 44 Imprime uma matriz indicando somente a distribuição de freqüência para desempregados do sexo feminino com período entre 1 a 7 dias.1.Encontre a probabilidade de uma pessoa sorteada ao acaso deste grupo ter menos de 35 anos e ser do sexo masculino. > apply(data.Encontre a proporção de homens e mulheres que ficaram desempregados por mais de 30 dias.Qual a diferença entre os comandos data[. .> data[1.1. 1. ]? b).1.dig=1) F 28.sum).1] e data[1.1])/sum(data) .]? c).Qual a diferença entre os comandos data[. 1]. .]. e).sum)/apply(data.3.. 1].3. data[.Encontre o número total de pessoas em cada faixa etária. data[1. > round(100*apply(data[. > data[1.] e data[1.2 O comando calcula e imprime o que foi solicitado.7 M 34. d).1] 1-7 36 8-30 48 >30 30 Imprime uma matriz que indica a distribuição de freqüência para desempregados do sexo feminino com menos de 35 anos.sum) <35 247 >35 249 O comando calcula e imprime o que foi solicitado. . . Peso) > with(tab. Questão 07 • Dados para questão: Peso Sexo • Baixo Normal Alto Masculino 136 92 248 Feminino 102 195 62 Comandos. 248. each = 2). 102. resultados e comentários: Letra a)- > freq=c(136.frame(Sexo. "Normal". 92.freq) > tab=data. 195. Peso)) . "Mulheres").2681452 O comando calcula e imprime o que foi solicitado. table(Sexo. "Alto"). 62) > Sexo=rep(rep(c("Homens". freq) > Peso=rep(rep(c("Baixo". 3).[1] 0. • Perguntas: sorteando-se ao acaso uma dessas pessoas.0742515 A probabilidade de uma mulher ter peso alto é de 0. length(Sexo[Sexo == "Homens"])) > Homens.baixo/total [1] 0.Homens [1] 0. (length(Sexo[Peso == "Alto" & Sexo == "Mulheres"]))) > total=length(tab[.inter. Letra e). 1]) > Homens.50299% Letra d).uniao. (length(Sexo[Peso == "Normal" | Sexo == "Homens"]))) > total=length(tab[.A pessoa selecionada ter peso baixo? > n.Homens = with(tab.baixo=with(tab.inter.Um homem ser selecionado ou a pessoa selecionada ter peso normal? > Homens.2850299 A probabilidade de uma pessoa escolhida ao acaso ter peso baixo é de 0.inter.Sexo Homens Mulheres Alto 248 62 Peso Baixo Normal 136 92 102 195 Os Comandos imprimem uma tabela com a freqüência e classificação dos pesos entre homens e mulheres num hospital.uniao. 1]) > mulheres.inter.alto=with(tab.452515% Letra c).normal/total [1] 0.alto/total [1] 0.0742515 ou 7. (length(Sexo[Peso == "Alto" & Sexo == "Homens"]))) > n.8035928 O resultado acima[1] expressa a probabilidade de uma pessoa selecionada ao acaso ser homem ou ter peso normal.2850299 ou 29.Uma mulher ter peso alto? > mulheres. (length(Peso[Peso == "Baixo"]))) > total=length(tab[.normal=with(tab. 1]) > n.alto/n.5210084 .alto = with(tab.O peso ser alto dado que é homem? > Homens. qual a probabilidade de: Letra b). 08613836 Se o fabricante estiver correto.Suponha agora que o fabricante esteja mentindo. segundo o critério acima? . qual a probabilidade do lote ser rejeitado? > 1 . p = 0. Questão 08 • Dados.613836%. resultados e comentários: Situação 1: Um fabricante afirma que apenas 5% de todas as válvulas que produz têm uma duração inferior a 20 horas. a chance de um de seus lotes produzidos ser rejeito é 8. caso contrário o lote todo é rejeitado. Qual a probabilidade de um lote ser aceito.pbinom(1. na verdade a proporção de válvulas com duração inferior a 20 horas é de 10%. size = 10.O resultado acima[1] expressa a probabilidade de uma pessoa selecionada ao acaso ter peso alto sabendo que trata-se de um homem. no máximo uma tiver duração inferior a 20 horas.05) [1] 0. Letra b). isto é. Letra a).Se o fabricante de fato tem razão. Uma indústria compra semanalmente um grande lote de válvulas desse fabricante. em 10 válvulas escolhidas ao acaso. mas sob a seguinte condição: ela aceita o lote se. comandos. 3422960 A chance de receber no máximo três chamadas em 90 minutos é 34. lambda=3*(60/60)) [1] 0.657704 A chance de receber 4 ou mais chamadas em 90 minutos é 65.30) >pnorm(0.P (-1.40418%.2240418 A chance de receber exatamente 3 chamadas em uma hora é 22. Qual a probabilidade de: Letra a).35) > pnorm(-2.lambda=3*(90/60))) [1] 0. p = 0.76) .7704%. sd = 1.Receber no máximo três chamadas em 90 minutos? > sum(dpois(x=0:3.tail = F) [1] 0. Letra b). Situação 03: Seja W uma v.35.6099%.lambda=3*(90/60))) [1] 0.22960%.6179114 Letra d). Letra c).5276334 A chance de receber alguma chamada durante 15 minutos é 52.Receber quatro ou mais chamadas em 90 minutos? > 1-sum(dpois(x=0:3.tail = T) [1] 0.76334%.a com distribuição normal padrão.> pbinom(1.lambda=3*(15/60)) [1] 0.9906133 Letra e). lower. Calcula as probabilidades abaixo: Letra b).736099 Segundo o critério anterior.Receber alguma chamada durante 15 minutos? > 1-dpois(x=0.05 < W <2.P (W < 0.1) [1] 0. sd = 1. Situação 2: A média de chamadas telefônicas numa hora é três. se o fabricante estiver mentindo a chance de um dos lotes ser aceito é 73. Letra d).Receber exatamente três chamadas numa hora? > dpois(x=3. mean = 0. lower. mean = 0.P (W > -2.30. size = 10. sd=1) [1] 0.tail=T) .tail = TRUE))*1000 [1] 496. lower.tail = TRUE) . sd=0.2.78. sd=1. Letra b).8.qnorm(0.P (T < x) = 0. mean = 0.8 e 37.8502509 Os comandos acima calculam e imprimem as probabilidades solicitadas de acordo com as características da variável W. lower.6903088 Letra d).15. mean=36.8.92624 Situação 06: Sabendo-se que a taxa de hemoglobina (g%) em um grupo de ovinos sadios tem distribuição N(14. mean = 0.0. Letra c).P (x < T < 1. sd = 1. espera-se que 496.755.05. Situação 04: Seja T uma v.15.tail = F) [1] -1. construa faixas de referência que englobem: .Se considerarmos 1000 dessas pessoas. lower.1696 Considerando 1000 pessoas. mean = 0. mean=36. sd=1.2 graus? > (pnorm(37. sd = 1)-pnorm(-1.8.8.8617522 Os comandos acima calculam e imprimem os valores de x que satisfazem as probabilidades requisitadas. Situação 05: Sabe-se que para adultos do sexo masculine.1696 delas estejam com temperatura entre 36.78 > qnorm( pnorm(1. lower.058122 Letra e).145 > .a com distribuição normal padrão. mean=36.95) = 0.3). lower.tail = TRUE) [1] 0. mean=0.8ºC e 37.15.Qual a temperatura corporal que é excedida com probabilidade 20%? > qnorm(0.145.2ºC. mean=0.15 graus.P (T > –x) = 0. quantas se esperariam com temperatura entre 36. lower. sd=0.tail=T) [1] -0.> pnorm(2.tail = F) [1] 36. numa certa população. mean=0.76.20.95. sd = 1.8 graus e desvio padrão 0. Calcule os valores de x abaixo: Letra b). sd=0. a temperatura corporal segue uma distribuição Normal com média 36. com boa saúde. + lower.pnorm(36.755 > qnorm(0. tail=T) [1] 21.120108 . Letra b).05/2. mean=14.272512 . 21.Letra a). lower. amo=10) [1] 49.87989 > qnorm(1-0.01/2.tail=T) [1] 19. lower.iter) + for (i in 1:iter){ + propo[i]=becel(amo) +} + return(mean(propo)) +} > repeticao(iter=100.72749 ].2 > repeticao(iter=100.01/2. mean=14.tail=F) [1] 6.tail=F) [1] 8.amo){ + propo=rep(0. vezes. 19. lower. amo=100) . mean=14. mean=14. replace = TRUE) + return(sum(soma)/vezes*100) +} > repeticao=function(iter.95% das taxas de hemoglobina: > qnorm(1-0. sd=3. sd=3.87989 ]. sd=3. lower.1).05/2.72749 > qnorm(1-0.272512 A faixa de r referência que engloba 95% das taxas de hemoglobina é [ 6. sd=3.99% das taxas de hemoglobina: > qnorm(1-0. Questão 09 • Comandos e resultados: Letra a)> becel=function(vezes) +{ + soma=sample(c(0.120108 A faixa de referência que engloba 95% das taxas de hemoglobina é [ 8. 84 > repeticao(iter=100. > par(mfrow=c(3. 0. > Fx=pbinom(x.amo=100). 40. 40.877 > repeticao(iter=100.2)) > ?par > x=0:40 > fx=dbinom(x.5 ou 50%. # O comando par é usado para inserir parâmetros gráficos. mais próximo o valor da proporção fica próximo de 0. amo=10000) [1] 49.46 Letra b). Fx. amo=1000) [1] 49. mostrando o que faz cada bloco. amo=100) [1] 50. quanto mais lançamentos são realizados. 0. fx.Estude os comandos abaixo e comente a finalidade de cada uma deles. Estes parâmetros podem ser especificados atribuindo valores um a um. type='h') Os comandos acima plotam um gráfico de distribuição polinomial. type='S') .9959 • Comentário: Podemos concluir que. entre usar becel(vezes=100) e > becel(vezes=100) [1] 55 > repeticao(iter=100. • Explique qual a diferença repetição(iter=100.35) > plot(x.35) > plot(x. ou associando uma série de valores a uma série de valores tabelados.[1] 49. Os comandos acima plotam um gráfico com as probabilidades de distribuição polinomial. type = "l". lambda = 5) > plot(y. 130. lambda = 5) > plot(y.fy. > y=0:40 > fy=dpois(y. Fy. type='h') Os comandos acima plotam um gráfico de distribuição Poisson com lambda=5. 8) > plot(w. > w=seq(70. 100. len = 100) > fw=dnorm(w. type='s') Os comandos acima plotam um gráfico com as probabilidades de distribuição Poisson com lambda=5. > Fy=ppois(y.xlab='valores de w'. ylab='densidade de probabilidade (f(w))') . fw. 8) > plot(w.1)) > plot(function(x) dnorm(x. ylab='f(x)') . > x=rnorm(1000) > par(mfrow=c(1. 100. 64)') Dá título para o gráfico. 100. 60. 8). 140. > Fw=pnorm(w.Os comandos acima plotam um gráfico de densidade de probabilidades de 70 a 130 com média 100. > title('Distribuicão Normal\nX ~ N(100. Fw. type = "l") Os comandos acima plotam um gráfico com as probabilidades da distribuição normal. "N(90. add=T. col=3) Os comandos acima adicionam ao gráfico anterior uma curva verde de média 100 e desvio padrão 15. col=2) Os comandos acima adicionam ao gráfico anterior uma curva vermelha de média 90 e desvio padrão 8. 8). 60."N(100.225)").64)". add=T. fill=1:3) . 15). 140. 60.05.Os comandos acima plotam um gráfico com curva preta possuindo média 100 e desvio padrão 8. 0. 100.64)". > plot(function(x) dnorm(x. 140. 90. > legend(120. c("N(100. > plot(function(x) dnorm(x. lambda=8).function(x)max(x)-min(x)) > mean(T) [1] 10.Os comandos acima colocam legenda identificando as curvas.nc=5) .65 > sd(T) [1] 1.nc=20) > T<-apply(sim.72419 • Mudando o tamanho da amostra para 5: > sim2<-matrix(rpois(1000*5.887626 > sd(T)/mean(T)*100 [1] 17.lambda=8). Questão 10 • Ilustração 1: > sim<-matrix(rpois(100*20.1. mean=0.1.lty=3) .xlab="observações". > abline(v=(media-dp).ylab="frequencia") O comando acima criou um gráfico para a distribuição de uma normal. visto que amostras pequenas em relação à população aumentam as chances de errar.sd=1) > dp<-sd(dados) > media<-mean(dados) > media [1] -0. considerando 100000 valores.function(x)max(x)-min(x)) > mean(T2) [1] 6.> T2<-apply(sim2.main="Distribuição de uma Normal".49 > sd(T2) [1] 2.9988525 > hist(dados. média=0 e desvio padrão=1.483156 > sd(T2)/mean(T2)*100 [1] 38.0004719812 > dp [1] 0. • Ilustração 2: > dados<-rnorm(100000.26127 Após mudarmos o tamanho da amostra observou-se que o coeficiente de variação aumentou.col="blue". lty=1) .lty=3) Os comandos acima adicionaram uma linha azul pontilhada aos valores correspondentes a ‘media-dp’ e ‘media+dp’.col="red".> abline(v=(media+dp). > abline(v=(media-2*dp).col="blue".col="red".lty=1) > abline(v=(media+2*dp). com margem de erro e grau de confiança fixados n<-(N*Var)/((N-1)*(B/alfa)^2+Var) Letra a).lty=4) > abline(v=(media+3*dp). Segundo .00 da verdadeira renda média deste universo com probabilidade de 94%.col="darkgreen".9988525 Questão 11 # tamamo: é uma funcão para calcular o tamanho amostral para estimar uma média # N: é o tamanho da população # Var: é a variância que se tem (populacional ou estimada) # B: é a margem de erro que será utilizada no cálculo amostral # Alfa: é o nível de significância que será adotado # Ponto da Normal que deixa 100(1-alfa)% de probabilidade no centro e 100(alfa)% nas caudas alfa<-qnorm(1-Alfa/2) # Tamanho amostral para estimar uma média.DP=dp) > resumo $Media [1] -0.col="darkgreen".Os comandos acima adicionaram uma correspondentes a ‘media-2*dp’ e ‘media+2*dp’.0004719812 $DP [1] 0. > resumo=list(Media=media.Determine o número de pessoas necessário para estimar a renda média dos residentes dessa cidade para que a renda média amostral esteja a no máximo R$85. linha vermelha nos pontos > abline(v=(media-3*dp).lty=4) Os comandos acima adicionaram uma linha tracejada nos pontos correspondentes a ‘media-3*dp’ e media+3*dp’. 00 da verdadeira renda média deste universo com probabilidade de 94%.B=90.1245811 Letra b).7.06) [1] 0.03114564 Letra d.6.1111235 Letra c).conf=0.208.7 144.7.B=90. qual seria o tamanho da amostra? • Comandos e resultados: > tamamo(N=8000.1 113.96.6) Letra a)> var.141.6 .168.108.119.6 132.q3.Alfa=0.8 141. 3 153.1.00. • Comandos e resultados: > tamamo(N=8000.Var=500^2.9.4 • Comandos.145.Var=500^2.B=85.2.5 168.2 189.02778115 Questão 12 • Dados para a questão: Quad.5.132.142.1 192.Repita o item B supondo um erro do tipo I de 3%.5.9) 208.E se a média amostral estivesse a no máximo R$90. 1 114.192.178.1.03) [1] 0.189.8.113.7.7.06) [1] 0.87.Var=500^2.144.7 87.Var=500^2.03) [1] 0.6 178.9 96.Alfa=0.levantamentos anteriores o desvio padrão da renda destas pessoas é aproximadamente R$500.7 119.test(q1.6.5.4 Quad.B=85.Alfa=0.5 145. resultados: > q1<-c(114.4) > q3<-c(153.5 141.Repita o item A supondo um erro tipo I de 3%.Alfa=0. • Comandos e resultados: > tamamo(N=8000.7 108.4. • Comandos e resultados: > tamamo(N=8000. F test to compare two variances data: q1 and q3 F = 0.9111 114.7250 Warning messages: 1: In if (!var.equal) { : a condição tem comprimento > 1 e somente o primeiro elemento será usado Letra c)- .alt="greater") Two Sample t-test data: q3 and q1 t = 5. p-value = 0.var.87632 Inf sample estimates: mean of x mean of y 168.0157646 sample estimates: ratio of variances 0. df = 15.1545622 2. p-value = 6.9. denom df = 8.equal) "Welch" : a condição tem comprimento > 1 e somente o primeiro elemento será usado 2: In if (var.831e-05 alternative hypothesis: true difference in means is greater than 0 90 percent confidence interval: 39.0764. num df = 7.5410395 Letra b)> t.equal=T.conf=0.test(q3.q1.4331 alternative hypothesis: true ratio of variances is not equal to 1 90 percent confidence interval: 0.541. 100.mean) + aa=round(mean(medias). resultados e comentários: > bdsim=matrix(rbinom(2500000.digits=4) + hist(medias.digits=4) + bb=round(sd(medias).50.xlab='medias'.10.1.500)) + text(0. 280.3.i). aa)) + text(0. expression(hat(mu[bar(x)]))) + text(0.7).3.ylab='freq'.2)) > for(i in c(5.1. paste("= ". bb)) +} .2500) > par(mfrow=c(3.1000..ylim=c(0. paste("= ". 280. 400.500.Questão 13 • Comandos.1.1.xlim=c(0.1:i]. 400.1).main=paste("n=".1000)) +{ + medias=apply(bdsim[. expression(hat(sigma[bar(x)]))) + text(0. n.1:m). rbind(1:m.Os comandos acima calcularam.lty=1. ou seja.col=tofora.p)/n > SE=sqrt(phat*(1-phat)/n) > alpha=0. a média se aproxima de 1 e o desvio padrão tende a 0. criam e imprimiram uma série de gráficos para distribuição binomial.]<p)."red".1 > zalp=qnorm(1-alpha/2) > inco=rbind(phat . cada um deles com um tamanho de amostra diferente. Observamos que quanto maior forem as amostras aleatórias.zalp*SE.5 > phat=rbinom(m. "black") > matplot(inco.] > p) | (inco[2. a distribuição se aproxima de uma distribuição normal padrão.n=20. xlim=c(0.p=. Questão 14 • Comandos e resultados: > m=50.type="l". phat + zalp*SE) > tofora = ifelse((inco[1.1)) . Cria um gráfico > abline(v=p.col='blue'.lwd=3) . 1:m).]<p).table(table(tofora)) tofora black red 0.col=tofora.n. rbind(1:m.p)/n > SE=sqrt(phat*(1-phat)/n) > alpha=0.1 • Alterando o alpha para 0.05: > m=50. xlim=c(0.col='blue'.] > p) | (inco[2.n=20.type="l"."red".zalp*SE.lwd=3) .lty=1.5 > phat=rbinom(m.9 0.1)) > abline(v=p.05 > zalp=qnorm(1-alpha/2) > inco=rbind(phat .p=.Adiciona ao gráfico uma linha azul que representa > prop. phat + zalp*SE) > tofora = ifelse((inco[1. "black") > matplot(inco. 200.80.206. Questão 15 • Entrando com os dados: > massa<-c(25.250) > colheita<-c(84.175.169.94 0.table(table(tofora)) tofora black red 0.154.8.150.05.75.06 • Comentário(s): após mudarmos o alpha para 0.100.244.225.> prop. tem proporção 0. foi possível observar que os intervalos que não contem p=0.90.212.125.50.248) • Fazendo o gráfico de dispersão entre as duas variáveis: .148.5. 8352087 0.95) > cor.697 1.9907664 sample estimates: cor 0.79 Coefficients: Estimate Std.pearson=cor. method = c("pearson"). p-value = 1.93333 12.9600003 • Ajustando um modelo de regressão linear simples: > modfert=lm(colheita~massa) > resultados=summary(modfert) > resultados Call: lm(formula = colheita ~ massa) Residuals: Min -22.97904 4.001 0. conf.08367 9.level = 0.00 3Q Max 12.79 1Q -11.07 Median -5.00 29. df = 8.067e-05 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.colheita.pearson Pearson's product-moment correlation data: massa and colheita t = 9.• Calculando a correlação linear existente entre as duas variáveis: > cor.00394 ** massa 0.6975.test(massa.07e-05 *** --- .81139 0. Error t value Pr(>|t|) (Intercept) 51. colheita.933+0.’ 0.81139. respectivamente.933 e 0.col="orange". p-value: 1.300).05 ‘.main="Dispersão dos dados". Adjusted R-squared: 0.(massa) • Colocando a reta ajustada em cima do diagrama de dispersão: > plot(massa.01 ‘*’ 0. codes: 0 ‘***’ 0.Signif.04 on 1 and 8 DF.ylab="Colheita de grama") > abline(modfert) .067e-05 As estimativas para o intercepto e para a inclinação são 51. A regressão tem a fórmula: colheita = 51.001 ‘**’ 0.9118 F-statistic: 94.pch=19.ylim=c(0.xlab="Massa de fertilizante".81139.1 ‘ ’ 1 Residual standard error: 19 on 8 degrees of freedom Multiple R-squared: 0.9216. ylim=c(0.xlab="Massa de fertilizante".coefs 2.• Extraindo os coeficientes do modelo ajustado: > coefs=coefficients(modfert) > coefs (Intercept) massa 51.5 % (Intercept) 22.6184496 1.811394 • Calculando os intervalos de confiança para os parâmetros: > ic.main="Dispersão dos dados".300).level=0.863042 massa 0.5 % 97.coefs=confint(modfert.pch=19.933333 0.colheita.col= "orange".0036246 81.ylab="Colheita de grama") .95) > ic.004338 • Plotando o gráfico com a reta ajustada e o intervalo de confiança para a mesma: > plot(massa. > abline(coefs.coefs[.lty=2) > abline(ic.lty=2) .col="green") > abline(ic.coefs[.col="red".1].col="red".2]. coefs[2.3619 .• Uma previsão hipotética: para um fertilizante com 115 de massa.colest.coefs[1.colest. o valor médio esperado para a colheita(em gramas é de: > colest=coefs[1]+coefs[2]*115 > colest (Intercept) 145.sup=ic.coefs[2.2]*115 > ic.sup [1] 197.coefs[1.2436 o O intervalo de confiança para esta estimativa é: > ic.colest.1]*115 > ic.inf [1] 93.colest.inf=ic.12532 > ic.2]+ic.1]+ic.

Comments

Description