Ejercicios de Estadistica II

UNIVERSIDAD NACIONAL DEL CALLAOVICERECTORADO DE INVESTIGACIÓN FACULTAD DE CIENCIAS ECONÓMICAS TEXTO DE PROBLEMAS DE INFERENCIA ESTADÍSTICA AUTOR: JUAN FRANCISCO BAZÁN BACA (Resolución Rectoral 940-2011-R del 22-9-11) 01-09-11 al 31-08-13 CALLAO – PERÚ 2013 1 ÍNDICE Pág. INDICE 2 INTRODUCCIÓN 5 Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE CENTRAL 6 1.1 Distribución normal 6 1.2 Distribución normal estándar 7 1.3 Propiedad reproductiva de la distribución normal 9 1.4 Teorema del límite central 10 1.5 Ejercicios resueltos 13 1.6 Ejercicios propuestos 29 Capítulo 2. DISTRIBUCIONES MUESTRALES 33 2.1 Distribución muestral de la media 37 2.2 Distribución muestral del total (conocida la media) 39 2.3 Distribución de la diferencia de medias muestrales 40 2.4 Distribución muestral de la proporción 43 2.5 Distribución muestral del total (conocida la proporción) 47 2.6 Distribución muestral de la diferencia de proporciones 48 2.7 Ejercicios resueltos 52 2.8 Ejercicios propuestos 73 Capítulo 3. DISTRIBUCIONES ESPECIALES 77 3.1 Distribución Chi-cuadrado 77 3.2 Distribución t de student 86 3.3 Distribución muestral de la media (n < 30) 92 3.4 Distribución de la diferencia de medias muestrales con varianzas desconocidas pero iguales 93 3.5 Distribución F de Snedecor 94 3.6 Distribución de la razón de dos varianzas muestrales 98 3.7 Ejercicios resueltos 100 2 3.8 Ejercicios propuestos 119 Capítulo 4. ESTIMACIÓN PUNTUAL 122 4.1 Estimadores. Propiedades 123 4.2 Métodos de Estimación Puntual 130 4.3 Método de Máxima Verosimilitud 130 4.4 Método de los Momentos 132 4.5 Método de los mínimos cuadrados 133 4.6 Ejercicios resueltos 135 4.7 Ejercicios propuestos 152 Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155 5.1 Intervalo de confianza para la media y tamaño de muestra 160 5.2 Intervalo de confianza para el total (conocida la media) 162 5.3 Intervalo de confianza para la proporción y tamaño de muestra 164 5.4 Intervalo de confianza para el total (conocida la proporción) 167 5.5 Intervalo de confianza para la diferencia de medias 168 5.6 Intervalo de confianza para la diferencia de proporciones 170 5.7 Intervalo de confianza para la media (n < 30) 173 5.8 Intervalo de confianza para la varianza 175 5.9 Intervalo de confianza para la razón de varianzas 177 5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179 5.11 Ejercicios resueltos 187 5.12 Ejercicios propuestos 235 Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245 6.1 Prueba de hipótesis para la media (con varianza conocida) 251 6.2 Prueba de hipótesis para la media (con varianza desconocida) 258 6.3 Prueba de hipótesis acerca de una varianza 263 6.4 Prueba de hipótesis para la razón de varianzas 270 6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276 6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281 6.7 Prueba de hipótesis para la proporción 290 3 6.8 Prueba de hipótesis para la diferencia de proporciones 293 6.9 Ejercicios resueltos 299 6.10 Ejercicios propuestos 348 Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355 7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356 7.2 Test de bondad de ajuste 362 7.3 Test de Wilcoxon 364 7.4 Test de signos 367 7.5 Test de la mediana 374 7.6 Ejercicios resueltos 379 7.7 Ejercicios propuestos 395 REFERENCIAS BIBLIOGRÁFICAS 398 Apéndice 400 Tabla 1. Distribción acumulativa normal estándar 401 Tabla 2. Distribución acumulativa chi-cuadrado 403 Tabla 3. Distribución acumulativa T de student 407 Tabla 4. Distribución acumulativa F 408 Tabla 5. De Wilcoxon para n ≤ 40 y  = 0.05 o 0.01 409 Tabla 6. Valores críticos para la prueba del signo S 409 4 INTRODUCCIÓN La ciencia económica para poder realizar las mediciones económicas recurre permanentemente a la inferencia estadística, ya que las deducciones y conjeturas económicas acerca de los parámetros están basadas en muestras aleatorias tratadas por esta disciplina. Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la estadística para economistas en la Universidad Nacional del Callao (UNAC), hemos creído conveniente elaborar un “Texto de problemas de inferencia estadística” que de manera sencilla ayude a estudiantes de la especialidad a desarrollar competencias conceptuales y procedimentales, mediante la asimilación de la terminología propia de la estadística, así como las correspondientes aplicaciones a la economía. El texto consta de siete capítulos. En el primero, se desarrolla la distribución normal y el teorema del límite central; el capítulo dos, presenta las distribuciones muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la chi-cuadrado, t de student y F. En los capítulos cuatro y cinco se desarrollan los temas relacionados a la estimación puntual y la estimación por intervalos de confianza respectivamente. En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas paramétricas, poniendo especial énfasis en la determinación del valor-P (probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos computacionales modernos. Finalmente, en el capítulo siete se presentan las pruebas de hipótesis no paramétricas. Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas para la discusión en clases. El reconocimiento especial a los estudiantes de economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los últimos años se han puesto en práctica los resultados de este modesto trabajo. 5 Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA CENTRAL DEL LÍMITE “Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar cuando se mira lejos”. José Ortega y Gasset CONTENIDO 1.1 1.2 1.3 1.4 1.5 1.6 Distribución normal. Distribución normal estándar. Propiedad reproductiva de la distribución normal. Teorema del límite central. Ejercicios resueltos. Ejercicios propuestos. 1.1 DISTRIBUCIÓN NORMAL La teoría de probabilidades nos ofrece la distribución normal como una de las distribuciones más importantes, junto al teorema central del límite, con múltiples aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la distribución normal y la presentación del teorema central del límite. Definición.- una variable aleatoria continua X tiene distribución normal con media μ y varianza σ2 , si su función de densidad de probabilidad esta dada por: f ( x)  donde: π = 3.14159265.... 1 2 2 y e  ( X   )2 2 2 -∞ < x < ∞ e = 2.71828184 (la base de los logaritmos neperianos). Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2 ) Que se lee “la variable aleatoria X se distribuye normalmente con media μ y varianza σ2 ”. Características geométricas. La gráfica tiene forma acampanada, con centro en μ. 6  Es una función creciente en el intervalo (- ∞ , μ).  Es una función decreciente en el intervalo (μ , ∞).  Tiene sus puntos de inflexión en μ – σ y μ + σ. Características estadísticas. Media: E (X) = μ  Varianza: V (X) = σ2  Si X ~ N(μ , σ2 ). Entonces, la variable aleatoria Y = a + b X también se distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2 σ2 . Es decir: Y ~ N(a + bμ , b2 σ2 )  Si X ~ N(μ , σ2 ) el cálculo de probabilidades se efectúa realizando el proceso de estandarización siguiente: Z = (X - μ ) / σ ~ N(0, 1) y decimos que la v.a. Z tiene distribución normal estándar. DISTRIBUCIÓN NORMAL 40 35 30 25 20 15 10 5 0 μ - 3σ X μ - 2σ μ-σ μ μ+σ μ + 2σ μ + 3σ 1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2 = 1) y su función de densidad de probabilidades es: f ( z)  1 z2 / 2 e 2 -∞ < z < ∞ La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula así: 7 z Φ (z) = F(z) = P [Z  z] = 1 t 2 / 2 e dt 2   Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z. Entonces, conocidos los valores de la media μ y la varianza σ2 de una variable aleatoria X ~ N(μ , σ2 ) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede efectuar el cálculo de probabilidades tales como:  P[a  X  b] = P[ (a - μ ) / σ  (X - μ ) / σ  (b - μ ) / σ ] = P[ (a - μ ) / σ  Z  (b - μ ) / σ ] = Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]  P[X  a] = P[(X - μ ) / σ  (a - μ ) / σ ] = P[Z  (a - μ ) / σ ] = Φ [(a - μ ) / σ ]  P[X > a] = 1 – P[X  a] = 1 - Φ [(a - μ ) / σ ] Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z), han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel. Uso de la Tabla de la distribución normal estándar a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ (z) = F(z) = P [Z  z]. Por ejemplo, para z = 1.96, tenemos que: Φ (1.96) = F (1.96) = P [Z  1.96] = 0.97500. b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la probabilidad Φ (z) = F (z) = P [Z  z] = α , en la tabla 1, se debe hallar el valor de z que acumule en probabilidad α y que denotaremos como z = Zα . Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z  z] = 0.97500, esto implica que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 . Una característica importante de la distribución normal es que:  Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que :     X          P(μ – σ  X  μ + σ) = P    P 1  Z  1       = Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268 8 Φ (-4) = 0.Φ (-3) = 0.99999942  Entre μ – 6σ y μ + 6σ se encuentra el 99.02275 = 0..999942% de las observaciones.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL Sean X1 . + n an Xn .9999998% de las observaciones.Φ (-2) = 0. . Es decir que:   3       3   P(μ – 3σ  X  μ + 3σ) = P  Z   P 3  Z  3      = Φ (3) .. Es decir: Xi ~ N(μi .000031 = 0..a.999937  Entre μ – 5σ y μ + 5σ se encuentra el 99. la variable aleatoria Y ~ N [a0 +  ai i . 2.Φ (-6) = 0.999999999 – 0. Xi : Y = a0 + a1 X1 + a2 X2 + .00000029 = 0. puesto que:   2       2   P(μ – 2σ  X  μ + 2σ) = P  Z   P 2  Z  2      = Φ (2) .999968 – 0..9545  Entre μ – 3σ y μ + 3σ se encuentra el 99.000000001 = 0. n . . Entonces. Es decir que:   5       5   Z P(μ – 5σ  X  μ + 5σ) = P    P  5  Z  5     = Φ (5) .999999998 1. Entre μ – 2σ y μ + 2σ se encuentra el 95.99865 – 0.9973  Entre μ – 4σ y μ + 4σ se encuentra el 99.97725 –0.Φ (-5) = 0.99999971 – 0.45% de las observaciones. 3. X2 . i 1 9 n a  i 1 2 i 2 i ] . .00135 = 0.73% de las observaciones. Si Y es una combinación lineal de las v. Es decir que:   4       4   P(μ – 4σ  X  μ + 4σ) = P  Z    P  4  Z  4     = Φ (4) . σi2 ) i = 1... . Es decir que:   6       6   Z  P(μ – 6σ  X  μ + 6σ) = P    P  6  Z  6     = Φ (6) .9937% de las observaciones. Xn . n variables aleatorias independientes distribuidas normalmente con media μi y varianza σi2 .... . + an Xn ) = = E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + . la variable aleatoria Zn definida por: n Y  E (Yn ) Zn  n  V (Yn ) n  X   i 1 i i 1 i n  2 i i 1 tiene aproximadamente una distribución normal estándar N(0. + V(an Xn ) = = 0 + a12 V(X1 ) + a22 V(X2 ) + ....4 TEOREMA DEL LÍMITE CENTRAL Sean X1 ...... + an2 V(Xn ) = = a12 σ12 + a22 σ22 + . + an E(Xn ) = n = a0 + a1 μ1 + a2 μ2 + .. + Xn = X i 1 i ......... n variables aleatorias independientes con media y varianza finitas dadas por: E(Xi) = μi y V(Xi ) = σi2 . + E (an Xn ) = = a0 + a1 E(X1 ) + a2 E(X2 ) + .. entonces bajo ciertas condiciones generales.. + an Xn ) = = V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + ... Xn ........ E(Yn ) = E (X1 + X2 + . X2 . Nota..Puesto que:  μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .. + Xn ) = E (X1 ) + E (X2 ) + . . + E (Xn ) = 10 ... n Si: Yn = X1 + X2 + . .. + a2n σn2 = n a  i 1 2 i 2 i 1.. + an μn = a0 +  ai i i 1 2   Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .. 1). 2. contribuyen con una cantidad despreciable a la variación de la suma. y no es probable que un simple término tenga una gran contribución a la suma... + σn2 = i 1 2 i . sus contribuciones a explicar la demanda son despreciables. etc.. Efectivamente.. se asume que las cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del precio (P) del bien. por lo que la suma de sus contribuciones. La aplicación del teorema central del límite se da cuando se asume que los errores ei se distribuyen normalmente. pero existen otras variables independientes (gastos de publicidad.. Las condiciones generales indicadas en el teorema están referidas a que los términos Xi tomados individualmente. gustos y preferencias. precio del bien sustituto. sin embargo.... Una aplicación importante de estas condiciones generales del teorema central del límite. en los modelos de demanda Qi = a – b Pi + ei . independientes) puede ser aproximada por una v. se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .. Xk ) más un error e... .a. distribuida normalmente. debido a que estos errores recogen la suma de las contribuciones despreciables de todas las variables dejadas de considerar en el modelo.. Por ejemplo. La variable aleatoria Yn = X i 1 i (suma de v...  V(Yn ) = V (X1 + X2 + .) que también podrían explicar dicha demanda. 11 .n 1.a..n = μ1 + μ2 + . + μn =  i 1 i .. Observaciones. + V(Xn ) = n  = σ12 + σ22 + . X2 . + Xn ) = V(X1 ) + V(X2 ) + . reflejadas en los errores ei se aproximan a la distribución normal. cualquiera que sea la distribución de las Xi .. + βk Xki + ei Donde la variable explicada o dependiente Y es función de un conjunto de variables explicativas o independientes (X1 .. . n Si: Yn = X1 + X2 + . n variables aleatorias independientes.. como veremos más adelante) y que permita encontrar la distribución de una media muestral.3. E(Yn ) = E (X1 + X2 + . Xn . + Xn = X i 1 n por : Y  E (Yn ) Zn  n  V (Yn ) X i 1 i i .... .. La propuesta es la siguiente: Sean X1 ... + E (Xn ) = = μ + μ + . X2 .... Donde X n  es la media muestral de las Xi .. + Xn ) = V(X1 ) + V(X2 ) + . .... Nota. 1). Una situación especial del teorema central del límite se presenta cuando cada Xi tiene la misma distribución (que es el caso de la definición de muestra aleatoria. + σ2 = n σ2 12 1 n  Xi n i 1 . entonces la variable aleatoria Zn dada  n  n  Xn   / n tiene aproximadamente distribución normal estándar N(0 .. + μ = n μ . + V(Xn ) = = σ2 + σ2 + ... idénticamente distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2....  V(Yn ) = V (X1 + X2 + ... + Xn ) = E (X1 ) + E (X2 ) + ... 25) = Φ(1.1092 e) P(Z < -1.0668 = 0. 1)].5000 – 0.0 0.13) = 1 – Φ(1.Φ(1.0643 f) P(0  Z  1.0516 = 0.5  Z < 0.5000 = 0.Φ(0) = 0.13) = 1 – 0. d) P(-1. Solución.00 < Z < 1.Φ(1.52) = 1 .6247 0.42) = Φ(1.00) .42) .42 -1.65  Z  -1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0. Hallar las probabilidades siguientes: a) P(Z > 1. e) el área a la izquierda de z es 0.1 0.3944 g) P(-1. f) P(0 < Z < 1.65) = 0. Hallar el valor de z para los casos siguientes: a) Φ(z) = 0.0809 0.2 0 Z 0.52) = 1 – 0. d) el área entre –z y z es 0.52) .5 < Z < 0.8944 – 0.9357 = 0.42) c) P(-1.6247 d) P(-1.00 < Z < 1.0809 Para obtener los gráficos en Minitab ver Bazán.9772.25) y g) P(-1.52) = Φ(-1.4484 2.3 Densidad Densidad 0.9987.8413 = 0.5 0 0. b) Φ(z) = 0.63 < Z  0) = Φ(0) .-Usando la tabla 1 del anexo se tiene: a) P(Z > 1. Juan (2010) 0.4 0.25) .50) .5 EJERCICIOS RESUELTOS 1. b) P(1.01.63) = 0.1 0.5) = Φ(0.2 0.5 Z P(-1. Sea Z una variable aleatoria normal estándar [Z ~ N(0.65 < Z < -1.3 0.5  Z < 0.00) = Φ(-1. 13 .00 < Z < 1.63 < Z < 0).6915 – 0.1587 – 0.13) .00) = 0.00) .5) En Minitab: P(1.4 0.Φ(-1.5) = 0. c) Φ(z) = 0.42) c) P(-1.1.P(Z ≤ 1.1292 b) P(1.05. 1)].0 1 1.9500.Φ(-1.0495 = 0.8708 = 0. y f) el área a la derecha de z es 0.Φ(-1.9222 – 0.95. e) P(Z < -1.50) .13) = 1 . le corresponde z = Z0. está distribuido aproximadamente en forma normal con μ = S/.9500. a la probabilidad 0.000.00) . esto implica que. c) Mayores de que cantidad será el 20 % de los préstamos? Solución Sea X = monto de las solicitudes de préstamo. b) Sea menor que S/. 14 . en la tabla 1. entonces Z = (X – 10000)/ 1000 ~ N(0.9772.Solución a) Sí Φ (z) = F (z) = P [Z  z] = 0.00aproximadamente.0) = Φ(2. Luego. esto implica que.33 aproximadamente.9772 = 2.000. d) Si 0. b) Sí Φ (z) = F (z) = P [Z  z] = 0.645.91044 Rpta.Φ(-1.9987 = 3.97725 – 0. esto implica que.9500. 10002). esto implica que.500 y 12.01 = -2.00 aproximadamente.000. le corresponde z = Z0. a la probabilidad 0.9987. 8. a la probabilidad 0.500 y 12. Calcule e interprete la probabilidad de que el monto del préstamo solicitado: a) Esté entre S/.06681 = 0. 1. f) Si 0.01.000. 8. a la probabilidad 0.9500 = 1. las probabilidades solicitadas son:  8500  10000 X  10000 12000  10000    a) P(8500 ≤ X ≤ 12000) = P   = 1000 1000 1000  = P(-1.9500 y de acuerdo a lo visto en la parte a) de este problema le corresponde a z = Z0.05 = P [Z ≥ z] = 1 .01 = Φ (z) = P [Z  z]. en la tabla 1. 8. Entonces.645 aproximadamente.9750 y en la tabla le corresponde a z = Z0. c) Sí Φ (z) = F (z) = P [Z  z] = 0. le corresponde z = Z0. entonces Φ (z) = 0.Φ (-z) = Φ (z) – [1 . le corresponde z = Z0. Φ (z) = 0.9772. Interpretación: el 91.9987.96.04% de los montos de préstamo solicitados por los comerciantes fluctúa entre S/. 3. 1).50) = 0.95 = P [-z  Z  z] = Φ (z) . El monto de las solicitudes de préstamo de los comerciantes que recibe un Banco.5 ≤ Z ≤ 2.9500 = 1. e) Si 0. en la tabla 1. 10. en la tabla 1.000 y σ = S/.Φ (z)] = 2 Φ (z) – 1. Se sabe que X ~ N(10000 .9750 = 1.Φ (z). 0001 0.0) = Φ(-2. 15 .0004 Densidad 0. 10840 Rpta.0002 0.0228 0.84 1000  C = S/. 8 0 0.Est.20 = P(X > C) = 1 . Media=10000.0003 0. X  10000 8000  10000   b) P(X ≤ 8000) = P   = 1000  1000 = P(Z ≤ -2.P  Z   1000    C  10000  0. 8.000.28% (ó en 228 de cada 10000 solicitudes) de los montos de préstamo solicitados por los comerciantes es menor a S/.80 =     1000   C  10000  Z 0 . Interpretación: el 20% de los montos de préstamo solicitados por los comerciantes es mayor a S/.=1000 0. 10. Interpretación: el 2. Distribución del monto de préstamo Normal. Desv. entonces: C  10000   0.02275 Rpta.0000 8000 10000 X = monto del préstamo Resultado gráfico en Minitab c) Sea C la cantidad de préstamo buscada.00) = 0.840. Distribución del monto de préstamo Normal.Est. 1).20 0.0000 4. Si se selecciona a 2000 de estos trabajadores. Sea M la máxima nota desaprobatoria buscada. Se sabe que X ~ N(11 . 1000 y desviación estándar σ = S/. 2 Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10. 200.0001 0. Los ingresos de los trabajadores tiene distribución normal con media µ= S/.5 Rpta. 850 y 1300? Solución 16 . Media=10000.25  M = 10. Desv.40  0. 5. 10000 10840 X = monto del préstamo Para cierto examen la calificación vigesimal tiene distribución normal con media 11 y desviación estándar 2. Solución Sea X = calificación vigesimal de los examinados.0004 Densidad 0. entonces: M  11    M  11  0. calcule e interprete: a) ¿Cuántos trabajadores tienen ingreso menor a S/.40 = P(X < M) = P  Z   =  2  2      M  11  Z 0.5. 600? b) ¿Cuántos trabajadores tienen ingreso entre S/.=1000 0. entonces Z = (X – 11)/ 2 ~ N(0. 22). ¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado.0002 0. Se desea desaprobar al 40% de los examinados.0003 0. 5) .12 trabajadores Rpta. 600. Interpretación: 46 trabajadores (2. primero se determina la probabilidad P y después multiplica por n.0010 0.Φ(-0.  850  1000 X  1000 1300  1000    b) P = P(850 ≤ X ≤ 1300) = P   = 200 200  200 = P(-0.28%) tienen ingreso menor a S/.0020 0.70656 Distribución del ingreso Normal. 6.7066 0. Se pide:  X  1000 600  1000  a) P = P(X < 600) = P    = P(Z < -2.5) = Φ(1. Desv.5 trabajadores Rpta.0015 Densidad 0.93319 – 0. Interpretación: alrededor de 1413 trabajadores (70. Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los intervalos dados.02275 Luego nP = 0. El volumen de negociaciones diarias (en millones de nuevos soles) para las acciones comercializadas en la bolsa de Lima tiene distribución normal con media µ= 800 y desviación estándar σ = 100.0005 0.0) = Φ(-2.75) = 0.66%) tienen ingreso entre S/.75 ≤ Z ≤ 1. 1). Z = (X – 1000)/ 200 ~ N(0. calcule e interprete: a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones? b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones? 17 .02275 x 2000 = 45. En un período de 60 días. 850 y 1300.=200 0.0) = 200  200  0.Est.22663 = 0. Media=1000.0000 850 1000 X = ingreso 1300 Luego nP = 0. 2002).Si X = ingreso de los trabajadores ~ N(1000.70656 x 2000 = 1413. 5 días (15. primero se determina la probabilidad P y después multiplica por n.0) = 1 . Luego nP = 0.28%) el volumen de negociaciones es de 600 o menos millones de nuevos soles.0) = Φ(-2.02275 5   5 Luego nP = 0. 1002)  Z = (X – 800)/ 100 ~ N(0. 52)  Z = (X – 80)/ 5 ~ N(0. Para determinar en cuántos de los n = 60 días el volumen de las negociaciones está en los intervalos dados. y desviación estándar σ = 5 gr. primero se determina la probabilidad P y después multiplica por n. calcule e interprete ¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90 gramos? Solución Si X = peso de los pernos ~ N(80. 7. El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr.4 días (2. Interpretación: en alrededor de 9. Se pide:  X  800 600  800  a) P = P(X ≤ 600) = P    = P(Z < -2.15866 x 60 = 9. Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos dados.15866.0) = 100   100 0.02275 Luego nP = 0.  75  80 X  80 90  80    b) P = P(75 ≤ X ≤ 90) = P  = P(-1 ≤ Z ≤ 2) = 5 5   5 18 .28%) pesan menos de 70 gramos. ~ N(800.Φ(1.0) = Φ(-2.  X  800 900  800  b) P = P(X > 900) = P    = P(Z > 1. 1).Solución Si X = volumen diario de negociaciones en millones de S/. Si se almacenan 2000 pernos.02275 x 60 = 1.87%) el volumen de negociaciones es mayor de 900 millones de nuevos soles.0) = 0. Interpretación: alrededor de 46 pernos (2. Se pide:  X  80 70  80  a) P = P(X < 70) = P    = P(Z < -2. 1).02275 x 2000 = 46 pernos Rpta.4 días Rpta.5días Rpta.0) = 100   100 = 1 – 0. Interpretación: en alrededor de 1.84134 = 0. 0) .0) = 0.Φ(-1.02275 x 60 = 1.81859.8186 0.04 0.4 alumnos Rpta.=5 0.Est. Interpretación: alrededor de 1637 pernos (81.97725 – 0. 102)  Z = (X – 80)/ 10 ~ N(0.86%) pesan entre 75 y 90 gramos.= Φ(2.06 0. 1).03 0.02275.0) = Φ(-2. Desv. Distribución del peso de los pernos Normal. Se pide:  X  80 60  80  a) P = P(X ≤ 60) = P    = P(Z ≤ -2.02 0.0) = 0.01 0. si éste dura 90 minutos? Solución Si X = tiempo para terminar un examen ~ N(80.09 0. 8. 10   10 Luego nP = 0.15866 = 0.08 0. primero se determina la probabilidad P y después multiplica por n.05 0. 19 .81859 x 2000 = 1637 pernos Rpta. calcule e interprete cuántos alumnos terminan el examen: a) ¿en una hora o menos? b) ¿en más de 60 minutos.00 75 80 X = peso 90 Resultado gráfico en Minitab Luego nP = 0. Para determinar cuántos de los n = 60 alumnos terminan el examen en los intervalos dados. El tiempo necesario para terminar un examen se distribuye normalmente con media µ= 80 minutos y desviación estándar σ = 10 minutos. Media=80. En un curso de 60 alumnos. pero en menos de 75 minutos? c) ¿Cuántos alumnos no terminan el examen.07 Densidad 0. 28%) terminan el examen en una hora o menos.0) = 10   10 = 1 – 0. Resultado gráfico en Minitab Distribución tiempo duración examen Normal.Φ(-2.01 0.=10 0.84134 = 0.Interpretación: alrededor de 1. 9.02275 = 0.  X  80 90  80  c) P = P(X > 90) = P    = P(Z > 1.28579. Interpretación: alrededor de 17 alumnos (28. Si los gastos de consumo familiar (C) están dados por la relación C = 0.Est.04 Densidad 0. ¿calcule e interprete la probabilidad de que los gastos de consumo familiar sean inferiores a $320? Solución 20 .30854 – 0.15866.15866 x 60 = 9. Interpretación: alrededor de 10 alumnos (15.02 0. Desv. Media=80.Φ(1.4 alumnos (2.286 0. si éste dura 90 minutos.5) = 10 10   10 = Φ(-0.80 X + 50.87%) no terminan el examen. pero en menos de 75 minutos.0) = 0.50) . Suponga que el ingreso familiar mensual (X) en una comunidad tiene distribución normal con media $400 y desviación estándar $50.5 alumnos Rpta.00 60 75 80 X = tiempo duración examen Luego nP = 0.6%) terminan el examen en más de 60 minutos.  60  80 X  80 75  80    b) P = P(60 ≤ X ≤ 75) = P  = P(-2 ≤ Z ≤ -0. Luego nP = 0.28579 x 60 = 17 alumnos Rpta.0) = 1 .03 0. entonces la media y la varianza de C son:  C  E(C)  0. 21 .80 X + 50.64(2500)  1600  402 2 Luego C ~ N(370. X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 .  12  3 X2 ~ N (12 .6% de (ó en 1057 de cada 10000 familias) los gastos de consumo familiar en la comunidad son menores a S/.8 Var ( X )  0.10565 40  40  Rpta. Si Y = X1 . Entonces:  C  370 320  370  P(C < 320) = P    = P(Z < -1. Otra forma de resolver es usando la propiedad reproductiva de la distribución normal. 320. X2 ~ N (12 .2 X2 + X3 . 3 ) .  22  4 X3 ~ N (14 .8E( X )  50  0.10565 Rpta.25) = 0. 3 ) 1  10 . 6 ) 3  14 . Se pide: a) Hallar la media y la varianza de Y .25) = Φ(-1. 4 ) y X3 ~ N (14 .8(400)  50  370   C2  Var (0.25) = 0.25) 50  50  = Φ(-1.  Z = (C – 370)/ 40 ~ N(0. Interpretación: el 10.5) =  X  400 337. Se pide: P(C < 320) = P(0. b) Ca1cule e interprete P  8  Y  10 Solución X1 ~ N (10 . Sí C = 0.  Z = (X – 400)/ 50 ~ N(0. 502).   Y2  V (Y )  V ( X1  2 X 2  X 3 )  V ( X1 )  4V ( X 2 )  V ( X 3 )  Y2  12  4 22   32  3  4(4)  6  25 Rpta. 10. 6). 4 ) 2  12 . 1). 402). Sean Xl .5  400  = P   = P(Z < -1. 1).Si X = ingreso familiar mensual ~ N(400.8 X  50)   0.80 X + 50 < 320) = P(X < 337.  32  6 a) Cálculo de la media y la varianza de Y  Y  E Y   E  X1  2 X 2  X 3   E( X1 )  2E( X 2 )  E( X 3 ) = Y  1  22  3  10  2(12)  14  0 Rpta. X2. 11.b) Cálculo de la P  8  Y  10 Sabemos que Y  0 y  Y2  25   Y  5 .Φ(-1.0 ≤ Z ≤ 2. Luego:  8  0 Y  0 10  0  P  8  Y  10  P     P  1.  1 = 8 . 1). = 1 2 3 4   4 2 2 2 4    2   1 1 1 1 E  X1   E  X 2   E  X 3   E  X 4  4 2 2 2 μY = E(Y) = =  1 1 1 1 (30)  (25)  (12)  (8)  10 4 2 2 2  Y2 = V (y) = 1 V ( X )  1 V ( X )  1 V ( X )  1 V ( X ) 1 2 3 4 16 = 4 4 4 1 1 1 1 (8)  (6)  (6)  (2)  4 16 4 4 4 Siendo Y una combinación lineal de las variables independientes Xi cada una con distribución normal. Luego:  8 10 Y 10 14 10    a) P 8  Y  14 = P  = P (-1. 25]  Z = (Y – 0)/ 5 ~ N(0.  4 = 2. Sean X1. entonces por la propiedad reproductiva de la distribución normal se cumple que Y ~ N [10.  3 = 6 . Sí:  X  2X 2   X3  X4  Y=  1  - 2  4     Calcule e interprete: a) P 8  Y  14 y b) P  Y  12 Solución: X X X X  X  2X 2   X3  X4  Y =  1 . Interpretación: alrededor del 92. 1).60) = 0.6  Z  2  5 5   5 = Φ(2. X3 y X4 variables aleatorias normales independientes con μ1 2 2 2 2  30.92245 Rpta.97725 – 0.Φ(-1.0) .15866 = 0.0) = 2 2   2 = Φ(2. 22 . μ3 = 12 .0) = 0. Además Y ~ N [0.  2 = 6 .97725 – 0. 4]  Z = (Y – 10)/ 2 ~ N(0.0) .05480 = 0.81859 Rpta.25% de los valores observados de Y se encuentran entre -8 y 10. μ2 = 25 . μ4 = 8 . 97725 – 0.0) = Φ(2. En los sistemas en que se utilizan. En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que ajustarse a una abertura circular seleccionando cada elemento al azar en un suministro continuo. Los diámetros del tapón y de los casquillos en mm. Si para que el ajuste sea 23 .0 ≤ Z ≤ 2.8) = 0. 0.73% de los valores absolutos de Y son menores o iguales a 12. 0.0) = = 0. 1).8) = Φ(-1. ¿Qué proporción de condensadores fallará por sobre calentamiento? Interprete el resultado. la temperatura máxima (en °C) a que se sujeta un condensador individual es N(116. 16). varias pruebas han demostrado que la temperatura más alta (en °C) que pueden soportar es N(125. 16) Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0. 25)  Z = ( F – U – 9)/ 5 ~ N(0. así: F – U ~ N(9. 9) y U = temperatura máxima de uso ~ N(116. En el proceso de fabricación de condensadores.9. 9).  12 10 Y 10 12 10  b) P  Y  12 = P  12  Y  12  = P  =   2 2   2 = P (-11.97725 Rpta. 12.042 ) respectivamente. Interpretación: alrededor del 97. Solución Sean: F = temperatura más alta de fabricación ~ N(125.86% de los valores de Y se encuentran entre 8 y 14.Interpretación: el 81.Φ(-11.59% de los (ó 359 de cada 10000) condensadores fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.00000 = 0. son N(24.0) . Interpretación: alrededor del 3.0.03593 Rpta. Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0) determinamos la distribución de F – U usando la propiedad reproductiva de la distribución normal. 13. Entonces:  F  U  80 0  9  P(S) = P(F < U) = P(F – U < 0) = P   = 5 5   = P(Z ≤ -1.032 ) y N(25. 0162) y 9 L = longitud del recipiente con 9 pastillas = X i 1 i . Si las nueve pastillas se ensamblan al azar.29 = 9 x 0. usando la propiedad reproductiva de la distribución normal se tiene que: µX = E(X) = E(C – T) = E(C) – E(T) = 25. ¿en qué proporción de los casos el ajuste no será satisfactorio? Interprete el resultado.016cm.05 ~ N(0.290 cm. ¿qué proporción de estos no se ajustará en el espacio requerido? Interprete el resultado.61 cm.9. se tiene que: 9 E(L) = E(  X i ) = i 1 9  E( X i ) = i 1 9  0.02  0. en un recipiente que ocupa una longitud no mayor de 2.05 Rpta.9 = 0.0548 0. 0.8) = Φ(-1.10  P(X < 0.05   0. i1 24 .10 σ2X = V(X) = V(C – T) = V(C) + V(T) = 0. Luego: X = claro del diámetro = C – T ~ N(0.48% de los (ó en 548 de cada 10000) ensambles el tapón no se ajusta al casquillo. 0. (claro del diámetro = diámetro del casquillo – diámetro del tapón) Solución Sean: T = diámetro del tapón ~ N(24. Nueve de estas pastillas deben ajustarse.02. 1).042) Si X = claro del diámetro = C – T.052.6) = 0.02 mm.052)  Z = (X – 0. Entonces:  X  0.0009 +0. Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en serie y puede suponerse que sus longitudes siguen una distribución normal con media 0.10)/ 0. 14. Interpretación: en alrededor del 5. extremo con extremo.10.10 0.02) = P    = P(Z ≤ -1.0 – 24.0016 = 0.670 cm.0025 = 0. 0.29 = 2. 0. Solución Sean: Xi = diámetro de las pastillas ~ N(0. y desviación estándar 0.032) y C = diámetro del casquillo ~ N(25.satisfactorio se requiere un claro de diámetro de cuando menos 0.29. Que el ajuste no sea satisfactorio implica que X < 0. Por la propiedad reproductiva de la distribución normal. . X2 ..0162 = 0.. …. i1 Luego: 9 L = longitud del recipiente con 9 pastillas = X i 1 i ~ N(2... .67  2.89435 = 0. Suponga que las variables aleatorias X1 .41) 25 .. 2.67) = 1 – P(L ≤ 2.. 1). Interpretación: en alrededor del 10. i = 1. …. los mismos que se usan de la siguiente manera: tan pronto como falla el primer tubo...002304 cm2.41 ≤ Z ≤  i 1  = P 500 x 50) 500 x 50)   500 x 50)     1.048 = 1 . Por lo tanto:  L  2.0002304)  Z = (L – 2. Sea Y50 = tiempo de funcionamiento de los 50 tubos = 50 = X1  X 2  . .67.P   = 0.Φ(1. por el teorema del límite central la probabilidad solicitada es: P(20 000 ≤ Y50 ≤ 30 000) = 50    20000  50 x500  X i  50 x500 30000  50 x500   = P(-1. 50.25) = 1 ..P(Z ≤ 1. empieza a funcionar el segundo y cuando falla el segundo empieza a funcionar el tercero.25) = 1 . σ2 = 1/ λ2 = 5002] i = 1. etc. 0.  X 50   X i i 1 Entonces...61  P(L > 2. ¿Cuál es la probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido entre 20 000 y 30 000 horas? Interprete el resultado.61 2. Suponga que los Xi.56% de los (ó en 1056 de cada 10000) recipientes con 9 pastillas. 2.61)/ 0. X50 representan la vida útil de 50 tubos electrónicos.61. Las 9 pastillas no se ajustan al espacio requerido si L > 2. éstas no se ajustan en el espacio requerido. 50 tienen distribución exponencial con parámetro λ = 1/500..9 V(L) = V(  X i ) = i 1 9 V ( X i ) = i 1 9  0.. Solución Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500) Entonces µ = E(Xi) = 1/ λ = 500 .048   0.048 ~ N(0.016 2 = 9 x 0.0.67) = 1 .10565 Rpta.. 15.. En una ciudad grande el 20% de los hogares no tiene desagüe.. si el hogar no tiene desagüe ~ Bernoulli [p = 0...04 lts..] Sea Y36 = contenido por caja de las 36 botellas = 36 = X1  X 2  .  X 36   X i i 1 Entonces. npq = i 1 16] Entonces.. Interpretación: alrededor del 0.. σ = 0.00621 Rpta.99379 = 0.92073 – 0.Φ(2..= Φ(1.41) .41) = 0. entre los 100 elegidos = 100 = X1  X 2  . Si se eligen 100 hogares al azar.  X100   X i ~ B[n = 100.04 36   0... Calcule e interprete la probabilidad que una caja contenga más de 36..6  36 x1  =  P(Y36 > 36. calcule e interprete la probabilidad de que más de 30 hogares no tengan desagüe.P  i 1 0.6 litros.Φ(-1.5) = 1 – 0.. por el teorema del límite central la probabilidad solicitada es:  36    X i  36 x1 36..04.04 36     = 1 – P(Z ≤ 2.6 litros..84146 Rpta..P(Y36 ≤ 36. por el teorema del límite central la probabilidad solicitada es: 26 . 17. p = 0.20] ó N[np = 20. Para la distribución se acomodan en cajas de 36 botellas.62% de las (ó en 62 de cada 10000) cajas con 36 botellas de aceite el contenido es de más de 36...6) = 1 .6) = 1 .20] Sea Y100 = el total de hogares sin desagüe. Solución Sea Xi = contenido de las botellas de aceite ~ [µ = 1.5) = 1..07927 = 0. 16.. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y una desviación estándar de 0.15% de los (ó en 8415 de cada 10000) tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30 000 horas.... Solución Sea Xi = 1. Interpretación: en alrededor del 84.. 15 100     = P(Z < -2.62% de los (ó en 62 de cada 10000) grupos de 100 hogares escogidos.. reciba un peso total de menos de 697 kilos? Interprete su resultado.02275 Rpta.. ¿Cuál es la probabilidad de que un vendedor cualquiera de estos tomados al azar..5) = 1. La Constructora “Techito” estima que el peso promedio de las personas que vivirán en un edificio de apartamentos es de 68 Kg.80 100   0. más de 30 hogares no tienen desagüe.. y una desviación estándar de 0.0) = Φ(-2. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. Solución 27 . Este lote debe ser entregado a los vendedores minoristas a razón de 100 cada uno. 19.20 x0.20 30  100 x0.P(Y100 > 30) = 1 - P(Y100 ≤ 30) = 1 -  100    X i  100 x0... Interpretación: en alrededor del 0. 18.15 100   0.00621 Rpta.5) = 1 – 0.  X100   X i i 1 Entonces. con una desviación estándar de 15 Kg.20  = P  i 1  0.28% de los (ó 228 de cada 10000) vendedores minoristas recibe un peso total menor a 697 Kg.99379 = 0.0) = 0.. Si la estimación es correcta...15 Kg.Φ(2. Interpretación: alrededor del 2.15 Kg.20 x0.80 100     = 1 – P(Z ≤ 2. De acuerdo con la estimación.. por el teorema del límite central la probabilidad solicitada es:  100    X i  100 x7 697  100 x7   =  P(Y100 < 697) = P  i 1 0... σ = 0. Solución Sea Xi = peso de los pavos ~ [µ = 7. calcule e interprete la probabilidad de que un cupo completo exceda la capacidad del ascensor. instala en el edificio un ascensor para 36 personas con capacidad máxima de 2700 Kg.] 100 Sea Y100 = peso total de los 100 pavos = X1  X 2  . ] 36 Sea Y36 = peso total de las 36 personas = X1  X 2  ..8) = 1 – 0.P  i 1 0. Solución Sea Xi = contenido de las botellas de ron ~ [µ = 2..8) = 1. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una desviación estándar de 0..36 litros...99744 = 0.P  i 1 15 36 15 36       = 1 – P(Z ≤ 2..36 litros. por el teorema del límite central la probabilidad solicitada es:  36    X i  36 x68 2700  36 x68  =  P(Y36 > 2700) = 1 .  X 36   X i i 1 Entonces.018 lts.018. Interpretación: alrededor del 0. Interpretación: alrededor del 0.] Sea Y36 = contenido por caja de las 36 botellas = 36 X1  X 2  .Φ(3. σ = 0.36  36 x 2   =  P(Y36 > 72..99957 = 0...00256 Rpta.Sea Xi = peso de las personas ~ [µ = 68.36) = 1 ..P(Y36 ≤ 72....P(Y36 ≤ 2700) = 1 .. 20.36) = 1 .26% de los (ó en 256 de cada 10000) cupos completos del ascensor con 36 personas exceden su capacidad máxima de 2700 Kg. σ = 15 Kg...018 36     = 1 – P(Z ≤ 3.. Calcule e interprete la probabilidad que una caja contenga más de 72. 28 ..33) = 1 – 0.04% de las (ó en 4 de cada 10000) cajas con 36 botellas de ron contienen más de 72...33) = 1.Φ(2.018 36   0.00043 Rpta.  X 36   X i i 1 Entonces.. Para la distribución se acomodan en cajas de 36 botellas.. por el teorema del límite central la probabilidad solicitada es:  36    X i  36 x2 72. Hallar el valor de z para los casos siguientes: a) Φ(z) = 0. 2.9222 c) Φ(z) = 0.80 < Z < 1.99 e) el área a la izquierda de z es 0.15) b) P(0. 10.38) f) P(-2. 29 . 4.50.65) e) P(Z ≥ -1. b) Se encuentre entre S/.05 f) el área a la derecha de z es 0.50 y 13. b) Menos de 985 ml. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene distribución normal con media µ= S/. 12 y desviación estándar σ = S/.45 < Z ≤ 1. Hallar las probabilidades siguientes: a) P(Z ≤ 2.65) d) P(-2.80.33).57 ≤ Z < 0) g) P(0 ≤ Z < 2. 1)]. Calcule e interprete la probabilidad de que el precio pagado por el kilo de pescado: a) Sea menor de S/.025 3.EJERCICIOS PROPUESTOS 1. Calcule e interprete la probabilidad de que una botella de gaseosa tenga: a) Entre 990 y 1005 ml. El contenido en las botellas de cierta gaseosa tiene distribución normal con media µ= 1000 ml. c) Por arriba de que precio paga el 10% superior de los consumidores.75 ≤ Z ≤ -0.96) c) P(-2. 0.9972 d) el área entre –z y z es 0. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0. Sea Z una variable aleatoria normal estándar [Z ~ N(0. 10.8665 b) Φ(z) = 0. 1)]. y desviación estándar σ = 5 ml. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg.5 Kg. Si se almacenan 2000 huevos.X2. El tiempo que dura la atención a los clientes de un negocio se distribuye normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos. b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones. calcule e interprete: a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar? b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar? 10. El volumen de ventas diarias de bolsas de azúcar de la comercializadora “Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación estándar σ = 100. 6. Si compra 2000 de estos focos. y desviación estándar σ = 0. μ2 = 35. Calcule e interprete la probabilidad de que el tiempo de atención a los clientes: a) dure entre 25 y 40 minutos.  1 = 10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con 2 2 μ1  50. calcule e interprete ¿qué cantidad de cajas pesan: a) menos de 19 kilos? b) entre 19. Calcule e interprete: a) La media y la varianza de Y b) P 10  Y  25 30 . Si: Y = X1 .5. En un período de 60 días. calcule e interprete ¿qué cantidad de huevos pesan: a) Menos de 70 gramos? b) Entre 55 y 60 gramos? 8.  2 = 6. Si se almacenan 2000 cajas.5 y 21 kilos? 7. La duración de ciertos focos eléctricos tiene distribución normal con media µ= 1000 horas y desviación estándar σ = 200 horas. y desviación estándar σ = 5 gr. El peso de los huevos de gallina producidos por una avícola se distribuye normalmente con media µ= 65 gr. calcule e interprete: a) ¿Cuántos focos durarán menos de 600 horas? b) ¿Cuántos focos durarán entre 850 y 1300 horas? 9. Calcule e interprete la probabilidad de que el peso de 410 cajas recibidas al azar y cargadas en un camión.250 kg. 18.  2 = 4. Si se escogen 100 hogares. calcule e interprete la probabilidad que más de 30 no tengan agua. ¿Cuál es la probabilidad de que una pollería. 14. supere su capacidad máxima que es de 8. cualquiera 31 . Este lote debe ser entregado a las pollerías a razón de 100 cada una. 2002 ) y N(2878. μ2 = 15.980 kg. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50 kilos y una desviación estándar de 1. Las cajas con naranja tienen un peso medio de 15 Kg.4 kilos. μ3 = 12. En una ciudad grande el 20% de hogares no tiene agua.5 kilos. 2502 ) respectivamente. 17. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190. y una desviación estándar de 0. Calcule e interprete la probabilidad de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos. Sean X1. Calcule e interprete la probabilidad de que el peso de 400 cajas tomadas al azar sea menor de 5. y una desviación estándar de 750 gr. calcule e interprete la probabilidad de obtener entre 40 y 60 caras.11. Al lanzar una moneda 100 veces. 15. 16. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. Sí: Y = X + 2 X con μ1  10. Las cajas con limón tienen un peso medio de 20 Kg. ¿cuál es la probabilidad que los A duren un año o más que los B? Interprete su resultado.05 Kg.  1 = 3. 13. Si se prueba la vida de cada uno de los teléfonos correspondientes a cada una de las marcas. y una desviación estándar de 0. X2 y X3 variables aleatorias independientes distribuidas normalmente 2 2  32 = 6. 1 2 X3 Calcule e interprete: a) P  20  Y  40 b) P Y  18 12. Calcule e interprete la probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un montacargas. Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg.5 kilos? Interprete su resultado. reciba un peso total de menos de 98. 19. Este lote debe ser entregado a los supermercados a razón de 100 cajas cada uno.? 32 .5 Kg. 20. reciba un peso total de menos de 1 990.2 Kg. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de 580 libras y una desviación estándar de 80 libras. y una desviación estándar σ = 0. Calcule e interprete ¿la probabilidad de que un supermercado cualquiera.de estas tomada al azar. supere su capacidad de 30 000 libras. Xn ) de una población de tamaño N y se busca alguna función de esta muestra que estime el parámetro desconocido θ. La estadística es una ciencia importante porque permite el conocimiento de la población basándose en muestras aleatorias representativas. 33 . . Para ello. a la proporción.. Si se conoce θ.1 2. θ) conocida o supuestamente conocida. Distribución muestral del total (conocida la proporción) Distribución muestral de la diferencia de proporciones... Ejercicios resueltos. problema que será abordado con mayor detalle en el capítulo de estimación.. a la diferencia de medias..5 2. DISTRIBUCIONES MUESTRALES “¿Hace falta remarcar que un país que no conoce su demografía.4 2.3 2. menos aún se puede contar la producción.2 2. el factor trabajo.. En un país donde no se puede contar a los hombres.Capítulo 2. .8 Distribuciones muestral de la media.7 2. En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n ≥ 30 ) referidas a la media. a la diferencia de proporciones y a los totales (conocida la distribución de la media y la proporción). la distribución de probabilidad queda determinada. Ejercicios propuestos.. X2 . Distribución muestral de la proporción. se toma una muestra aleatoria de tamaño n (X1 .” José Carlos Mariátegui CONTENIDO 2. Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte fundamental para poder comprender el desarrollo de la estimación por intervalos y la docimasia de hipótesis a tratar capítulos más adelante.6 2. tampoco conoce su economía? No se puede saber lo que un país produce y ahorra si se ignora esta cosa fundamental: la población. A continuación se desarrolla cada uno de los conceptos importantes de las distribuciones muestrales. Distribución muestral del total (conocida la media) Distribución de la diferencia de medias muestrales. con parámetro θ desconocido. El principal problema de la estadística es estudiar una población con función de cuantía o función de densidad. . Se desconoce el primero de sus factores: el factor humano. f(x. Una muestra aleatoria (m.. es importante en estimación puntual.es una parte representativa de la población. Xn está dada por: n f X1 ... Por lo tanto la función de probabilidad conjunta de la muestra aleatoria X1 . . Xn ) que cumplen: 1.. Relacionado al ejemplo anterior.... tamaño de muestra. etc. X n )  f X ( X 1 ) f X ( X 2 ). . la muestra vendría dada por una parte representativa de empresas u hogares. . la misma media  X i = E(Xi) = E(X) N = μ con   N 2  (X i 1 i X i 1 N i y la misma varianza  X2 I = V(Xi ) = V(X) =   )2 N . selección de la muestra y propuesta de estimadores (fórmulas)... tienen la misma distribución de probabilidades f X i ( x)  f X ( x) . n) tiene la misma distribución que X..) de tamaño n de X. ya que allí representa la función de verosimilitud a maximizar. Muestra. f X ( X n )   f X ( X i ) . La representatividad implica adecuado: método de muestreo. Es decir. 2. . en todas las empresas podemos estudiar: el número de trabajadores. Por ejemplo.. 2... la misma función de distribución acumulativa FX i ( x)  FX ( x) . es el conjunto de todas las observaciones posibles que puede tomar una variable aleatoria X..Sea X una variable aleatoria con distribución de probabilidad f(x) (función de cuantía o función de densidad) con media μ y varianza σ2. las ventas. es un conjunto de n variables aleatorias (X1 ...... en todos los hogares podemos estudiar: los ingresos... . Nota: 34 . etc. los gastos.. Cada Xi (i = 1.. .. . 2. Muestra Aleatoria. Es decir.es el conjunto de todas las unidades de análisis (individuos u objetos) a ser observadas y que poseen una característica común.. Las variables aleatorias Xi (i = 1. . i 1 Esta probabilidad de ocurrencia de la muestra observada. X n ( X 1 .. X 2 . X 2 . n) son independientes....Población. X2 . X2 .a. .. hallar la función de probabilidad conjunta (función de verosimilitud) para dicha muestra.. Xi = 0.Si se toma una m. X2 . X n )  f X ( X 1 ) f X ( X 2 )..2. .. ... i  1. n . σ2 ).Si se toma una m.... Xi = 0. 2.a. .. 3. entonces Xi probabilidad es: f X ( X i )   X e  i ~ Poisson (λ) y su función de . Xn no son independientes.. Sin embargo..  i = 1. . Solución: 35 . se cumple cuando la muestra proviene de una población infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de una población finita..a. con parámetro λ. X 2 .. 2. de tamaño n...a. 1.a.a.. f X ( X n ) = n  i 1  X e  i X i!   X n e     X1 e     X 2 e     . i Rpta.. 3. hallar la función de probabilidad conjunta (función de verosimilitud) para dicha muestra... ya que las v. ... X 2 . X ~ Poisson (λ). si el tamaño n de la muestra es muy pequeño en comparación con el tamaño N de la población (n < 5% N ) se cumple aproximadamente la definición.. Solución: Como la v. 2.. de tamaño n.X n ( X 1 . X i! Luego la función de probabilidad conjunta (función de verosimilitud) será: f X1 .n .. .. 1.. La definición de m..  La definición de m.. no se cumple cuando el muestreo es sin reemplazo de una población finita.. . de una población X con distribución de Poisson. X1 .a. Ejemplo 1..... de una población X con distribución N(μ .. Ejemplo 2.. =  =    X 1!   X 2 !   X n!  n Xi  i 1 =  e n n X ! i 1 . con media E(X) = E(Xi ) = μ y varianza Var (X) = Var (Xi) = σ2. X 2 .Como la v. Donde: n X  n  Xi i 1 n s2  y ( X i 1 i  X )2 n 1 Distribución muestral. Rpta. X ~ N(μ . ... X2 ... X2 .  2 2 2  2   2   2  = n 2  1  e = 2  2   n ( X i   ) 2 / 2 2  i 1 .. .. entonces: E (X )   y  X2  Var( X )  2 n X i 1 n i la .  i = 1. 3.. f X ( X n ) =  1 2 2   1 2 2   2 2  1 e ( X n   ) / 2  = e ( X1  ) / 2   e ( X 2  ) / 2  . . Así. n. Xn es una m... n... . Xn una muestra aleatoria sin reemplazo de tamaño n de una población X de tamaño N.Sea X1 . . Estadístico.. .. 2. X n )  f X ( X 1 ) f X ( X 2 )...  xi  . .. 2. con media E(X) = μ y varianza Var (X) = σ . X 2 .. entonces la media muestral ( X ) y la varianza muestral (s2 ) son estadísticos.. si X1 .. Xn una muestra aleatoria de tamaño n de una n población X. σ2 ) y su función de probabilidad está dada por: 1 f X (Xi )  2 2 e ( X i   ) 2 / 2 2 .a....es el coeficiente de variación de la distribución muestral de un estadístico. Entonces: E (X )   y 2  N n S2  N  n    Var( X )     . Error estándar de un estadístico.Sea X1 .  i = 1.es la desviación estándar de la distribución muestral de un estadístico.....a. de una población X. σ2 )... Teorema 2... entonces Xi ~ N(μ .X n ( X 1 ... n  N 1  n  N  2 X 36 . X2 .. ...es la distribución de probabilidad de un estadístico.es una variable aleatoria que depende sólo de la muestra observada.. 3..  X i  . Error relativo de un estadístico. Luego la función de densidad conjunta (función de verosimilitud) será: f X1 . . Teorema 1. . Sea X  2 media muestral. Si X1 .. N 1 A continuación presentamos las distribuciones muestrales de la media. van a permitir la determinación de intervalos de confianza y la verificación de hipótesis para los parámetros poblacionales. representa la cuasivarianza poblacional y el factor N 1 N n se llama factor de corrección para poblaciones finitas (f. X  N (. del total (conocida la media). Xn es una muestra aleatoria de tamaño n de una población X. Todas ellas de suma importancia en el diario quehacer de muchos campos de la investigación científica. Entonces. cuando el tamaño de la muestra n ≥ 30. X2 .N Donde: S2  ( X i 1 i   )2 . por el n teorema central del límite. Y la variable aleatoria Z  ( X  ) tiene aproximadamente distribución N(0. . Si la población es normal.. la variables aleatorias Xi no son independientes. con media E(X) = μ y varianza Var (X) = σ2. / n Este teorema es válido para cualquier población finita o infinita. entonces la distribución de X es hipergeométrica. del total (conocida la proporción) y de la diferencia de proporciones. .c. 1). se cumple cualquiera sea el tamaño n de la muestra.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA Teorema 3. de la diferencia de medias muestrales. 2.p. ya que como estudiaremos más adelante.05  0.f... la media muestral X  X i 1 n i tiene aproximadamente distribución normal con media μ y varianza σ2/n.) el mismo que N 1 es f  descartado cuando n  0. Luego: n  N 1  37 . de la proporción. Cuando la población es finita de N elementos y el muestreo es sin reemplazo. 2 / n) . con: E (X )   y  X2  Var( X )  2  N n   .97  N la fracción de muestreo (f ) N n  1. discreta o continua. b) la probabilidad que el precio medio muestral sea inferior a S/.00 . y c) dentro de que límites simétricos alrededor del precio promedio verdadero se encontrará el 95 % de los precios promedios muestrales..85  5.00427 = 0.00 4.00    a) P(4. σ = S/.0.Teorema 4. se encuentran entre S/.95994 – 0.51)  0.85 y 5. b) P( X < 4.75) =  (1. 1).057.40)2 / 50 = 0. 5.63  Z  1.En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio promedio de S/.10  5.63) = = 0.  N n n N 1 variable aleatoria Z  Ejemplo 3.057 0.567% de los precios promedios muestrales de las botellas de aceite “primor” de un litro. X2 . . para muestras de 50 precios.40.10.. S/. ( X  5.057 0..0032 Luego: X  N (5. 4. Y la n  N 1  ( X  ) tiene aproximadamente distribución N(0.057 38 .Como datos del problema se tiene que: μ = S/.0032) y Z    X  0.80  5.80.057   . .057 = P(-2. Interpretación. 0. (-2.00. 5.40 y n = 50.85  X  5. Xn es una muestra aleatoria de tamaño n extraida sin reemplazo de una población X finita de tamaño N.00022 0.95567 Rpta.  X2  Var( X )  2 n = (0. 4.057  4.. 4.Si X1 .10) = P = 0.10. la media muestral X  2 X i 1 n i tiene aproximadamente distribución normal con media μ y varianza   Var( X )  2 X 2  N n   . 0. Entonces.el 95.00 X  5.00 5.75) . Si se toman muestras aleatorias de 50 precios.1) .00  )  P( Z  3. se pide calcular e interpretar: a) la probabilidad que el precio promedio muestral se encuentre entre S/.00 y una desviación estándar de S/.00)  N (0.85 y 5. con media E(X) = μ y varianza n Var (X) = σ .. Solución.80) = P( X  5. Nos piden: 0. .975  1.Interpretación. conocida la media muestral. dentro de los cuales estará el 95 % de las X .2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media) En muchas situaciones vamos a estar interesados en efectuar estimaciones de un total poblacional. será inferior a S/.00 – E y 5. 1) N X Donde la varianza del estimador del total está dada por: 39 .057  E  Z 0.11 = S/.00 – E= 5. llegamos al resultado siguiente: Xˆ  Nˆ  NX  N N . para lo cual se tiene que tener presente lo siguiente: N  Sí el promedio poblacional es: X i 1 i N n El total de la población se define como: X   X i  N i 1 Xˆ  Nˆ  NX el cual es estimado por: Utilizando la propiedad reproductiva de la distribución normal.057   0..el 0.057 5.00 – 0.11. el teorema central del límite y los operadores esperanza y varianza para el estimador de total. Luego los límites serán: 0.057   0.11 .00.057   0. 5. 2.00.89  X  5. 4. para muestras de 50 precios.975   0.95 = P(5.00 + E) = P( E E Z ) 0. c) Sean 5.96  E  1.057 0.95 = P(4. Es decir: 0. Entonces: 0.80.057  E   E   E   E  =       2    1     0.00 – E  X  5. para muestras de 50 precios.el 95 % de los precios promedios muestrales de las botellas de aceite “primor” de un litro.057 )  0. 4. se encuentran entre S/.96(0.11) Interpretación.89 y 5.89 y 5.11 = S/. 5.11 alrededor de μ = S/. 5. N 2 X2  y Z NX  N ~ N(0.00 + 0.00 + E los límites simétricos alrededor de la media μ = S/. 4.022% de los precios promedios muestrales de las botellas de aceite “primor” de un litro. 3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES Esta distribución va a surgir cuando estemos interesados en efectuar la comparación de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio poblacional de un bien o servicio en la ciudad X (μX ) y el precio promedio poblacional del mismo bien o servicio en la ciudad Y (μY ). Y2 .. sino también entre grupos. con media E(X) = μX n media muestral X  X i 1 i tiene aproximadamente distribución normal: n X  N ( X .. de la siguiente manera:  Sea X1 . no sólo entre ciudades. X2 ) . . si la fracción de muestreo f = n / N > 0. Ym una muestra aleatoria de tamaño m.. los rendimientos promedios. la misma que va a requerir tomar muestras aleatorias de ambas poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas. . O comparar los ingresos promedios. etc. . que esta comparación se reduce a conocer la diferencia de medias poblacionales. Sabemos que la tamaño N.. 2. X2 .. con media E(Y) = μY y varianza Var (Y) =  Y2 .05..05 . ventas promedios.... Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idéntico a plantearse ¿μX = μY o μX – μY = 0? o también ¿μ1 = μ2 o μ1 – μ2 = 0? Es decir. Var( Xˆ )  Var( Nˆ )  Var( NX )  N 2Var( X )  N 2 X2  N 2 n 2 si la fracción de muestreo f = n / N  0. Sabemos que la m media muestral Y  Y i 1 m i tiene aproximadamente distribución normal: 40 . de una población X de y varianza Var (X) =  X2 . . Donde:  X2   X2 o  X2  Var( X )  n  X2  N  n    . de una población Y de tamaño M. (1) n  N 1   Sea Y1 .  .. Xn es una muestra aleatoria de tamaño n. o  Var( Xˆ )  Var( Nˆ )  Var( NX )  N 2Var( X )  N 2 X2  N 2 2 N n n N 1 . ... Ejemplo 4. 1). y varianzas Var (X) =  X2 y Var (Y) =  Y2 . Y2 Y  N (Y . Si las poblaciones X e Y son normales. (3) Además. el teorema se cumple para cualesquier tamaño de muestra. respectivamente..  X2 Y ) y la variable aleatoria Z X  Y  (  X  Y ) )  X2 n   Y2 o Z X  Y  ( X  Y ) )  X2  N  n   Y2  M  m  tiene     n  N 1  m  M 1  m aproximadamente distribución normal estándar N(0 .. Donde:   m o 2 Y  Y2  Var(Y )   Y2  M  m    m  M  1  . Cierto día de producción se toman independientemente dos muestras al azar sin reposición... Sintetizamos lo expuesto hasta aquí en el teorema 5.Si X y Y son las medias de dos muestras aleatorias (de tamaños n y m) de dos poblaciones X e Y.  X2 Y ) Z y X  Y  (  X  Y ) )  X Y ~ N(0 .Y es una variable aleatoria con media: X Y  E X  Y   E X   EY   X  Y  X  Y y varianza:  X2 Y  Var X  Y   Var X   VarY    X2   Y2  X2  Y2 + n m  X2 Y = o  X2  N  n    M m   + Y  m  M 1  n  N 1  2 . y una desviación estándar de 20 gr...... 1) donde  X Y se obtiene a partir de (3)... entonces la distribución muestral de la diferencia de medias es aproximadamente normal N(  X  Y . con n = 500 y m = 800.. la aproximación a la normal para la diferencia de medias muestrales es óptima.. Si n y m son mayores o iguales que 30. Y2 ) .. (2)  De (1) y (2) tenemos que X . por la propiedad reproductiva de la distribución normal.Ciertas bolsas de café tienen un peso medio de 500 gr..Y ~ N(  X  Y . con medias μX y μY . de (1) y (2) se tiene que: X . Teorema 5. ¿Cuál es la probabilidad que los pesos medios 41 . Y < 1 ) = P( -1 < X .(-0.P    = 1 .Y  2) =   2  0 X Y  0 2  0 = 1 .62114 Rpta.Y > 2 ) = 1 . las diferencias de pesos medios serán mayores a 2 gramos. Luego:  X Y =  X  Y = 500 – 500 = 0. y  X = 20 gr.? Interpretar los resultados.en el 8.14 1. para muestras de 500 y 800 bolsas de café respectivamente. con μX = 500 gr.Y  2 ) = 1 .Y < 1) =  1 0 X  Y  0 1 0    = P  = P(-0.88  Z  0.75) .P(-1. (-1.en el 62.01% de las comparaciones. Interpretación. b) P ( X .14 1.Sea X la muestra de tamaño n = 500 bolsas de café.14 = (0..de las dos muestras difieran a) en más de 2 gr. Interpretación.14 1.[ (1.75) = 2 – 2 (0. para muestras de 500 y 800 bolsas de café respectivamente. 1).75)] = = 2 – 2  (1.81057 – 0.88) . con μY = 500 gr.3 y Además.3) y Z X Y  0 ~ N(0 .08012 Rpta.11% de las comparaciones. Sea Y la muestra de tamaño m = 800 bolsas de café.14 gr.14 Nos piden: a) P ( X .Y ~ N(0.14   1.P ( X .75  Z  1. y  Y = 20 gr.P(-2  X .75) = = 1 – [ (1. 1.18943 = 0.88) = 0. las diferencias de pesos medios serán menores de 1 gramo.75)] = 1 ..95994) = 0.  X2 Y =  X2  Y2 + n m = 202 202 =  500 800  X Y = 1.14   1. Solución. 1. X .75) – 1 +  (1.88) = 1. 1. 42 .? y b) en menos de 1gr. Notación: Además de la notación usada anteriormente. Xi = 0. Entonces: N N A   Xi y P X i 1 i 1 i representan el número total de unidades (A) y la N proporción (P) de unidades en la población que poseen una cierta característica.El porcentaje (o número) de clientes que compran más de 10 000 dólares mensuales. jóvenes (menores de x años) y adultos (de x años y más). Bernoulli: Xi = 1. empleados y desempleados. entonces la proporción muestral p definida como: n p X i 1 n i  X n 43 . aprueba y desaprueba. . si la unidad estadística observada posee la característica de interés (éxito). a favor y en contra.El porcentaje (o número) de personas que consumen un cierto producto. se desea estimar la proporción de unidades (P) o el número total de unidades (A) en la población que poseen una cierta característica o atributo que cae dentro de una clase definida. si se define la v.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o cuantitativos de la población en dos clases distintas (población dicotómica o binomial) tales como: éxitos y fracasos. estima a P. hombres y mujeres.a. . si la unidad estadística no posee la característica de interés (fracaso). caras y sellos. Por ejemplo. Suponga que se extrae una muestra aleatoria simple de tamaño n de la población binomial.2. se desea estimar: . En este caso.El porcentaje (o número) de ciudadanos que está a favor de un personaje. etc. . Binomial (n. P). es una media muestral de v. 1) PQ n Si el muestreo se efectúa sin reemplazo de una población binomial finita.  n   pP ~ N(0. representa la proporción de éxitos en la muestra y estima a la proporción de éxitos en la población P. donde no se utiliza). La proporción muestral p. Por lo tanto:   n   Xi  1 n 1 n 1 E ( p)  E  i 1    E ( X i )   P  (nP)  P n i 1 n  n  n i 1    n  n  X Var ( Xi )   i  i 1 i 1  Var( p)  Var n2  n    n  (propiedad de la varianza) n Var( X )  PQ i i 1 n  2 i 1 n 2  nPQ PQ    p2 2 n n n Luego: y p Z X i 1 n i  X n  PQ   N  P. Entonces: n p X i 1 n i  X n  PQ  N  n   N  P. Bernoulli con E(Xi ) = P y V(Xi ) = P Q. Es decir.a. que p tiene el mismo comportamiento de una media muestral X .   n  N  1   44 .n X = X i 1 i = número de éxitos en la muestra es una v.a. la distribución muestral de p sigue la distribución hipergeométrica y su varianza requiere el factor de corrección para poblaciones finitas (salvo que la fracción de muestreo f = n/N sea menor del 5%. Según el Censo Nacional de Talla en Escolares de 19991 la desnutrición crónica en el Perú era del 27. la proporción muestral: 1 Ministerio de Educación.9%. Noviembre de 2000. Solución. Resultados del II Censo Nacional de Talla en Escolares 1999. Como la fracción de muestreo n/N es menor de 0.Z y pP ~ N(0.314 = 0. Q = 0. 45 . N X= X i 1 = 574 314 niños y niñas desnutridos crónicos. 1) PQ  N  n    n  N 1  Ejemplo 5.426 desnutrición crónica.279 = proporción censal de niños y niñas con  N 2'059. entonces.05. i N P X i 1 N i  X 574.El mencionado Censo tiene los siguientes datos: N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población.721 = proporción censal de niños y niñas sin desnutrición crónica. Lima. Si se toma una muestra al azar sin reposición. de n = 1500 niños y niñas. Calcule e interprete la probabilidad que: a) la desnutrición crónica muestral se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la proporción verdadera de desnutridos crónicos se encontrará el 95% de las proporciones muestrales. Perú. Nutrición y Retardo en el Crecimiento. n = 1500 niños y niñas = tamaño de la muestra. 81 ) =  (1.95 = P(0.91435 Rpta.279 – 0.30  0.0116   0.0116  E   E   E   E  =       2    1     0.en el 91. Entonces: 0.279.279 + E) = P( E E Z ) 0.0116 PQ 0.96485 – 0.023 = 0.279 + 0.0116 = P( -1.256 y 0.96(0.en el 95 % de las muestras de 1500 niños y niñas a nivel nacional.279 ~ N(0.279 + E los límites simétricos alrededor de la proporción verdadera P = 0. Es decir: 0.279 – E y 0.64) = = 0.0116   0.30 ) = P    0.0001341 n Se pide calcular:  0.. (-1.05050 = 0.302 .0116  E  Z 0.279 0.279 p  0.279 p  0.023 .0116 )  0. Interpretación.44 % de las muestras de 1500 niños y niñas a nivel nacional.975   0.0116 0..302 alrededor de la proporción verdadera P = 0. b) Sean 0. Interpretación.0116 0.0001341  n   pP p  0.279 – E  p  0. la proporción de desnutridos crónicos se encontrará entre 0.975  1.64  Z  1. el porcentaje de desnutridos crónicos.n p y X i 1 Z n i  X n  PQ   N  P. 46 .279.279 – E = 0. 1)   0.023 = 0.279 .26  0.26  p  0.   N 0.96  E  1.256  p  0.95 = P(0.279  a) P ( 0.0116   0. 0.0116   0.256 y 0.0116 0.302 ) Rpta.81) . se encuentra entre el 26 y 30 %. dentro de los cuales estará el 95 % de las p. Luego los límites serán: 0. Entonces: N El total de la población se define como: A   X i  NP i 1 Aˆ  NPˆ  Np el cual es estimado por: Utilizando la propiedad reproductiva de la distribución normal. 1) N p Donde la varianza del estimador del total está dada por:  Var( Aˆ )  Var( NPˆ )  Var( Np)  N 2Var( p)  N 2 p2  N 2 PQ . o  Var( Aˆ )  Var( NPˆ )  Var( Np)  N 2Var( p)  N 2 p2  N 2 la fracción de muestreo f = n / N > 0. para lo cual se tiene que tener presente lo siguiente: N Sí P X i 1 N i representa la proporción (P) de unidades en la población que N poseen una cierta característica y A   X i el número total (A) de unidades que i 1 poseen dicha característica. el teorema central del límite y los operadores esperanza y varianza para el estimador de total. 47 PQ  N  n    . N 2 p2  y Z Np  NP ~ N(0. si n  N 1  . conocida la proporción muestral.2. n si la fracción de muestreo f = n / N  0. llegamos al resultado siguiente:  Aˆ  NPˆ  Np  N NP.5 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la proporción) En muchas situaciones vamos a estar interesados en efectuar estimaciones de un total poblacional.05 .05. . Por ejemplo: comparar la proporción poblacional de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporción poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ). (1)  Suponga que se extrae una muestra aleatoria simple de tamaño n2 de la población binomial 2. de tamaño N2 con una proporción de éxitos igual a P2. Sea X2 el número de éxitos en la muestra de tamaño n2 . sino también entre grupos. de tamaño N1 con una proporción de éxitos igual a P1. que esta comparación se reduce a conocer la diferencia de proporciones poblacionales.2. definida como p2  X2 n2 estima a P2 y para n2 suficientemente grande tiene aproximadamente distribución normal: 48 . entonces la proporción muestral de éxitos p1 .. definida como p1  X1 n1 estima a P1 y para n1 suficientemente grande tiene aproximadamente distribución normal: p1  N ( P1. Sea X1 el número de éxitos en la muestra de tamaño n1 .. Esta comparación se formula así: ¿Serán iguales las proporciones poblacionales de individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idéntico a plantearse ¿ P1 = P2 o P1 – P2 = 0 ? Es decir. Comparar las proporciones de aceptación no sólo entre ciudades. p21 ) . Donde:  p21  P1Q1 n1 o  p21  P1Q1  N1  n1    n1  N1  1  .6 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE PROPORCIONES Esta distribución surge cuando estemos interesados en efectuar la comparación de las proporciones de dos poblaciones. entonces la proporción muestral de éxitos p2 . la misma que va a requerir tomar muestras aleatorias de ambas poblaciones y estudiar el comportamiento de la proporción muestral en cada una de ellas y de la diferencia p1 – p2 de la siguiente manera:  Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población binomial 1.. . 1) 2 donde  p1  p2 se obtiene a partir de (3).. respectivamente.. (2)  Siendo p1 y p2 variables aleatorias independientes. p22 ) .... entonces la distribución muestral de la diferencia de proporciones p1 . Teorema 6.. por la propiedad reproductiva de la distribución normal. 49 p1  p2  ( P1  P2 ) P1Q1 P2Q2  n1 n2 o tiene aproximadamente distribución . 1). cuyas distribuciones están dadas en (1) y (2) tenemos que p1 – p2 es una variable aleatoria con media:  p  p  E  p1  p2   E  p1   E  p2    p   p  P1  P2 1 2 1 2 y varianza:  p2  p  Var p1  p2   Var p1   Var p2    p2   p2 1 2 1  p2  p = 1 2 2 P1Q1 P2Q2 PQ  N  n  P Q  N  n2   + o 1 1  1 1  + 2 2  2 n2  N 2  1  n1 n2 n1  N1  1  ... Donde:  p22  P2Q2 n2  p2  o 2 P2Q2  N2  n2    n2  N2  1  ..  p21  p2 ) y Z la variable Z aleatoria p1  p2  ( P1  P2 ) P1Q1  N1  n1  P2Q2  N 2  n2      n1  N1  1  n2  N 2  1  normal estándar N(0 . Sintetizamos lo expuesto hasta aquí en el teorema 6.  p21  p2 ) Z y p1  p2  ( P1  P2 )  p p 1 ~ N(0 . (3) Además...Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños n1 y n2 ) de las poblaciones binomiales 1 y 2....p2  N ( P2 ..p2 ~ N(P1 – P2 . de (1) y (2) se tiene que: p1 – p2 ~ N(P1 – P2 .. 1) 0.P1 = 0.0011 .30 = 0.05 .05 ~ N(0 .35)(0.Si n1 y n2 son mayores o iguales que 30.  p21  p2 ) Con media:  p1  p 2  P1  P2 = 0. Ejemplo 6. n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades) Considerando que ambas ciudades son grandes y que las correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.35 = proporción de hogares que prefiere el producto en la ciudad 1.0331 . 0. Q1 = 1 – P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad 1.05 Y varianza:  p2  p = 1 2 (0.65) P1Q1 PQ  + 2 2 = = 0.65) (0.0011) y Z  p1  p2  ( P1  P2 )  p p 1 50 2  p1  p2  0. Si se toma una muestra aleatoria de 400 hogares de cada ciudad.35 – 0.30 = proporción de hogares que prefiere el producto en la ciudad 2.35)(0. 400 400 n1 n2 Luego: p1 – p2 ~ N(0.05) se tiene que: p1 – p2 ~ N(P1 – P2 .Una empresa que trabaja en ciudades grandes. ¿Cuál es la probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el producto en ambas ciudades sea menor al 8%? Interpretar el resultado. Q2 = 1 – P2 = 0. la aproximación a la normal para la diferencia de proporciones muestrales es óptima. considera que el nivel de aceptación de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un 30%.70 = proporción de hogares que no prefiere el producto en la ciudad 2. P2 = 0. Solución. 91) =  (0.08  0.Se pide calcular: P (p1 – p2  0..81855 Rpta.81859 – 0.05 p1  p2  0.08  0.93) = = 0.0331   0.08  p1 – p2  0.86% de las comparaciones. Interpretación.0331 0.93  Z  0.en el 81. 51 .00004 = 0.91) .0331 = P(-3. las diferencias de proporciones muestrales de hogares que prefieren el producto en ambas ciudades será menor al 8%. para muestras de 400 hogares de cada ciudad.05  = P    = 0.08 ) = P(-0.08) =   0. (-3.05 0. 7 EJERCICIOS RESUELTOS 1.. n i Luego la función de probabilidad conjunta o de verosimilitud será: f ( x1.  n Cxm p xm q n xm  m m    xi m xi =   n Cxi  p i1 q i1 . p) y su función de probabilidad es: f X ( xi )  n C x p xi q n xi .. 2.. x2 .. m .. hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra.... n .... 2.. con parámetro B. . n . . Solución Como la variable aleatoria X ~ B(n.. . hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra... xi = 0 y 1. hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra.. p).  i 1  m Rpta. . Si se toma una muestra aleatoria de tamaño n. 3...... Rpta..... xi = 0...n. xn )  f X ( x1 ) f X ( x2 ).. i  1...2. 1. x2 . i  1. 1. xi = 0 y 1. de una población X con distribución de Pareto.. Si se toma una muestra aleatoria de tamaño n. f X ( xn )  =  n Cx1 p x1 q n x1   n Cx2 p x2 q n x2  .. 3.. 2.. 2... xi = 0.  i = 1. X ~ Bernoulli (p)... con parámetros n y p... de una población X con distribución Bernoulli... . Si se toma una muestra aleatoria de tamaño m. Luego la función de probabilidad conjunta o de verosimilitud será: f ( x1. entonces cada Xi ~ B(n.. con parámetro p.  i = 1..  p xn q xn  n  xi = p i1 n q n  xi i 1 . f X ( xn )   p x1 q x1   p x2 q x2  . 52 . 2. 2. Solución Si la variable aleatoria... 2. m . de una población X con distribución binomial. entonces cada Xi ~ Bernoulli (p) y su función de probabilidad es: f X ( xi )  p xi q1 xi . xn )  f X ( x1 ) f X ( x2 ).  i = 1.... con parámetros μ y σ2.... X i  X 0 ... entonces cada Xi ~ LN (μ . x2 .. X ~ Pareto (B).. i  1. n.... . .. x2 . σ2 ). entonces cada Xi ~ Pareto (B) y su función de probabilidad es: f X ( xi )  BX 0B ... Luego la función de probabilidad conjunta o de verosimilitud será:  BX 0B  f ( x1. Rpta. . de una población X con distribución log-normal. n  X B 1  . f X ( xn )  =   2 2  2 2   2 2  1 1 1 e (ln x1   ) / 2   e (ln x2   ) / 2  .... 4. Luego la función de densidad conjunta o de verosimilitud será: f ( x1....Solución Si la variable aleatoria... 2.. Si se toma una muestra aleatoria de tamaño n. 3. xi  0. f X ( xn )   X B 1   1   BX 0B   BX 0B   B 1  ... σ2 ) y su f X ( xi )  función de probabilidad esta dada por: 1 xi 2 2 e (ln xi   ) 2 / 2 2 . hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra..... 2.. X i  X 0 . n. n . xn )  f X ( x1 ) f X ( x2 )..  B 1   X1   X1     B n X nB    n 0  . Donde: X iB 1 B = Coeficiente de Pareto > 0... xn )  f X ( x1 ) f X ( x2 ). i    i 1 Rpta.. Xo = Ingreso mínimo.. xi  0. 2.  e (ln xn   ) / 2  =  2 2 2  x1 2   x2 2   xn 2  n n (ln xi   ) 1  1  2  i 1 = n e  2 2  x   i 1 2 / 2 2 .  i = 1. Solución Como la variable aleatoria X ~ LN (μ .. 2.. i 53 . i  1.  X2  Var( X )  2 n = (0. b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales alrededor de la media poblacional? Solución Los datos del problema son: μ = 2.00    a) P(1.5) =  (1.00 2.  X2 ) = N(2..96 2.02 lts.02 0.00 2.9104 10 5 0 1.5.96  2.0  Z  0. Luego: X  N (  .=0.02275 = 0. 0.0004   X  0.91044 Rpta.02 lts.1) . (-2.93319 – 0.02   0.12 lts.03 X = media muestral Resultado gráfico en Minitab 54 .96 y 2. Distribución contenido medio de aceite Normal. Nos piden: 0.12 litros.00 X  2. Desv.Est. Las botellas de aceite para motor de carros tienen un contenido medio de 2. y n = 36 botellas.0) = = 0.03 litros.12)2 / 36 = 0. Media=2.0 lts.03) = P  = P(-2. σ = 0.0004) y Z  ( X  2. Si se toma una muestra aleatoria de 36 botellas. 20 Densidad 15 0.02  1.03  2.02 1. Calcule e interprete la probabilidad que: a) Las botellas tengan una media de llenado entre 1.0 litros y una desviación estándar de 0.96  X  2.00)  N (0.5) .00. 961  X  2.02   0.00 + E los límites simétricos alrededor de la media μ = 2.02 = 0.02   0.039) Rpta. y 2.039 = 1.  X2  Var( X )  2 n = (2.04% de las (ó en 9104 de cada 10000) muestras de 36 botellas de aceite para motor de carro de dos litros.0 lts.00 + 0.039 = 2.02   0.039 lts.0 lts..8.96 → E = 1. 55 .039 lts.00 – E y 2. b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales alrededor de la media poblacional? Solución Los datos del problema son: μ = 15 glns.en el 95% de las (ó en 9500 de cada 10000) muestras de 36 botellas de aceite para motor de carro de dos litros..96 x 0. el contenido medio está entre 1. Una estación de servicio de una ciudad grande ha encontrado que sus ventas semanales de petróleo tienen un promedio de 15 galones por cliente con una desviación estándar de 2. calcule e interprete: a) La probabilidad de que la compra promedio semanal de petróleo sea menor de 14 galones.039 lts.00 – 0.961 lts.00 + E) = P( E E Z ) 0..961 y 2.03 litros. Luego los límites serán: 0.975  0. σ = 2. dentro de los cuales estará el 95 % de las X . 6.00 – E = 2.02 0.95 = P(2. Interpretación.en el 91. el contenido medio está entre 1.4 glns. Es decir: 0.96 y 2.02  E   E   E   E  =       2   1      0. alrededor de μ = 2.8)2 / 49 = 0.16   X  0..00 – E  X  2.8 glns.95 = P(1.02 2.02  E  Z 0.975 = 1. b) Sean 2. Entonces: 0. Para una muestra aleatoria de 49 clientes. y n = 49 clientes.Interpretación. 97 glns.0 Densidad 0. 0.4  E  Z 0.4 = 1.03 Resultado gráfico en Minitab 56 .4  E   E   E   E  =       2   1      0.575 → E = 2. 1).03 glns. 0. dentro de los cuales caerá el 99 % de las X . Entonces: 0.621% de las (ó en 62 de cada 10000) muestras de 49 clientes de petróleo.en el 0..0 13.4   0.4 Interpretación.5) = 0. Media=15.4   0.97  X  16.2 0.995  0. Nos piden: 0.99 1.5) =  (-2.8 0. la compra media es menor a 14 galones. b) Sean 15 – E y 15 + E los límites simétricos alrededor de la media μ = 15 glns.03 = 16.99 = P(15 – E  X  15 + E) = P( E E Z ) 0.=0.4 0.03) Rpta. Desv.  X2 ) = N(15.4 0. Distribución compra media de petróleo Normal.4   0.4 15 – E = 15 – 1. Luego los límites serán: 0. Es decir: 0.6 0.4 0.4   0.16) y Z  ( X  15)  N(0.00621 Rpta.Entonces: X  N (  .995 = 2.97 15 X = media muestral 16. y 15 + 1.4  X  15 14  15   a) P( X < 14) = P  = P(Z < -2.03 glns..Est.99 = P(13.03 = 13.575 x 0. 1) = P   = P(Z > 3.033 Kg.033   0.95  0.  X2  Var( X )  2 n = (0.033  X  5 5.033  E  Z0. b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 90% de los pesos medios muestrales? Solución Los datos del problema son: μ = 5 Kg.2)2 / 36 = 0.03) =  0. 1). La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5 kilos y una desviación estándar de 0. Luego los límites serán: 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas de azúcar.033 57 .033 0.03 glns. el peso medio supera los 5.033 0.99878 = 0.en el 99% de las (ó en 9900 de cada 10000) muestras de 49 clientes de petróleo. Entonces: 0.1 kilos. la venta media se encuentra entre 13.1  5   a) P( X > 5. (3. σ = 0. Entonces: X  N (  .054 Kg. 0.033  = 1 . alrededor de μ = 15 glns.2 Kg.  X2 ) = N(5.00122 Rpta.95 = 1.1 kilos.03) = 1 .97 y 16.033   0.0. Interpretación. 7...645 → E = 1. dentro de los cuales caerá el 90 % de las X . Se pide: 0. b) Sean 5 – E y 5 + E los límites simétricos alrededor de la media μ = 5 Kg.033  E   E   E   E  =       2   1      0.0011) y Z  ( X  5)  N(0.033 = 0.645 x 0.033   0.90 = P(5 – E  X  5 + E) = P( E E Z ) 0.. Si se toma muestras al azar de 36 bolsas.en el 0.2 kilos.Interpretación.0011   X  0. y n = 36 bolsas. Calcule e interprete: a) La probabilidad de que el peso medio de la muestra supere los 5.. Si se selecciona una muestra aleatoria de 100 consumidores de arroz. Entonces: 0.000625) y Z  ( X  3.20 + E) = P( 58 E E Z ) 0.20)  N(0.. 0.054 Kg. Interpretación.20. 3.97725 = 0.  X2  Var( X )  2 n = (0. y 5 + 0.054 Kg.054 = 4. 0.20 3.28% de las (ó en 228 de cada 10000) muestras de 100 consumidores de arroz. 0.20.025 Entonces: X  N (  .946  X  5. calcule e interprete: a) La probabilidad que el precio medio muestral del arroz sea mayor a S/.en el 2.20 + E los límites simétricos alrededor de la media μ = S/. (2. dentro de los cuales caerá el 95 % de las X ..025 0.0) = 1 .25. 3.20   a) P( X > 3. y n = 100 consumidores. 3.025   0.en el 90% de las (ó en 9000 de cada 10000) muestras de 36 bolsas de azúcar.25  3. 3.02275 Rpta.20. Es decir: 0. Interpretación.946 y 5.000625   X  S/.25) = P  = P(Z > 2. 0.25.90 = P(4.5 – E = 5 – 0.0. b) Sean 3.20 – E  X  3. Se 0.054 = 5.25 el kilo.946 Kg. 8.25)2 / 100 = 0. En Lima el precio promedio al consumidor del kilo de arroz es μ = S/.025 pide:  X  3.25. el contenido medio se encuentra entre 4.025 .20 – E y 3. el precio medio del kilo es mayor a S/. alrededor de μ = 5 Kg.054) Rpta.00) = 0.95 = P(3.  X2 ) = N(3. 1).20 con una desviación estándar σ = S/. b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios muestrales alrededor de la media poblacional? Solución Los datos del problema son: μ = S/. 3. σ = S/.025 = 1 . b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 99.62% de las (ó en 62 de cada 10000) muestras de 25 latas de café.025   0. 3.25. Calcule e interprete: a) La probabilidad de que el peso medio de la muestra sea menor de 192 gramos.025 3.   Var( X )  2 X 2 n = (6)2 / 25 = 1.025  E  Z 0.73% de los pesos medios muestrales? Solución Los datos del problema son: μ = 195 gr. 1).25) Rpta.05 = S/.en el 95% de las (ó en 9500 de cada 10000) muestras de 100 consumidores de arroz. Entonces: 59 . el precio medio del kilo se encuentra entre 3.96 → E = 1. b) Sean 195 – E y 195 + E los límites simétricos alrededor de la media μ = 195 gr.  X2 ) = N(195.05 = S/. 9. Interpretación.. 0. el peso medio es menor 192 gr.2  X  195 192  195   a) P( X < 192) = P  = P(Z < -2.975  0. σ = 6 gr. 3. E   E   E   E  =       2   1      0. Entonces: X  N (  .50) = 0.2 Interpretación.025 = S/.20.2 gr.15 y 3.975 = 1.95 = P(3.44) y Z  ( X  195)  N(0.20 – E = 3.00621 1. Es decir: 0.025   0.20 – 0.73 % de las X .25 nuevos soles alrededor de μ = S/.44   X  1.. y n = 25 latas.96 x 0. 1. La compañía “La negrita” vende latas de café con un contenido medio de 195 gramos y una desviación estándar de 6 gramos.20 + 0.2   1.05.5) =  (-2. dentro de los cuales caerá el 99.en el 0.15 y 3. Si se toman muestras al azar de 25 latas. Se pide: 1. 3. Luego los límites serán: 0..15  X 3.025   0. En una auditoría para determinar el gasto medio mensual en arbitrios en las ciudades A y B.6 – 0.6 gr. Interpretación. se toma una muestra al azar de 300 hogares de cada ciudad.2 = 3.2 1. Solución Los datos del problema son: μA = S/. σA = S/. 10.6 gr. y 195 + 3.2   1.99865 = 3.6 = 198. 20 y nB = 300 hogares. 250. 235.2   1.9973 = P(195 – E  X  195 + E) = P( E E Z  ) 1.2 195 – E = 3. el peso medio se encuentra entre 191. con una desviación típica de S/. 235.0 → E = 3 x 1.4 y 198.9973 = P(191. 250.0..00 y  X2 B  Var ( X B )  B  = 8. μB = S/.2  E   E   E   E  =       2    1      0.4 gr.33 300 nB 300 60 .05 = 191. Calcule e interprete la probabilidad de que: a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad A.6) Rpta.6 gr. 50. 35 y nA = 300 hogares. 60.2  E  Z 0. mientras que en la ciudad B dicho gasto medio mensual es de S/. b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad B. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. alrededor de μ = 195 gr. Luego:  X2  Var ( X A )  A  A2 nA   2 (50)2 (60)2 = 12. σA = S/. Es decir: 0. con una desviación típica de S/.73% de las (ó en 9973 de cada 10000) muestras de 25 latas de café.4  X  198.99865  1.2   1.en el 99. Luego los límites serán: 1. 20. Interpretación.04% de las (ó en 4 de cada 10000) muestras de 300 hogares de cada ciudad. el gasto medio mensual en arbitrios en la ciudad A será al menos S/.P  A  4. Luego: X A  X B  N (  A  B .33) = 0.00043 Rpta.51   = = 1 – P(Z < 2. b) Las bombillas B tengan una duración media mayor que la duración media de las bombillas A. 61 .235 = 15.X A XB X AXB   A  B = 250 . 4.33 = 20. Interpretación.33 y = 4.51 4.33) y Z  ( X A  X B  15)  N(0..98679 = 0.  X  X B  15 25  15   b) P  X A  X B  25 = 1 .51 4.  X2 A  X B ) = N(15. el gasto medio mensual en arbitrios en la ciudad B será mayor que en la ciudad A. 11.. (2. con desviaciones típicas de 90 y 100 horas.51 Se pide: a) P( X B > XA) = P( X A < XB ) = P( X A - XB < 0) =  ( X  X B  15) 0  15  P A  = 4.22) = = 1 – 0. Dos fábricas A y B productoras de bombillas afirman que el promedio de duración de ellas es de 1980 y 1950 horas. 25 más que el gasto medio mensual en arbitrios en la ciudad B.51.en el 0. 1). respectivamente.01321 Rpta.en el 1.22) = 1 . Si se seleccionan 100 bombillas al azar de cada fábrica.32% de las (ó en 132 de cada 10000) muestras de 300 hogares de cada ciudad.51   = P(Z < -3.P  X A  X B  25 = 1 .33) =  (-3.  X2 A  X B   x2A   x2B = 12 + 8. calcule e interprete la probabilidad de que: a) Las bombillas B tengan una duración media menor de 1930 horas.  X2 A  X B   x2A   x2B = 81 + 100 = 181 y X AXB = 13. 2. calcule e interprete la probabilidad de que: a) El llenado medio de la máquina 1 sea menor que el llenado medio de la máq.1950 = 30.  X2 B ) = N(1950.01321 Rpta. b)  X A  X B   A  B = 1980 . 62 .45.Solución Los datos del problema son: μA = 1980 horas. σA = 90 horas y nA = 100 bombillas. Interpretación.. σB = 100 horas y nB = 100 bombillas. la duración media menor de 1930 horas. 1). Se pide: 9  X  1950 1930  1950   P( X B < 1930) = P  B  = P(Z < -2. 12.  X2 A  X B ) = N(30. Un proceso automático es realizado por dos máquinas que empaquetan un producto en bolsas de 500 gramos.X B < 0) = P  A  13. μB = 1950 horas. Luego:  X2  Var ( X A )  A  A2 nA = (90)2 / 100 = 81 y  X2 B  Var ( X B )   B2 nB = (100)2 / 100 = 100 a) X B  N ( B . Se pide:  ( X  X B  30) 0  30   P( X B > X A ) = P( X A < X B ) = P( X A . Luego: X A  X B  N (  A  B .45 13. la duración media de las bombillas B es mayor que la duración media de las bombillas A.32% de las (ó en 132 de cada 10000) muestras de 100 bombillas B.en el 1..23) = 0. Si se seleccionan muestras de 100 bolsas de cada máquina.01287 Rpta.en el 1.23) =  (-2.22) = 9 9   =  (-2.29% de las (ó en 129 de cada 10000) muestras de 100 bombillas A y 100 bombillas B. 181) y Z  ( X A  X B  30)  N(0.45 1).22) = 0. Interpretación. La máquina 1 llena con una desviación estándar de 15 gramos y la máquina 2 de 20 gramos. 81) y Z  ( X B  1950)  N(0. 13.45   = = P(Z < -2. Interpretación. 63 ..2 en el Perú los varones de 9 años de edad tienen un peso promedio de 26.X 2 < 0) = P  1 = 2.80) .5   2.5 Kg. Lima. Luego:  2 X1  Var ( X 1 )   12 n1 = (15) / 100 = 2.b) Las medias muestrales difieran en menos de 2 gramos.25 + 4 = 6.5   = P(Z < 0) =  (0) = 0. μ2 = 500 gr. mientras que las mujeres tienen un peso promedio de 26.. 13. CENAN – INEI.8 Kg. Si se toman independientemente dos muestras al azar sin reposición.500 = 0..5000 Rpta.25) y Z  ( X1  X 2  0)  N(0. Se pide: 2. y una desviación estándar de 2.  X2 1  X 2 ) = N(0.en el 57. y n2 = 100 bolsas.  X2  X   x2   x2 = 2. Según un estudio del Ministerio de Salud.5 2.63% de las (ó en 5763 de cada 10000) muestras de 100 bolsas de cada máquina.. el llenado medio de la máquina 1 es menor que el llenado medio de la máquina 2.5   = P(-0. σ2 = 20 gr.7 Kg.25 1 2 1 2 y = 2. 1 X 2 AXB 2 X2  Var ( X 2 )   22 n2 = (20)2 / 100 = 4.25 y  2  X  X  1  2 = 500 . y una desviación estándar de 3.5 2.en el 50% de las (ó en 5000 de cada 10000) muestras de 100 bolsas de la máquina 1 y 100 bolsas de la máquina 2.8 Kg. 1). Perú..78814) – 1 = 0.. 2011.5.80 < Z < 0.  2  0 X 1  X 2  0 2  0    b) P X1  X 2  2 = P  2  X1  X 2  2 = P  = 2. de n = 300 niños y m = 300 niñas. y n1 = 100 bolsas. Luego: X1  X 2  N ( 1  2 .5  ( X  X 2  0) 0  0   a) P( X 1 < X 2 ) = P( X 1 . 6. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010.80) = 2  (0.1 = = 2 (0.. Interpretación. Solución Los datos del problema son: μ1 = 500 gr. Calcule e interprete la probabilidad de que: 2 Ministerio de Salud. σ1 = 15 gr.57628 Rpta. Informe del estado nutricional en el Perú. las medias muestrales difieren en 2 gramos. .87% de las (ó en 287 de cada 10000) muestras de 300 niños y 300 niñas peruanos de 9 años de edad.1 0.35197 Rpta.02872 Rpta.8 Kg.2626. Una empresa azucarera embolsa azúcar con un contenido medio de 50 kg. 0. Interpretación. μm = 26. b) El peso promedio de los niños sea al menos 0.  X2 v  X m ) = N(0.6  0.2% de las (ó en 3520 de cada 10000) muestras de 300 niños y 300 niñas peruanos de 9 años de edad.1)  N(0.5 kg.1. más que el peso promedio de las niñas.. 0.en el 35.1) 0  0.a) El peso promedio de los niños sea menor que el peso promedio de las niñas.6 kg.38) =  (-0. más que el peso promedio de las niñas.2626   = P(Z < -0.7 Kg.2626   0. 14. Se pide:  ( X  X m  0.38) = 0. y nv = 300 niños.  X  X  v  m = 26.6  = 1 - P  X v  X m  0. (1. Interpretación. Luego:  X2  Var ( X v )   v2 v  2 Xm  Var ( X m )  = (2..2626 1).06896 y = 0. b) P  X v  X m  0.6 kg.5)2 / 300 = 0. el peso promedio de los niños es menor que el peso promedio de las niñas.2626 0.02083 y nv  m2 nm = (3. y nm = 300 niñas. y desviación estándar de 0.90) = 1 . v X m v Xm  X2 v  Xm   x2v   x2m = 0. σm = 3.1   a) P( X v < X m ) = P( X v .6  = 1 -  X  X m  0. el peso promedio de los niños será al menos 0. Para el control de calidad se toman muestras 64 .2626 = 1 – P(Z < 1.5 Kg.8 Kg.97128 = 0.7 = 0.X m < 0) = P  v  = 0.90) = = 1 – 0.04813.2626) y Z  ( X v  X m  0.1  P v   = 0. Luego: X v  X m  N ( v  m .. Solución Los datos del problema son: μv = 26.1.8 – 26.8)2 / 300 = 0.en el 2. σv = 2.  X2 1  X 2 ) = N(0.1225 0. Calcule e interprete la probabilidad de que la producción media de las bolsas de ambos turnos difieran en menos de 0. 1).30. Se 0.8969 Rpta.50 = 0. y n1 = 25 bolsas.2  0 X1  X 2  0 0.2 kg.  X2  X   x2   x2 = 0.2  =  0. σ1 = 0.5)2 / 50 = 0.70 = proporción de las compras en alimentos y bebidas en las tiendas Metro.1225.2 kg. la producción media de las bolsas de ambos turnos difieren en menos de 0. Luego:  X2  Var ( X 1 )  1  12 n1 = (0.005 = 0. 0.010 + 0. μ2 = 50 Kg.en el 89.94845) – 1 = 0..1 = = 2 (0.69% de las (ó en 8969 de cada 10000) muestras de 25 bolsas de la producción diurna y 50 de la producción nocturna. b) ¿entre que límites simétricos alrededor del verdadero porcentaje de compras en alimentos y bebidas caerá el 99% de los porcentajes muestrales? Solución Los datos del problema son: P = 0. σ2 = 0.5) / 25 = 0.. y n2 = 50 bolsas.01 y  X2  Var ( X 2 )  2 2  22 n2 = (0..1225  P X1  X 2  0.5 Kg. Calcule e interprete: a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea mayor al 80%. n = 200 compras = tamaño de la muestra.1225   0. Luego: X1  X 2  N ( 1  2 . Q = 0.005  X  X  1  2 = 50 .015 1 X 1 2 AXB 2 1 2 y = 0.63) . 15.63 < Z < 1.2  0    = P = 0. 65 . Si se seleccionan muestras aleatorias de 200 compras.5 Kg.aleatorias de 25 bolsas de la producción diurna y 50 de la producción nocturna. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas.2  X1  X 2  0. Solución Los datos del problema son: μ1 = 50 Kg.015) y Z  pide:  ( X1  X 2  0)  N(0.2 = P  0.1225 = P(-1. Interpretación.63) = 2  (1. 575  E  2.0324   0.70 – 0.995  0. dentro de los cuales estará el 99 % de las p (proporciones muestrales).. El 40% de los clientes de las tiendas Saga son varones.70 p  0.en el 0..3% alrededor de la proporción verdadera P = 0.70 0.00105 0.0. Interpretación. (3.0324  E  Z0. Si se toma una muestra aleatoria de 200 clientes.783.0324   0.0324   0. b) Sean 0.80 ) = 1 .0324 0. la proporción muestral: n p Z X i 1 n i  X  PQ   N  P.09) = 1. Interpretación.70. Es decir: 0.99 = P(0.80  0.083 .0324 0.70. 66 . Se pide calcular:   PQ 0.09) = 1 .0010 Rpta.083 = 0.70.70 – E y 0.9990 = 0.617  p  0.995  2.0324  E   E   E   E  =       2   1      0. Calcule e interprete: a) La probabilidad que el porcentaje de clientes varones esté entre 36% y 45%. 1).575(0. Luego los límites serán: 0.99 = P(0.70 + E los límites simétricos alrededor de la proporción verdadera P = 0. entonces.en el 99% de las (ó en 9900 de cada 10000) muestras de 200 compras en las tiendas Metro.70 + 0.10 % de las (ó en 10 de cada 10000) muestras de 200 compras en las tiendas Metro.P (p ≤ 0.0324   0.70  a) P (p > 0.083 = 0.P(Z  3.617 y 0.Asumiendo un número muy grande de compradores.P    0. el porcentaje de compras en alimentos y bebidas se encuentra entre 61. el porcentaje de compras en alimentos y bebidas es mayor al 80%.0324 = 1 .70 – E = 0. 16.70 + E) = P( E E Z )= 0.70 – E  p  0.00105) y n n   pP p  0.7% y 78. 0. Entonces: 0.80 ) = 1 .0324 n  p  0.783) Rpta.70 ~ N(0.  = N(0.0324)  0. 45) .0346 Sean 0.975  0.40 p  0.60.60 – E  q  0.40    a) P ( 0.36  p  0. el porcentaje de clientes varones está entre 36% y 45%. 0.b) ¿dentro de que límites simétricos del porcentaje de mujeres en la población caerá el 95% de los porcentajes de la muestra? Solución Los datos del problema son: P = 0.40 = proporción de clientes varones en las tiendas Saga.45 ) = P   = 0.92647 – 0.40 0.0346   0.60 – E y 0.0346 n  0. 0.60 y n = 500 clientes.0346 = P(-1.12302 = 0.  = N(0. dentro de los cuales estará el 95 % de las proporciones muestrales de mujeres q.80345 Rpta.0346 0. 1). b) La distribución de la proporción muestral de mujeres q es: n q Z X i 1 n i  X  PQ   N  Q.60 + E) = P( E E Z )= 0. Entonces: 0.36  0. Se pide calcular límites simétricos.40.60 ~ N(0.0346  E   E   E   E  =       2   1      0.60 + E los límites simétricos alrededor de la proporción verdadera Q = 0. Asumiendo un número muy grande de clientes en las tiendas Saga.40 ~ N(0. 1).45  0.0346  67 .35 % de las (ó en 8035 de cada 10000) muestras de 200 clientes de las tiendas Saga..en el 80.0346 0.45) =  (1.16) = = 0.60. Q = 0. (-1. Se pide calcular:   PQ 0.0012 0.95 = P(0.0346   0.0346   0.0012) y n n   p  P p  0. la distribución de la proporción muestral de hombres p es: n p Z X i 1 n i  X  PQ   N  P. 0. Interpretación.0346   0.  = N(0.16  Z  1.0012) y n n   q  0.40 p  0. 1).60. Q = 0.60   a) P (p < 0. 0.068 = 0.068 .en el 95% de las (ó en 9500 de cada 10000) muestras de 200 clientes de las tiendas Saga.62 % de las (ó en 262 de cada 10000) muestras de 1000 hogares.. Es decir: 0.8% alrededor de la proporción verdadera Q = 0.96(0.0155 0.60 0. Interpretación. Si se toma una muestra aleatoria de 1000 hogares.0346)  0.57  0. la distribución de la proporción muestral de hogares que consume mantequilla p es: n p Z X i 1 n i  X  PQ   N  P.532  q  0.668) Rpta.0346 0. el porcentaje de clientes mujeres está entre 53.  = N(0.668.94) =  (-1.00024) y n n   p  P p  0.60 – 0.60. estará el 99% de las proporciones muestrales. Calcule e interprete: a) La probabilidad que menos del 57% de los hogares consuma mantequilla. alrededor de la verdadera proporción de hogares que consume mantequilla. Luego los límites serán: 0. Entonces: 68 . Asumiendo un número muy grande de hogares en Lima. Solución Los datos del problema son: P = 0. menos del 57% de los hogares consume mantequilla.0155 = P(Z < .96  E  1.40 y n = 1000 hogares.57 ) = P   = 0.60 + E los límites simétricos alrededor de la proporción verdadera P = 0.E  Z0. 17.1.60 – E y 0. Interpretación.60 = proporción de hogares que consume mantequilla. dentro de los cuales cae el 99 % de las proporciones muestrales de hogares que consume mantequilla p.60   ~ N(0.95 = P(0.60 – E = 0.en el 2.532 y 0.60 + 0.60 p  0. En Lima el 60% de los hogares consume mantequilla. b) Dentro de que límites simétricos.0155 n  p  0.60. Se pide calcular: PQ 0.2% y 66.975  1.94) = 0..0155   0.068 = 0.02619 Rpta. b) Sean 0. 60.995  2. la empresa A produce por término medio 20% de defectuosos. Interpretación.2)(0. mientras que la empresa B produce un 30% de defectuosos. 18.20 = proporción de artículos defectuosos producidos por la empresa A.04 = 0.0155 0.64) Rpta.04 = 0.575(0. QA = 0.05) se tiene que: pB .7)  + = = 0.3)(0.0019.56 y 0.80 = proporción de artículos buenos producidos por la empresa A.pA ~ N(PB – PA . Dos empresas producen cierto artículo. Luego los límites serán: 0.0155)  0.30 = proporción de artículos defectuosos producidos por la empresa B.20 = 0.0.60 – 0. Si se extrae una muestra aleatoria de 300 y 150 artículos respectivamente.  p2B  pA ) Con media:  pA  pB = PB – PA = 0.70 = proporción de artículos buenos producidos por la empresa B. Considerando que ambas empresas producen gran número de artículos y que las correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.64.0155   0. Luego: 300 150 nA nB 69 ..10 Y varianza:  p2B  pA = PAQA PB QB (0.60 – E  p  0. QB = 0.60 – E = 0.en el 99% de las (ó en 9900 de cada 10000) muestras de 1000 hogares de Lima. calcule e interprete la probabilidad de que el porcentaje de artículos defectuosos producidos por la empresa B difiere de los defectuosos producidos por la empresa A en 2% o menos. el porcentaje de hogares que consume mantequilla está entre 56% y 4% alrededor de la proporción verdadera P = 0.30 – 0.0155   0.04 . Es decir: 0.8) (0.0155   0.0155 0.575  E  2.60 + E) = P( E E Z )= 0.60 + 0.56  p  0. PB = 0.0155  E  Z 0.0155  E   E   E   E  =       2   1      0. nA = 300 y nB = 150 artículos. Solución Los datos del problema son: PA = 0.99 = P(0.995  0.99 = P(0. 10 ~ N(0 .044 0. Si se toma una muestra aleatoria de 200 mujeres y 100 hombres. nM = 200 mujeres y nH = 100 hombres.10 .8) (0.05 Y varianza:  p2M  pH = PM QM PH QH (0. En una ciudad se sabe que la preferencia de las mujeres por un diario es del 20% y para los hombres de un 25%. 19.10  P (pB – pA  0.02  0.44% de las (ó en 344 de cada 10000) comparaciones.05) se tiene que: PM – pH ~ N(PM – PH .20 = proporción de mujeres que prefiere el diario.25 = -0.10 0.75)  + = = 0. el porcentaje de artículos defectuosos producidos por la empresa B difiere de los defectuosos producidos por la empresa A en 2% o menos. 0.02) = P  B =  0.0027.2)(0.25)(0.  p2M  pH ) Con media:  pA  pB = PM – PH = 0.0019) y Z pB  pA  ( PB  PA ) p  B  pA pB  pA  0.25 = proporción de hombres que prefiere el diario. calcule e interprete la probabilidad de que el porcentaje de mujeres que prefiere el diario difiera del porcentaje de hombres que lo prefiere en 8% o más.pB – pA ~ N(0. para muestras de 300 artículos de la empresa A y 150 de la empresa B. Interpretación. Considerando que el número de mujeres y hombres en la ciudad es grande y que las correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0. 0..044 1) Se pide calcular:  p  pA  0.044   = PZ  -1.82) = 0. PH = 0.82) =  (-1.en el 3.20 – 0.80 = proporción de mujeres que no prefiere el diario.75 = proporción de hombres que prefiere el diario. QM = 0.03438 Rpta. Luego: 200 100 nM nH 70 . QH = 0. Solución Los datos del problema son: PM = 0. PB = 0.08) = P  M = P(Z ≥ 2. si se seleccionan muestras aleatorias de 250 hogares de la ciudad A y 150 hogares de la B..05 .65 = proporción de hogares que no prefiere el artículo en la ciudad B.052   = 1 . Solución Los datos del problema son: PA = 0.50) =  0. nA = 250 y nB = 150 hogares.30 – 0. QB = 0.05) se tiene que: pA – pB ~ N(PA – PB .05 0.052 1) Se pide calcular:  p  pH  0. QA = 0.pM – pH ~ N(-0.35 = proporción de hogares que prefiere el artículo en la ciudad B.0027) y Z  pM  pH  ( PM  PH ) p M  pH  pM  pH  0.50) = 1 . 20. el porcentaje de mujeres que prefiere el diario difiere del porcentaje de hombres que lo prefiere en 8% o más. Considere que los niveles de preferencia de un determinado artículo en la ciudad A es de un 30% de hogares y en la ciudad B de un 35%. 0.65)  + = = 0. calcule e interprete la probabilidad de que el % de hogares que prefiere el artículo en la ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más.35)(0.30 = proporción de hogares que prefiere el artículo en la ciudad A.3)(0.05 Y varianza:  p2A  pB = PAQA PB QB (0. Interpretación.00621 Rpta.05 ~ N(0 .052 0. 0.7) (0.05  P (pM – pH ≥ 0.0024.35 = -0.en el 0.08  0.99379 = 0.62% de las (ó en 62 de cada 10000) muestras de 200 mujeres y 100 hombres. Luego: 250 150 nA nB 71 . Considerando que en ambas ciudades hay un gran número de hogares y que las correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.  p2A  pB ) Con media:  pA  pB = PA – PB = 0.70 = proporción de hogares que no prefiere el artículo en la ciudad A. (2.0. pA – pB ~ N(-0.71% de las (ó en 71 de cada 10000) muestras de 250 hogares de la ciudad A y 150 hogares de la ciudad B.99286 = 0. Interpretación.07  0.049   = 1 .049 1) Se pide calcular:  p  pB  0. 0.05 .45) = 1 . (2.05  P (pA – pB ≥ 0.07) = P  A = P(Z ≥ 2. el % de hogares que prefiere el artículo en la ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más. 72 .en el 0.05 0.05 ~ N(0 .45) =  0.0024) y Z  pA  pB  ( PA  PB ) p A  pB  p A  pB  0. 0.00714 Rpta..0.049 0. c) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 95% de las medias muestrales? 73 .8 EJERCICIOS PRPUESTOS 1.20 con una desviación estándar σ = S/.53 litros. Si se selecciona una muestra aleatoria de 100 consumidores de mango. Las botellas de la bebida “Rica Kola” familiar tienen un contenido medio de 2. Si se cargan 400 cajas al azar en un camión. calcule e interprete la probabilidad: a) que el precio medio muestral sea mayor a S/. hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra. 0. de una población X con distribución binomial negativa. b) ¿Dentro de que límites simétricos caerá el 95% de las medias muestrales alrededor de la media poblacional? 6.75 Kg. con parámetro λ.25 el kilo. Si se toma una muestra aleatoria de tamaño n. Calcule e interprete la probabilidad que: a) Las botellas tengan una media de llenado entre 2. calcule e interprete la probabilidad de que: a) El peso total de las cajas supere la capacidad máxima del camión que es de 8.46 y 2. hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra. Las cajas con mango tienen un peso medio de 20 Kg.2.1 litros. con parámetro p. y una desviación estándar de 0.040 Kg. 4. b) ¿dentro de qué límites simétricos caerá el 99 % de las medias muestrales alrededor de la media poblacional? 5. b) El peso medio de las cajas sea menor a 19. 2. 3. hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra. 2.92 Kg.20. Si se toma una muestra aleatoria de 36 botellas. Si se toma una muestra aleatoria de tamaño n. 2. En Lima el precio promedio al consumidor del kilo de mango es μ = S/. Si se toma una muestra aleatoria de tamaño n. de una población X con distribución geométrica. con parámetros r y p. de una población X con distribución exponencial.5 litros y una desviación estándar de 0. Los cables de la compañía A tienen una vida media de 7. En una gran ciudad el promedio de empleados para establecimientos pequeños es de 10 y la desviación estándar de 5 empleados. 74 . con una desviación estándar de 5 lts. calcule e interprete la probabilidad que: a) La duración promedio de los focos menor de 1475 horas. En una muestra aleatoria de 16 focos. b) ¿Dentro de que límites simétricos de la duración media poblacional caerá el 95% de las duraciones medias muestrales? 9. En una empresa de gaseosas la producción media de los varones es de 52 lts. Si se toman m.a. calcule e interprete: a) La probabilidad que el promedio muestral de empleados sea menor que 8.7 años con una desviación estándar de 0. respectivamente.7 años. Calcule e interprete la probabilidad que la producción media de los varones resulte menor que la producción media de las mujeres. y la producción media de las mujeres es de 48 lts. mientras que los de la B tienen una vida media de 6. Con una desviación estándar de 7 lts. afirman que el promedio en las bolsas es de 495 y 490 gramos. Uno de los principales fabricantes de tv compra cables a dos compañías. calcule e interprete la probabilidad de que la vida media de los cables A sea de al menos un año más que la vida media de los B. 11. b) El contenido medio de las bolsas A sea menor que el contenido medio de las bolsas B. con desviaciones típicas de 5 y 6 gramos. Para una muestra aleatoria de 36 establecimientos pequeños extraídos sin reemplazo. Si se toma una muestra aleatoria de 40 trabajadores hombres y 40 mujeres. b) ¿Dentro de que límites simétricos del promedio poblacional caerá el 95% de las medias muestrales de empleados por establecimientos pequeños? 8.7. Una empresa eléctrica fabrica focos cuya duración tiene distribución normal con media de 1500 horas y desviación estándar de 50 horas. de 34 cabless de A y 40 de B. Dos fábricas A y B que embolsan café. 10.2 años con una desviación estándar de 0. calcule e interprete la probabilidad de que: a) El contenido medio de las bolsas A sea mayor de 497 gramos.8 años. Si se seleccionan 36 bolsas al azar de cada fábrica. 13. Si se toma una muestra aleatoria de 500 ciudadanos. estará el 99% de las proporciones muestrales. estará el 95% de las proporciones muestrales. En Lima el 30% de los hogares compra periódicos y/o revistas. 15. b) Dentro de que límites simétricos. b) Dentro de que límites simétricos. b) Dentro de que límites simétricos. calcule e interprete: a) La probabilidad de que más del 65% esté de acuerdo con la gestión presidencial.12. En Lima el 60% de los hogares usa gas como combustible para cocinar.73% de las proporciones muestrales de hogares que compra periódicos y/o revistas? 16. calcule e interprete: a) La probabilidad de que más del 85% esté casado. Si se toma una muestra aleatoria de 64 empleados. El 60% de los ciudadanos esta de acuerdo con la gestión presidencial. esta el 95% de las proporciones muestrales. En una universidad la edad promedio de los alumnos del turno de la mañana es de 22 años con una desviación estándar de 3 años. alrededor de la verdadera proporción de ciudadanos esta de acuerdo con la gestión presidencial. alrededor de la verdadera proporción de hogares que usa gas. Si se toma una muestra aleatoria de 50 alumnos de cada turno. mientras que los del turno de la noche tienen una edad media de 28 años con una desviación estándar de 5 años. Si se toma una muestra aleatoria de 1000 hogares. 14. Calcule e interprete: a) La probabilidad de que más del 34% de hogares compre periódicos y/o revistas. Si se toma una muestra aleatoria de 1000 hogares. 75 . calcule e interprete la probabilidad de que la edad promedio de los alumnos de la mañana es superior a la edad media de los de la noche. El 70% de empleados públicos es casado. b) ¿Dentro de que límites simétricos alrededor de la proporción verdadera caerá el 99. Calcule e interprete: a) La probabilidad que más del 65% de los hogares use gas. alrededor de la verdadera proporción de empleados públicos casados. mientras que la empresa B produce un 20%. calcule e interprete la probabilidad de que el porcentaje de hombres familiarizados con el producto sea mayor que el de mujeres. En cierta ciudad se sabe que el 25% de los hombres y el 30% de las mujeres están familiarizados con un producto. Calcule e interprete: a) La probabilidad que las muestras tengan entre 65% y 80 % de compras mayores que $200? b) ¿Entre que límites simétricos del porcentaje de compras mayores de $200 en la población caerá el 99% de los porcentajes muestrales? 18. Dos empresas producen equipos de sonido.17. 76 . Si se toma una muestra aleatoria de 200 hombres y 200 mujeres. Si se seleccionan muestras aleatorias de 100 compras. 20. En un estudio pasado se determinó que el porcentaje de hombres que está de desacuerdo con la construcción de un gimnasio era del 12%. mientras que el porcentaje de mujeres en desacuerdo era del 10%. Si se toma una muestra aleatoria de 100 hombres y 100 mujeres. 19. Si se extrae una muestra aleatoria de 400 y 200 unidades respectivamente. calcule e interprete la probabilidad de que el porcentaje de equipos defectuosos producidos por la empresa A difiere de los defectuosos producidos por la empresa B en 7% o menos. El 70 % de las compras con tarjeta de crédito en tiendas Ripley son superiores a $200. la empresa A produce por término medio 10% de defectuosos. calcule e interprete la probabilidad de que el porcentaje de hombres en desacuerdo sea al menos 3% mayor que el de las mujeres. Distribución de la diferencia de medias muestrales con varianzas desconocidas pero iguales. y resumiéndolo en una sola palabra (aunque no sea muy buena). Distribución muestral de la media (n < 30).2 3.. En este capítulo.Capítulo 3.1 3.8 Distribución Chi-cuadrado. Ejercicios resueltos.4 3. variables aleatorias independientes. 1) . las mismas que han sido desarrolladas fundamentalmente para muestras pequeñas (menores de 30 observaciones). se presentan las distribuciones muestrales especiales. Zr. estadisticulación” Darrell Huff CONTENIDO 3.. cada una con distribución normal estándar.7 3. Distribución F de Snedecor Distribución de la razón de dos varianzas muestrales. podría llamarse manipulación estadística. Z2.6 3.1 DISTRIBUCIÓN CHI-CUADRADO Esta distribución fue descubierta por Helmert el año 1875 y redescubierta por Karl Pearson el año 1900. utilizando material estadístico. Distribución t de student. A continuación veremos sus principales características y propiedades de cada una de ellas. Zi ~ N(0 . 3.  Zr2 77 .3 3. Entonces. . Ejercicios propuestos.Sean Z1.. DISTRIBUCIONES ESPECIALES “El informar mal. la distribución t – student de Gosset y la distribución F de Snedecor.5 3... la variable aleatoria x²  Z12  Z22  . Definición. Entre las principales distribuciones tenemos: la distribución chi – cuadrado de Pearson.. n > 0. en otros casos Donde:   Γ representa el gamma de un número.l. Además. Media y Varianza: La media y la varianza de la v. en otros casos. a. Observación: la distribución chi – cuadrado es un caso particular de la distribución de probabilidades Gamma con n = r / 2 y λ = 1 / 2.     . la denotaremos como X ~ X r2 . 0<x< .x>0 . entonces su función de densidad de probabilidades está dada por: f ( x)  n  ( n) x n 1e x = 0 .tiene una distribución chi-cuadrado (o Ji-cuadrado) con r grados de libertad. Si n 0 1 es entero positivo (n) = (n – 1)! .a. independientes que se suman o el número de variables que pueden variar libremente. (n)   X n 1e x dx . La esperanza y la varianza de la distribución gamma son: E(X) = n / λ Var (X) = n / λ2 y Notación: decir que la variable aleatoria X tiene distribución chi-cuadrado con r grados de libertad. En regresión y econometría es el rango de una matriz (máximo número de columnas linealmente independientes) asociado a formas cuadráticas delas sumas de cuadrados.) representa el número de v. chi-cuadrado con r grados de libertad son: 78 . si su función de densidad de probabilidades está dada por: f X 2 ( x) = 1 r 2   2 r 2 r 1 x 2 e x / 2 = 0 . 2  r = grados de libertad (g. Si X ~ Gamma con parámetros n > 0 y λ > 0. chi-cuadrado. Función de Distribución Acumulativa de Probabilidades. está dada por: f X 2 x dx    0 r 1 x2 r 2   2 r 2 y representada en la figura 2. la media es igual a los grados de libertad y la varianza es igual a dos veces los grados de libertad. La fig.a.Las probabilidades para v. los que han sido reproducidos en la Tabla 2 del Anexo. representada por:     P X  X 2   . se calculan utilizando los valores de la función de distribución acumulativa menor o igual que. P X  x2   x2 0 0 <  < 1. 1 muestra la forma de la función de densidad de la variable aleatoria chi-cuadrado. utilizando la hoja de cálculo Excel. la probabilidad que la variable aleatoria X con distribución xr2 1  r  30 sea menor o igual a un valor constante x2 . Así tenemos que. para distintos grados de libertad. = E(x²) = r ² = Var(x²) = 2r y Es decir. 79 1  x x 2 e 2 dx   . 050001 80 .CHI devuelve el valor de error #¡NUM!.CHI devuelve el valor de error #¡NUM!  DISTR. Sintaxis: DISTR.CHI se calcula como DISTR.CHI = P(X>x).grados_de_libertad) X es el valor al que desea evaluar la distribución. con sus probabilidades (p) en la parte superior de esta tabla. presenta un resumen de la información más esencial acerca de la distribución.  Si el argumento x es negativo. Observaciones :  Si uno de los argumentos no es numérico. la tabla 2 de la distribución acumulativa chi-cuadrado. Grados_de_libertad es el número de grados de libertad = r. se trunca.L. En el encabezado de la columna de la izquierda. Ejemplo: DISTR.CHI devuelve el valor de error #¡VALOR!. En lugar de esto. DISTR. DISTR.CHI: devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi cuadrado de una sola cola. dice grados de libertad (G. En la hoja de cálculo Excel se determina las probabilidades y los valores de chi-cuadrado así: a) DISTR. resulta impráctico proporcionar tablas de áreas completas.  Si el argumento grados_de_libertad < 1 o grados_de_libertad ≥ 10^10.307. donde X es una variable aleatoria chi cuadrado.) y cada fila de esta tabla corresponde a una distribución chi-cuadrado particular.  Note que P x  x2  1   Puesto que existe una distribución chi-cuadrado diferente para cada valor de r. El cálculo es el complemento de la mayoría de tablas.10) es igual a 0. La distribución chi cuadrado está asociada con la prueba chi cuadrado.  Si el argumento grados_de_libertad no es un entero. DISTR.CHI(18.CHI(x. CHI. se trunca.  Si el argumento probabilidad < 0 o probabilidad > 1. Si PRUEBA.INV reitera hasta que el resultado tenga una exactitud de ± 3x10^-7. hallar el x2 correspondiente para: 81 .05.CHI. Observaciones  Si uno de los argumentos no es numérico. la función devuelve el valor de error #N/A. Ejemplo: PRUEBA..INV(0. entonces PRUEBA. el valor x de la variable aleatoria siguiendo una distribución chi cuadrado.INV devuelve el valor de error #¡NUM!...INV usa una técnica iterativa para calcular la función.CHI.  Si el argumento grados_de_libertad no es un entero.CHI. Sintaxis: PRUEBA.INV: devuelve para una probabilidad dada.CHI.CHI.Si X ~ X r2 .INV devuelve el valor de error #¡VALOR!..).3070290368475 Ejemplo 1. de una sola cola.  Si el argumento grados_de_libertad < 1 o grados_de_libertad ≥ 10^10. PRUEBA.INV(probabilidad.grados_de_libertad) Probabilidad es una probabilidad asociada con la distribución chi cuadrado.INV(probabilidad. PRUEBA.CHI..INV devuelve el valor de error #¡NUM!. Usando la tabla 2.CHI(x.CHI. Si el argumento probabilidad = p = DISTR.10) es igual a 18.CHI.) = x. PRUEBA.. de Ji-cuadrado. PRUEBA.INV no converge después de 100 iteraciones. PRUEBA.b) PRUEBA.CHI. Grados_de_libertad es el número de grados de libertad. Dado un valor de probabilidad. 99. si r = 15 g. en el margen izquierdo y se intercepta con la probabilidad 0.94  Rpta.4 ] .95  P X  x02. Procediendo como en a) se obtiene entonces x2 = x02.9 Rpta. pero éste se encuentra entre los valores 19.05 de las columnas y se obtiene x2 = x02.9 < X  31.l.Si X es X 132 .P[X  10. 15 g. Calcular: a) P[X < 10. para 13 grados de libertad. b) P(X < x2 ) = 0.95 = 0. de chi cuadrado.l. Hallar P(X  20).4 ] b) P[ X > 31.9]. c) P[ 10.9] =  P X  x02.95 = 1 – 0.4 ] = P[X  31.8 (con probabilidad 0. Ejemplo 3.4  1  P X  x02.95) para hallar p interpolamos de la siguiente manera: 82 . Ejemplo 2. 15 = 7.99.9 ] =    = P X  x02. no se encuentra el valor 20. c) P[ 10.a) P(X < x2 ) = 0.  b) P[ X > 31. Solución Para obtener las probabilidades solicitadas.01 = 0.l. 21 = 38. si r = 21 g.2 Si X es una variable aleatoria x20 .05  Rpta.01 = 0. 05 Rpta. Solución P(X  20) = 1 – P(X < 20) = 1 – p Como en la tabla 2.05.05  = 0. en la fila de 20 g.l de la tabla 2 se buscan los valores dados para X y se leen las probabilidades (acumuladas menores que) correspondientes en el encabezamiento de las columnas así: a) P[X < 10.4 ].4 (con probabilidad 0.90) y 22.26 Rpta. Se busca en la tabla 2.95 – 0.4 ] = 1  PX  31.9 < X  31.05. 0.Si la variable aleatoria X ~ N(. Ejemplo 5. Calcule e interprete P[13. entonces la variable Y = Z² = (X .975 .025 y Solución a = x02.)²/² es una x12 .x2 P 19. Hallar a y b tal que: P[a ≤ X ≤ b] = 0.4 0.90 p  0. n Sabemos que X  X i 1 n N(0.l. Veamos a continuación algunos teoremas importantes relacionados con la distribución chi-cuadrado y de mucha importancia para la construcción de intervalos de confianza y pruebas de hipótesis. Rpta. 25 = 13. 25 = 40.90   52  0.1 Para r = 25 g.95 22.4  19.6 Rpta.0962 p  0.55  (X – 12)² < 19.Si X ~ N(12.9038 Rpta.2  52 p  46.20 ] 83 ..8  0.9038 = 0. Teorema 1.1) entonces.0.90 20 p 22.95 = P[a ≤ X ≤ b] = P[X  b] – P[X  a] = P[X  b] .  X   ²n ² ~  X    n es ² ) y por lo tanto Z  n  x12 . ²).975  b = x02.2  p  0. Ejemplo 4. aleatoria. 5).90  P(X  20) = 1 – 0.95  0.2 Si X es una variable aleatoria con distribución x25 . Z 2  I ~ N ( .025 .8 0.025 Luego: P[X  b] = 0.95 P[ X ≤ a ] = 0.8  0..8 20  19. 4% de las desviaciones al cuadrado. entonces: a) Las variables aleatorias X y S² son independientes.71  x12 < 3. X2.55  (X – 12)² < 19.. la variable aleatoria: n 2 Y   xi    /  ² ~ x n2 i 1 Distribución de la Varianza Muestral Teorema 4.. . 5) entonces la variable aleatoria Y  X  12² 5 ~ x12 . Sea X y S² la media muestral y varianza muestral respectivamente. Teorema 2. n b) La función de la varianza muestral x 84 2 n  1S ²   i 1  ² xi  X ² ² ~ x n21 .. .P[ x12  2.. Entonces.55  X  12 ² 19. rp respectivamente. .95 .  X p2 p Sigue una distribución chi-cuadrado con grado de libertad igual a r   ri i 1 Teorema 3. Luego: 13.84 ] = P[ x12  3.04 Interpretación: el Rpta..0.55 y 19. X 22 .20  P[13.. r2... X2.. X p2 variables aleatoria chi-cuadrados dependientes con grados de libertad r1.90 = 0. . Xn una muestra aleatoria de tamaño n de una población normal con media  y varianza ². ²).- Sea X1.84 ] ...(Propiedad Reproductiva de la Chi-Cuadrado) Sean X 12 .. .. una muestra aleatoria de una variable aleatoria X ~ N (.20.Sea X1. Xn.Solución Como X ~ N (12.20 ] = P  =   5 5   5 = P[2. estarán comprendidos entre 13. entonces la variable aleatoria: X ²  X 12  X 22  .. 5) con respecto a su media 12.. de los valores observados de X ~ N (12..71 ] = = 0. )²/(²/n) tiene una distribución X 12 .. Calcule e interprete: 10   a) P 2. por la propiedad aditiva de la chi-cuadrado..a Xi ~ N(0.Demostración. Consideremos: n n i 1 i 1   X i   ²    X i  X    X   ² n n n i 1 i 1 i 1    X i  X ²    X   ²  2 X     X i  X  n =  X i 1 i  X ²  n X   ² Dividiendo entre ² y ordenando tenemos: n n  X i   ²   X i  X ²   X   ² i 1  i 1  ² ² ²/n = n  1S ²   X   ² ² ²/n Dado que ( X . 10 X i 1 2 i 85 ~ X 102 . concluimos que la distribución de n  1S ² ² 2 es x n 1 . …. Ejemplo 6. 1)..3 110   b) P(S2 < 1. ² puesto que cada término (xi .Demostraremos sólo la parte b) n  x i 1 Sabemos que la variable aleatoria i   ² tiene una distribución xn2 . X2.X10 es una muestra aleatoria de una variable aleatoria normal estándar. y  X i 1 i   ² /  ² tiene una distribución x n2 ....88) y Solución entonces X2 i ~ X 12 y por lo tanto a) Como las v. como X y S² n son independientes. Además.56   X i2  18.Suponga que X1..)/ son variables aleatorias normales estándar e independientes (teorema 3). 9 x1. entonces la variable aleatoria T Z X2 r  Z r ~ tr Y tiene una distribución t.org/wiki/William_Sealy_Gosset. Sea X2 ~ X r2 una variable aleatoria que tiene una distribución chi-cuadrado con r grados de libertad.88 ) = P( X 92  16. la varianza muestral es menor que 1.92) = 0. con r grados de libertad.95 1 Rpta. quien. Interpretación: En el 95% de las muestras de 10 observaciones de la distribución normal estándar. “Es Ronald A.. 3.56) = = 0. 1). Fisher quien aprecia la importancia de los trabajos de Gosset sobre muestras pequeñas.2 DISTRIBUCIÓN T DE STUDENT Esta distribución fue descrita en 1908 por el estadístico inglés William S.94 Rpta.56   X i2  18.56  X 102  18.56 y 18.3 = 110     = P( X 102  18.88. y si Z y X2 son independientes. la X i 1 b) P(S2 < 1. al estar prohibido de publicar artículos científicos por la empresa cervecera Guinness donde laboraba en Dublin.95 – 0.” 3 Definición.01 = 0.10    P 2.Sea Z una variable aleatoria normal estándar N(0. tuvo que presentarla con el pseudónimo de “Student” y es comúnmente conocida como la “distribución t”. y su función de densidad de probabilidades está dada por: 3 http://es.3 = P 2.88) = P( 9S 2  2  2 i estará entre 2. 86 . revisado en agosto de 2012.3) – P( X 102  2. Gosset.3. tras recibir correspondencia de Gosset en la que le decía le envío una copia de las Tablas de Student.wikipedia. Interpretación: En el 94% de las muestras de 10 observaciones de la 10 distribución normal estándar. ¡ya que es la única persona que probablemente las use jamás. es decir su media es cero.  r   r  r   2 - < t <  Notación: decir que la variable aleatoria T. T con r grados de libertad son: E(T) =  T = 0 Var(T) =  T2  . pero la distribución t tiene mayor dispersión que la 87 . La distribución t es simétrica alrededor de la media  T = 0 y varía de menos infinito a más infinito. ya que ambas varían de . a . se denota como T ~ tr. r r2 r>1 . la gráfica de la normal estándar. Media y Varianza: La media y la varianza de la v. a. r  1  r 1     2   t ²   2   f t   1 . tiene distribución t con r grados de libertad. En la figura 3 se presenta la función de densidad de la variable aleatoria T. son simétricas y centradas alrededor de  = 0. En la misma figura se da. Es muy similar a la distribución normal estándar. queda completamente determinada sólo por el parámetro r. para diferentes grados de libertad. hay una distribución t correspondiente a cada grado de libertad. r>2 Observe que la distribución de la variable aleatoria T. Por lo tanto. la distribución t. las probabilidades y los valores de T se determinan así: 88 . En la hoja de cálculo Excel.L. 4. representada por: PT  t    .El cálculo de probabilidades para la v.a. Función de Distribución Acumulativa de Probabilidades. 0<<1 Está dada por: PT  t    f t dt  t  t    r  1 r 1    t ²  2  1   2 dt    r   r  r     2 cuya representación gráfica la podemos ver en la fig. los que han sido reproducidos en la Tabla 3 del Anexo. t. En la práctica se trata a la distribución t. se efectúa utilizando los valores de la función de distribución acumulativa menor o igual que.distribución normal estándar. la probabilidad que la variable aleatoria T con distribución tr (con 1  r < 30) sea menor o igual a un valor constante t . En el encabezado de la columna de la izquierda. con sus probabilidades (p) en la parte superior de esta tabla.1) cuando r > 30. se aproxima a la distribución normal estándar cuando el grado de libertad r es suficientemente grande. dice grados de libertad (G. Por lo tanto. Así tenemos que. de la distribución acumulativa t de student.) y cada fila de esta tabla corresponde a una distribución t particular. esto se observa de la varianza  T2  r . utilizando la hoja de cálculo Excel. como N(0. Estas probabilidades están determinadas en la Tabla 3. que r2 se aproxima a 1 cuando el grado de libertad r es grande (r → ∞). T devuelve el valor de error #¡NUM!  Los argumentos grados_de_libertad y colas se truncan a enteros. Sintaxis: DISTR.T se calcula como DISTR.T devuelve la distribución de dos colas. Ejemplo: DISTR.INV : Devuelve el valor t de la distribución t de Student como función de la probabilidad y los grados de libertad. colas) X es el valor numérico al que se ha de evaluar la distribución.INV(probabilidad. Observaciones:  Si uno de los argumentos no es numérico. Se puede utilizar esta función en lugar de una tabla de valores críticos para la distribución t.  Si el argumento colas es un número distinto de 1 ó 2. Si colas = 1. grados_de_libertad. Colas especifica el número de colas de la distribución que se ha de devolver.grados_de_libertad) Probabilidad: es la probabilidad asociada con la distribución t de Student dos colas.T devuelve la distribución de una cola. Si colas = 2. donde X es una variable aleatoria que sigue la distribución t.T devuelve el valor de error #¡VALOR!  Si grados_de_libertad < 1.T(1.T(x.054645 ó 5. DISTR.T. Sintaxis: DISTR.a) DISTR.46% b) DIST.T = P( x < X ). 89 .T: devuelve la probabilidad (los puntos porcentuales) de la distribución t de Student. Grados_de_libertad es un entero que indica el número de grados de libertad.2) es igual a 0. DISTR.96.T devuelve el valor de error #¡NUM!  DISTR.60. La distribución t de Student se utiliza para la comprobación de pruebas de hipótesis cuando el tamaño de la muestra es pequeño (n < 30). donde un valor numérico (x) es un valor calculado de t para el que deben calcularse los puntos porcentuales. DISTR. DISTR.T. DISTR.  Puede devolverse un valor t de una cola reemplazando probabilidad por 2*probabilidad.T. DISTR. Para una probabilidad de 0. Dado un valor del argumento probabilidad.Si la variable aleatoria T ~ t20 (r = 20).725 ] Solución Para obtener las probabilidad solicitada. que devuelve 2. Ejemplo: DISTR.10).INV(0.INV se calcula como DISTR.T.T.60) es igual a 1.725 en la fila de 20 g.T. buscar en la tabla 3 el valor T = 1. la función devuelve el valor de error #N/A.INV devuelve el valor de error #¡NUM!  Si el argumento grados_de_libertad no es un entero ≥ 1.INV devuelve el valor de error #¡VALOR!  Si el argumento probabilidad < 0 o si probabilidad > 1.INV no converge después de 100 iteraciones. Usando la tabla 3.Grados_de_libertad: es el número de grados de libertad para diferenciar la distribución.  DISTR.l y su probabilidad correspondiente se lee en la parte superior de esa columna.05.T.INV reitera hasta obtener un resultado con una exactitud de ± 3x10-7. El valor de una cola para la misma probabilidad y los mismos grados de libertad puede calcularse con DISTR.054645.T. DISTR.INV se calcula utilizando una técnica iterativa. se trunca. Observaciones:  Si uno de los argumentos no es numérico..T. DISTR.INV = P (X > t ).INV(0. la probabilidad se describe como (1-p). que devuelve 1.T.812462.96 Ejemplo7.En algunas tablas. el valor de dos colas se calcula con DISTR. donde X es una variable aleatoria que sigue la distribución t. Si DISTR.95. hallar: P[T  1.28139.10).T. Es decir: 90 . de T de student.T.INV(2*0.05. cuyo valor es 0.05 y grados de libertad de 10. Nota. DISTR. 95 ] = = 0. 571] – P[T  ..05 = 0.571] = P[T  2.925 Rpta. 015 ] = Buscando las probabilidades en la tabla 3 y reemplazando se tiene: = P [T  t0. los valores t son: t = .P[T  t0.975 – [ 1 . Hallar el valor de a tal que: P[T  a ] = 0.P[T  1.95 91 . entonces r = 5 y T ~ t5 .0.2.Sea T una variable aleatoria que tiene una distribución t con varianza ² = 5 .T(1 .5.α) 0 T(1 .95 Rpta. Luego: r 2 3 P [. Fig.975 . Ejemplo 9.Por la simetría de la distribución t.2. 5 Obtención de valores Tα para α < 0.Sea T una variable aleatoria que tiene una distribución t con 23 grados de libertad. Nota.95 ]} = = 0. 3 Calcular: P[-2.P[ T  a ] Ejemplo 8.t1.95 ] = 0.. (ver fig.05 α 0 α Tα = . se tiene que:  Para  < 0.0.571] Solución Como  T2  r 5  .015  T  2.975 ] – {1 .α)  P[ T  -a ] = 1 . 5).015  T  2. 571] – [1 – P[T  2. .725 ] = P[T  t 0. 015 ] = = P[T  2. de una variable aleatoria X con distribución N(. 23 = 2.975  En la tabla 3.069 Rpta.975 . .1 vimos la distribución muestral para la media. o2).l. 3. cuando las muestra son pequeñas (n < 30) la aproximación es hacia la distribución t de student. Ejemplo 9.1). Hallar la constante C tal que: 92 . X y S² son variables aleatorias independientes (n  1)S 2  2 ~ x 2n 1 (teorema 4). (teorema 4).   n n  1S ² / n  1  X    S n ~ tn-1 ² tiene distribución t con n – 1 grados de libertad y se usa para estimar  cuando no se conoce la desviación estándar ..95 = P [T  a ] = P[-a  T  a ] = = P[T  a] – P[T  .a] = P[ T  a ] – [ 1 – P[T  a ] = 2P[Ta]–1  P[ T  a ] = 0. la misma que se aproximaba a la distribución normal. con muestras grandes (n ≥ 30). tal como veremos a continuación. tenemos que: X    T Z x2 g. La variable aleatoria Z  2. ²).Solución 0. Usando la definición de la variable aleatoria T. en acápites anteriores hemos visto que: X  ~ N(0.3 DISTRIBUCIÓN MUESTRAL DE LA MEDIA (n < 30) En el acápite 2.. X2. Xn una muestra aleatoria de tamaño n. / n 1. Sin embargo. Sea X1.Si X y S 2 son la media y la varianza de una muestra aleatoria de tamaño 17 de una distribución N(. La variable aleatoria x 2  3.. a = t0. De acuerdo a lo estudiado en acápites anteriores se tiene que: 1. CON VARIANZAS DESCONOCIDAS PERO IGUALES Si se toma dos muestras aleatorias independientes de dos poblaciones normales X e Y. Sea también Y1.1 4    C 17  t16 .12 4 C 17   4    C 17  P t16   = 0. 3.975 4     C = 2. de una variable aleatoria X con distribución N(X. con varianzas desconocidas pero iguales ²X = ² Y = ².975  2. T  ( X   ) n ( X   ) 17 ~ t 16. Entonces:  S S  C 17 X    17 C 17  = P     = 4 S 4     4X     C 0. La distribución de la variable aleatoria Z  X  Y    X  Y    X  Y    X  Y  ² ² n 2. así: Sea X1.95 S   Solución En el problema propuesto. Xn una muestra aleatoria de tamaño n.. X2.4X      P  C   C   0. . 0567 Rpta. .P t16    = 4 4  4  4      C 17  = P t16  4     1  P  t16     C 17  0.. 1 ) La variable aleatoria: n n  1S U ² 2 X  X i 1 93 i  X ² ² ~ x 2n  1 . ²).4 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES. Ym una muestra aleatoria de tamaño m de una variable aleatoria Y..... Y2. con distribución N(Y.  1 1   n m m ~ N (0 .95 = 2 P t16  . 0.95 = P  C  S    C 17   C 17  C 17  C 17  = P   t16   = P t16   . ²). 3.a. Por la propiedad reproductiva de la distribución chi-cuadrado. siendo las variables Z normal estándar y U + V chi-cuadrado e independientes. Y y S X2 . : U+V= n  1S X2 + ² m  1SY2 ² ~ x2n  m  2 Con los resultados encontrados en (1) y (4).5 DISTRIBUCIÓN F DE SNEDECOR Esta distribución fue descubierta por Fisher. Observe que esta variable aleatoria depende de las medias y las varianzas muestrales. 94 . usando la definición de la variable aleatoria T se obtiene la distribución de la diferencia de medias muestrales X . Es muy utilizada para comparar las varianzas de dos variables aleatorias independientes distribuidas normalmente.Y siguiente:  X  Y    X  Y  T Z  U V nm2 1 1  n m (n  1) S X2  (m  1) SY2 /  2 nm2     X  Y    X  Y  n  1S X2  m  1SY2 1  1 ~ t n+m-2 Simplificando: T nm2 n m tiene distribución t con n + m – 2 grados de libertad.U es independiente de X e Y . 4. la v. La variable aleatoria: n  m  1SY2 V ²  Y  Y ²  i 1 i ~ x2m  1 ² V es independiente de X . de allí la denominación F y redescubierta por Snedecor. 3. En la figura 6 se muestra la función de densidad de probabilidades de la variable aleatoria F para tres pares diferentes de grados de libertad. r1 = grados de libertad en el numerador.. 6 Las distribuciones F son una familia de distribuciones asimétricas hacia la derecha. respectivamente. Existe una distribución F separada para cada par de valores de sus parámetros r1 y r2.Sea U y V dos variables aleatorias independientes que tienen distribuciones chi-cuadrado. 95 . 0<x< en otros casos La distribución F depende de los parámetros r1 y r2 en ese orden. la variable aleatoria: tiene una distribución F con r 1 y r 2 U / r1 V / r2 grados de libertad y su función de densidad de probabilidades está dada por: r r  1 2 r1 1   1 2  r1 2 r2 2 x2  2  . con r1 y r2 grados de libertad. . y r2 = grados de libertad en el denominador. F Entonces. Fig.  r1   r2  x r  r r1 2 r2      1 2 2  2  r fF (x) = r = 0 .Definición. F. dx    r1   r2  x r  r r1 2 r2      1 2 2  2  r f f 96 r . se efectúa utilizando la Tabla 4 de distribución acumulativa F. r 2 sea menor o igual que una constante f está dada por: PF  f    0 PF  f    0 f F x  dx   r r  1 2 r1 1   1 2  r1 2 r2 2 2 x 2   . 2r22 r1  r2  2 . F con r1 y r2 grados de libertad son:  F  E F   r2 r2  2  F2  VarF   . a. las mismas que han sido elaboradas utilizando la función de distribución acumulativa de probabilidades que en la mayoría de los casos son del tipo de acumulación menor o igual que.La media y la varianza de la v. Media y Varianza.a. r1 r2  2²r2  4 r2 > 2 r2 > 4 Función de Distribución Acumulativa de Probabilidades El cálculo de probabilidades para v. r 2 .Notación: decir que la variable aleatoria F tiene distribución F con r1 y r2 grados de libertad. La probabilidad que la variable aleatoria F ~ Fr1 . se denota como F ~ Fr1 . Hallar : a) PF  15. r1 F U / r1 tiene distribución F con r2 y r1 g....r1   1   U / r1   .. V / r2  P  f1 .. r1 . (2) Igualando (1) y (2).0358 ]. r1 ... r2 .. se tiene que: f1 . r2 f .50 Ejemplo 10..... r2 .r ..69 . y r2. con r1 = 7.. r2 = 6 d) Hallar los valores a y b tales que: 97 ... r1 .0 .l..r   P    V / r U / r f .r1 ..Sea F una variable aleatoria que tiene una distribución F con r1 y r2 grados de libertad.    1 V / r2  ~ Fr2 . se necesita una tabla con tres entradas para tabular el valor de F que corresponde a diferentes probabilidades y valores de r1 y r2. (1) . Como la distribución depende de los dos parámetros r1...Estas probabilidades se presentan en tablas de F. con r1 = 5..r2   Pero. Para valores de  < 0. para  < 0.. r2 = 8 c) P[F  0. r2   1 f1 .r   2 1    1 2 1 2 V / r2 1 = 1  P  U / r1 f ....r2 V / r2 1  P    1 U / r1 f . r2 = 4 b) PF  3. se obtiene usando la siguiente igualdad U / r  V / r 1  1 2   P  F ..r2 .50 .r . con r1 = 3. r1  1 f .r1 .... 7.  Y2 .189 a 1/F ~ F 5.69 ] = P[F  f0.95.99. de donde a = 0. Xn una muestra aleatoria de tamaño n de una variable aleatoria X ~ N(X. 5.P[F  a] = 0.975 . 6. 3.  X2 ). Ym una muestra aleatoria de tamaño m de una   variable aleatoria Y con distribución N Y .95 = P[a  F  b] = P[F  b] .01 Rpta. F a Luego: 1  f.85 Rpta. Sea Y1.975  b = f0. Sea X1. 7. 7 Rpta..95 Rpta. X2. Y2.29 . b) P[F  3. 98 . 5. 1  1 1  c) P[F  0.0358  F  1  = 1  P   f 0. . Con r1 = 7.0358] = P    1  P   27. r2 = 5 Solución Usando la tabla F: a) P[F  15. 7  5.9   F 0.01 F  d) P[F  b] = 0.. 3  = 1 – 0. 0.0 ] = 1 – P[F  15.P[ F  b ] = 0.95 .0 ] = 1 – P[F  f0.99 = 0..025  1 1  1 1 P[F  a] = P     1  P     0.0975.025 F a F a   1 1 P     0. ...975.99.99 = 0. la variable aleatoria. Rpta. 8 ] = 0.6 DISTRIBUCIÓN DE LA RAZÓN DE DOS VARIANZAS MUESTRALES Si se toman dos muestras aleatorias independiente de las poblaciones normales X e Y.P[F  a]  P[F  a] = 0.. encontraremos la distribución de probabilidades para la razón de varianzas muestrales de la siguiente manera. 4 ] =1 – 0. 5 = 6. Entonces.975 .975 y P[a  F  b] = 0. usando la definición de la variable aleatoria F. las dos variables aleatorias chi-cuadrado U y V son independientes por que X e Y son independientes.n n  1S X2 U  2 X  X i 1 i   X ² 2 X ~ x 2n  1 De modo similar.m-1  SY2 /  Y2 SY2  X2 . la variable aleatoria. m V m  1SY2   Y2   Y  Y ² i 1 i  Y2 ~ x2m  1 Además. tenemos que la variable aleatoria: n  1S X2 / n  1 F U / (n  1)  X2  V / (m  1) m  1SY2  Y2 / m  1 99  S X2 /  X2 S X2  Y2 ~ Fn–1. Entonces. 0 (con probabilidad 0.95 = 0.975 = 0. a) P[X > 27. d) Hallar a y b tal que P(X ≤ a) = 0. pero éste se encuentra entre los valores 22.975 b) P[7.0 X Resultado gráfico en Minitab c) P(X ≤ 23. Si X ~ X2 con 15 grados de libertad.05  = = P  X  x0.025 Rpta.0] = P[X  25. hallar: a) P(X > 27.7 EJERCICIOS RESUELTOS 1.3. 0.025 y P(a ≤ X ≤ b) = 0.95. Distribución chi-cuadrado con 15 g.l de la tabla 2 se buscan los valores dados para X y se leen las probabilidades (acumuladas menores que) correspondientes en el encabezamiento de las columnas así: 2  = 1 – 0.0 ] .5).5).P(X ≤ 27.95) para hallar p interpolamos de la siguiente manera: 100 .l.3 (con probabilidad 0.P[X  7. para 15 grados de libertad.26] = 2 2   P  X  x0.5] = 1 . c) P(X ≤ 23. de chi cuadrado.0).26 25.P  X  x0. no se encuentra el valor 23.900 0 0 7.90 Rpta.26 ≤ X ≤ 25. en la fila de 15 g.5.5) = p Como en la tabla 2.5) = 1.90) y 25.95 – 0. Solución Para obtener las probabilidades solicitadas.26 ≤ X ≤ 25. b) P(7.05 = 0. 975.9222 p = 0.26 Para r = 15 g. 18 ).3 23. 15 = 27.90 1.0.025 2 a = x0.95 = P[a ≤ X ≤ b] = P[X  b] – P[X  a] = P[X  b] .5 Rpta.5) = 0.2  p  0.5  22. Rpta. Calcule e interprete: a) P [ 3.5 X 2.025 P[X  b] = 0.90 p  0. Distribución chi-cuadrado con 15 g.90 23..90 P(X ≤ 23. 0.95 0 0 a = 6.9222 Rpta. d) P(X ≤ a) = 0. 15 = 6.0  22.µ )2 < 5.95  54  Luego: 25.2  54 p  48.975 Luego:  2 b = x0. De una población X: N(u.3  0.95  0.025 .l.3 0.l.26 b = 27. 0.683 ] b) ¿Entre que valores se encontrará el 90 % central de las varianzas muestrales? Solución 101 .5 p  25.291 < ( x .0 0.6  1. se extrae una muestra aleatoria de tamaño n = 21.x2 P 22. 05  20S 2 20a   2 20a  P    P  20   18  18    18 = 20a 2   20.µ ) < 5.7 <  (X i .63] = P[ 12  6.99 – 0. con el 5% hasta a y 95% hasta b.84 < 12 < 6. 18 Luego: a = 9.95 Se sabe que: (n 1)S 2 2  n21 entonces.en el 4% de las muestras de tamaño 21.n a) Se sabe que X  X i 1 n N(0..26) Rpta.84] = 0.P[ 12  3. de una población X N(u.81 ≤ S2 ≤ 28. Además: 0.05 y P (S2 ≤ b) = 0.291 y 5. Z 2  I ~ N ( . el 90% central de las varianzas muestrales (S2) se encuentra entre 9.04.en las muestras de tamaño 21.683] = P  =   18 18   18 2 = P [3. se encuentran entre 3. 18 ). b) Sean a y b los valores centrales dentro de los cuales se encuentra el 90% de las varianzas muestrales (S2). Calcule e interprete: 21 a) P [208. 931. 3.  X    n es ² ) y por lo tanto Z  n   X    ²n   X    ² x21 ~  ² 18 2 1 .05  10.683 x21  P [3. de una población X N(u.26. 18 ). se extrae una muestra aleatoria de tamaño n = 21.1) entonces. las desviaciones al cuadrado.. 18). con P (S2 ≤ a) = 0.81 y 28. Entonces: 0.9 . es decir: 0. (21  1)S 2 20S 2   202 18 18 Multiplicando en la probabilidad anterior por 20/18 se tiene una  202 así: 0. 5 18 Luego: b = 28. 0 .291x21 ( x  ) 2 x21 5.4 .µ)2 < 638.90 = P (9.95  20S 2 20b   2 20b  P    P  20   18  18    18 = 20b   22 0 .683. Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad por 21/18 y se construye una 12 así:  3.291 < ( x . Interpretación. de las medias muestrales x con respecto a la media poblacional µ.7] i 1 102 . De una población X: N(u.95 = 0.26. 0.81. Interpretación.90 = P (a ≤ S2 ≤ b).63] .   202 18 18 Multiplicando en la probabilidad solicitada por 20/18 se tiene una  202 así:  20 x9.77 20 S 2 20 x30.P[  212  11. Suponga que el número de horas semanales que las amas de casa ven TV tiene distribución normal con una varianza de 3. 18 ).17  =  i 1  (X i . las varianzas muestrales (S2) se encuentra entre 9.µ)2 < 638.975 – 0. de una población X N(u.7 <  i 1 21   2  208.7  ( X i   )  638.9] = 0.5] .975 – 0.925.b) P (9.77 < S2 < 30.925. las sumas de desviaciones al cuadrado.9 <  212 < 34.6] = 0. b) Se sabe que: (n 1)S 2 2  2 n 1 (21  1)S 2 20S 2 entonces.7] = P  18 18   18   = P [11. Interpretación.. Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 18 y se construye una  212 así: 21 P [208.05 = 0.2] .5] = P[  212  35.7.77 < S2 < 30. se encuentran entre 208.5% de las muestras de tamaño 21.78 P (9.en el 92. 4.6 <  212 < 35.78) = P    18 18  18  =  = P[10.05 = 0.77 y 30.78) Solución a) Se sabe que n (X i 1 2 i  )  2 para muestras de una población normal se cumple que: 21   n2  (X i 1 i   )2 18   212 . de una población X N(u.5% de las muestras de tamaño 21.. 18 ).2] = P[  202  34.P[  202  10.78. Interpretación. Al escoger una muestra de 17 amas de casa y registrar el número de horas a la semana que ven TV.7 y 638. calcule e 103 . de los valores observados con respecto a la media poblacional µ.en el 92. 25] = P[  92 ≤ 12. σ2 = (60)2 = 3600 y n = 10. 5.4) = 1 . Se sabe que: (n 1)S 2 2  n21 entonces. calcule e interprete la probabilidad que la desviación típica muestral se encuentre entre 50 y 70 horas.interprete la probabilidad de que la varianza muestral de los tiempos obtenidos sea mayor que 5. Solución Sean X = número de horas semanales que las amas de casa ven TV.25] = 0.0.20) y 6.39 (con probabilidad 0.80 .5% de las muestras de 17 amas de casa.   92 3600 400 Dividiendo en la probabilidad solicitada entre 400 se tiene una  92 así:  2500 S 2 4900  P(50 ≤ S ≤ 70) = P (2500 ≤ S2 ≤ 4900) = P    =  400 400 3600  = P[6.25. de chi-cuadrado.P   = 3   3 2 2 = 1 .4   P (S > 5. Se sabe que: (n 1)S 2 2  2 n 1 (10 1)S 2 S 2 entonces.025 Rpta.25 ≤  92 ≤ 12.4 (horas)2.30) para hallar p interpolamos así: 104 . no está el valor 6. (17  1)S 2 16S 2   162 3 3 Multiplicando en la probabilidad solicitada por 16/3 se tiene una 162 así:  16S 2 16 x5.p Como en la tabla 2.4) = 1 . La duración de los transistores fabricados por una compañía tienen una media de 2000 horas y una desviación típica de 60 horas.8] = 1 .4 (horas)2.P (S ≤ 5. Se selecciona 10 transistores al azar.P[ 162 < 28. n = 17 y σ2 = 3.25] – P[  92 ≤ 6.975 = 0. las varianzas muestrales (S2) del número de horas semanales que ven TV es mayor que 5.. Interpretación.38 (con probabilidad 0. µ = 2000. para 9 grados de libertad.en el 92. Solución Sean X = duración de los transistores. pero éste se encuentra entre los valores 5. 80 .26   X i2  27.26 y 27. Calcule e interprete: 15   a) P  7.87  10. 1) se extrae una muestra aleatoria de tamaño n = 15.26  152  27. La probabilidad solicitada es: 15   P  7.05 = 0.25  5..20 p  0.4693 < S² < 1.30  0.en el 51.38 6.5] – P[ 152 ≤ 7.26   X i2  27.39 0.1 p  2.1  6.5% de las muestras de 15 observaciones de la distribución normal estándar.20 Reemplazando p = 0. la suma de los valores observados al cuadrado se encuentra entre 7. b) Dado que: (n 1)S 2 2  n21 entonces. Interpretación.864) Solución a) Se sabe que las observaciones muestrales tienen la misma distribución que la población.20 6.38 0.2861 = 0.20 0. De una población X: N(0.87  p = 0. la desviación estándar muestral de la duración de dichos transistores se encuentra entre 50 y 70 horas.5139 Rpta.38  0..25 p  6. 1).925 Rpta.30  10.2861 en la última expresión se tiene que: P(50 ≤ S ≤ 70) = 0. 6.2861 p  0.x2 P 5.975 – 0.en el 92. entonces X i2 ~ 12 y por tanto 15 X i 1 2 i ~ X 152 .26] = 0.0.5 = i 1   = P[ 152 ≤ 27.02  0.5  i 1   b) P(0. Interpretación. (15 1)S 2  14 S 2  142 1 Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad por 14 y se construye una 142 así: 105 .4% de las muestras de 10 transistores.39  5.5. luego Xi ~ N(0.5  = P  7.0. 4693 < S² < 1. Interpretación.4693 y 1.  P(0. la varianza muestral se encuentra entre 0. 7.975 – 0.18 ≤  82 ≤ 17. la suma de de las desviaciones al cuadrado de los valores observados respecto a la media muestral. 10) se extrae una muestra aleatoria.8   ( X i  X )2  175  = P  10 10   10 i 1       = P(2.975 – 0.8 i 1 175    =   P  21.5% de las muestras de 15 observaciones de la distribución normal estándar. Interpretación.8 y 175. Para obtener la probabilidad solicitada se divide dentro de la desigualdad entre 10 y se construye una  82 así: 9   ( X i  X )2   9 21.5% de las muestras de 9 observaciones de la población X: N(μ.925. De una población X: N(μ.864) = P 14 x 0.864 = = P[6.025 = 0...en el 92. 12) se extrae una muestra aleatoria de tamaño m = 4.57 ≤ 142 ≤ 26.1] – P[ 142 ≤ 6.18] = = 0. 106 .955 Rpta.2  i 1   Solución  x  X  ² n a) Si  2   n  1 S ²  ² i 1 i ²  x  X  ² 9   n21 entonces i 1 i 10  82 .5) = P[  82 ≤ 17.81   (Yi   ) 2  133. 10).05 = 0. se encuentra entre 21.en el 92.964.5] – P[  82 ≤ 2.57] = 0.8   ( X i  X )2  175  i 1   y 4   b) P  5.4693  14 S 2  14 x1.1] = P[ 142 ≤ 26. de tamaño n = 9 y de una población Y: N(μ. Calcule e interprete: 9   a) P  21. en el 92. 8.101) = 1 . 12). hallar: a) P(T > 2.94 107 Rpta.484] = = 0. en la fila de 18 g.101) = 1. .P(T ≤ T18.101) b) P(-1.99 .P(T ≤ 2.1] = P[  42 ≤ 11.99 – [1 – 0.P(T  1.m  Y    ² b) Para una muestra de una población normal.734 ≤ T ≤ 2.552) c) P(T ≤ 1.1] – P[  42 ≤ 0.81 y 133.025 = 0.l de la tabla 3 se buscan los valores dados para T y se leen las probabilidades (acumuladas menores que) correspondientes en el encabezamiento de las columnas así: a) P(T > 2.025 Rpta.95.53) d) Hallar t0 tal que P(-t0 ≤ T ≤ t0) = 0.81   (Yi   ) 2  133.05 = 0.552) = P(T  2. Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 12 y se construye una  42 así: 4   (Yi   )2    4 5.2  = P  12 12   12 i 1       = P[0.975) = 1 – 0.484 ≤  42 ≤ 11.975 = 0.0.5% de las muestras de 4 observaciones de la distribución normal Y: N(μ.2. Si T ~ t con 18 grados de libertad (T18). la suma de de las desviaciones al cuadrado de los valores observados respecto a la media poblacional μ.734) = = P(T ≤ T18..95. Solución Para obtener las probabilidades solicitadas. 0.2   =  i 1  P  5. b) P(-1.99) – [1 . se sabe que: i 1 i ²   m2 4  Y    ² entonces i 1 i 12   42 . 0. Rpta. Interpretación.81 133.552) – P(T  -1. se encuentra entre 5.95] = 0.734 ≤ T ≤ 2.734)] = = 0.975 – 0. 552 Resultado gráfico en Minitab c) P(T ≤ 1.2  8.272  0.33 0.53 p  1.734 1. d) 0.53) = 0.90) y 1.940 0 -1. pero éste se encuentra entre los valores 1.95  8.33  0.90 P(T ≤ 1. 0. no se encuentra el valor 1.9248 Rpta.90 0.95 = P(-t0 ≤ T ≤ t0) = P(T18 ≤ t0 ) – P(T18 ≤ -t0) = = P(T18 ≤ t0 ) – [1 .90 p  0.Gráfica de distribución T con 18 G.975 = 2.53.975  to = T18.734 (con probabilidad 0.L. 0.53 1. Resultado gráfico en Minitab 108 .P(T18 ≤ t0)] = 2 P(T18 ≤ t0 ) – 1  P(T18 ≤ t0 ) = 0.90 1.101 Rpta.95  0.9248 p  0.734 0 T 2. para 18 grados de libertad.08 p  7. T de student.2  p = 0.53) = p Solución Como en la tabla 3.95) para hallar p interpolamos de la siguiente manera: Tα P 1.33 (con probabilidad 0.33 1.08  Luego: 1.734 0. no está el valor 2. Se pide hallar P X    0. (1) Como en la tabla 3.99) para hallar p interpolamos de la siguiente manera: 109 .101 0 T 2.085 litros.131) = = P(T24 ≤ 2. Calcule e interprete la probabilidad de que el promedio muestral difiera de su media poblacional µ en menos de 0.036 0.975) y 2.036     = P(-2.361) = 0.18 / 25 0.L.131) – [1 .036 y se construye una T24 así:  X   0.131)] = = 2 P(T24 ≤ 2.95 0.025 -2.131) – P(T24 ≤ -2.025 0 9.036 S/ n Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 0.Gráfica de distribución T con 18 G. Solución  Datos: n = 25. S = 0. entonces: T    t24 0.131) – 1 = 2p – 1 ….085  P X    0. para 24 grados de libertad. 0.131) = P(T24 ≤ 2.131. 0.085 Se sabe que: T   X  X  X   tn1 .101 Un inspector investiga las acusaciones contra la fábrica de ron “Pepito” porque no llena bien sus envases. Una muestra de 25 botellas de ron indica una desviación típica S = 0.18 litros. T de student.131 ≤ T24 ≤ 2.P(T24 ≤ 2.064 (con probabilidad 0.492 (con probabilidad 0. pero éste se encuentra entre los valores 2.18 lts.085 = P     P( T24  2. Donde X es la media muestral de las X y SY es la desviación estándar muestral de las Y.064 0. De una población X ~ N(10.95.817 = 0. 10.064 0. se tiene que: X  N(10.492 0.48% de las muestras de 25 botellas de ron “Pepito”.067  p = 0.064 2. Interpretación. Determine el valor de la constante a tal que: P (a SY < X . Reemplazando Z y la  92 en la expresión anterior se obtiene: X  10 2( X  10) 10 T   t9 SY 9SY2 / 40 9 110 ..53 =  0.085 = 2 (0. 1) . Con la muestra de tamaño 10 de la población X. 10).085 litros.131  2.9774) – 1 = 0.131 p  2.9548 Rpta.975 2.Tα P 2. Entonces: Z  X  10  N (0.10) = 0.9774 en (1) se tiene que:   P X    0.975 p  0. 40) se extrae una m.492  2. de tamaño 10.53p .27.a.9774 Reemplazando p = 0.067  28. 100) se extrae una muestra aleatoria de tamaño 10 y de una población Y ~ N(20.en el 95.975 2.990  0.975 p  0. el promedio muestral difiere de su media poblacional µ en menos de 0. 10 Con la muestra de la población Y se tiene que:  2  (10 1)SY2  92 40 Con los resultados anteriores construimos una variable T así: T Z 2 se distribuye como una T con los grados de libertad de la chi- G.L cuadrado.990  28. Solución Para resolver el problema es necesario construir una distribución T de student. 711 1.12 =  0. 0.95) y 2.9 ≤ T24 ≤ 1.95 p  0. S2 = 2. así: 0. Calcule e interprete la probabilidad de que el tiempo promedio muestral de atención a las clientas difiera de su media poblacional µ en menos de 0. Se pide hallar P X    0.25 minutos2.10) = P ( X .9)] = 2 P(T24 ≤ 1. 0.9) – [1 .25 minutos2.95 1.975) para hallar p interpolamos así: Tα P 1.3     = P(-1.5 / 25 S/ n Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 0.9634 111 . Solución  Datos: n = 25.13. se tomó una muestra aleatoria sin reemplazo de 25 atenciones con lo cual se obtiene S2 = 2.833  a = -0.10 ≤ a SY )  2( X 10)   2a  = P(T9 ≤ 2a)  0.10 ≥ a SY ) = 1 .3 0. no tiene el valor 1.05 = . la probabilidad dada se adecúa a la distribución t de student antes construida.95 = -1.T9.9) = P(T24 ≤ 1. pero éste se encuentra entre los valores 1.9  1.9 p 2.9.57  P X    0.95 p  0.9) = = P(T24 ≤ 1.064 (con probabilidad 0. 11.975  2.Para hallar el valor de la constante a solicitada.064  1.189  14.711 0.95  14.711 (con probabilidad 0.05 = P ( X .P(T24 ≤ 1.9) = 0.3 1. (2) Como en la tabla 3.57 = P     P( T24  1.10 ≤ a SY) = P  SY   Luego: 2a = T9.9165 Rpta.711 0.064 0.95 = P(a SY < X . Para analizar el tiempo de atención por clienta en las tiendas de pantalones “Ricas y apretaditas”.975  0. entonces: T    t24 0.9) – P(T24 ≤ -1.P ( X . T de student. para 24 grados de libertad.57 minutos.3 y se construye una T24 así:  X   0.189  p = 0.57 Se sabe que: T   X  X  X   tn1 .414 = 0.12p .9) – 1 = 2p – 1 …. 112 .68% de las muestras de 25 atenciones en las tiendas de pantalones “Ricas y apretaditas”.57 = 2 (0.055    0.055/a = T8.055 X  t8 SY Para hallar el valor de la constante a solicitada.L cuadrado.a. Solución Para resolver el problema es necesario construir una distribución T de student.055 Rpta. Donde x es la media muestral de las X y SY es la desviación estándar de las Y. así: 0. Determine el valor de la constante a tal que: P (a x > SY) = 0.a.99 = 2. la probabilidad dada se adecúa a la reciente distribución t de student construida.. 12. De una población X: N(0.57 minutos.9634) – 1 = 0.99 = P ( X /SY ≤ 1/a) = P   = P(T8 ≤ 3. Interpretación.9634 en (2) se tiene que:   P X    0. el tiempo promedio muestral de atención a las clientas difiere de su media poblacional µ en menos de 0.en el 92. 0.Reemplazando p = 0.9268 Rpta. Con la muestra de tamaño 7 de la población X.896  a = 1.P ( X /SY ≤ 1/a)  3.055/a) a   SY Luego: 3. 1) . 1/ 28 Con la muestra de la población Y se tiene que:  2  (9 1)SY2  24SY2  82 1/ 3 Con los resultados anteriores construimos una variable T así: T Z 2 se distribuye como una T con los grados de libertad de la chi- G. ¼) se extrae una m.055 X 3. de tamaño 9. se tiene que: X  N(0. Entonces: Z  X 0  2 7 X  N (0. 1/28). 1/3) se extrae una m. Reemplazando Z y la  82 en la expresión anterior se obtiene: T 2 7X 24SY2 8  3.01 = P (a x > SY) = 1 .01. de tamaño 7 y de una población Y: N(0. 99) – 1 = 0.98 Rpta.6 8 / 25 S/ n Para obtener la probabilidad solicitada se divide dentro de la desigualdad entre 1.13.5) – [1 . de n+1 observaciones.5)] = 2 P(T24 ≤ 2. σ²(n +2)/(n + 1)]. Calcule e interprete la probabilidad de que el número medio muestral de libros encuadernados difiera de su media poblacional µ en a lo más 4 libros. el número medio muestral de libros encuadernados difiere de su media poblacional µ en a lo más 4 libros.5) – 1 = 2(0. Puesto que las correspondientes medias se restan y las varianzas se suman.en el 98% de las muestras de 25 días de encuadernación cada una.a. σ²). se seleccionó una muestra aleatoria de 25 días con lo cual se obtiene S = 8 libros. se tiene que: X .5) = 1.P(T24 ≤ 2. 14.5) = = P(T24 ≤ 2.. Solución Para hallar la constante c es necesario construir una distribución T de student. Con la muestra dada se tiene que: X → N(μ. 113 . De una población X: N(μ. Por la propiedad reproductiva de la distribución normal.6   1. Para analizar el Nº de libros encuadernados diariamente por una máquina automática. entonces: T    t24 1. Interpretación.5 ≤ T24 ≤ 2. σ²).6   = P(-2. se extrae una m. S = 8 libros.6 y se construye una T24 así:  X  4  P X    4 = P    P( T24  2. Se pide hallar P X    4 Se sabe que: T   X  X  X   tn1 . 2 n 1 ) y Xn+1 → N(μ. Donde X y S es la media y la desviación estándar muestral obtenidas con las n + 1 observaciones.5) – P(T24 ≤ -2. Encontrar c tal que el estadístico c( X – Xn+1)/S tenga distribución t. Solución  Datos: n = 25 días.Xn+1 → N[0.5) = P(T24 ≤ 2. 268) c) P(0.P(F8.53) d) Hallar c y d tal que P(F7. en la intercepción de la línea del valor dado de F (en la fila 8) con la columna P así: a) P(F7.7 > 3.7 ≤ 3.05 Rpta. 15. se tiene que: c= n 1 n(n  2) Rpta.Entonces: Z  X  X n1  0  (n  2) /(n  1) 2 n  1  X  X n1     N (0. n2     Como S la desviación estándar muestral obtenidas con las n + 1 observaciones. numerador) y la fila 8 (G.268) = P  F   P(F8.50) = 1 – 0. entonces la chi-cuadrado es:  2  nS 2  2  n21 Con los resultados anteriores construimos una variable T así: T Z 2 se distribuye como una T con los grados de libertad de la chi- G.8 ≤ d) = 0.50) b) P(F7.025 y P(c ≤ F7. ubicarse en la gran casilla formada por la intercepción de la columna 7 (G. Reemplazando Z y la  n21 en la expresión anterior se obtiene: T n  1  X  X n1   n  2    nS 2  n  1  X  X n1     tn1 n(n  2)  S  2 Comparando el resultado anterior con la expresión dada.73) =  7.8 ≤ 3. 1) .P(F7. denominador) se busca el valor dado de F y se leen las probabilidades acumuladas menores que correspondientes.L.50) = 1 . Si F ~ f con 7 y 8 grados de libertad.1462 ≤ F7.8 ≤ c) = 0.8 > 3. 114 .95 = 0.8 ≤ 0.8 0.8 ≤ 0.L.  1 1  b) P(F7. hallar: a) P(F7.L cuadrado.95 Solución Para obtener las probabilidades solicitadas en la tabla 4.73) = 1 .8 > 3.95 Rpta.268  = 1 – 0.8 ≤ 4. 7 S2 1 S2  P S  5S 2 1 2 2   S12   P 2  5  = P(F7. 16.95.50 y se usa la relación: f .0. Si 0.53) = P(F7.n2 1 = F7.P(F7.204 4.95] = 0.[1 .7 ≤ 5) =  S2  = 1 – 0.025  1 f 8.8 que es otra distribución F8. 115 . 268 7 .8 ≤ d) = 0.P(F7.8 ≤ 4.8 ≤ d) .[1 – 0.8 ≤ 4. Si muestras aleatorias independientes de tamaño n1 = n2 = 8 provienen de poblaciones normales con la misma varianza.8 ≤ c) = P(F7.025 Luego: P(F7.8 ≤ d) – 0.025 Rpta. r2 .7 > 3.73 y le corresponde la probabilidad 0.925 Rpta.P(F8.73) = P(F7.1462)  1 1  = P(F7.7 ≤ 3. d) Hallar c y d tal que P(F7.975 = 0.53) .73)] = 0.P(F7.7 > 5) = 1 .8 ≤ 4.8 ≤ 4.53) .53) .8.53 Rpta.8 = 0.8.P  F  0 .8 ≤ c) = 0.975 entonces d = F7.975 = 4. En la intercepción de la columna 8 y la fila 7 de la Tabla 4 se busca el valor 3.025 entonces c = f 7.0. 8   = P(F7.8 ≤ d) = P(F7.7.53) .8 ≤ d) = 0.Para valores de 0 < F < 1 les corresponde probabilidades P =  < 0.8 ≤ 0.0. r1 .268 no se encuentra en la intercepción de la columna 7 y la fila 8 de la Tabla 4.95 = P(c ≤ F7. Calcule e interprete la probabilidad que la varianza de la primera muestra sea al menos 4 veces más grande que la otra.025 y P(c ≤ F7. r2  1 f1 .90 Rpta.P(F8.8 ≤ 4.8 ≤ c) = 0.975 .975  1 = 0. se toma el inverso de F7. Solución Dado que las varianzas son iguales. para obtener la probabilidad solicitada se S12  22 S12 emplea la distribución siguiente: F  2 2  2  f n1 1.95 Si P(F7. c) P(0. r1 Como el valor de F7.7 (con los grados de libertad permutados).1462≤ F7. 46  5. j 1  i 1  Solución Para hallar la probabilidad solicitada se construye una F como el cociente de dos chi-cuadrados entre sus respectivos grados de libertad.0  5. ¼) se extrae una muestra aleatoria de tamaño 7 y de una población Y: N(0. no se tiene el valor 6.99  144.29 0. para 5 y 7 grados de libertad.05 = 1.984 Interpretación.67 p – 141.  S2    Como en la tabla 4 de la distribución F. la varianza de la primera muestra es menor que seis veces la segunda.984 Rpta.29 1.29 (con probabilidad 0.29  p = 0.en el 98.99) para hallar p interpolamos de la siguiente manera: Fα P 5.46 0. De una población X: N(0. 17.67 =  0.975) y 7. 116 . la varianza de la primera muestra es al menos 4 veces más grande que la segunda.975 p  0. Calcule e interprete la probabilidad que la varianza de la primera muestra sea menor que seis veces la segunda.0 p  7.7 < 6) = p = 0. pero éste se encuentra entre los valores 5.29 6.975 7.29  144.Interpretación.975 p  0.99  0.5% de las (ó en 25 de cada 1000) muestras de tamaño 8 de cada población.. Solución Para hallar la probabilidad solicitada se emplea la propuesta del problema 16.. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de poblaciones normales con la misma varianza.46 (con probabilidad 0.4% de las (ó en 984 de cada 1000) muestras de tamaño 6 de la población 1 y 8 de la población 2.975 6.en el 2. 1/3) se extrae una muestra aleatoria de tamaño 9 Calcule 9  7  e interprete: P 4 X i2  9Y j2  .  S2  P S12  6S 22  P 12  6  = P(F5. 18. 61 (con probabilidad 0.88  5.9 ≤ 3.61 0. ¼) → Z i  Luego: Z i2  4 X i2  12 y 7 7 i 1 i 1  Z i2  4 X i2   72 . j 1 Con las dos chi-cuadrado anteriores se construye la distribución F siguiente: 7 F 4 X i2 / 7 i 1 9 3 Y / 9 2 j j 1 7  9 x4 X i2 / 7 i 1 9 7 x3 Y / 9 j 1  F7.991 Interpretación.9% de las (ó en 9 de cada 1000) muestras de tamaño 7 7 9 i 1 j 1 de la población X y 9 de la población Y.99 p  0. 1/ 2 9 Z j 1 Yj  0 1/ 3  3Y j  N (0.1) . 19.009 Rpta. 9 2 j  3Y j2   92 .88 (con probabilidad 0. pero éste se encuentra entre los valores 5. no está el valor 3. Si Y: N(0. Dos compañías A y B fabrican transistores.99) y 6.. 4 X i2  9Y j2 .25  p = 0.86) = 1 .61 0.25  254 =  0. 1/3) → Z j  Luego: Z 2j  3Y j2  12 y Xi  0  2 X i  N (0.P(F7. para 7 y 9 grados de libertad.9 > 3. Se toma una muestra de 8 transistores de A y 117 .88 0.Si X: N(0. ¼) entonces cada Xi: N(0.en el 0.61 5. en tanto que los B tienen una desviación estándar de 50 horas.99 p  0.995  254 p – 251.995  0.99 6. Como en la tabla 4 de la distribución F.86  5.86) = 1 – p = 1 – 0. 1/3) entonces cada Yj: N(0.995) para hallar p interpolamos así: Fα P 5.86 p  6.46 = 0.1) .991 = 0.99 5.86.9 2 j Acondicionando la probabilidad solicitada a la distribución anterior se tiene: 7  7 2    4 X 9 x 4 X i2       i 7 9  9 x3  2 2 i 1 i 1    = P 4 X i  9 Y j   P 9 3 P  9    7  2 2 j 1  i 1   3 Y j   7 x3 Y j  j 1  j 1    = P(F7. La duración para los fabricados por A tienen una desviación estándar de 40 horas. . 100) se extrae una muestra aleatoria de tamaño 12 y de una población Y ~ N(μ.en el 5% de las (ó en 50 de cada 1000) muestras de tamaño 8 de la población A y 16 de la población B. Para obtener la probabilidad solicitada se emplea la distribución F siguiente: F S A2  B2 S A2 40 2 S A2   0 . 118 . Solución Datos: σ2X = 100 horas.23x0. Para obtener la probabilidad solicitada se emplea la distribución F siguiente: F S X2  Y2 S X2 225 S X2   2 .25 x1. σB = 50.15 > 2.6 veces que la varianza muestral de las Y.64 A2  4.95 = 0. 64  f n A 1. 20. Interpretación.6  = SY  SY      = P(F11. 25  f n X 1. Calcule e interprete la probabilidad que la varianza de la primera muestra sea mayor 4.6SY2  P X2  1.23 veces que la varianza muestral de la segunda. Interpretación.15 S B2  A2 S B2 50 2 S B2 Adecuando la probabilidad solicitada al resultado anterior se obtiene:  S2    S2 P S A2  4.05 Rpta.nY 1 = F11.95 Rpta.23 veces que la segunda.71) = 1 – 0.nB 1 = F7.23S B2  P A2  4.16 de B.15 ≤ 2. 225) se extrae una muestra aleatoria de tamaño 8. Calcule e interprete: P( S X2  1.64  = P(F7. σ2Y = 225. De una población X ~ N(μ. la varianza de la duración de los transistores de la primera muestra es mayor 4.71) = SB  SB      = 1 ..7 SY2  X2 SY2 100 SY2 Adecuando la probabilidad solicitada al resultado anterior se obtiene:  S2    S2 P S X2  1. nA = 8 transistores y nB = 16.P(F7.6   P 2.6) = 0.en el 95% de las (ó en 950 de cada 1000) muestras de tamaño 12 de la población X y 8 de la población Y.23   P 0.25 X2  2. Solución Datos: σA = 40 horas.7 ≤ 3. la varianza muestral de las X es menor o igual que 1. nX = 12 transistores y nY = 8.6SY2 ) . se extrae una muestra aleatoria de tamaño n = 25.)2.3.µ)2 < 978.05 y P(a ≤ X ≤ b) = 0. calcule e interprete la probabilidad que la varianza muestral se encuentre entre 2500 y 4900 (horas)2. Se selecciona 10 transistores al azar. calcule e interprete la probabilidad de que la varianza de la muestra sea menor que 8.3).011 < ( x .52 ) 4.5 <  (X i . c) P(X > 37. Calcule e interprete: a) P [ 0. De una población X → N(µ . 6. Si X ~ X2 con 25 grados de libertad. d) Hallar a y b tal que P(X ≤ a) = 0. De una población X: N(u. 18 ). se extrae una muestra aleatoria de tamaño n = 25. Si se toma una muestra de 12 latas. 20 ). La duración de transistores fabricados por una compañía tienen distribución normal con una media de 2000 horas y una desviación típica de 60 horas.7 EJERCICIOS PROPUESTOS 1. Se seleccionan 23 focos al azar. La duración de los focos producidos por una compañía tienen una media de 1500 horas y una desviación típica de 80 horas. 2. Se sabe que los pesos de ciertas latas de atún se distribuyen normalmente con una desviación estándar de 2 gramos. 5.9). b) P(11. calcule e interprete la probabilidad de que la desviación estándar muestral se encuentre entre 60 y 100 horas.5 ≤ X ≤ 44.8 ] i 1 119 . Calcule e interprete: 25 a) P [327.7).614 ] b) ¿Entre que valores se encontrará el 95 % central de las varianzas muestrales? 3. Calcule e interprete: a) P [354 ≤ 30 (X i 1 i   ) 2 ≤ 876 ] b) P ( 11. 7. hallar: a) P(X ≤ 46.5 (gr.90.µ )2 < 3. 18). De una población X N(u. se extrae una muestra aleatoria de tamaño n = 30.04 ≤ S2 ≤ 31. De una población X → N(μ. Una muestra de 25 latas de cerveza indica un contenido medio x = 33.5) c) P(T > 1.a.05 y P(-t0 ≤ T ≤ t0) = 0.096 litros.a.5 minutos y una varianza S2 = 2. Calcule e interprete la probabilidad de que el promedio muestral difiera de su media poblacional en menos de 0. σ²). 12.0  i 1   Si T ~ t con 23 grados de libertad.513 minutos.929 onzas. Una inspectora de calidad investiga las acusaciones contra una fábrica de cerveza porque no llena bien sus envases. Calcule e interprete la probabilidad de que el promedio muestral difiera de su media poblacional en menos de 0.1   ( X i  X )2  190. De una población X: N(μ. Encontrar c tal que el estadístico c( x – Xn+1 )/S tenga distribución t. Determine el valor de la constante k tal que: P (k x > SX) = 0. 10   a) P  30.714) b) P(-1. 8. 10.05.0  i 1   8   b) P  32.7   (Yi   ) 2  201. 11.319) d) Hallar a y b tal que P(T ≤ -t0) = 0. 10) se extrae una m. 120 . Donde x y S es la media y la desviación estándar muestral obtenidas con las n primeras observaciones.319 ≤ T ≤ 2. ¼) se extrae una muestra aleatoria de tamaño 10.90. Calcule e interprete la probabilidad de que el promedio muestral difiera de su media poblacional µ en menos de 0.25 minutos2. De una población X: N(0.b) P (8.18 < S2 < 32. se extrae una muestra aleatoria de n+1 observaciones. 13. Una muestra de 16 botellas de gaseosa indica una desviación típica S = 0.18 litros. 14.25). Para analizar el tiempo de atención por cliente en un establecimiento grande. 15) se extrae una m. de tamaño m = 8. Calcule e interprete: 9.25 onzas. de tamaño n = 10 y de una población Y → N(μ. hallar: a) P(T ≤ -1.2 onzas y S = 2. Donde x es la media muestral de las X y SX es la desviación estándar muestral de las X. Un inspector investiga las acusaciones contra una fábrica de gaseosas porque no llena bien sus envases. se tomó una muestra aleatoria sin reemplazo de 25 atenciones con lo cual se obtiene un tiempo promedio de 7. La duración de los fabricados por A tiene una desviación típica de 40 horas. en tanto que los B tienen una desviación estándar de 50 horas. .90.15. La duración para los fabricados por A tiene una desviación estándar de 40 horas. 17. ….276 ≤ F ≤ 4. Y9 muestras aleatorias independientes de distribuciones normales. en tanto que los B tienen una desviación estándar de 50 horas. Si F ~ f con 10 y 12 grados de libertad. Se toma una muestra aleatoria de 10 focos de A y 10 de B. Calcule e interprete la probabilidad que la varianza de la muestra A sea al menos dos veces más grande que la B. 16. hallar: a) P(F ≤ 0.30) c) P(F > 3. Calcule e interprete la probabilidad que la varianza de la primera muestra sea mayor que 5 veces la segunda. 20. Dos compañías A y B fabrican focos.37) d) Hallar c y d tal que P(F ≤ c) = 0. ambas con media cero y varianza uno. …. Calcule e interprete la probabilidad que la varianza de la muestra A sea mayor que tres veces la varianza de la muestra B.05 y P(c ≤ T ≤ d) = 0. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de poblaciones normales con la misma varianza. Y2 . X2 . Dos compañías A y B fabrican transistores. X7 e Y1 . 121 . Calcule e 9  7  interprete: P 2 X i2  7Y j2  j 1  i 1  19. . Se toma una muestra de 10 transistores de A y 10 de B.212) b) P(0. Si muestras aleatorias independientes de tamaños n1 = n2 = 8 provienen de poblaciones normales con la misma varianza. Calcule e interprete la probabilidad que la varianza de la primera muestra sea 5 veces más grande que la segunda 18. Sea X1 . . xn. .5 4. la estadística permite cuantificar el error asociado a la estimación.7 Estimadores. se presenta los aspectos fundamentales de la estimación puntual. Salvo que estos parámetros se conozcan. Xn a las observaciones y. Propiedades.a. Ejercicios resueltos. 122 . Método de los momentos. p). buscando de observar las propiedades que deben reunir los estimadores de los parámetros... la segunda una v. Por lo tanto.4 4.1 4. Así.6 4. sean los que mejor representan a los verdaderos valores de los parámetros de interés.2 4. Método de máxima verosimilitud. N(µ. antes de obtener la muestra denotaremos X1 . Métodos de estimación puntual. deben estimarse a partir de los datos muestrales. X2. en algún sentido. pero lo que hago lo entiendo” Confucio CONTENIDO 4. Método de los mínimos cuadrados. En este capítulo. pero representativo de datos). una vez obtenida la muestra los valores observados los denotaremos x1. Supongamos que se selecciona una muestra de tamaño n de una población.Capítulo 4. es decir la aproximación al valor del parámetro a través de un solo valor. . Sin embargo.. así como el uso de los métodos de estimación puntual. ESTIMACIÓN PUNTUAL “Lo que escucho lo olvido. etc. Por ejemplo: P(λ).. El objetivo de la estimación puntual es usar una muestra para obtener números que. Cuando inferimos no tenemos garantía de que la conclusión que obtenemos sea exactamente correcta. B(n. La mayoría de las distribuciones de probabilidad dependen de cierto número de parámetros.. X2 . x2.. . lo que veo lo recuerdo. Antes de obtener la muestra no sabemos cuál será el valor de cada observación. Ejercicios propuestos. la primera observación puede ser considerada una variable aleatoria X1. etc. La estadística provee técnicas que permiten obtener conclusiones generales a partir de una muestra (un conjunto limitado. σ2 ).3 4. ... a la diferencia E( ˆ ) – θ = b ( ˆ ) se le denomina sesgo de ˆ . como estimación de la probabilidad de as? Parece razonable utilizar la frecuencia relativa de ases.un estimador puntual ˆ del parámetro θ es insesgado si: E( ˆ ) = θ .. xn . dado que depende de la muestra obtenida. . x2 . Propiedades de los estimadores Observemos que dada una m. es decir ˆ = F(X1 .θ es el error de estimación y una estimación será más precisa cuanto menor sea este error. una fórmula. se arroja el dado 100 veces en forma independiente. . p = 21 / 100 = 0.1 ESTIMADORES.. . En este caso. Xn).. ¿Qué valor podría utilizarse. ˆ . si llamamos p a la probabilidad que queremos estimar. Una propiedad deseable es que la esperanza del error sea 0. es una v.a. xn ). Ejemplo 1. . X1 . . . x2 . Este error es también una v. La diferencia ˆ . a) Insesgamiento. obtenido como una función de la muestra..a. obteniéndose 21 ases.Con el fin de estudiar si un dado es o no equilibrado. es decir ˆ = F(x1 . . 123 .4.... Definición: Una estimación puntual de un parámetro θ es un valor que puede ser considerado representativo de θ y se indicará ˆ . .. X2 . es decir que “en promedio” el error obtenido al estimar a partir de diferentes muestras sea cero. en base a esa información. PROPIEDADES Estimador y estimación Definición: Un estimador puntual ˆ del parámetro θ es un estadístico. Para algunas muestras será positivo. para otras negativo..a. Se obtiene una vez determinada la muestra de valores observados x1 .21.. Xn un estimador puntual del parámetro θ obtenido en base a ella. X2 .. Si ˆ no es insesgado. .. de una población X con media μ y varianza σ2.. X2 . Ejemplo 3.. Hemos visto en las distribuciones muestrales que un estimador de la n media poblacional μ es la media muestral. y hemos probado que:  n   Xi  1 n 1 n 1 E ( X )  E  i 1    E ( X i )     (n )   n i 1 n  n  n i 1   Es decir que la media muestral X es un estimador insesgado de la media poblacional μ..a.. es decir que ˆ  X  X i 1 n i .. .sea X1 .. X2 . basado en una muestra aleatoria X1 .. Xn una m.a.. . Xn . es insesgado asintóticamente si: 124 . se dice que un estimador es insesgado si su distribución tiene como valor esperado al parámetro que se desea estimar.Un estimador puntual ˆ del parámetro θ. . que un estimador de la n ˆ 2  varianza poblacional σ2 es ( X i 1 i  X )2 n . σ2 ) . en estimación máximo verosímil. b) Insesgamiento asintótico. X2 . Xn una m.. . cuya esperanza está dada por:  n    ( X I  X )2  n n   1 E X 2  nX 2   1 E X 2   E X 2 E (ˆ 2 )  E I 1  i i   n  n i 1  n  i 1       =        n 2 2 E X i2  E X 2  V ( X i )  E ( X i )   V ( X )  E ( X )  n =    2 2 n  2  E (ˆ 2 )  Es decir que: n Luego ˆ 2  2 ( X i 1 i  n 1 2  n n 1 2  n  X )2 n no es estimador insesgado de la varianza poblacional σ2. ..Si X1 . Veremos más adelante. Ejemplo 2.. de una población X ~ N(μ .Por lo tanto. Xn una m. c) Consistencia.a.verificar que la varianza muestral s 2  ( X i 1 i  X )2 n 1 es un estimador insesgado de la varianza poblacional σ2 cualquiera sea la distribución. .   lím P ˆn      1 n n Ejemplo 4. Diremos que ˆn es un estimador consistente de θ. de una distribución que depende de un parámetro θ. si   0 . 2 / n) . n Ejercicio..Como la media muestral Z X  N (. X2.Demuestre que la media muestral ˆ  X  X i 1 n i es un estimador consistente de la media poblacional μ.. y sea ˆn un estimador puntual de θ basado en esa muestra.Sea X1.... . n pero es asintóticamente insesgado ya que su esperanza tiende a σ2 cuando el tamaño de la muestra tiende a infinito. Y la variable aleatoria ( X  ) tiene aproximadamente distribución N(0. 1) .lím n E(ˆ)   n En el ejemplo 3. Solución. tenemos que: / n   n  n   n  1 P X       P   X       P Z   2          Luego:  n  lím lím   1 = 2 (1) – 1 = 1 2  P X      = n n      125 .. si bien ˆ 2  ( X i 1 i  X )2 no es un estimador insesgado. . Entre un estimador insesgado y otro que no lo es. si el 126 . ECM ( ˆ ) = Var ( ˆ ) + [ b( ˆ ) ]2. siempre que tenga media y varianza. se escoge al que tenga menor varianza.n Por lo tanto. se debe elegir al que tiene menor ECM. ECM ( ˆ ) = Var ( ˆ ).Sea ˆ un estimador puntual del θ.- ECM (ˆ)  Eˆ     Var(ˆ)  b(ˆ) 2 2 Siendo b (ˆ ) = E( ˆ ) – θ el sesgo del estimador ˆ .2 ECM (ˆ)  E[(ˆ   ) 2 ]  E[ˆ  E(ˆ)  E(ˆ)    ] = 2 2 = E[ˆ  E(ˆ   E(ˆ)     2ˆ  E(ˆE(ˆ)   ] = E[ˆ  E(ˆ ]  E[E(ˆ)    ]  2Eˆ  E(ˆE(ˆ)    2 2 Utilizando las propiedades del operador esperanza. como queríamos probar.Si el estimador ˆ es insesgado. Demostración. Nota.Dados dos o más estimadores del parámetro θ. la media muestral X  X i 1 i es un estimador consistente de la n media poblacional μ.. d) Error Cuadrático Medio (ECM) de un Estimador . e) Eficiencia Relativa (Principio de estimación de menor error cuadrático medio). En el caso de que los estimadores sean insesgados. parámetro su error cuadrático medio es: 2 ECM (ˆ)  Eˆ    Proposición. por lo tanto. se tiene que: ECM (ˆ)  E[ˆ  E (ˆ  ]  [E (ˆ)    ]  2Eˆ  E (ˆ E (ˆ)     V (ˆ)  [b(ˆ)]2  0 2 2 y. el error cuadrático medio es igual a la varianza del estimador. cualquiera que sea el tipo de distribución de la población.. Es decir. de una población X ~ N(μ .El estimador ˆ1 es insesgado. Ejemplo 5.Sea X1 .. ˆ2 será mejor estimador que ˆ1 . Cuya solución es: Es decir que ˆ1 será mejor estimador que ˆ2 si  > 3. ˆ 2  X1  X 2 2 y ˆ 3  X 1 Mientras que. si  < 3.. podría ser preferible su uso.. . Rpta..... (1) El estimador ˆ2 es sesgado. (2) ˆ1 será mejor estimador que ˆ2 si: ECM (1 ) < ECM ( ˆ2 ) Reemplazando (1) y (2): 6 < (18 + 4 2) / 9  > 3. por lo tanto: ECM ( ˆ2 ) = Var( ˆ2 ) + [ E ( ˆ2 ) . son estimadores insesgados de μ. ]2 = (18 + 4 2) / 9 . Var ( ˆ1 ) = 6 .Suponga que ˆ1 y ˆ2 son dos estimadores de  con E ( ˆ1 ) = .. Xn una m.. por lo tanto: ECM ( ˆ1 ) = Var ( ˆ1 ) = 6 . la varianza de estos estimadores es: 127 .estimador sesgado tiene una varianza mucho menor que el insesgado. Ejemplo 6. ]2 = 2 + [/3 . porque tiene menor ECM. Var ( ˆ2 ) = 2. en caso contrario.. ¿Cuál es mejor estimador de  ? ¿por qué? Solución. . σ2 ) . E( ˆ2 ) = /3. ˆ1  X . Se puede verificar inmediatamente que los siguientes estimadores. X2 ..a.. . la cota inferior de la varianza de ˆ es: Var(ˆ)  B( )  1 d  nE  ln f ( x.V (ˆ1 )  2 n . de n observaciones y sea f(x.a. V ( ˆ 2 )  2 y V ( ˆ 3 )   2 2 Por lo tanto. n estima a P.Demostrar que la proporción muestral p es un estimador insesgado de varianza mínima de la proporción poblacional P. Cramer y Rao establecieron una cota inferior de las varianzas. Para todos los estimadores insesgados de θ. es una media muestral de v. el mejor estimador de μ será ˆ1  X por tener menor varianza. basado en una m.   d  2 Si la varianza de un estimador insesgado ˆ satisface la desigualdad de Cramer y Rao como una igualdad.. entonces: n p X i 1 i . Luego: 128 . Solución. este es un estimador insesgado de varianza mínima o eficiente. Ejemplo 7. de la siguiente manera: La cota inferior de Cramer – Rao [ B(θ) ] Sea ˆ un estimador insesgado del parámetro θ.a X.Se dice que un estimador puntual ˆ es un estimador eficiente del parámetro θ si es insesgado y de varianza mínima.a. f) Eficiencia. La proporción muestral p. de una variable aleatoria X con distribución de Bernoulli. representa la proporción de éxitos en la muestra y estima a la proporción de éxitos en la población P. Bernoulli con E(Xi ) = P y V(Xi ) = PQ.Suponga que se extrae una muestra aleatoria simple de tamaño n de la población X con distribución de Bernoulli. Entonces. θ) la distribución de probabilidades de la v.   n   Xi  1 n 1 n 1 E ( p)  E  i 1    E ( X i )   P  (nP)  P n i 1 n  n  n i 1   Es decir que la proporción muestral p es un estimador insesgado de la proporción poblacional P. P) = P x (1 – P) 1 . P) = x ln P + (1 – x) ln (1 – P) iii) d x 1 x xP ln f ( x. 1 ii) ln f(x. Veamos si es de varianza mínima. Como la proporción muestral p es un estimador insesgado y de varianza mínima para P. 129 .x . x = 0 . P)    dP P 1  P P(1  P) iv)  ( x  P)2  Var( X ) PQ 1 d  E  ln f ( x.  n  n    X i  Var( X i ) i 1 Var( p)  Var i 1   n2  n    n   Var( X i ) i 1 n 2 (propiedad de la varianza) n   PQ i 1 n 2  nPQ PQ  n2 n Hallemos la cota inferior de Cramer – Rao. P)  E  2  2 2  2 2  2 PQ PQ PQ  dP   P (1  P)  v) B( P)  2 1 d  nE  ln f ( x. es un estimador eficiente. P)  dP  2  1 PQ = Var (p)  n  1  n   PQ  Dado que la Var (p) es igual a la cota inferior de Cramer-Rao B(P). B(P): i) f(x. p es un estimador de varianza mínima para P. Dicha probabilidad está representada por la función de probabilidad conjunta de la muestra y recibe la denominación de función de verosimilitud. x2 ... Sabemos que si 4 http://buscon. θ) f (x2 .es/drae/ Real Academia Española © Todos los derechos reservados.. Que tiene apariencia de verdadero. Adj. xn . X2. y sean x1 .. Xn una m.... . que representa la probabilidad de obtener la muestra observada. El método de los mínimos cuadrados ordinarios (que busca minimizar la varianza de los errores en el modelo de regresión lineal). θ) . A continuación presentamos cada uno de estos métodos de estimación. . 4.rae. xn .. ) i 1 i 2) El método de máxima verosimilitud consiste en tomar como estimación el valor ˆ que hace máxima la función de verosimilitud V(θ). Creíble por no ofrecer carácter alguno de falsedad. 2. una variable aleatoria con función de probabilidad f(x. de X..Sea X1. . . Procedimiento.. . Para hallar el EMV del parámetro desconocido θ se procede de la siguiente manera: 1) Hallar la función de verosimilitud. θ) = f (x1 .. .2 MÉTODOS DE ESTIMACIÓN PUNTUAL Entre los principales métodos de estimación puntual se tiene: El método de máxima verosimilitud (que busca maximizar la probabilidad de que ocurra la muestra observada) El método de los momentos (en el que se iguala los correspondientes momentos poblacionales y muestrales). y se define así: n V(θ) = f (x1 .4.. al estimador ˆ que maximiza la probabilidad de obtener la muestra realmente observada. a. Vigésima segunda edición (2001). θ) =  f ( x . x2 . Adj. 130 . Verosímil: 1. los valores observados. θ) que depende del parámetro θ. f (xn .3 MÉTODO DE MÁXIMA VEROSIMILITUD El método consiste en seleccionar como Estimador Máximo Verosímil4 (EMV) puntual del parámetro θ. 2. Es decir: n L  ln f ( xi . 1 . Solución. también hace máxima a su logaritmo ln V(θ).ˆ hace máxima a V(θ).. .. x2 . ˆ r . Xn una m..x . . Ejemplo 8. )   0  ˆ = F (x1 . . xn )  i 1  Si la distribución tiene r parámetros desconocidos θ1 .. P) ..... . . a.... P) =  P i 1 i xi X n X (1  P)1 xi = P  i (1  P)  i i 1 n   x ln P  n   i   xi  ln(1  P) i 1 i 1   n iv) L = ln V(P) = 131 . xn. P) = n n =  f ( x . . n iii) La función de verosimilitud V(P) está dada por: V(P) = f (x1 . Para convertir el producto en suma. 0 < P < 1 ii) Sea X1 .Hallar el estimador de máxima verosimilitud para el parámetro P (proporción o probabilidad de éxito) de la distribución X de Bernoulli. X Bernoulli es: f (x. P) = f (x1 . se toma la función: n L = ln V(θ) =  ln f ( x ..... θr ... …... . x2 . xi = 0 ..a. x2 . xn . ) i 1 i 3) Se toma derivadas parciales de L con respecto a θ. f (xn . . .. . 1 L L  0 . se toma derivadas parciales con respecto a cada parámetro y en lugar de una ecuación tendremos las r ecuaciones: L 0 . X2 . .. se iguala a cero y se obtiene ˆ . Entonces: f ( xi . θ2 . x = 0 . 1 . de X. 0  2  r a partir de las cuales se obtiene los estimadores ˆ 1 . P)  P xi (1  P)1 xi . .. P) = P x (1 – P) 1 . cuyos valores observados son x1 . P) f (x2 . .i) La función de probabilidad de la v. . . i = 1.. ˆ 2 . .. y x E( X k )   x k f ( x)dx en el caso continuo. es decir: E ( X k )   x k p( x) en el caso discreto. Dada una muestra aleatoria X1 . el momento muestral de orden k n alrededor del origen denotado por M’k . Recordemos la siguiente definición. ˆ m que se obtienen igualando m momentos poblacionales con los correspondientes momentos muestrales. Los estimadores de momentos de Ө1. X2 . . se obtienen resolviendo el siguiente sistema de ecuaciones: 132 . Өm son los valores ˆ 1.  si esas esperanzas existen. Ө2.Sea X1 . ... Xn . 4. Definición.a. X2 . Estimador muestral que sabemos es un estimador eficiente de la proporción poblacional P. . . de una distribución con función de probabilidad o función de densidad que depende de m parámetros Ө1.Sea X una v. ... ˆ 2.... Xn ... . es: M 'k  X i 1 k i n Definición. una m. Өm..a.. .. En general.n  xi v) n n   xi L i 1 i 1   P P 1 P n 0 1 P  P n   xi i 1 n x i 1  i n Pˆ  p  Luego: x i 1 n i X Rpta. Se denomina momento de orden k (k  N) o momento poblacional de orden k a E(Xk ). Ө2...4 MÉTODO DE LOS MOMENTOS La idea básica de este método consiste en igualar los momentos muestrales con los correspondientes momentos poblacionales. . con función de probabilidad puntual p(x) en el caso discreto o función de densidad f(x) en el caso continuo.. basta plantear una ecuación basada en el primer momento...Sea X1. a la cual se le agrega la variable aleatoria error y lo que se busca es n minimizar la varianza de los errores representada por e i 1 2 i . n k = 1. Como hay un solo parámetro a estimar. m Ejemplo 9.b Xi y por tanto se busca minimizar: n n i 1 i 1  ei2   (Yi  a  bX i ) 2 Se toman derivadas parciales con respecto a a y con respecto a b. X2. . Si Yi = a + b Xi + ei entonces ei = Yi ..a .. . . Se parte del hecho de que no todos los puntos caen sobre la recta postulada. Sabemos que para la distribución exponencial E ( X )  1 Entonces:  n M  ' 1 X i 1 n i  E( X )  1   ˆ  n  n X i 1 1 X i 4. es utilizado para estimar los parámetros del modelo de regresión lineal simple y múltiple. M1’ = E (X).. una m. Xn. Es decir.5 MÉTODO DE LOS MÍNIMOS CUADRADOS Conocido también como el método de los mínimos cuadrados ordinarios. .n E ( X k )  M 'k  X i 1 k i . de una distribución exponencial de parámetro λ.a. se igualan a cero así: n d n 2 ei  2 (Yi  a  bX i )(1)  0  da i 1 i 1 133 .. 2. . (1) n n n i 1 i 1 i 1 a X i  b X i2   X i Yi …..n d n 2 e  2 (Yi  a  bX i )( X i )  0 i  db i 1 i 1 Luego de igualarlas a cero se obtiene las denominadas ecuaciones normales: n n i 1 i 1 na  b X i   Yi …. (2) Cuya solución proporciona los siguientes estimadores: de b y a: n bˆ   X Y  nX Y i 1 n i i X i 1 aˆ  Y  bˆ X y 2 i  nX 2 Cuando se reemplaza los resultados muestrales se obtiene: Yˆ  aˆ  bˆX i 134 . Si ˆ  X1 . ¿Es éste un estimador: a) insesgado? y b) eficiente? Solución Por definición de muestra aleatoria se sabe que: X1. X2 . Xn son n variables aleatorias independientes con: E(Xi) = µ. V(Xi) = σ2. Demostrar que la varianza muestral ˆ 2  s 2  (X i 1 i  X )2 n 1 es un estimador insesgado de la varianza poblacional σ2.. La primera observación de una muestra aleatoria de tamaño n.4. Solución Sabemos que: n n i 1 i 1  ( X i  X ) 2   X i2  nX 2 Hallando la esperanza de la varianza muestral se tiene:  n 2  n 2  n  2 2   ( X I  X ) 2  E  X i  nX  E  X i   nE X    i 1     i 1 E (ˆ 2 )  E (s 2 )  E i 1   n 1 n 1 n 1              nE X i2  nE X 2 n V ( X i )  E ( X i )   V ( X )  E ( X )   = n 1 n 1 2 2    2 n 2   2   2 n n 2   2   =  n 1 n 1 (n  1) 2 Es decir que: E(ˆ )  E(s )  2 n 2 2 n Luego ˆ 2  s 2  (X i 1 i  X )2 n 1 es estimador insesgado de la varianza poblacional σ2. …. entonces: a) E(ˆ )  E( X1 ) = µ. 2. podría utilizarse como un estimador de la media poblacional.6 PROBLEMAS RESUELTOS n 1. luego ˆ  X1 es un estimador insegado de µ. 135 . 58. 15.6 159  = 15. a) ¿Cuál es la estimación puntual del peso medio poblacional de las cajas de cereal? b) ¿Cuál es la estimación puntual de la varianza poblacional del peso de las cajas? Solución a) El estimador puntual de la media poblacional es la media muestral y su estimación es la siguiente: n   X   Xi i 1 n 10  X i 1 i 10  15.9. 15.7 2  15.1.2. Las cajas de un cereal producido por una fábrica deben tener un contenido de 16 onzas (una libra).7 2  . 15. entonces ECM (X1) = V(X1) = σ2. 16.8. X X i 1 i también es un estimador insesgado de µ.7.8.  15..3. 3. 16. ya que X es un estimador más eficiente.  15.7  .7. 16.6..9 onzas. 15...9. Reemplazando en la expresion de la varianza muestral se obtiene: 136 .. 15. con n ECM ( X )  V ( X )  2 n . se tiene que: ECM (X1) > ECM ( X ) luego X1 no es un estimador eficiente de µ.7  15. 15.. n Pero.b) Como X1 es un estimador insesgado. Comparando los errores cuadráticos medios de ambos estimadores.6 2 = 2528. 10 10 b) El estimador puntual de la varianza poblacional es la varianza muestral y su estimación es: n ˆ 2  S 2  n 10 i 1 i 1 ( X i  X )2 i 1 n 1 n   X i2  nX 2 i 1 n 1 10  X i 1 2 i  10 X 2 10  1   X i2   X i2  15. Un inspector toma una muestra aleatoria simple que arroja los siguientes pesos en onzas: 15. 9) 2 = 0. Solución El estimador puntual de la proporción poblacional es la proporción muestral siguiente: n  p p X i 1 n i  X N  de éxitos  n n a) La estimación de la proporción de adultos que opinan que la economía se está contrayendo es:  p X adultos que opinan que la economía se está contrayendo 300   = n 1000 1000 0.10 ˆ 2  S 2  4. X i 1 2 i  10 X 2 10  1  2528 . d) La proporción de adultos que No sabe/No opina. c) La proporción de adultos que opinan que la economía está creciendo. b) La proporción de adultos que opinan que la economía permanece igual. Las respuestas fueron las siguientes: OPINIÓN: ADULTOS La economía se está contrayendo 300 La economía permanece igual 400 La economía está creciendo 200 No sabe/No opina 100 Determine la estimación puntual de los siguientes parámetros de la población: a) La proporción de adultos que opinan que la economía se está contrayendo.30. b) La estimación de la proporción de adultos que opinan que la economía permanece igual es:  p X adultos que opinan que la economía sige igual 400   = 0.0533 (onzas)2.58  10 x (15.40 n 1000 1000 c) La estimación de la proporción de adultos que opinan que la economía está creciendo es: 137 . 9 En una encuesta de opinión a 1000 adultos para conocer su opinión acerca de la economía. ECM (î )  V (î )    E(î )  2 E (ˆ1 ) = E[3X1 – X2] = 3 E(X1) . Luego: 2 ECM (ˆ1 )  V (ˆ1 )    E (ˆ1 )  = = 44 + [ϴ . n 1000 1000 Estimaciones que casi siempre son presentadas como porcentajes de la siguiente manera: NÚMERO Y PORCENTAJE DE ADULTOS. V(X1) = 4. ¿Cuál de los estimadores es más eficiente? Solución Para determinar cuál de los estimadores es más eficiente hay que hallar sus errores cuadráticos medios y compararlos.5]2 = 44 + [ϴ2 – 10 ϴ + 25] = ϴ2 – 10 ϴ + 69 E(ˆ2 ) = E[3X2 – X1] = 3 E(X2) – E(X1) = 3(4) – 3 = 9 V (ˆ2 ) = V[3X2 – X1] = 32 V(X2) + V(X1) = 9(8) + 4 = 76. E(X2) = 4. Si ˆ1 = 3X1 – X2 y ˆ2 = 3X2 – X1 son dos estimadores de ϴ. V(X2) = 8. p X adultos que opinan que la economía está creciendo 200   = 0. ADULTOS % La economía se está contrayendo 300 30 La economía permanece igual 400 40 La economía está creciendo 200 20 No sabe/No opina 100 10 Total 1000 100 Asumiendo que X1 y X2 son variables aleatorias independientes con: E(X1) = 3. SEGÚN SU OPINIÓN SOBRE LA SITUACIÓN DE LA ECONOMÍA OPINIÓN: 5. n 1000 1000 d) La estimación de la proporción de adultos que No sabe/No opina es:  p X adultos que No sabe/No opina 100   = 0.20.10.E(X2) = 3(3) – 4 = 5 V (ˆ1 ) = V[3X1 – X2] = 32 V(X1) + V(X2) = 9(4) + 8 = 44. Luego: 138 . hay que hallar sus varianzas y compararlas. por definición de muestra aleatoria. X 1  n  Xi i 1 2n y X2  X i 1 n i . ya que son medias muestrales con 2n y n observaciones muestrales respectivamente. el estimador ˆ2 es un estimador más eficiente para ϴ que ˆ1 Rpta. ¿cuál es el mejor estimador de µ? Solución 2n Ambos estimadores de µ propuestos.18ϴ + 157 El estimador ˆ1 es un estimador más eficiente para ϴ que ˆ2 si se cumple que: ECM (ˆ1 )  ECM (ˆ2 ) → 8ϴ < 88 → ϴ2 – 10 ϴ + 69 < ϴ2 . X 1 es el mejor estimador de µ. Sean X 1  2 n  Xi i 1 X2  y 2n X i 1 i n dos estimadores de µ. Luego. Si ϴ > 11. Teniendo en cuenta que E(Xi) = µ y Var(Xi) = σ2.9]2 = 68 + [ϴ2 . 6. será mejor estimador el que tenga menor varianza. son estimadores insesgados. Suponga que tiene una muestra de tamaño 2n de una población X con E(X) = µ 2n y Var(X) = σ .2 ECM (ˆ2 )  V (ˆ2 )    E (ˆ2 )  = = 76 + [ϴ .  2n   Xi V ( X 1 )  V  i 1  2n         V ( X i )  n   Xi V ( X 2 )  V  i 1  n         V ( X )   2n i 1 ( 2 n) 2 2n  n  2 i 1 ( 2 n) 2  2n 2  2  2n ( 2n ) 2  n 2  2  n n2 n i i 1 n2  i 1 n2 2 Se observa que V ( X 1 )  V ( X 2 ) . 139 . Rpta.18ϴ + 81] = ϴ2 .18ϴ + 157 → → ϴ < 11. Por lo tanto. α + 1]. Rpta.….. a) Demuestre que la media muestral x = ˆ es un estimador sesgado de α. ˆ2 = ( 2 X1 . entonces f ( x)  1  1 . Sea X1. α ≤ X ≤ α + 1. Considere los siguientes estimadores de µ: ˆ1 = (X1 + X2 + …. (b) n n 1 V ( X )  12 i i 1 n 2  i 1 n 2  1 n  2 12n 12n Reemplazando la varianza de ˆ y la esperanza de ˆ en (b) se tiene: 2 1  1  1 1 1  3n  ECM (ˆ )           12n  2  12n 4 12n  8. b) Calcule el error cuadrático medio del estimador ˆ  x . X2 . X7 una muestra aleatoria de una población con media µ y varianza 2.X6 + X4 ) / 2 a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de µ? Solución a) Por definición de muestra aleatoria E(Xi) = µ y Var(Xi) = σ2. entonces:  n   Xi E (ˆ )  E ( x )  E  i 1  n         n  E( X i ) i 1 n n   i 1 2  1 2  1 1 2    n 2 2 Luego: ˆ = x es un estimador sesgado de α.Xn.. Así mismo. + X7 ) / 7 .. …. Solución a) Como la variable aleatoria X tiene distribución uniforme en el intervalo [α. Sea X1 . . Luego: 140 . X2. α + 1]. Rpta. b) El error cuadrático medio del estimador ˆ  x esta dado por: ECM (ˆ )  V (ˆ )    E(ˆ ) 2  n   Xi V (ˆ )  V ( X )  V  i 1  n         …. una muestra aleatoria de una variable aleatoria X con distribución uniforme en el intervalo [α.7.  1 E( X )  EX i      1 2 2  1 (  1   ) 2 1 y V ( X )  V X i    2 12 12  Si ˆ  x . entonces: ECM (ˆ1 )  V (ˆ1 )  6 2    8  ECM (ˆ2 )  V (ˆ2 )    E (ˆ2 )   2      2 4  2 2 El estimador ˆ1 es mejor estimador de ϴ que ˆ2 si se cumple que: ECM (ˆ1 )  ECM (ˆ2 ) → 6 8  2 → 24 < 8 + 2 → 2 > 16 →   4 . E ( ˆ2 ) = β Var ( ˆ2 ) = 6... 9.. 7    7 7 7 2E ( X 1 )  E ( X 6 )  . E ( ˆ1 ) = β /2. E( ˆ 2) = ...E ( X 4 ) 2     2 E ˆ2      2 2 2 Por lo tanto ˆ1 como ˆ2 son estimadores insesgados de µ. 4 Si   4 .   2 49 49 7 2 2 V ( X 1 )  V ( X 6 )  .. Var ( ˆ1 ) = 7 y Rpta. E ˆ1   b) Por ser insesgados.E ( X 1 )  E ( X 2 )  . Suponga que ˆ1 y ˆ2 son 2 estimadores de β con: /3. es mejor estimador de µ el que tiene menor varianza.14 σ2.V ( X 4 ) 4 2   2   2 6 2 ˆ = 1...  Suponga que ˆ 1 y ˆ 2 son estimadores de  con E(ˆ 1) = .. Rpta... ¿Cuál es mejor estimador de  ? ¿por qué? Solución De los dos estimadores.. Var ( ˆ 1 2 ) = 6 .5 σ2. 10. Como ˆ 1 es estimador insesgado de . Rpta. Luego: V ˆ1   V ( X 1 )  V ( X 2 )  . V  2     2 4 4 2 Por lo tanto ˆ1 es mejor estimador de µ que ˆ2 . el estimador ˆ2 es mejor estimador de ϴ que ˆ1 . ¿Cuál es mejor estimador de β? ¿Por qué? Solución 141 .   2 7 2 = 0. 2 ˆ ˆ ˆ Sabemos que: ECM (i )  V (i )    E (i )  .  V ( X 7 )  2   2  .  E ( X 7 )     . es mejor el que tiene menor error cuadrático medio. Var ( ˆ 2 ) = 2. De los dos estimadores. Por lo tanto ˆ es un estimador insesgado de . Luego. Solución a) Si ˆ1 y ˆ2 son estimadores independientes insesgados del parámetro desconocido .   6 7 7 . con varianzas conocidas  12 y  22 respectivamente: a) Demostrar que ˆ = a ˆ1 + (1 – a) ˆ2 también es un estimador insesgado de . para cualquier valor de a. entonces: E( ˆ1 ) =  y E( ˆ2 ) = . el estimador ˆ2 es mejor estimador de β que ˆ1 . la varianza del estimador es: V( ˆ ) = V[a ˆ1 + (1 – a ) ˆ2 ] = a2 V( ˆ1 ) + (1 – a)2 V( ˆ2 ) Reemplazando la varianza de los estimadores se obtiene: V( ˆ ) = a2  12 + (1 – a)2  22 = f(a) 142 . es mejor el que tiene menor error cuadrático medio. para cualquier valor de a. 11. Si ˆ1 y ˆ2 son estimadores independientes insesgados de un parámetro desconocido . Rpta. 2   28    ECM (ˆ1 )  V (ˆ1 )     E (ˆ1 )   7       2 4  2 2 2   54  4  ECM (ˆ2 )  V ( ˆ2 )     E (ˆ2 )   6       3 9  2 2 El estimador ˆ1 es mejor estimador de β que ˆ2 si se cumple que: 28   2 54  4 2  → 252 + 9 β2 < 216 + 16 β2 ECM (ˆ1 )  ECM (ˆ2 ) → 4 9 → 36 < 7 β2 → 7 β2 > 36 → 6 7   Si 7 . b) Se tiene como datos: V( ˆ1 ) =  12 y V( ˆ2 ) =  22 . Luego: E( ˆ ) = E[a ˆ1 + (1 – a ) ˆ2 ] = a E( ˆ1 ) + (1 – a) E( ˆ2 ) = = a  + (1 – a )  = . b) Encontrar el valor de a que minimiza la varianza de ˆ . Entonces: E( X 1 ) =  y E( X 2 ) = . f’’(a) = d 2V (ˆ) = 2  12 + 2  22 . 143 2 n2 . .  22 minimiza la varianza de ˆ . Solución Se sabe que la media muestral es un estimador insesgado de la media poblacional. 0 ≤ a ≤ 1.Para hallar el valor de a que minimiza la varianza del estimador ˆ . a) Demostrar que: X  aX1  (1  a) X 2 . Por lo tanto el valor a = 12. da 2 Reemplazando el punto crítico encontrado en f’’(a) se tiene que: f’’(a) = 2  12 + 2  22 > 0 → a es un mínimo para la V( ˆ ). Luego: V ( X 1 )  2 n1 y V (X 2 )  a) E( X ) = E[ aX 1  (1  a) X 2 ] = a E( X 1 ) + (1 – a) E( X 2 ) = = a  + (1 – a)  = .  12   22 Sea X una variable aleatoria con media  y varianza σ2. punto  12   22 crítico. hallar el valor de a que minimiza la varianza de X . Dadas dos muestras aleatorias de tamaños n1 y n2 con medias muestrales X 1 y X 2 respectivamente. es un estimador insesgado de .Q.D. se toma la derivada parcial de V( ˆ ) con respecto a a y se iguala a cero. Así: dV (ˆ) = 2a  12 + 2(1 – a)  22 (-1) = 0 da f’(a) = Para resolver la ecuación anterior se divide entre 2 en ambos miembros y se tiene: a  12 . la varianza de la media muestral es igual a la varianza poblacional entre el tamaño de la muestra. Además. X es un estimador insesgado de .Q. Entonces.(1 – a )  22 = 0 → a  12 + a  22 =  22 → a=  22 . L. Rpta. b) Asumiendo que X 1 y X 2 son independientes. Rpta. Xn) =  i 1  X e  i X i!   Xi e  n n  Xi ! i 1 144 .. . n1  n 2 En base a una muestra aleatoria de tamaño n de una distribución Poisson con parámetro  . . X2. punto crítico.. Xn.. se toma la derivada parcial de V( X ) con respecto a a y se iguala a cero. n1 n2 da 2 Reemplazando el punto crítico encontrado en f’’(a) se tiene que: 2 2 f’’(a) = 2 +2 > 0 → a es un mínimo para la V( X ). Así: f’(a) = 2 2 dV ( X ) = 2a + 2(1 – a) (-1) = 0 da n1 n2 Para resolver la ecuación anterior se divide entre 2σ2 en ambos miembros y se tiene: n1 a 1 a = 0 → an2 + an1 = n1 → a = . n1 n2 Por lo tanto el valor a = 13. . Xi = 0. X2.a. ) =  X e  i Xi ! Además: E(Xi) =  = Var (Xi). 2. se pide: a) Determinar el estimador máximo verosímil del parámetro  . Entonces: f (Xi. X3 . n1 minimiza la varianza de X . 1. …… La función de verosimilitud es: n V() = f(X1.…. una m. de una distribución X ~ Poisson( ). n1 n2 n1  n 2 f’’(a) = 2 2 d 2V ( X ) = 2 + 2 . b) Es eficiente el estimador obtenido para el parámetro  ? Solución Sea X1.b) V( X ) = V[ aX 1  (1  a) X 2 ] = a2 V( X 1 ) + (1 – a) 2 V( X 2 ) = Reemplazando la varianza de las medias muestrales se obtiene: V( X ) = a2 2 2 + (1 – a)2 = f(a) n1 n2 Para hallar el valor de a que minimiza la varianza del estimador X . ln X !  X ( X  ) ln f ( X .  )    2  X e  f(X. ) = X ln  .  )   E ( X   )²  V ( X )  2  ² ²      Luego: B( )   1     V ( )  .n   Xi i 1 L = Ln V() = Ln e n n  Xi ! i 1 n L= n  X i Ln  n Ln e  ln  X i ! = i 1 i 1 n n i 1 i 1  X i Ln  n   ln X i ! a) Determinación del estimador de : n L   n  Xi n0 i 1  →   X i 1 i n = x Rpta.  )   1     2    ( X   )²  ln f ( X . ) = X! ln f(X.   Por lo tanto  = x es un estimador de varianza mínima. n 1 n n  . 145 . . n B( )  1   nE  ln f ( x.  )   ²    2    1 1  1 E ln f ( X .   E ( )  1 n 1 n n E ( X )      i n i 1 n i 1 n  Por lo tanto  = x es un estimador insesgado para  .   Es de varianza mínima si: V(  ) = B()  V ( λ)  λ . b) ¿Es eficiente el estimador de ? Será eficiente si es insesgado y de varianza mínima. ln e – ln X ! = X ln  . 2. 2.. de una variable X ~ Geométrica (p)... Xn...  n 1 X Rpta..….. X2. σ2 ) .. ..  i  1.. . σ2 ) se pide: a) Determinar el estimador máximo verosímil de µ y σ2.n La función de verosimilitud es: n V(. . una m. En base a una muestra aleatoria de tamaño n de la distribución geométrica determine el estimador máximo verosímil del parámetro p. de una distribución X ~ N(μ .²) = f(X1. 2.a.²) = Ln  2  2  2 1 2 2 n ( X i  )2  i 1 146 1 e 2 2 n ( X i  )2 1 n ( X i  )  1  2 2 2  i 1 e =  2  2  2 .. . una m.. X3 . Como  = x es un estimador insesgado y de varianza mínima. b) Es eficiente el estimador del parámetro µ? Solución Sea X1.. Solución Sea X1. X n )   p(1  p) X i 1  Xi  n  p (1  p) i1 n i 1  n Xi  n   n i 1   = n Ln p    X i  n  Ln (1  p) L = Ln V(p) = Ln p (1  p)    i 1    n n L n   p p X i 1 i n 0 1 p pˆ  → n X i 1 15.3. Entonces: f X ( X i )  p(1  p) X 1 .... Entonces: f (Xi )  1 2 2 1 e 2 2 ( X i  )2 . n Luego la función de verosimilitud será: n n V ( p)  f ( X1 . es un estimador eficiente para  . i En base a una muestra aleatoria de tamaño n de una distribución normal N(µ. X 2 ..3... X2... Xn..a..    X i   .  i  1. X2. X i  1... Xn) =  i 1 n 2 1  1  2 e L = Ln V(. 14.  )    1  2 2 e 1  X      2   2 1 X  Ln f(X. n  E( X )  X i 1 i n  1 n 1 n n E X i   E( X i )    n i 1 n i 1 n  Por lo tanto μ = X es un estimador insesgado para μ. Determinación del estimador de σ2 L n 1   2 2 ² 2( ²)²  n (X i 1 i n 1   )² = 0 → n  ( Xi   )²  2 ² 2( ²)² i 1 n →  ( X i   )² i 1 n n 2( ²)²  2 ²  ²  →  ( Xi   ) i 1 2 Rpta. ) = 1    nE  ln f ( x.  Es de varianza mínima si: B(  )  f(X. n b) ¿Es eficiente el estimador de μ? Será eficiente si es insesgado y de varianza mínima.n  Ln1  Ln ( ²2 )  1  ( X i   )² Ln e 2 2 ² = L= n n 1 Ln ²  Ln 2  2 2 2 ² n (X i 1   )² i a) Determinación del estimador de μ n L 1  (2) (1)  ( X i   )  0  2 ² i 1 n Luego: (X i 1 i n  )  0 X ó i 1 i  n  0 n X  i 1 μ= Por lo tanto: i X n Rpta.) = Ln1-Ln  2    Ln e 2   2 2 147 2 V ( X )  2 n . . Entonces: fX (Xi )  BX 0B .. es un estimador eficiente para μ. .. 2.. . En base a una muestra aleatoria de tamaño n de la distribución de Pareto determine el estimador máximo verosímil del parámetro B.Xn ) =  i 1 BX 0B B n X 0nB  n X iB 1  X iB1 i 1 L = Ln V(B) = Ln B n X 0nB n X i 1 B 1 i n  n LnB  nB LnX 0  ( B  1) Ln X i i 1 n n L n n   n Ln X 0   Ln X i  0    Ln X i  n Ln X 0  B B B i 1 i 1  n n n n   Ln X i   Ln X 0   Ln ( X i / X 0 ) B i 1 i 1 i 1 148 .1 X  = .  Como μ = X es un estimador insesgado y de varianza mínima.. X2 . una m. La función de verosimilitud es: n V(B) = f(X1 . n . de una variable X ~ Pareto (B) .... Donde: B = Coeficiente de Pareto > 0 y X iB 1 Xo = Ingreso mínimo. Rpta.Ln  2    2   2 2  1 ( X  ) ln f ( X .  )   (2) ( X   )(1) =  2 ² ² B ( )  1 ( X  )  n E   ²  2 1 1 ²   = n n  ( X   )²  ( ²) n E  (  ²)² (  ²)²   = V (X )  Por lo tanto μ = X es un estimador de varianza mínima. Solución Sea X1. X2.. X i  X 0 .... 16. Xn. . i  1.a. . n. n i / X0) En base a una muestra aleatoria de tamaño n de una distribución Lognormal con parámetros (µ. . X i  0.. n..... Determine una estimación de µ con los ingresos de 20 familias escogidas al azar siguientes: 10 18 50 61 40 16 8 9 12 11 15 19 10 21 25 27 14 25 32 30 Solución Sea X1. Luego la función de verosimilitud será: V(µ.. .. σ2). σ2) = f ( X1.. Rpta. de una variable X ~ Lognormal (µ.. X 2 . .  i = 1... X i  0.. 2. Entonces: fX (Xi )  1 X i 2 2 e ( L n X i   ) 2 / 2 2 .  i = 1. b) Se sabe que el ingreso familiar anual (en miles de soles) tiene aproximadamente distribución Lognormal. X2. i 1 L = Ln V(. . .. Xn. Se pide: a) Determinar el estimador máximo verosímil de los parámetros µ y σ2.. una m. 3. Bˆ  n  Ln ( X i 1 17. 2. σ2). X n )  n X i 1 = n 2  1   2 2  e  Xi 1  1 2 i e ( L n X i   ) 2 2 / 2 2 = n ( L n X i  )2 / 2 2 i 1 n .²) = Ln n 2  1   2 2  e  Xi 1  n ( L n X i  )2 / 2 2 i 1 n i 1 n = Ln1  Ln X i  i 1 n L =   Ln X i  i 1 n  Ln1  Ln ( ²2 )  1  ( Ln X i   )² Ln e 2 2 ² n n 1 Ln ²  Ln 2  2 2 2 ²  ( Ln X a) Determinación del estimador de μ L 1  (2) (1)  2 ² n  (Ln X i 1 i  )  0 149 n i 1 i   )² .a. basado en una muestra aleatoria de tamaño n de X. Hallar el estimador de a por el método de los momentos.. M1’ = E (X). Solución 150 . Es decir. Entonces: n M  ' 1 19.. basta plantear una ecuación basada en el primer momento.. hallar el estimador de momentos μ= 18.. n b) Estimación de µ con los ingresos de las 20 familias: n  Ln10  Ln 50  Ln 40  . n 20 Basados en una muestra aleatoria de tamaño n.  Xi i 1 n n  E ( X )    ˆ  X i 1 n i X Rpta. .  Ln X i 1 i  para el parámetro . Sabemos que para la distribución Poisson E(X) = . X2. 3a]. de la distribución de Poisson. Sea X una variable aleatoria con distribución uniforme en el intervalo [-a . una muestra aleatoria de una variable X ~ Poissón () Como hay un solo parámetro a estimar. Solución Sea X1.  Ln 25  Ln 30 = 2.9538 Rpta. n Determinación del estimador de σ2 L n 1   2 2 ² 2( ²)²  n  ( Ln X i 1 i   )² = 0 → n  ( Ln X n 1 n → → ( Ln Xi   )²   2( ²)² i 1 2 ² i 1 i   )² n  2( ²)² 2 ² n  ²  Por lo tanto:  ( Ln Xi   ) 2 i 1 Rpta. Xn.n Luego: n  ( Ln X i   )  0  Ln X ó i 1 i 1  n  0 i n  μ= Por lo tanto:  Ln X i 1 i Rpta... . . Por lo tanto: n M  ' 1 20.. b].. X2. .. X2. una muestra aleatoria de una variable X ~ uniforme en el intervalo [ -a . (2) En la distribución normal E (X) =  y E (X2) = σ2 + 2. hallar el estimador de momentos para los parámetros  y σ2 de la distribución de normal. . E(X) = (a + b)/2. . (1) M2’ = E (X2) …. σ2).. Luego: en el intervalo [ -a . Solución Sea X1. Sabemos que para la distribución uniforme en el intervalo [a. n Basados en una muestra aleatoria de tamaño n. Como el único parámetro es a. E(X) = a. es necesario igualar los dos momentos muestrales y poblacionales correspondientes.. la reemplazamos en la expresión anterior para hallar el estimador de σ2. 3a ].. una muestra aleatoria de una variable X ~ N(. Como la distribución tiene dos parámetros. 3a ].  Xi i 1 n n  E ( X )  a  aˆ  X i 1 i  X Rpta. n En (2): M 2'  X i 1 n 2 i  E( X 2 )   2   2 Como la media muestral es un estimador de la media poblacional . Xn. Es decir. M1’ = E (X). Reemplazando en las ecuaciones anteriores se tiene: n En (1): M  ' 1 X i 1 n i n  E ( X )    ˆ  X i 1 n i X Rpta. basta plantear una ecuación basada en el primer momento. . n  2  2  2  X 2  X i 1 n  ˆ 2   X i2 i 1 n 2 i n n X2   X i2  nX 2 i 1 n n  151 (X i 1 i  X )2 n Rpta. Es decir: M1’ = E (X) ….. Xn.Sea X1. a) ¿Cuál es la estimación puntual de la proporción de la población que Si está de acuerdo con la gestión del Alcalde de la ciudad? b) ¿Cuál es la estimación puntual de la proporción de la población que No está de acuerdo con la gestión del Alcalde de la ciudad? 5. 158. X2. 157. 162. Considere los siguientes estimadores de µ: ˆ1 = (X1 + X2 + …. E(X2) = 2. Los pesos netos (grs. Realizada una encuesta de opinión. Suponga que tiene una muestra de tamaño n de una población X con E(X) = µ y n2 2 Var(X) = σ . ¿cuál de los estimadores es más eficiente? 2. Sean X 1  X i 1 n i n2 y X2  X i 1 n i dos estimadores de µ. Si X1. 159. Var ( ˆ 1 ) = 8. 156.X10 ) / 3 a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de µ? 6. Siendo ˆ1 = 2X1 – 3 X2 y ˆ2 = 3 X2 . ˆ2 = ( X1 + 3 X5 .) en una muestra aleatoria simple de diez latas de conserva fueron los siguientes: 159. ¿cuál es el mejor estimador de µ? 3. V(X1) = 8 y V(X2) = 4. 158. 161 a) ¿Cuál es la estimación puntual del peso neto medio poblacional de las latas de conserva? b) ¿Cuál es la estimación puntual de la desviación estándar poblacional del peso neto de las latas de conserva? 4. .157.4. 163. y X2 son variables aleatorias independientes con: E(X1) = 4. en la pregunta. Sean ˆ 1 y ˆ 2 dos estimadores de  con E ( ˆ 1) = .X1 dos estimadores de ϴ. Sea X1. ¿Cuál es mejor estimador de  ? ¿por qué? 152 . …. 440 que No y el resto No sabe/No opina. Var ( ˆ 2 ) = 2. E ( ˆ 2) = /3. X10 una muestra aleatoria de una población con media µ y varianza 2. a una muestra aleatoria simple de 800 ciudadanos.7 PROBLEMAS PROPUESTOS 1. ¿Está usted de acuerdo con la gestión del Alcalde de la ciudad? 260 responden que Sí. + X10 ) / 10 . En base a una muestra aleatoria de tamaño n de la distribución de Pascal o binomial negativa. Basados en una muestra aleatoria de tamaño n. En base a una muestra aleatoria de tamaño n de la distribución exponencial con parámetro λ. Suponga que ˆ1 y ˆ2 son 2 estimadores de β con: /3. Dadas dos muestras aleatorias de tamaños n1 y n2 con medias muestrales y1 y y2 respectivamente. 11. 10. determine el estimador máximo verosímil de dichos parámetros. 0 ≤ b ≤ 1. de la distribución Bernoulli. En base a una muestra aleatoria de tamaño m de la distribución binomial con parámetros n y p. a) Demostrar que: Y  b y2  (1  b) y1 . 9. 15. 12. Sea Y una variable aleatoria con media  y varianza σ2. determine el estimador máximo verosímil del parámetro p. para cualquier valor de k. Basados en una muestra aleaatoria de tamaño m.7. hallar el valor de b que minimiza la varianza de Y . hallar el estimador de momentos para el parámetro p. de la distribución Geométrica. ˆ Si 1 y ˆ2 son estimadores independientes insesgados de un parámetro desconocido β. determine el estimador máximo verosímil del parámetro β. 16. b) Encontrar el valor de k que minimiza la varianza de ˆ . b) Asumiendo que y1 y y2 son independientes. es estimador insesgado de  . de la distribución binomial. hallar el estimador de momentos para el parámetro p. ¿Cuál es mejor estimador de β? ¿Por qué? 8. 13. En base a una muestra aleatoria de tamaño n de la distribución gamma con parámetros α = 2 y β. b) Es eficiente el estimador obtenido para el parámetro  ? 14. se pide: a) Determinar el estimador máximo verosímil del parámetro λ. con varianzas conocidas  12 y  22 respectivamente: a) Demostrar que ˆ = k ˆ2 + (1 – k ) ˆ1 también es un estimador insesgado de β. Var ( ˆ1 ) = 4 y E ( ˆ1 ) = β /2. 153 . hallar el estimador de momentos para el parámetro p. Basados en una muestra aleatoria de tamaño n. E ( ˆ2 ) = β Var ( ˆ2 ) = 3. 19. de la distribución Pascal o binomial negativa. determine el estimador de momentos del parámetro β. 2a]. En base a una muestra aleatoria de tamaño n de la distribución gamma con parámetros α = 2 y β. En base a una muestra aleatoria de tamaño n de la distribución de Pareto determine el estimador de momentos del parámetro B. Basado en una muestra aleatoria de tamaño n. Basados en una muestra aleatoria de tamaño n. 18. 20. 154 .17. halle el estimador de a por el método de los momentos. Sea X una variable aleatoria con distribución uniforme en el intervalo [-2. hallar el estimador de momentos para el parámetro p. buscando también algunas bondades para dichos estimadores.8 5. Ejercicios resueltos. es decir la aproximación al valor del parámetro a través de un rango de valores.7 5. En el capítulo anterior se establecieron una serie de procedimientos para determinar estimadores y estimaciones de los parámetros a través de un solo valor. Intervalo de confianza para la diferencia de medias (n y m <30).12 Intervalo de confianza para la media y tamaño de muestra. En este capítulo. ESTIMACIÓN POR INTERVALOS DE CONFIANZA “Quien hace que las cosas difíciles parezcan fáciles.1 5.11 5. no tenemos garantía de que la conclusión obtenida sea exactamente correcta. Intervalo de confianza para la diferencia de proporciones. se presenta los aspectos fundamentales de la estimación por intervalos de confianza. Intervalo de confianza para el total (conocida la proporción). Intervalo de confianza para la varianza.9 5. la estadística permite cuantificar el grado de confiabilidad y el error asociado a la estimación (la precisión de la estimación).2 5. Intervalo de confianza para la media (n < 30). Intervalo de confianza para la proporción y tamaño de muestra. Intervalo de confianza para la razón de varianzas.Capítulo 5. Sin embargo. es el educador” Emerson CONTENIDO 5. Cuando inferimos usando muestras.4 5. 155 . como un complemento de la estimación puntual. El objetivo de la estimación por intervalos de confianza es usar una muestra para obtener un rango de posibles valores para el parámetro y sean los que mejor lo representan.6 5.10 5.5 5. Intervalo de confianza para el total (conocida la media). Intervalo de confianza para la diferencia de medias. Ejercicios propuestos.3 5. 99. k = una constante positiva que corresponde al valor de la distribución del estimador para una probabilidad 1 – α. b = Límite superior del intervalo de confianza. es decir. se llama estimación por intervalos. 1 . el coeficiente de confianza de nuestras afirmaciones. se tiene una confianza de que 95 de cada 100 intervalos que se extraigan como muestra.. el intervalo de confianza será:  ˆ ˆ  1    P(a    b)  P(ˆ  kˆ    ˆ  kˆ )  P     k2   k1 Donde: a = Límite inferior del intervalo de confianza. se tiene una probabilidad 0 ó 1 de que contenga al parámetro a estimar y no hay otra opción. b] que comprenda un parámetro poblacional θ con cierta probabilidad 1 . que si para muestras distintas y bajo el mismo procedimiento se construye el intervalo repetidamente. Pero una vez determinado el intervalo. para cualquier parámetro θ y su estimador ˆ . seguridad y α significa riesgo.90.α. En general. es decir 1 . Ejemplo 1.95 se dice que se tiene un intervalo de confianza del 95% y que la probabilidad de que el intervalo contenga el verdadero valor del parámetro es del 95%. ya que lo contiene o no lo contiene. una vez calculados numéricamente los extremos.El procedimiento de determinar un intervalo [a. pues la situación pasa a ser completamente determinística. por lo tanto.Definición. 156 . De tal manera. contendrán el verdadero valor del parámetro.95 o 0.α da.Sí 1 – α = 0. Se puede pensar que 1 significa certeza.α = Nivel de confianza (probabilidad de que el parámetro poblacional este comprendido en el intervalo) cuyo valor se toma de 0. 0. 95 de cada 100 de estos intervalos. La seguridad menos el riesgo. contendrá el parámetro y 5 de ellos no. Es decir. ya no debe hablarse en términos de confiabilidad ni en términos probabilísticos. asociado a un intervalo de confianza ya calculado. En el caso anterior. Resumiendo. F.  Total: Xˆ  Nˆ  NX  N N .Y. ya que sus estimadores tienen distribución normal y la determinación de los intervalos de confianza para cada uno de ellos es similar. Fijar el nivel de confianza 1 – α que se desea en la estimación. Determinar la distribución muestral (normal estándar Z. Así tenemos:  ˆ Z y ( X  ) ~ N(0.) los mismos que estudiamos en los capítulos 2 y 3. Poisson. Extraer la muestra y calcular el o los estadísticos necesarios. la diferencia de proporciones P1 – P2. el mismo que debe ser una función del estimador y del parámetro. etc. t. la diferencia de medias X . Donde d1 y d2 son valores obtenidos de acuerdo a la distribución muestral. Dentro de la probabilidad se trabaja las desigualdades de modo tal que al centro quede el parámetro θ y en los extremos los límites inferior y superior de confianza buscados. 4. son: 1.) que tiene el estadístico empleado. la proporción P. Se verán los casos paramétricos. t. N 2 X2  y 157 Z NX  N ~ N(0. mientras que el parámetro a determinar es constante. es decir aquellos en los que se tiene conocimiento del tipo de distribución de la población o del estimador (Bernoulli. θ)  d2 ]. Los pasos a seguir para construir intervalos de confianza para un parámetro. Es decir. Trabajaremos primero un Caso General con muestras grandes (n ≥ 30) los intervalos de confianza para la media .  2ˆ ] Media: Z entonces: X  N (. / n 1). es decir f ( ˆ . 2 / n) ˆ   ~ N ( 0. chi-cuadrado. se establece la relación: 1 – α = P[ d1  f ( ˆ . Normal. dependiendo del estimador y de los valores d1 y d2. 5. que sí ˆ ~ N[θ. los totales conocida la media y la proporción. F. chi cuadrado. etc. 2. θ). Conocida la distribución del estadístico y el nivel de confianza. Binomial. 1) N X . los extremos del intervalo son variables aleatorias. 1 ). 3. dado un nivel de confianza 1 – α es posible hallar: 1 – α = P [ ..995 = 2..575 Reemplazando la v.995 Z0 = Z0. la probabilidad queda como: 1 – α = P [ ... 1) N p p1  p2  ( P1  P2 )  p p 1 ~ N(0 .Z 1  2  ˆ    ˆ  Z 1  2 Multiplicando por el error estándar del estimador  ˆ en la desigualdad: 158 ] . (1) Donde los valores Z0 son simétricos.  X2 Y ) y Z X  Y  (  X  Y ) )  X Y ~ N(0 ..975 Z0 = Z0.Y ~ N(  X  Y ..95 = 1..Z0  Z  Z0 ] = P [ ...96 0...975 = 1.90 0. Proporc.95 Z0 = Z0..95 0. Z  ˆ   en (1) y trabajando con la desigualdad buscando  ˆ dejar al centro el parámetro θ.....645 0..Dif. de modo tal que centralizan la probabilidad 1 α y se determinan como Z0 = Z 1  . 2 1) Para todos ellos.. N 2 p2  pP  ~ N(0. Así tenemos: 1-α 1 – α/2 Z0 = Z 1  2 0. Medias: X ..a.Z0  Z  Z0 ] . 1) PQ n Z y Z y Dif.  p21  p2 ) y Z Np  NP ~ N(0.99 0. 1) n Proporción: p  Total: X i 1 i n  X n  PQ   N  P..  n    Aˆ  NPˆ  Np  N NP. cuyos valores son ubicados en la tabla de la 2 distribución normal estándar.: p1 – p2 ~ N(P1 – P2 . siguiente: El parámetro θ  [ ˆ . cuyo estimador ˆ ~ N[θ. cuyo estimador sigue distribución normal ˆ ~ N[θ.Z 1  ˆ  . N p  N Z   p  1 1 2 2   159  . Resumimos el Caso General.Z 1   ˆ  ˆ .1–α =P[. ˆ + Z0  ˆ ] con el 100 (1 – α) % de confianza. la diferencia de medias.θ  Z 1 2  ˆ ]  2 Restando el estimador ˆ en la desigualdad 1 – α = P [. Donde el error de estimación es E = ± Z0  ˆ . señalando que para obtener intervalos del 100 (1 . Utilizando este resultado veamos rápidamente la determinación de intervalos de confianza para los parámetros poblacionales: la media.θ  .  2ˆ ].Z0  ˆ . la diferencia de proporciones y los totales. la proporción.ˆ + Z  1 2   ˆ ] 2 Multiplicando por (-1) y manteniendo el sentido de la desigualdad.ˆ . se tiene: 1 – α = P [ ˆ . p  Z  p  1 1 2 2     N P  N p  N Z   p . al valor del estimador ˆ se le debe restar o sumar el error de estimación E = ± Z0  ˆ .Z 1   ˆ  θ  ˆ + Z 1 2  ˆ ]  2 A partir del cual se obtiene el intervalo de confianza para el parámetro θ. Media : Total : Proporción : Total :    X  Z  1  2 X . N X  N Z   X  1 1 2 2     P  p  Z  p .  2ˆ ].α)% de confianza para parámetros θ. X  Z 1   X  2   N   N X  N Z   X . .. 1). Medias :  X  Y  ( X  Y )  Z   X Y .  Dif.... ( X  Y )  Z   X Y  1 1 2 2     Dif.. : P1  P2  ( p1  p2 )  Z   p1  p2 . debe emplearse el factor de corrección por finitud y el intervalo será:    X  Z  1   2 n N n  .y que para n suficientemente grande (n ≥ 30) por el teorema central del límite: X  N (. ( p1  p2 )  Z   p1  p2  1 1 2 2   5. n Si las muestras se toman sin reposición de una población finita de tamaño N.. 160 N n  al 100(1 – α ) % de N 1  . X2. / n Entonces.... es la media muestral . se tiene que:   X  1 – α = P [ .1 INTERVALO DE CONFIANZA PARA LA MEDIA Y TAMAÑO DE MUESTRA Sea X1.. ... X Z 1    2  con el 100 (1 – α ) % de confianza. se obtiene:     1 – α = P X  Z     X Z  1 1 n n  2 2  A partir del cual se deduce el intervalo de confianza para la media poblacional  siguiente:    X  Z  1   n 2 . Sabemos que el estimador de la media poblacional  .. Xn una muestra aleatoria de tamaño n de una población X distribuida con media  desconocida y varianza  2 conocida. Proporc. 2 / n) y Z ( X  ) ~ N(0.z0  Z  z0 ] = P  Z    Z   1 2   1 2  / n Trabajando como en el caso general y dejando al centro de la desigualdad el parámetro poblacional  . X Z  1 N 1 n 2 confianza. para un nivel de confianza 1 – α. 975 = 1. se encuentra entre S/ 960. Interpretación: la verdadera venta media mensual de gaseosas.96x 120/6] = [1000 ± 39. al 95% de confianza: Z0 = Z0. Ejemplo 2 Se hace un estudio de mercado. Solución = 1000.96 Entonces: Є[ ± Z0  / n ] = [1000 ± 1. Calcule e interprete un intervalo de confianza del 95% para la verdadera venta promedio en la cadena de tiendas. Los resultados para una muestra de 36 tiendas indicaron ventas promedio de S/1000 con una desviación estándar de S/120. S = 120. n = 36. En la tabla de la distribución normal estándar.80. durante un mes en una cadena de tiendas. TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA µ Se sabe que: X  N (.20] Luego:  Є [960. 1039. con el 95% de confianza. en la cadena de tiendas. 2 / n) → Z  ( X  ) E  / n / n Elevando al cuadrado y despejando n se obtiene el tamaño inicial de muestra siguiente: n0  Z 2 2 E2 Donde: Z = valor de la abscisa de la distribución normal estándar para un nivel de confianza (1 – α) dado.20] S/.Donde el error de estimación E para la media es: E  Z  1  2 n ó E  Z  1  2 n N n N 1 La longitud del intervalo de confianza para la media es 2E. para determinar la venta promedio de una nueva marca de gaseosas. Rpta. Si se desconoce se estima con una muestra pasada o reciente (S2).80 y S/ 1039. 161 .20 con el 95% de confianza. σ2 = varianza de la variable en estudio. 2 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la media) Sea X1. 975 = 1.. para un nivel de confianza 1 – α.05 ó n0 ≤ 0. 1) N X Entonces. con el 95 % de confianza? Solución Datos: S = 120. si se desea que difiera de µ en menos de S/. y que para n suficientemente grande (n ≥ 30) por el teorema central del límite: Xˆ  Nˆ  NX  N N .. 30 y según la tabla de la distribución normal estándar. 30.  Si f = n0 / N > 0. E = | . al 95% de confianza: Z = Z0...µ| = error máximo permisible.. .E= | .  Si la fracción inicial de muestreo f = n0 / N ≤ 0.96 Entonces: Z 2 2 1..96 2 x120 2 n0    61 tiendas.. ¿Qué tamaño de muestra debe tomarse. Rpta.... Xn una muestra aleatoria de tamañazo n de una población X de tamaño N. es N ..05N → n = n0. E2 30 2 5. para estimar la venta promedio mensual de una nueva marca de gaseosas.05 es necesario el factor de corrección para poblaciones finitas y se ajusta el tamaño de muestra así: n n0 n 1 0 N Ejemplo 3 En el estudio de mercado del ejemplo 2.µ| = S/.. se tiene que: 162 . Sabemos que el estimador del total poblacional X = N .. X2. N 2 X2  y Z NX  N ~ N(0. distribuida con media  desconocida y varianza  2 conocida.. se obtiene:     1 – α = P NX  NZ   N   N X  NZ   1 1 n n  2 2  A partir del cual se deduce el intervalo de confianza para el total poblacional N siguiente:     N   NX  NZ  . Ejemplo 4 En el ejemplo 2.  NX  N 1 – α = P [ . NX  NZ  1 N 1 n 2 N n  N 1  al 100(1 – α ) % de confianza. Solución 163 . si el número de tiendas de la cadena es 1000. Si las muestras se toman sin reposición de una población finita de tamaño N. calcule e interprete un intervalo de confianza del 95% para determinar el monto total mensual de las ventas de la nueva marca de gaseosas en la cadena de tiendas. entonces dividirlo entre N para determinar los intervalos para la media poblacional. y viceversa.z0  Z  z0 ] = P  Z    Z    1 1 N / n 2 2   Trabajando como en el caso general y dejando al centro de la desigualdad el total poblacional N . NX  NZ   con el 100 (1 – α ) % de 1 1 n n 2 2  confianza. debe emplearse el factor de corrección por finitud y el intervalo será:   N   NX  NZ  1 n 2  N n  . Observe que si se quiere construir intervalos de confianza para el total poblacional. basta con multiplicar por N los límites encontrados para la media poblacional. si se conoce el intervalo de confianza para el total poblacional. 1 039 200] S/.2)] T = N  Є [960 800. .. se obtiene:  PQ PQ  1 – α = P p  Z   P p  Z  1 1 n n  2 2  Luego el intervalo de confianza para la proporción poblacional P es: 164 . Interpretación: el monto total mensual por la venta de gaseosas se encuentran entre S/. 5. 1039.....En el ejemplo 2...3 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN Y TAMAÑO DE MUESTRA Sea X1.  n   y Z pP  ~ N(0. T = N  Є [(1 000x 960. para hallar los límites de confianza para la real venta total mensual de gaseosas.Xn una muestra aleatoria de tamañazo n de una población binomial X con parámetro P... es la proporción muestral p.. se tiene que:     pP  1 – α = P [ ..8) . con el 95% de confianza. se multiplica a los límites anteriores por 1000.. (1 000x1039. 1) PQ n Entonces. para un nivel de confianza 1 – α. Es decir..80. y que para n suficientemente grande (n ≥ 30) por el teorema central del límite: n p X i 1 n i  X n  PQ   N  P. X2. con el 95% de confianza.. 960 800 y 1 039 200 con el 95% de confianza.20] S/. Sabemos que el estimador de la proporción poblacional P .Z0  Z  Z0 ] = P  Z   Z   1 1  PQ 2 2   n   Trabajando como en el caso general y dejando al centro de la desigualdad la proporción poblacional P. Entonces. se ha determinado que la verdadera venta media mensual de gaseosas en la cadena de tiendas es:  Є [960. n N 1  TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN P n Se sabe que: p  X i 1 i n  X n  PQ   N  P. resulta entonces el intervalo de confianza para la proporción poblacional P siguiente:  P  p  Z  1 2  pq . n  Si las muestras se toman sin reposición de una población finita de tamaño N. debe emplearse el factor de corrección por finitud y el intervalo será:  Pp  Z  1 2  pq N  n . pZ  1 n N 1 2 pq N  n   al 100 (1 – α ) % de conf.05 ó n0 ≤ 0. pZ   con el 100 (1 – α ) % de confianza.05N → n = n0.P se desconocen.  n   → Z pP  PQ n E PQ n Elevando al cuadrado y despejando n se obtiene el tamaño inicial de muestra siguiente: Z 2 PQ n0  E2 Donde: Z = valor de la abscisa de la distribución normal estándar para un nivel de confianza (1 – α) dado.P| = error máximo permisible. Q = 1 – P. PQ PQ  Pp  Z  . se estiman mediante p y q = 1 .p. pZ  1 n 2 pq   con el 100 (1 – α ) % de confianza.  Si la fracción inicial de muestreo f = n0 / N ≤ 0. 1 1 n n  2 2  Como los valores poblacionales P y Q = 1 . Si se desconoce se estima con una muestra pasada o reciente (p). P = proporción de éxitos para la variable en estudio.  Si f = n0 / N > 0. E = |p .05 es necesario el factor de corrección para poblaciones finitas y se ajusta el tamaño de muestra así: n 165 n0 n 1 0 N . 40 x0. sobre pólizas pagadas dentro del plazo de dos meses de haber recibido el reclamo. X = 80.40 + 2.40 x0. ¿qué tamaño de muestra (reclamos) será necesario si desea cometer un error máximo del 5%? Solución a) n = 200. y b) Con un 95% de confianza. Se selecciona una muestra aleatoria de 200 reclamos y se determina que 80 fueron pagados en un plazo de 2 meses después de recibidos. Rpta.05 y según la Tabla 1 de la distribución normal estándar.995 = 2. 0. Interpretación.489 (31.60 ] 200 P ϵ [ 0.60   369 reclamos.40. 0. Z0 = Z 0.Ejemplo 5 El auditor de una dependencia gubernamental de protección del consumidor.311 y 0.9%) con el 99% de confianza.575 0.311 .40 x0.la verdadera proporción (porcentaje) de reclamos. q = 0. E = |p . pZ  1 n 2 pq   n  Reemplazando valores se tiene: P ϵ [ 0. se encuentra entre 0.60 . es:  P  p  Z  1 2  pq . E2 (0.40 + 0.1% y 48.089 ] Por lo tanto: P ϵ [ 0.40 – 2.. en un plazo de dos meses de haber recibido el reclamo.575 p = proporción muestral de reclamos pagados en el plazo de dos meses.40 – 0.96 2 x0. n 200 q = 1 – p = 0. 0.60. p X 80   0.05) 2 166 Z = Z0. al 95% de confianza: Entonces: n0  Z 2 pq 1.P| = 0.489 ] con el 99% de confianza. 975 = 1.96 .089 . 1 – α = 0. quiere determinar la proporción de reclamos sobre pólizas de enfermedades que paga el seguro. Rpta.4 .99. b) Datos: p = 0.6 El intervalo de confianza para la verdadera proporción poblacional P de reclamos pagados en plazo de dos meses. a) Calcule e interprete un intervalo del 99 % de confianza para la proporción real de reclamos pagados dentro de ese plazo de dos meses.575 200 0. . Np  NZ  1 n N 1 2 confianza. N pNZ  1 n 2 pq   con el 100 (1 – α ) % de n  confianza. Como los valores poblacionales P y Q se desconocen. X2..4 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la proporción) Sea X1. 167 pq N  n   al 100 (1 – α ) % de n N 1  .Xn una muestra aleatoria de tamañazo n de una población binomial X con parámetro P. Si las muestras se toman sin reposición de una población finita de tamaño N.. se obtiene:  PQ PQ  1 – α = P N p  N Z   N P N p  N Z  1 1 n n  2 2  A partir del cual se deduce el intervalo de confianza para el total poblacional NP siguiente:  PQ PQ  NP   N p  N Z  . N 2 p2  y Z Np  NP ~ N(0. N pNZ   con el 100 (1 – α ) % de 1 1 n n 2 2   confianza.. ... 1) N p Entonces.5. es Np...... se estiman por p y q. y que para n suficientemente grande (n ≥ 30) por el teorema central del límite:  Aˆ  NPˆ  Np  N NP.. debe emplearse el factor de corrección por finitud y el intervalo será:  NP   Np  NZ  1 2  pq N  n .Z0  Z  Z0 ] = P  Z   Z   1 1  PQ 2 2 N   n   Trabajando como en el caso general y dejando al centro de la desigualdad el total poblacional NP. se tiene que:     Np  NP  1 – α = P [ . Sabemos que el estimador del total poblacional A = NP. para un nivel de confianza 1 – α.. resulta entonces el intervalo de confianza para el total poblacional NP siguiente:  NP   N p  N Z  1 2  pq .. .... para hallar los límites de confianza para el total de reclamos pagados dentro del plazo de dos meses. si se conoce el intervalo de confianza para el total poblacional.. en un plazo de dos meses de haber recibido el reclamo. entonces dividirlo entre N para determinar los intervalos para la proporción poblacional... y que para n y m suficientemente grandes (n y m ≥ 30) por el teorema central del límite: 168 .Observe que si se quiere construir intervalos de confianza para el total poblacional. 5...Y es la diferencia de medias muestrales X . distribuida con media  X desconocida y varianza  X2 conocida. se ha determinado que la verdadera proporción de reclamos..5 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS Sea X1.... Sabemos que el estimador de la diferencia de medias poblacionales X . 2 445 ] con el 99% de confianza. sobre pólizas pagadas dentro del plazo de dos meses de haber recibido el reclamo. sobre pólizas pagadas dentro del plazo de dos meses de haber recibido el reclamo. basta con multiplicar por N los límites encontrados para la proporción poblacional... se encuentra entre 0.489 con el 99% de confianza. Entonces. .311)... Ejemplo 6 En el problema 6.. distribuida con media  Y desconocida y varianza  Y2 conocida.. Rpta..Ym una muestra aleatoria de tamañazo m de una población X de tamaño M. X2... se encuentra entre 1 555 y 2 445 reclamos con el 99% de confianza. Sea también Y1. si en la dependencia gubernamental de protección del consumidor hay 5 000 reclamos sobre pólizas de enfermedades que paga el seguro.. (5 000 x 0. Solución En el ejemplo 6...Xn una muestra aleatoria de tamañazo n de una población X de tamaño N. .489)] A = N P Є [1 555. se multiplica a los límites anteriores por 5 000.. Y2. Es decir..311 y 0.Y . y viceversa. A = N P Є [(5 000 x 0. Calcule e interprete un intervalo del 99% de confianza para el total verdadero de reclamos pagados dentro de ese plazo de dos meses.. Interpretación: el verdadero total de reclamos. α)% de conf. b) ¿Son iguales los pagos medios por hora en ambas ciudades? Solución 169 . 1) Entonces. n = 30. SX = $ 0.40.µY  ( X  Y )  Z   X Y . se estiman con las varianzas muestrales y el error estándar de la diferencia de medias muestrales  X Y es:  X Y  S X2 SY2  n m  X Y  o S X2 n  N  n  SY  M  m       N 1  m  M 1  2 Ejemplo 7 Muestras del pago por hora a los choferes de camiones. SY = $ 0. se obtiene:  1 – α = P ( X  Y )  Z   X Y   X  Y  ( X  Y )  Z   X Y 1 1 2 2      A partir del cual se deduce el intervalo de confianza para la diferencia de medias poblacionales X .X .  X2 Y ) X  Y  (  X  Y ) ) y Z  X Y ~ N(0 . 1 1 2 2   Donde. en las ciudades X e Y.16 y Y = $ 5. se tiene que:   X  Y  ( X  Y ) 1 – α = P [. el error estándar de la diferencia de medias muestrales  X Y =  Y  X es:  X Y   X2 n   Y2 m  X Y  o  X2  N  n   Y2  M  m      n  N 1  m  M 1  Si se desconoce las varianzas poblacionales. m = 30.15.30.Y siguiente:   µX .Z0  Z  Z0] = P  Z    Z    1 1  X Y 2 2   Trabajando como en el caso general y dejando al centro de la desigualdad el parámetro poblacional X .Y. ( X  Y )  Z   X Y  al 100 (1. proporcionan los siguientes datos: X = $ 5. a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre los pagos medios por hora a los choferes de camiones de las dos ciudades.Y ~ N(  X  Y . para un nivel de confianza 1 – α. 40 – 5. de tamaño N1 con una proporción de éxitos igual a P1.30) + 1.. entonces: Z0 = Z 0... es decir  X ..04 n m 30 30 Reemplazando valores en (1): X .96  X Y  S X2 SY2 (0.04)] Luego: X . Suponga también que se extrae una muestra aleatoria simple de tamaño n2 de la población binomial 2. definida como p2  170 X2 n2 estima a P2 .. 5. (5.95.a) Un intervalo de confianza para la diferencia de pagos medios por hora a los choferes de ambas ciudades viene dado por:    X  Y  ( X  Y )  Z   X Y . entonces la proporción muestral de éxitos p1 .. definida como p1  X1 n1 estima a P1 .04) . (1) 1 1  2  2 Si 1 – α = 0. los pagos medios por hora en ambas ciudades son diferentes.30) – 1..975 = 1.. Y no puede ser cero. Y = 0? Si apreciamos el intervalo de confianza construido en a)  X .40 – 5.Y Є [(5.96 (0.6 INTERVALO DE CONFIANZA PROPORCIONES PARA LA DIFERENCIA DE Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población binomial 1.02 y 0.02. Sea X2 el número de éxitos en la muestra de tamaño n2 . Rpta.18] $ con el 95% de confianza. Sea X1 el número de éxitos en la muestra de tamaño n1 . ..18 con el 95% de confianza. 0... Rpta.Y Є [0. b) Responder a la pregunta ¿Son iguales los pagos medios por hora en ambas ciudades? implica responder si ¿ X =  Y? o también ¿ X .16) 2 (0. entonces la proporción muestral de éxitos p2 . Interpretación: la diferencia entre los pagos medios por hora a los choferes de camiones de las dos ciudades se encuentra entre $ 0. Por lo tanto. ( X  Y )  Z   X Y  ... Y ≠ 0 o  X ≠  Y.15) 2    = $ 0. de tamaño N2 con una proporción de éxitos igual a P2..96 (0.. 1) 2 Entonces. se tiene que:   p  p2  ( P1  P2 ) 1 – α = P [ . resultando entonces:  p p = p1q1 p2 q2  n1 n2  p p = p1q1  N1  n1  p2 q2  N 2  n2      n1  N1  1  n2  N 2  1  1 1 2 2 o 171 X1 X . para un nivel de confianza 1 – α.P2 se obtiene:   1 – α = P ( p1  p2 )  Z   p1  p2  P1  P2  ( p1  p2 )  Z   p1  p2  1 1 2 2   A partir del cual se deduce el intervalo de confianza para la diferencia de proporciones poblacionales P1 . P2 y Q2 se desconocen. ( p1  p2 )  Z 1 2 2  1  2  p  p  al 100 (1 – α ) % de 1 2  conf.P2 siguiente:  P1 – P2  ( p1  p2 )  Z  1   p  p . p2  2 y q2 n1 n2 . Q1 . q1 = 1 – p1 .z0  Z  z0 ] = P  Z   1 Z   1 1   p1  p2 2 2   Trabajando como en el caso general y dejando al centro de la desigualdad la proporción poblacional P1 . se estiman con las proporciones muestrales p1  = 1 – p2 .  p21  p2 ) y Z p1  p2  ( P1  P2 )  p p 1 ~ N(0 . Donde  p1  p2 =  p2  p1 se obtiene a partir de:  p p = 1 2 P1Q1 P2Q2  n1 n2  p p = ó 1 2 P1Q1  N1  n1  P2Q2  N 2  n2      n1  N1  1  n2  N 2  1  Como los proporciones poblacionales P1 .Para n1 y n2 suficientemente grande (n1 y n2 ≥ 30) por el teorema central del límite: p1 – p2 ~ N(P1 – P2 . Ejemplo 8 Una empresa de estudios de mercado quiere estimar las proporciones de hombres y mujeres que conocen un producto promocionado a escala nacional. en una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60 mujeres están familiarizados con el artículo indicado. a) Calcular el intervalo de confianza de 95 % para la diferencia de proporciones de hombres y mujeres que conocen el producto. b) ¿Son iguales las proporciones de hombres y mujeres que conocen el producto? Solución Sea el grupo 1, el referido a los hombres y el grupo 2, a las mujeres. a) El intervalo de confianza para la diferencia de proporciones de hombres (P1 ) y de mujeres (P2 ) que conocen el producto, P1 - P2 está dado por:   P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1) 1 1 2 2   Si 1 – α = 0.95, entonces Z0 = 1.96 Como: n1 = 100, Entonces: p1   p p = 1 2 X1 = 20, X 1 20  = 0.20 n1 100 n2 = 200 y p2  y X2 = 60 X2 60  = 0.30 n2 200 p1q1 p2q2 (0.20)(0.80 (0.30)(0.70)    = 0.0515 n1 n2 100 200 Z0  p1  p2 = 1.96 (0.0515) = 0.1009 Reemplazando valores en (1) se tiene que: P1 - P2  [(0.20 – 0.30) – 0.1009 ; (0.20 – 0.30) + 0.1009] = [0.10 ± 0.1009] P1 - P2  [-0.2009 ; 0.0009] con el 95% de confianza. Rpta. Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres (P2) que conocen el producto, está entre -0.2009 y 0.0009 con el 95% de confianza. b) La pregunta ¿Son iguales las proporciones de hombres y mujeres que conocen el producto? implica preguntar ¿P1 = P2? o también ¿P1 - P2 = 0? 172 La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, las proporciones de hombres y mujeres que conocen el producto son iguales. Rpta. Veamos a continuación la construcción de intervalos de confianza para la media poblacional y la diferencia de medias poblacionales, cuando se trabaja con muestras pequeñas (n < 30), donde es necesario utilizar la distribución t de student. El proceso de construcción es idéntico a los determinados anteriormente. 5.7 INTERVALO DE CONFIANZA PARA LA MEDIA (n < 30) Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con distribución N(, ²), con varianza desconocida, al estudiar la distribución t de student vimos que para muestras pequeñas, n < 30, la variable aleatoria: T X  ~ tn-1 S/ n Esta variable aleatoria depende de valores conocidos con la información muestral, entonces, dado un nivel de confianza 1 – α es posible hallar: 1 – α = P [ - t0  T  t0 ] ..................... (1) Donde los valores t0 son simétricos, de modo que centralizan la probabilidad 1 - α y se determinan como t0 = t 1  2 , n 1 , cuyos valores son ubicados en la tabla de la distribución t de student. Reemplazando la variable aleatoria T  X  en (1) y trabajando con la S/ n desigualdad buscando dejar al centro el parámetro  , la probabilidad queda como: 1 – α = P [- t0  T  t0 ] = P [ - t0  X  S/ n  t0] Multiplicando por el error estándar del estimador S / n en la desigualdad: 173 1 – α = P [- t0 S / n  X    t0 S / n ] Restando el estimador X en la desigualdad 1 – α = P [- X - t0 S / n  -   - X + t0 S / n ] Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene: 1 – α = P [ X - t0 S / n    X + t0 S / n ] A partir del cual se obtiene el intervalo de confianza para el parámetro  ,   [ X - t0 S / n , X + t0 S / n ] con el 100 (1 - α )% de confianza. El intervalo de confianza para el total N se determina multiplicando el intervalo de confianza para la media  por el tamaño de la población N, obteniéndose: N  [N X - Nt0 S / n ; N X + Nt0 S / n ] con el 100 (1 - α )% de confianza. Ejemplo 9 Una Universidad grande (12 000 alumnos) quiere estimar el número promedio de días de enfermedad de los estudiantes durante un año académico; una muestra de 25 estudiantes indica que x = 5.2 días y S = 3.1 días. Calcule e interprete intervalos de confianza del 95% Para: a) el verdadero número medio de días de enfermedad de los estudiantes, y b) el verdadero número total de días que los estudiantes se enferman en un año. Solución N = 12 000 alumnos, n = 25, x = 5.2 días y S = 3.1 días Para 1 – α = 0.95 , t0 = t24 , 0.975 = 2.064 a) El intervalo de confianza para la media  está dado por:   [ X - t0 S / n , X + t0 S / n ] Reemplazando valores tenemos:   [5.2 – 2.064 x 3.1 3.1 , 5.2 + 2.064 x ] = [5.2 ± 1.28] 25 25 Por lo tanto:   [3.92 ; 6.48] días con el 95% de confianza. Rpta. 174 Interpretación: en la Universidad el verdadero número medio de días de enfermedad de los estudiantes en el año, se encuentra entre 3.92 y 6.48 días con el 95% de confianza. b) Para hallar el intervalo de confianza para el total se multiplica por N = 12 000 el intervalo de confianza para la media encontrado en a) y se obtiene: Total = N  [12 000 (3.92) , 12 000 (6.48) ] Por lo tanto: Total = N  [47,040 ; 77,760 ] días con el 95% de confianza. Rpta. Interpretación: el verdadero número total de días que los estudiantes se enferman en un año, se encuentra entre 47,040 y 77,760 días con el 95% de confianza. 5.8 INTERVALO DE CONFIANZA PARA LA VARIANZA Al estudiar la distribución chi-cuadrado determinamos que si X1, X2, ... , Xn es una muestra aleatoria de tamaño n de una población normal con media  y varianza ², entonces: La función de la varianza muestral x 2  n  1S ² ² ~ x n21 . Esta variable aleatoria depende de valores conocidos con la información muestral, entonces, dado un nivel de confianza 1 – α es posible hallar: 1 – α = P [ a  x 2  b ] ..................... (2) Los valores a y b son valores chi-cuadrados, obtenidos en la tabla 2, con n – 1 grados de libertad, centralizando la probabilidad 1 - α y se determinan como: a = x2 n 1 , y  b = x2 2 n 1 , 1  , 2 los mismos que son ubicados en la tabla 2, de la distribución chi – cuadrado. Reemplazando la v.a. x 2  n  1S ² ² en (2) y trabajando con la desigualdad buscando dejar al centro el parámetro ², la probabilidad queda como: 1 – α = P [ a  x2  b ] = P [ a  175 n  1S ² ²  b] Dividiendo entre (n – 1) S2 tenemos:   a 1 b 1 – α = P  2  2 2  (n  1)S   (n  1)S Tomando el inverso dentro de la probabilidad y buscando mantener el sentido de la desigualdad, se tiene que:  (n  1) S 2 (n  1) S 2  2  1 – α = P  b a   Luego se tiene que el intervalo de confianza para la varianza ², está dado por:  (n  1)S 2 (n  1)S 2   (n  1) S 2 (n  1) S 2  , ²   = , 2  2  al 100 (1 – α)% de  b a    xn 1 , 1 / 2 xn 1 ,  / 2  confianza. Un intervalo de confianza para la desviación estándar  se obtiene sacando raíz cuadrada a cada uno de los límites del intervalo anterior, entonces:  (n  1)S 2 (n  1)S 2   (n  1)S 2 (n  1)S 2  ,   ,  al 100(1 – α)% de  =  2 xn21 ,  / 2  b a    xn 1 , 1 / 2 confianza Ejemplo 10 Para el ejemplo 9, en la Universidad grande se estudia el número de días que los estudiantes se enferman durante el año académico, una muestra de 25 estudiantes indica que x = 5.2 días y S = 3.1 días. Calcule e interprete intervalos de confianza del 95% para la varianza y la desviación estándar del número de días que los estudiantes se enferman. Solución El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  , ²    b a   Como n = 25 y 1 – α = 0.95, entonces: 2 a = x24 , 0.025 = 12.4 y 2 b = x24 , 0.975 = 39.4 Se tiene además la desviación estándar muestral S = 3.1 176 Reemplazando valores en el intervalo de confianza para la varianza, se tiene que:  (25  1)(3.1)2 (25  1)(3.1)2  ²   ,  39.4 12.4   Por lo tanto: ²  [5.85 , 18.60 ] (días)² con el 95% de confianza. Rpta.   [ 2.42 , 4.31 ] (días) con el 95% de confianza. Rpta. Interpretación: la varianza del número de días que los estudiantes enferman en la Universidad durante el año académico, se encuentra entre 5.85 y 18.60 (días)² con el 95% de confianza. Mientras que la desviación estándar esta entre 2.42 , 4.31 (días) con el 95% de confianza. 5.9 INTERVALO DE CONFIANZA PARA LA RAZÓN DE VARIANZAS Cuando estudiamos la distribución F, encontramos que si se toman dos muestras aleatorias independientes de tamaños n y m, de las poblaciones X ~ N (X ,  X2 )   e Y ~ N Y ,  Y2 , la distribución de probabilidades para la razón de varianzas muestrales estaba dada por: F S X2  Y2 ~ Fn–1,m-1 SY2  X2 Esta variable aleatoria depende de valores conocidos con la información muestral, entonces, dado un nivel de confianza 1 – α es posible hallar: 1 – α = P [ c  F  d ] ..................... (3) Los valores c y d son valores de la variable aleatoria F, de modo tal que centralizan la probabilidad 1 - α y se determinan como: c= F n 1 , m 1,  y d= F 2 n 1 , m 1 , 1  , 2 los mismos que son ubicados en la tabla 4 de la distribución F. S X2  Y2 Reemplazando la variable aleatoria F  2 2 en (3) y trabajando con la SY  X desigualdad buscando dejar al centro el parámetro razón de varianzas poblacionales  X2 /  Y2 , la probabilidad queda como: 1–α =P[c  F  d]=P[c  177 S X2  Y2  d] SY2  X2 Multiplicando en la desigualdad por SY2 se tiene que: S X2 SY2 S X2 1–α =P[c   Y2 SY2  d ]  X2 S X2 Tomando el inverso dentro de la probabilidad y buscando mantener el sentido de la desigualdad, obtenemos: 1–α =P[ 1–α =P[ 1 S X2  X2 1 S X2   ] d SY2 c SY2  Y2 1 F n 1, m 1,1   X2 S X2 1   2 2 Y SY F n 1, m 1, 2  S X2 ] SY2 2 Entonces, el intervalo de confianza para la razón de varianzas  X2 /  Y2 , está dado por:  2 2  S X2 / S Y2 S X2 / S Y2  S X2 / SY2  X2  S X / SY ; ;  =   F c  F  Y2   d  n 1,m1,1 n 1, m 1, 2 2     al 100 (1 – α)% de   conf. Ejemplo 11 Se hacen 16 ensayos para cada uno de los tratamientos X e Y, con las siguientes varianzas maestrales S X2 = 35 y SY2 = 10. a) Calcule e interprete un intervalo del 95% de confianza para  X2 /  Y2 b) ¿Son iguales las varianzas poblacionales de X e Y? Solución a) El intervalo de confianza solicitado es: Datos: n = m = 16, S X2 = 10,  S X2 / S Y2 S X2 / S Y2   X2  ;   c   Y2  d SY2 = 35. Como 1 – α = 0.95, entonces d = F15 , 15 , 0.975 = 2.86 y c = F15 , 15 , 0.025 = 1/ F15 , 15 , 0.975 = 1/ 2.86 = 0.349. Reemplazando valores en el intervalo se tiene que: 178  X2 35 / 10 35 / 10    = [1.22; 10.03] con el 95% de confianza. Rpta. ; 2 Y 0.349   2.86 Interpretación: la razón de varianzas de las poblaciones X e Y se encuentra entre 1.22 y 10.03 con el 95% de confianza. b) Preguntar si ¿Son iguales las varianzas poblacionales de X e Y? es similar a preguntar si ¿  X2 =  Y2 ? o también si ¿  X2 = 1?  Y2 Para responder a esto último, basta con observar si el valor 1 se encuentra en el intervalo construido. Como el valor 1 no pertenece al intervalo de confianza, entonces:  X2 ≠ 1  Y2  X2 ≠  Y2 .  Por lo tanto, las varianzas poblacionales de X e Y no son iguales. Rpta. Si en el intervalo de confianza para la razón de varianzas  X2 = 1, las varianzas  Y2 son iguales (homogéneas) caso contrario, son diferentes (heterogéneas) 5.10 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS (n y m <30) Cuando se quiere determinar intervalos de confianza para la diferencia de medias con muestras aleatorias independientes pequeñas (n y m < 30) se tiene que tomar en cuenta si las varianzas de las poblaciones normales de donde se extraen son homogéneas o heterogéneas, usando el intervalo de confianza para la razón de varianzas propuesto en el acápite anterior. A) Caso de varianzas homogéneas (  X2 =  Y2 = ²) Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con distribución N(X, ²). Sea también Y1, Y2, ..., Ym una muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución N(Y, ²). De acuerdo a lo estudiado en la distribución t de student vimos que para muestras pequeñas, n < 30 y m < 30, la variable aleatoria: 179 dado un nivel de confianza 1 – α es posible hallar: 1 – α = P [ .. de modo tal que centralizan la probabilidad 1 α y se determinan como t0 = t 1  2 .T  X  Y    X  Y  n  1S X2  m  1SY2 1  1 nm2 n ~ t n+m-2 m El estimador de la varianza común ² es: S c2  S p2  (n1  1) S X2  (n2  1) SY2 n1  n2  2 representa la varianza combinada (o ponderada) de las varianzas muestrales.. Esta variable aleatoria depende de valores conocidos con la información muestral.. respecto a su contenido medio de nicotina en miligramos.α )% de confianza.. entonces. dieron estos resultados: X = 14...t0  T  t0] = P [. ......7.9 y 180 Y = 15. cuyos valores son ubicados en la .Y )  t0 S c 1 1  ] al 100(1.Y ) + t0 S c n m 1 1  ] n m A partir del cual se tiene que el intervalo de confianza para la diferencia de medias poblacionales  X ..Y ) . X e Y. SX = 2. Reemplazando la variable aleatoria T   X  Y    X Sc  Y  1 1  n m en (4) tenemos: 1 – α = P [. nm 2 tabla de la distribución t de student.Y  [( X . la probabilidad queda como: 1 – α = P [ ( X .t0  T  t0 ] ......Y está dado por:  X . m = 21. (4) Los valores t0 son simétricos. dos muestras aleatorias de 21 cigarrillos de cada marca..Y.. SY = 3.3.8.t0 S c 1 1    X .. n = 21. de manera similar a los intervalos anteriores.Y  ( X . n m Ejemplo 12 Se compararon dos marcas de cigarrillos.t0   X  Y    X Sc  Y   t0] 1 1  n m Trabajando con la desigualdad buscando dejar al centro el parámetro  X . SX = 2. 0.95.41 / 14.44    .975 = 2.021(1. SY = 3. 1. 2  = [0.3 – 15.021 (21  1)(2. 181 Rpta.9) 2  (21  1)(3.  Y2 Considerando que las muestras son pequeñas y que las varianzas del contenido de nicotina son iguales.41. Reemplazando valores en la fórmula para el intervalo de confianza. tenemos que:  X .407  2. para la razón de varianzas: 2    c  Y  d Datos: n = m = 21.24.Y  [-3.7)  2.a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre los contenidos medios de nicotina para las dos marcas de cigarrillos.71] mg.44.41 / 14.Y  [ -1.40  2.11 ] Por lo tanto:  X .025 = 1/ F20 .3 – 15.95. 0.407.021. 0.Y  [(14. b) ¿Son iguales los contenidos medios de nicotina? Solución a) Primero determinamos si las varianzas son iguales con el intervalo de confianza  S X2 / S Y2 S X2 / S Y2   X2 . SY2 = 3.92 = 8. S X2 = 2. m = 21.8) 2 21  21  2   X .7. 20 .82 = 14.46 = 0.975 = 2. entonces  X2 =  Y2 .9 Y = 15. entonces d = F20 . el intervalo de confianza para la diferencia entre los contenidos medios de nicotina para las dos marcas de cigarrillos está dado por:  X .975 = 1/ 2. Como 1 – α = 0.3. 0. 20 . 20 .8.Y )  t0 (n  1) S X2  (m  1) SY2 nm2 1 1  ] n m Datos del problema: X = 14.  los grados de libertad de la t son n + m – 2 = 21 + 21 – 2 = 40 Si 1 – α = 0. n = 21.Y  [ ( X . . de nicotina con el 95% de confianza.46 Dado que el intervalo toma el valor 1.Y  [ (14. Reemplazando valores en el intervalo se tiene que:  X2 8.43] con el 95% de confianza. Y 0. y Como n = m = 21. es decir  X2 = 1.46 y c = F20 .7)  2.0431) ]  1 1  ] 21 21  X . 0.  t0 = t40 .51 .44 8. entonces... Por lo tanto..71 mg.  X2 )...Y = 0 está incluida en el intervalo de confianza construido en a).. b) Responder a la pregunta ¿Son iguales los contenidos medios de nicotina en los cigarrillos X e Y? implica preguntar ¿ X = Y? o también ¿ X .. cuyos valores son ubicados en la tabla 3 de la distribución t de student.. dado un nivel de confianza 1 – α es posible hallar: 1 – α = P [ ... Sea también Y1. Xn una muestra aleatoria de tamaño n.. se cumple que: T  X  Y    X 2 X  Y  2 Y S S  n m ~ tH 2  S12 S22     n n2  Donde: H   12 (valor entero) representa los grados de libertad.. Si las varianzas son diferentes.t0  T  t0 ] . es decir  X . B) Caso de varianzas heterogéneas (  X2 ≠  Y2 ) Sea X1. Reemplazando la variable aleatoria T  tenemos: 182  X  Y    X  Y  S X2 S Y2  n m en (5) .... X2.Y = 0? La diferencia  X . .. con distribución N(Y.Interpretación: la diferencia entre los contenidos medios de nicotina para las marcas de cigarrillos X e Y se encuentra comprendida entre -3. con el 95% de confianza.. de una variable aleatoria X con distribución N(X. H 2 ... los contenidos medios de o nicotina en los cigarrillos X e Y son iguales.. Rpta. Ym una muestra aleatoria de tamaño m de una variable aleatoria Y.. Y2..  Y2 ). 0. de modo tal que centralizan la probabilidad 1 α y se determinan como t0 = t  1 . .. (5) Los valores t0 son simétricos.. 2  S12   S22       n1    n2  n1  1 n2  1 Esta variable aleatoria depende de valores conocidos con la información muestral.Y = 0  X = Y.51 ... la probabilidad queda como: S X2 S Y2    X . 14 . 0. de manera similar a los intervalos anteriores.t0  T  t0] = P [.t0   X  Y    X  Y  S X2 S Y2  n m  t0] Trabajando con la desigualdad buscando dejar al centro el parámetro  X . nM = 15. se toma una muestra de 18 hombres encontrándose un promedio de S/. X H = S/.Y )  t0 S X2 S Y2  ] al 100(1.α )% de confianza.Y ) .Y. 0. S M2 = 902 = 8100. Reemplazando valores en el intervalo se tiene que: 183 .1 – α = P [.975 = 1/ 2. b) ¿Son iguales los salarios medios semanales de hombres y mujeres? Solución a) Primero determinamos si las varianzas de los salarios son iguales con el intervalo de confianza para las varianzas: Datos: nH = 18. entonces d = F17 .975 = 2. 420.    M2 c   d S H2 = 502 = 2500.t0 S X2 S Y2  ] n m A partir del cual se tiene que el intervalo de confianza para la diferencia de medias poblacionales  X . 17 .75 = 0.Y ) + t0 n m 1 – α = P [ ( X . mientras que en una muestra de 15 mujeres se encontró un promedio de S/.Y  [( X .  S H2 / S M2 S H2 / S M2   H2  .025 = 1/ F14 . 50. X M = S/. 420 y una desviación estándar de S/.90 y c = F17 . 360. 360 y una desviación estándar de S/. Se pide: a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre los salarios medios semanales de hombres y mujeres. 14 . Como 1 – α = 0.364.95. 0.Y está dado por:  X .Y  ( X . n m Ejemplo 12 En un estudio para determinar si hay diferencia en el salario semanal de los hombres y las mujeres de una gran empresa. 90. 65 . 184 Rpta. Considerando que las muestras son pequeñas y que las varianzas de los salarios semanales de hombres y mujeres son diferentes. 0.90 0.X M )  t0 S H2 S M2  ] n H nM Donde t0 = tH.360)  2.35] S/. Dado que el intervalo no toma el valor 1.11. los salarios medios semanales de hombres y mujeres son diferentes. es decir  H .M  [( X H .975 = 2.65 y S/.35 con el 95% de confianza. b) Responder a la pregunta ¿Son iguales los salarios medios semanales de hombres y mujeres? implica responder si ¿ H = M? o también ¿ H . 114. el intervalo de confianza del 95% para la diferencia de los salarios medios de hombres y mujeres está dado por:  H . 114. se tiene: 2500 8100   H .086. H2 2500 / 8100 2500 / 8100    . 2  = [0.M  [(420 .364 M  2.98 ≡ 20 2 2 2 2  2500   8100   S H2   S M2           18    15   n H    nM  18  1 15  1 n H  1 nM  1 Reemplazando valores en el intervalo de confianza propuesto. Interpretación: la diferencia entre los salarios medios semanales de hombres y mujeres se encuentra comprendido entre S/. es decir  H2 ≠ 1. Rpta. con el 95 % de confianza.85] con el 95% de confianza. . entonces  H2 ≠ 2 M  M2 .086 x ] = [60  54. 0.M ≠ 0 o  H ≠ M. 0.M = 0 no está incluida en el intervalo de confianza construido en a).975 = t20. Por lo tanto. 2 2  S H2 S M2   2500 8100        n H nM  18 15    Donde: H = = = 20. 5.M  [5.M = 0? La diferencia  H .35] 18 15 Por lo tanto:  H . X t  (  n 2  (1 . Tamaño de muestra para µ n Z 2 2 → n 0 n0  0 2 n E 1 0 N Tamaño de muestra para p ˆˆ n0 Z 2 pq → n n0  0 2 n 1 E 1 0 N 185 . n1) 2 ( ) S ) n I. para la media μ multiplicarlos por el tamaño de la población N. PARA LA VARIANZA POBLACIONAL: σ2 Caso Intervalo La muestra es aleatoria de una población normal. PARA EL TOTAL POBLACIONAL: Nμ A los I. n 1)  2 2   2 I.C.C. Cuando la muestra es aleatoria de X ~ N (μ. I. X Z 1 2.C. Cuando la muestra es aleatoria de X ~ N (μ. PARA EL TOTAL POBLACIONAL: Np Al I.C.C. PARA LA MEDIA POBLACIONAL: μ Caso Intervalo 1.C. para la proporción p multiplicarlo por el tamaño de la población N.INTERVALOS DE CONFIANZA PARA UN SOLO PARÁMETRO I. PARA LA PROPORCIÓN POBLACIONAL: p Caso Intervalo pˆ  Z La muestra es aleatoria y su tamaño es grande (n ≥ 30) 1  2 pˆ qˆ n I. σ2) con σ2 conocida o n ≥ 30. n 1)  (  .    (n  1) S 2 (n  1) S 2  . 2 σ ϵ  2    (1  .C. σ2) con σ2 desconocida. n < 30. 2  S12   S22       n1    n2  n1  1 n2  1 I. valor entero.C.C. PARA LA RAZÓN DE VARIANCIAS: 12 /  22 Caso Intervalo   S12 / S 22   12  S12 / S 22 Dos muestras aleatorias independientes de .INTERVALOS DE CONFIANZA PARA DOS PARÁMETROS I. H n1 n2 2 desconocidas pero diferentes 2 (varianzas heterogéneas) y n1 y n 2 <  S12 S22     30. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES: μ1 – μ2 Caso Intervalo 1. Dos muestras aleatorias independientes S12 S21 X1  X 2  t   de poblaciones normales con σ12 y σ22 1 .  12  22 X1  X 2  Z   de poblaciones normales con σ12 y σ22 1 n n2 1 2 conocidas y n1 y n 2 ≥ 30.  22  F  F 1 . Dos muestras aleatorias independientes 1 1 X1  X 2  t  Sc2    de poblaciones normales con σ12 y σ22 1 . n 1. Dos muestras aleatorias independientes. ϵ  poblaciones normales. n1  n 2  2  n1 n2  2 desconocidas pero iguales (varianzas homogéneas) y n1 y n 2 < 30.C. 2. (n  1) S12  (n2  1) S22 Con Sc2  1 n1  n2  2 2 3. n n2  Con: H   12 . PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES: p1 – p2 Caso Intervalo Dos muestras aleatorias independientes con n1 y n2 ≥ 30 pˆ 1  pˆ 2  Z pˆ 1 qˆ 1 1  2 186 n1  pˆ 21 qˆ 2 n2 . m 1 . m 1  2  2  I. n 1. 000 naranjas.µ | ≤ E X  b) Si 1    P(Z1 / 2  Z  Z1 / 2 ) y Z  entonces: / n     1    P X  Z    X Z  1 1 n n  2 2  Solución a) En la desigualdad: µ . la cual da una media de 200 gramos y una desviación estándar de 25 gramos.11 PROBLEMAS RESUELTOS 1.E ≤ x ≤ µ + E se resta µ en cada miembro y se obtiene: -E≤ x -µ≤ E → |x -µ|≤E b) En la expresión 1    P(Z1 / 2  Z  Z1 / 2 ) se reemplaza Z por: Z X  y se obtiene: / n 1 – α = P(Z1 / 2  X   Z1 / 2 ) / n Multiplicando en la desigualdad anterior por  / n queda:     1 – α = P  Z   X   Z  1 n  2  1 2 n Restando X en la desigualdad:     1 – α = P  X  Z      X  Z  1 1 n n  2 2  Multiplicando por -1 y manteniendo el sentido de la desigualdad se tiene:     1 – α = P X  Z     X Z  1 1 n n  2 2  2. son equivalentes a | x . Se desea estimar el peso total de una partida de 10.E ≤ x ≤ µ + E.5. Para ello se selecciona una muestra aleatoria de 41 naranjas. Calcule e interprete intervalos de confianza del 95 % para: 187 . Demostrar que: a) Las desigualdades µ . el peso total (Nμ) y la varianza verdadera (σ2) de los pesos de las naranjas.36 y 207. el verdadero peso total de las naranjas se encuentra entre 1’923600 y 2’076400 gr. n = 41. El intervalo de confianza para la media se obtiene con la expresión:    X  Z   1  2 n N n  .64 gr. el verdadero peso medio de las naranjas se encuentra entre 192. X = 200 gr. 207. Rpta.. Interpretación. con el 99 % de confianza? Solución Datos: N = 10000 naranjas. b) ¿Qué tamaño de muestra debe tomarse. 0. Zo = Z0..64] = [192. entonces en la Tabla 2: 2 a = x40 .con el 95% de confianza.96. (1) N 1  Donde el error de estimación para la media es: E= Z  1  2 n N n 25 10000  41 = 7. 0.4 y 2 b = x40 .975 = 59.975 = 1. con el 95% de Rpta.con el 95% de confianza. confianza. así: Total = Nµ ϵ 10000 [192. con el 95% de confianza. 2’076400] gr. 207.64 . ²    b a   Como n = 41 y 1 – α = 0.64 gr. 200 + 7.95. 1 – α = 0.  1.95 → en la Tabla 1. Interpretación.95 a) Para hallar el intervalo de confianza para la media y el total.a) El verdadero peso promedio (μ).36 . si 1 – α = 0.64] gr. El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  . X Z  1 N 1 n 2 N n  …………. si se desea que x difiera de µ en menos de 13 gr. Para hallar el intervalo de confianza para el Total (Nμ) se multiplica los límites de la media por N = 10000.96 N 1 41 10000  1 Reemplazando en (1) se tiene: µ ϵ [200 – 7. S = 25 gr.025 = 24.3 Se tiene además la desviación estándar muestral S = 25 188 .64] = [1’923600 .36 . 132 Rpta.Reemplazando valores en el intervalo de confianza para la varianza.575. 1 – α = 0.59 (gr. 1 – α = 0. Z = Z0. Z 2 2 b) El tamaño de muestra está dado por: n0  E2 Donde: | x .5 ≡ 25 naranjas. Zo = Z0.para estimar el peso medio de las naranjas con el 99% de confianza y un error máximo de 13 gramos se requiere de 25 naranjas.)² con el 95% de confianza.59 y 1024. Calcule e interprete intervalos de confianza del 99 % para: a) El verdadero contenido promedio (μ) de gaseosa en las botellas. resultando una media de 745 ml.99 → en la Tabla 1.59 . 1024. y una desviación típica de 12 ml. S = 12 ml. X Z   1  2  n ………….)² con el 95% de confianza.4   Por lo tanto: ²  [421.µ | = E = 13.575 2 25 2 = 24. b) La varianza verdadera (σ2) del contenido de gaseosa en las botellas. X = 745 ml.  59. Solución Datos: n = 41 botellas. Interpretación. 3. Se toma una muestra aleatoria de 41 botellas. se tiene que:  (41  1)(25) 2 (41  1)(25) 2  ²   .3 24. El intervalo de confianza para la media se obtiene con la expresión:    X  Z   1  2 n .995 = 2.575 y S = 25. (1) Donde el error de estimación para la media es: 189 .99 → En la Tabla 1. Un proceso está programado para embotellar la cantidad media de 750 mililitros de gaseosa. Reemplazando en la fórmula para n se tiene: n0  2. Rpta.99 a) Para hallar el intervalo de confianza para la media.995 = 2.59 ] (gr. Interpretación: la varianza del peso de las naranjas se encuentra entre 421.. si 1 – α = 0. 4.)².17 .59 (ml.)² con el 99% de confianza.7 galones.575 12 = 4.83] ml.7 2 b = x40 . 749.23 .con el 99% de confianza.  66.99.83 ml.E= Z  1  2 n  2..995 = 66.5 galones. Interpretación. la varianza del contenido de las botellas de gaseosa se encuentra entre 421.59 y 1024.8 20. a) Encuentre E tal que tengamos un 95 % de confianza de que el error de estimación es menor que E al usar X para estimar μ. el verdadero contenido medio de las botellas de gaseosa se encuentra entre 740. entonces en la Tabla 2: 2 a = x40 . Interpretación: con el 99% de confianza. confianza. 745 + 4. 0.83 .3 y la desviación estándar de S = 2.83 ml. b) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  . Rpta. con el 99% de Rpta. d) Encuentre el tamaño de muestra necesario para lograr un 95 % de confianza de que el error máximo de estimación sea menor que 0.005 = 20. se tiene que:  (41  1)(12) 2 (41  1)(12) 2  . 0. c) Construya un intervalo de confianza del 95 % para σ2. Solución 190 . Una muestra de 75 clientes de cierta gasolinera indica que el número medio de galones comprados es de X = 14.8 y Se tiene además la desviación estándar muestral S = 12 Reemplazando valores en el intervalo de confianza para la varianza.17 y 749. 41 Reemplazando en (1) se tiene: µ ϵ [745 – 4. ²    b a   Como n = 41 y 1 – α = 0.83] = [740.26] (ml.7   ²   Por lo tanto: ²  [86. b) Construya un intervalo de confianza del 95 % para el número medio de galones de gasolina comprados. 278. 1 – α = 0. S = 2. el verdadero consumo medio de gasolina se encuentra entre 13. 14. Rpta. ²    b a   Como n = 75 y 1 – α = 0.975 = 1.7. Interpretación.91] galones con el 95% de confianza.7) 2 (75  1)(2.61 . 14.µ | = E = 0.61 galones.95.. a) El error de estimación para la media E es: E= Z  1  2 n  1. Z 2 2 d) El tamaño de muestra está dado por: n0  E2 Donde: | x .7 Se tiene además la desviación estándar muestral S = 2. Interpretación: con el 95% de confianza. 0.35] (galones)² con el 95% de confianza.025 = 52. 75 b) El intervalo de confianza para la media se obtiene con la expresión:    X  Z   1  2 n .69 . c) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  . Rpta.Datos: n = 75 clientes.61] = [13.95 → en la Tabla 1.7 = 0.3 – 0. la varianza de la gasolina comprada se encuentra entre 5.96 2. (1) Reemplazando en (1) se tiene: µ ϵ [14.69 y 14.en la gasolinera.3 galones.7 Reemplazando valores en el intervalo de confianza para la varianza. se tiene que:  (75  1)(2. entonces en la Tabla 2: 2 a = x74 .3 + 0.41 y 10.35 (galones)². 7 52. 10.41 . 0. X Z   1  2  n ………….91 galones con el 95% de confianza.96 y S = 2.975 = 99.975 = 1.1 y 2 b = x74 .1   Por lo tanto: ²  [5.5 galones.95 → En la Tabla 1. Reemplazando en la fórmula para n se tiene: 191 . Z = Z0. 1 – α = 0.7) 2  ²   .7 galones.  99 . X = 14. Zo = Z0.96. 975 = 1.95 a) Para hallar el intervalo de confianza para la media..92 gr.42 gr.92] = [242.58 y 250.5 gr.95 → En la Tabla 1. n = 36 bolsas..con el 95% de confianza. a) Construya un intervalo de confianza del 95% para el verdadero peso medio de las bolsas con café.5 gramos y una desviación típica de 12 gramos.. si 1 – α = 0.7 2 = 112 clientes. 5.96 2 2. el verdadero contenido medio de las bolsas con café se encuentra entre 242.1.96. X Z   1  2  n …………. 192 . 36 Reemplazando en (1) se tiene: µ ϵ [246. Interpretación.5 galones se requiere una muestra de 112 clientes. n0  0.52 Rpta. Un proceso está programado para embolsar la cantidad media de 250 gramos de café.5 – 3. S = 12 gr. 246. Se toma una muestra aleatoria de 36 bolsas. puesto que µ = 250 gr.. b) No se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas de café.96 12 = 3. El intervalo de confianza para la media se obtiene con la expresión:    X  Z   1  2 n . Zo = Z0. 1 – α = 0. está en el intervalo de confianza obtenido en a).58 .para estimar el consumo medio de gasolina con el 95% de confianza y un error máximo de 0.92 . con el 95% de Rpta. b) ¿Se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas? c) Construya un intervalo de confianza del 95% para la verdadera varianza de los pesos de las bolsas con café. confianza. Interpretación. resultando una media de 246.. 250. ¿aceptaría usted que σ2 = 250 gr2 por bolsa? Solución Datos: µ = 250 gr..42] gr. (1) Donde el error de estimación para la media es: E= Z  1  2 n  1.5 + 3. X = 246. n = 36. si 1 – α = 0.  53. X = $ 5. Suponiendo que el banco tiene 12.95 a) Para hallar el intervalo de confianza para la media. Zo = Z0. se tiene que:  (36  1)(12) 2 (36  1)(12) 2  ²   .6   Por lo tanto: ²  [94.66 (gr.000.6 y 2 b = x35 . La muestra da una media de $ 5.975 = 1.)².2 20. c) La desviación estándar verdadera de los depósitos en las cuentas a la vista. entonces en la Tabla 2: 2 a = x35 . Reemplazando valores en el intervalo de confianza para la varianza.)² con el 95% de confianza.66] (gr. la varianza de los pesos de las bolsas con café se encuentra entre 94. Interpretación: con el 95% de confianza.2 Se tiene además la desviación estándar muestral S = 12. 0.000. El intervalo de confianza para la media se obtiene con la expresión: 193 .95. Calcule e interprete intervalos de confianza del 95 % para: a) El verdadero depósito promedio en las cuentas a la vista. d) ¿Qué tamaño de muestra debe tomarse. 1 – α = 0. 6. Para estimar la cantidad total de depósitos a la vista en dólares. 244. b) La cantidad total en depósitos. Nota: No aceptaría que σ2 = 250 gr2 por bolsa.000 cuentas a la vista.000 y una desviación estándar de $ 1. 0.95 → En la Tabla 1. ya que el resultado anterior indica que es menor de 250 gr2. si se desea que x difiera de µ en menos de $ 150 con el 95 % de confianza? Solución Datos: N = 12.025 = 20. Rpta.74 y 244.975 = 53.000.000 cuentas. un banco comercial selecciona una muestra aleatoria de 36 cuentas.74 . ²    b a   Como n = 36 y 1 – α = 0.c) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  .96. S = $ 1. el verdadero depósito medio a la vista en las cuentas se encuentra entre 4. se tiene que:  (36  1)(1000 ) 2 (36  1)(1000 ) 2  ²   .673. Reemplazando en (1) se tiene: 36 µ ϵ [5.13] ($)² con el 95% de confianza.96 1000 = $ 326. 0.673.029.040] $ con el 95% de confianza.326.000 [4.673.326. 5.303.2 20.975 = 53. c) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  .67..6   Por lo tanto: ²  [657. Entonces: .000. Reemplazando valores en el intervalo de confianza para la varianza. (1) Donde el error de estimación para la media es: E= Z  1  2 n  1. 5.025 = 20. Interpretación.con el 95% de confianza.894.con el 95% de confianza.   [811.000 – 326. 1.47] $ con el 95% de confianza.960 .67] = [56’079.11 .6 y 2 b = x35 . X Z   1  2  n …………. b) Para hallar el intervalo de confianza para el Total (Nμ) se multiplica los límites de la media por N = 12. 1’699.040. el verdadero total de depósitos a la vista en las cuentas en dólares se encuentra entre $ 56’079. Rpta.000 + 326. así: Total = Nµ ϵ 12. 194 Rpta.2 Se tiene además la desviación estándar muestral S = 1. 63’920.33 .. Rpta.74 .67] = [4.95. entonces en la Tabla 2: 2 a = x35 .960 y 63’920.67 . Interpretación. ²    b a   Como n = 36 y 1 – α = 0.33 .67] $ con el 95% de confianza.33 y 5.   X  Z   1  2 n . 5.326.000.  53. 0.67 dólares. 975 = 1. 1 – α = 0. (150) 2 Rpta. Interpretación.000) 2 n0  = 171 cuentas.96) 2 (1.µ | = E = $ 150. Solución Con la información en la tabla se determina el promedio y la varianza muestral de los hijos por familia así: 6 X X n i i 1 n i  0 x20  1x10  2 x7  3x6  4 x4  5 x3 73  = 1. c) La proporción de familias con menos de 2 hijos en el área. obteniéndose los siguientes datos sobre el número de hijos por familia: Hijos por familia (Xi) Familias (ni) 0 1 2 3 4 5 20 10 7 6 4 3 Calcule e interprete intervalos de confianza del 95 % para estimar: a) El número medio de hijos por familia en la ciudad.para estimar el depósito medio a la vista. d) El tamaño de muestra está dado por: n0  Z 2 2 E2 Donde: | x .303. d) El total de familias con menos de 2 hijos en el área.11 y 1.47 dólares. 50 50 195 . Reemplazando en la fórmula para n se tiene: (1. con el 95% de confianza y un error máximo de $ 150 se requiere una muestra de 171 cuentas. b) El número total de hijos por familia en el área de la ciudad. Z = Z0.Interpretación: con el 95% de confianza.000. De un área de la ciudad en la que habitan 500 familias se extrae una muestra aleatoria de 50 familias..96 y S = 1.95 → en la Tabla 1. la desviación estándar de los depósitos a la vista en las cuentas se encuentra entre 811.46 hijos. 7. 6 S2  6  ( X i  X ) 2 ni  i 1 n 1 X i 1 n  nX 2 2 i i n 1  231  50 (1. 1 – α = 0.975 = 1.975 = 1. el verdadero número medio de hijos por familia se encuentra entre 1. con el 95% de confianza.96.95. Zo = Z0.. entonces: 196 .95 Z0 = Z 0.46 + 0. X = 30 familias con menos de 2 hijos. El intervalo de confianza para la media se obtiene con la expresión:    X  Z   1  n 2 N n  .42 hijos. Interpretación.54 hijos2 y S = 50  1 1. así: Total = Nµ ϵ 500 [1. si 1 – α = 0. N 1 500  1 50 Reemplazando en (1) se tiene: µ ϵ [1. 940] hijos al 95% de confianza.88 hijos. (1) N 1  Donde el error de estimación para la media es: E= Z  1  2 n N n 1.con el 95% de confianza. Rpta. 1. a) Para hallar el intervalo de confianza para la media y el total. X Z  1 N 1 n 2 N n  …………. Interpretación. n = 50.46 – 0.04 .594.96.95 → en la Tabla 1. 1..04 y 1. n = 50. Si p = proporción muestral de familias con menos de 2 hijos.46) 2 = 2. c) Para determinar el intervalo de confianza para la proporción de familias con menos de 2 hijos en el área.88] = [520 . Si 1 – α = 0. b) Para hallar el intervalo de confianza para el Total (Nμ) de hijos se multiplica los límites de la media por N = 500 familias. Rpta.42 .04 . 6 X i 1 n 0 2 x20  12 x10  2 2 x7  32 x6  4 2 x4  5 2 x3 = 231 2 i i Otros datos: N = 500.el verdadero total de hijos en el área de la ciudad. 1.96 = 0. del enunciado y la tabla tomemos los datos: N = 500.594 500  50  1. → en la Tabla 1.88] hijos / familia con el 95% de confianza. se encuentra entre 520 y 940 hijos.42] = [1. 60 x0. Interpretación.729 ] con el 99% de confianza.6. En una muestra aleatoria de 1000 hogares de Lima Metropolitana (con 800 mil consumidores de gas doméstico) se encontró que 650 están a favor de la reducción del precio del gas doméstico. se encuentra entre 0. Rpta.311 y 0. 8.129 . Interpretación.60 – 1.60 + 0. se multiplica los límites de la proporción por N = 500 familias. El intervalo de confianza para la verdadera proporción poblacional P de familias con menos de 2 hijos.489 con el 95% de confianza.60 x0. así: Tot. 0.60 + 0.la verdadera proporción de familias con menos de 2 hijos en el área de la ciudad.60 – 0.129 ] Por lo tanto: P ϵ [ 0. con el 95% de confianza. a) Calcule e interprete un intervalo del 90% de confianza para la proporción y otro para el total verdadero de hogares que están a favor de la reducción del precio del gas doméstico. n 50 q = 1 – p = 0. ¿qué tamaño de muestra será necesario si desea cometer un error máximo del 5%? Solución 197 .40 500  50 50 500  1 . 0. b) Con un 95% de confianza. Rpta.40 500  50 ] 50 500  1 P ϵ [0. 0.4. d) Para hallar el intervalo de confianza para el Total (NP) de familias con menos de 2 hijos. 365] familias al 95% de confianza. pZ  1 N 1 2 pq N  n   n N 1  Reemplazando valores se tiene: P ϵ 1. 0.729] = [236.p X 30  = 0. = NP ϵ 500 [0.. se encuentra entre 236 y 365 familias.el total de familias con menos de 2 hijos en el área de la ciudad.96 [0. es:  Pp  Z  1 2  pq n N n .471 .96 0..471. Si p = proporción muestral de hogares que están a favor de la reducción del precio del gas doméstico. 1 – α = 0.96.645 0. Rpta. al 95% de confianza: 198 Z = Z0.000 . Para hallar el intervalo de confianza para el Total (NP) de hogares que están a favor de la reducción del precio del gas doméstico.000 hogares.000] hogares con el 90% de confianza.P| = 0.625 .025] Por lo tanto: P ϵ [0. b) Datos: p = 0.05.025 .645. así: Total = NP ϵ 800.65 + 1. 0.el total de hogares que están a favor de la reducción del precio del gas doméstico en Lima Metropolitana. con el 90% de confianza.645 ] 1000 1000 P ϵ [0.65 + 0. se encuentra entre 460.625 y 0.90. Interpretación. n 1000 El intervalo de confianza para la verdadera proporción poblacional P de hogares que están a favor de la reducción del precio del gas doméstico.65 x0. . Zo = Z0. E = |p .000. q = 0.05 y según la Tabla 1 de la distribución normal estándar.000 y 500.65 x0. se encuentra entre 0.5%) con el 90% de confianza.Datos: N = 800.5% y 67.35 . es:  Pp  Z  1 2  pq . 0.. Reemplazando valores se tiene: P ϵ [0. se multiplica los límites de la proporción por N = 800.35 0. 0. Rpta.000 [0. 0.575 .65 – 0. 975 = 1.95 = 1. n = 1. entonces: p  X 650  = 0.90 → En la Tabla 1.65 – 1.. 500.675] con el 90% de confianza.65. Interpretación. X = 650 a favor de la reducción del precio del gas.625] = [460.675 (62.la verdadera proporción (porcentaje) de hogares que están a favor de la reducción del precio del gas doméstico.35. si 1 – α = 0.35. a) Para determinar el intervalo de confianza para la proporción de hogares que están a favor de la reducción del precio del gas doméstico.65.000 consumidores de gas. pZ  1 n 2 pq   n  Se desecha el factor de corrección para poblaciones finitas porque la fracción de muestreo n/N < 0.000 hogares. q = 1 – p = 0. 305 es la proporción muestral de hogares que compra periódicos y revistas. 199 Rpta.96 0.65 x0. a) Determine un intervalo de confianza del 95 % para la proporción y otro para el total de hogares limeños que compra periódicos y revistas. q = 1 – p = 0.695 .35 n0    350 hogares. pZ  1 n 2 pq   n  Se desecha el factor de corrección para poblaciones finitas porque la fracción de muestreo n/N < 0.334] con el 95% de confianza. Zo = Z0.695.000 hogares.5 % y una confianza del 95 %.05) 2 Rpta. 0. n = 1.305 + 0.para estimar la proporción de hogares que están a favor de la reducción del precio del gas doméstico.305 – 1.96 ] 1000 1000 P ϵ [0. b) ¿Aceptaría Ud. Interpretación.029 . E2 (0.305 – 0. 9.. entonces el intervalo de confianza para la verdadera proporción poblacional P de hogares que compra periódicos y revistas.05.695 0. si 1 – α = 0. 0. p = 0.96 2 x0.305.975 = 1.Reemplazando en la fórmula para el tamaño de muestra se tiene: Z 2 pq 1. 0. . Reemplazando valores se tiene: P ϵ [0.276 .305 x0.95 → En la Tabla 1.96. es:  Pp  Z  1 2  pq . Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana (con 1’400 000 hogares) indica que el 30. a) Para determinar el intervalo de confianza para la proporción de hogares que compra periódicos y revistas.029] Por lo tanto: P ϵ [0. con el 95% de confianza y un error máximo del 5% se requiere una muestra de 350 hogares consumidores de gas.5 % de los hogares compra periódicos y revistas. ¿Qué tamaño de muestra es necesario para estimar la proporción de hogares que compran periódicos y revistas? Solución Datos: N = 1’400.000.305 x0. que menos del 25 % de hogares limeños compra periódicos y revistas? c) Con un error del 2.305 + 1. Si p = 0. 600] hogares con el 95% de confianza. E2 (0. c) Datos: p = 0.334] = [386.600 hogares.025 y según la Tabla 1 de la distribución normal estándar.334 (27.400 y 467. puesto que se encuentra entre 27. se multiplica los límites de la proporción por N = 1’400.6% y 33.96 2 x0. al 95% de confianza: Z = Z0.400 . Rpta. 0.96. Reemplazando en la fórmula para el tamaño de muestra se tiene: n0  Z 2 pq 1.303 hogares. ¿qué tamaño de muestra será necesario si desea cometer un error máximo del 4%? Solución Datos: n = 500 compradores. 10.4%) con el 95% de confianza.303 hogares.276 .la verdadera proporción (porcentaje) de hogares que compra periódicos y revistas en Lima Metropolitana. 975 = 1.276 y 0...000 [0.305 x0..6% y 33.para estimar la proporción de hogares que compra periódicos y revistas.025) 2 Interpretación. b) No aceptaría que menos del 25 % de hogares limeños compra periódicos y revistas.P| = 0. E = |p .5% se requiere una muestra de 1. se encuentra entre 386. con el 95% de confianza. con el 95% de confianza y un error máximo del 2. Una muestra aleatoria de 500 compradores de un centro comercial se encontró que 300 compran alimentos y bebidas. Rpta. q = 0. X = 300 compran alimentos y bebidas.Interpretación. b) Con un 99% de confianza.el total de hogares que compra periódicos y revistas en Lima Metropolitana. se encuentra entre 0. así: Total = NP ϵ 1’400.305. 467.4% (ver la parte a).000 hogares.695. Interpretación. a) Calcule e interprete un intervalo del 99% de confianza para la proporción verdadera de compradores que adquieren alimentos y bebidas. Para hallar el intervalo de confianza para el Total (NP) de hogares que compra periódicos y revistas. 200 .695   1. 0.60 + 2.544 y 0. con el 99% de confianza y un error máximo del 4% se requiere una muestra de 995 compradores.para estimar la proporción de compradores que adquieren alimentos y bebidas en el centro comercial.04 y según la Tabla 1 de la distribución normal estándar.P| = 0. la verdadera proporción (porcentaje) de compradores que adquieren alimentos y bebidas en el centro comercial. Si p = proporción muestral de compradores que adquieren alimentos y bebidas. b) Datos: p = 0. 995 = 2.575 2 x0.40. 0.056] Por lo tanto: P ϵ [0. Reemplazando valores se tiene: P ϵ [0.60. 0.544 . Se tomó una muestra aleatoria de 800 mujeres casadas en Lima y se encontró que 560 están a favor del uso de la píldora del día siguiente.995 = 2. E2 (0. al 99% de confianza: Z = Z0. pZ  1 n 2 pq   n  Se desecha el factor de corrección para poblaciones finitas. Interpretación.575 0. entonces: p  X 300  = 0. E = |p .05.575.656 (54.4% y 65. n 500 q = 1 – p = 0. Rpta. 201 .a) Para hallar los límites de confianza para la proporción de compradores que adquieren alimentos y bebidas. Zo = Z0. El intervalo de confianza para la verdadera proporción poblacional P de compradores que adquieren alimentos y bebidas.04) 2 Rpta.con el 99% de confianza.99 → En la Tabla 1.35 .60 x0.. si 1 – α = 0. Reemplazando en la fórmula para el tamaño de muestra se tiene: n0  Z 2 pq 2.40.60 x0. asumiendo un número grande de compradores. 11.056 .65 x0.40 0.60 – 2..6%). Interpretación.575.60 + 0.60. tal que la fracción de muestreo n/N < 0.60 – 0. q = 0.656] con el 99% de confianza.40   995 compradores. es:  Pp  Z  1 2  pq .575 ] 500 1000 P ϵ [0. se encuentra entre 0. si se desea un error máximo del 3%? Solución Datos: n = 800 mujeres casadas.30. se encuentra entre 0.668 .70 – 0.732] con el 95% de confianza.96 0.70. El intervalo de confianza para la verdadera proporción poblacional P de mujeres casadas que están a favor del uso de la píldora del día siguiente. 0. Reemplazando valores se tiene: P ϵ [0.70.05. Rpta.70 x0.668 y 0. 0. 0. es:  Pp  Z  1 2  pq .70 x0.70 + 0. entonces: p  X 560  = 0.la verdadera proporción (porcentaje) de mujeres casadas que están a favor del uso de la píldora del día siguiente en Lima.032 . b) Con el 95 % de confianza.032] Por lo tanto: P ϵ [0. si 1 – α = 0.70 – 1.2%) con el 95% de confianza. pZ  1 n 2 pq   n  Se desecha el factor de corrección para poblaciones finitas. tal que la fracción de muestreo n/N < 0. b) Datos: p = 0.30 . Interpretación.a) Calcule e interprete un intervalo del 95% de confianza para la verdadera proporción de mujeres casadas que están a favor del uso de la píldora del día siguiente.96 ] 800 800 P ϵ [0.732 (66. Si p = proporción muestral de mujeres casadas que están a favor del uso de la píldora del día siguiente.. E = |p . a) Para hallar los límites de confianza para la proporción de mujeres casadas que están a favor del uso de la píldora del día siguiente.95 → En la Tabla 1. X = 560 a favor del uso de la píldora del día siguiente.70 + 1.96. asumiendo un número grande de mujeres casadas en Lima. 975 = 1.30 0. Zo = Z0. n 800 q = 1 – p = 0.03 y según la Tabla 1 al 95% de confianza: Z = Z0. Reemplazando en la fórmula para el tamaño de muestra se tiene: 202 .P| = 0.975 = 1. ¿Qué tamaño de muestra debe tomarse.8% y 73.30. q = 0.96. 5 millones de ciudadanos) indica que el 19.03) 2 Rpta. Rpta.805.975 = 1.05.5 % de los ciudadanos juega la tinka.17 .96 0.n0  Z 2 pq 1.96.96 2 x0. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción de ciudadanos que juega la tinka? Solución Datos: N = 5’500. E2 (0. Interpretación.195 – 0.195 x0.195 + 0. a) Para determinar el intervalo de confianza para la proporción de ciudadanos limeños que juegan la tinka.22] con el 95% de confianza.70 x0. 203 . 0. si 1 – α = 0. Reemplazando valores se tiene: P ϵ [0.22 (17% y 22%).805 0. a) Determine un intervalo de confianza del 95 % para la proporción y otro para el total de ciudadanos limeños que juegan la tinka.025] Por lo tanto: P ϵ [0. Zo = Z0. se encuentra entre 0. 12. Si p = 0. Una “Encuesta de Opinión” realizada a 1000 ciudadanos de Lima Metropolitana (con 5...195 es la proporción muestral de ciudadanos limeños que juegan la tinka. se requiere una muestra de 896 mujeres casadas.195 + 1.con el 95% de confianza la verdadera proporción (porcentaje) de ciudadanos limeños que juegan la tinka.000. b) Con un error del 3. p = 0. q = 1 – p = 0.96 ] 1000 1000 P ϵ [0.195 – 1. es:  Pp  Z  1 2  pq .695 .con el 95% de confianza y un error máximo del 3% para estimar la proporción de mujeres casadas que están a favor del uso de la píldora del día siguiente. 0.305 x0. 0.5 % y una confianza del 95 %. pZ  1 n 2 pq   n  Se desecha el factor de corrección para poblaciones finitas porque la fracción de muestreo n/N < 0.195.17 y 0.025 . Interpretación.30   896 mujeres casadas.95 → En la Tabla 1. entonces el intervalo de confianza para la verdadera proporción poblacional P de ciudadanos limeños que juegan la tinka.000 ciudadanos. n = 1. 5%? Solución Datos: n = 600 compradores. c) Con un 95% de confianza.035 y según la Tabla 1 de la distribución normal estándar.17 .805. con el 95% de confianza.000] ciudadanos con el 95% de confianza. así: Total = NP ϵ 5’500. se multiplica los límites de la proporción por N = 5’500. q = 0.035) 2 Rpta.000 ciudadanos.195 x0. 13. b) ¿Esta evidencia es suficiente para concluir que menos de 2/3 de los compradores están a favor de un horario más extenso? Explique.95 → En la Tabla 1. 1’210. 975 = 1.22] = [935. X = 360 están a favor de un horario más amplio para las compras. Zo = Z0. E = |p .para estimar la proporción de ciudadanos limeños que juegan la tinka. al 95% de confianza: Z = Z0. se encuentra entre 935. b) Datos: p = 0.. Rpta.000 [0. 0. Reemplazando en la fórmula para el tamaño de muestra se tiene: Z 2 pq 1.000 y 1’210..el total de ciudadanos limeños que juegan la tinka.96. con el 95% de confianza y un error máximo del 3.P| = 0. si 1 – α = 0.975 = 1. a) Para hallar los límites de confianza para la proporción de compradores que están a favor de un horario más amplio para las compras. a) Calcule e interprete un intervalo del 95% de confianza para la proporción verdadera de compradores que están a favor de un horario más amplio para las compras.000 ciudadanos.Para hallar el intervalo de confianza para el Total (NP) de ciudadanos limeños que juegan la tinka.96. Interpretación.805 n0    492 ciudadanos. Interpretación.195.000 .5% se requiere una muestra de 492 ciudadanos. 204 . En una muestra aleatoria de 600 compradores de un centro comercial se encontró que 360 están a favor de un horario más amplio para las compras. ¿qué tamaño de muestra será necesario si desea cometer un error máximo del 4.96 2 x0. E2 (0. 05. entonces: p  X 360  = 0. 0.60 – 1.045 y según la Tabla 1 al 95% de confianza: Z = Z0.561 y 0.639 (ver parte a).60 x0..60 – 0.96.561 .60 x0..1% y 63. Rpta.96 ] 600 600 P ϵ [0.039] Por lo tanto: P ϵ [0. Interpretación. Reemplazando valores se tiene: P ϵ [0. El intervalo de confianza para la verdadera proporción poblacional P de compradores que están a favor de un horario más amplio para las compras.60 + 0.con el 95% de confianza y un error máximo del 4. se encuentra entre 0. c) Datos: p = 0. n 600 q = 1 – p = 0. se requiere una muestra de 455 compradores. 205 . E2 (0. puesto que P se encuentra entre 0.40.40.60.P| = 0.561 y 0. q = 0.60. pZ  1 n 2 pq   n  No se considera el factor de corrección para poblaciones finitas. Interpretación.639] con el 95% de confianza.5% para estimar la proporción de compradores que están a favor de un horario más amplio para las compras en el centro comercial. es:  Pp  Z  1 2  pq . 0.la verdadera proporción (porcentaje) de compradores que están a favor de un horario más amplio para las compras en el centro comercial.96 0.40 .9%) con el 95% de confianza. 975 = 1. tal que la fracción de muestreo n/N < 0. b) Se puede concluir que menos de 2/3 de los compradores están a favor de un horario más extenso.639 (56.96 2 x0.Si p = proporción muestral de compradores que están a favor de un horario más amplio para las compras. E = |p . 0.40 0. Reemplazando en la fórmula para el tamaño de muestra se tiene: Z 2 pq 1.045) 2 Rpta.60 x0. asumiendo un número grande de compradores en el centro comercial.60 + 1.40 n0    455 compradores.039 . 66 y 18. Interpretación: con el 99% de confianza. Rpta. con el 95% de confianza.34] Luego: A ..  (1) Si 1 – α = 0...B ≠ 0? Si apreciamos el intervalo de confianza construido en a) A . Rpta. la diferencia del gasto medio mensual en arbitrios en las ciudades A y B se encuentra entre S/. 15. b) Responder a la pregunta ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B? implica responder si ¿ A ≠ B? o también ¿A .34. Por lo tanto.99..30 n A nB 200 180 Reemplazando valores en (1): A . SA = 15.995 = 2.. 18.575 X AXB   XB X A S A2 S B2 (15) 2 (10) 2     = S/. 11.66.B ≠ 0 o A ≠ B. X B = 235. entonces: Z0 = Z 0.3 partes por 206 .30) . (X A  X B )  Z 2 1  X AXB 2   . b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B? Solución Datos: nA = 200.B ϵ [11..575 (1. se toma una muestra al azar de 200 hogares de A arrojando un gasto medio de S/. SB = 10.34] S/.B no puede ser cero.. el gasto medio mensual en arbitrios en ambas ciudades es diferente... Un departamento de producción desea determinar si hay diferencia en el rendimiento entre el turno diurno (A) y el nocturno (B). (250 – 235) + 2. X A = 250. 250 y una desviación estándar de 15.575 (1.30)] = [15 ± 3.B ϵ [(250 – 235) – 2.14. a) Determine un intervalo de confianza del 99 % para la diferencia del gasto medio en las ciudades A y B. En un estudio para determinar el gasto medio mensual en arbitrios en las ciudades A y B. es decir A . 1.. Una muestra aleatoria de 80 obreros del turno diurno alcanza una producción media de 94. a) Un intervalo de confianza para la diferencia del gasto medio mensual en arbitrios en las ciudades A y B viene dado por:   A   B  ( X A  X B )  Z  1  X AXB . Una muestra al azar de 180 hogares de la ciudad B da una gasto medio de 235 y una desviación estándar de 10. nB = 180. ..7. Interpretación: con el 95% de confianza. con una desviación 207 .7 partes por hora... b) Responder a la pregunta ¿Son diferentes los rendimientos medios de ambos turnos? Es responder si ¿ A ≠ B? o también ¿A . mientras que otra muestra de 60 obreros de la noche alcanza un promedio de 89. Por lo tanto.B toma el valor cero.B ≠ 0? Si apreciamos el intervalo de confianza construido en a) A . X A = 94. b) ¿Son diferentes los rendimientos medios de ambos turnos? ¿µA ≠ µB? Explique Solución Datos: nA = 80. X B = 89. Una muestra aleatoria de 60 hombres alcanza un promedio de 78 artefactos mensuales.7)] = [4.. SA = 14.7 partes por hora.6 ± 5. 9. Rpta.7) + 1. (X A  X B )  Z 2 1  X AXB 2   . nB = 60...hora.96 X AXB S A2 S B2 (14) 2 (17) 2     = 2.3 – 89. con una desviación estándar de 17.. los rendimientos medios de ambos turnos no son diferentes. (94.3 – 89. entonces: Z0 = Z 0.7.96 (2. Se pide: a) Calcule e interprete un intervalo de confianza del 95% para la verdadera diferencia de rendimientos medios de ambos turnos.3] Luego: A .. n A nB 80 60 Reemplazando valores en (1): A .3 partes por hora. 16.9] partes por hora con el 95% de confianza. Rpta. SB = 17..975 = 1.B ϵ [-0.B = 0 o A = B. El departamento de marketing desea determinar si hay diferencia entre las ventas mensuales realizadas por hombres y mujeres.9 partes por hora. la diferencia de rendimientos medios del turno diurno y nocturno se encuentra entre -0.95.B ϵ [(94.  (1) Si 1 – α = 0.7 y 9. a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado por:   A   B  ( X A  X B )  Z  1  X AXB .7) .96 (2. con una desviación estándar de 14 partes por hora.7) – 1. es decir A . Se pide: a) Construya un intervalo del 95% de confianza para la verdadera diferencia de las ventas medias realizadas por hombres y mujeres.m ϵ [(78 – 85) – 1.4 partes por hora. X h = 78 artefactos.m no puede ser cero.m ≠ 0? Si apreciamos el intervalo de confianza construido en a) h .4) .3 artefactos.m ≠ 0 o h ≠ m. (X h  X m )  Z 2 1  X h Xm 2    . 208 .50 y una desviación estándar de S/ 0. b) ¿Son diferentes las ventas medias realizadas por hombres y mujeres? ¿µh ≠ µm? Solución Datos: nh = 60. 0. nm = 50. la diferencia de las ventas medias mensuales de hombres y mujeres se encuentra entre -11. 6. con una desviación estándar de 10 artefactos. -2.. 6.90.4)] = [-7 ± 4. a) Un intervalo de confianza para la diferencia de las ventas medias realizadas por hombres y mujeres viene dado por:   h   m  ( X h  X m )  Z  1  X h Xm . es decir h ..95. nh nm 60 50 Reemplazando valores en (1): h . X m = 85.. Una muestra al azar de 100 hogares de la ciudad B da una precio medio de S/.7 y -2.7..75 y una desviación estándar de S/.m ϵ [-11. Para determinar el precio medio del kilo de pollo en las ciudades A y B.96 X h Xm  S h2 S m2 (15) 2 (10) 2    = 2. se toma una muestra al azar de 120 hogares de A arrojando un precio medio de S/.. Rpta.96 (2. mientras que otra muestra de 50 mujeres arroja una venta media de 85 artefactos mensuales.. (78 – 85) + 1. entonces: Z0 = Z 0. Interpretación: con el 95% de confianza.3] artefactos con el 95% de confianza... Sm = 10..7] Luego: h . Rpta. b) Responder a la pregunta ¿Son diferentes las ventas medias realizadas por hombres y mujeres? implica responder si ¿h ≠ m? o también ¿h . Sh = 15.975 = 1. (1) Si 1 – α = 0. si es diferente la venta medias mensual de artefactos entre hombres y mujeres. Por lo tanto. 17..70.estándar de 15.96 (2. 03] S/. 18.50 – 6. Interpretación: con el 95% de confianza. a) Construya un intervalo del 95 % de confianza para la diferencia entre los pagos medios a los obreros de las dos ciudades.11)] = [-0. a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado por:   A   B  ( X A  X B )  Z  1  X AXB . entonces: Z0 = Z 0..B ≠ 0? Si apreciamos el intervalo de confianza construido en a) A .96 (0.25 ± 0.96 (0. (6..  (1) Si 1 – α = 0.03. 6.50 – 6.90.11 n A nB 120 100 Reemplazando valores en (1): A . b) ¿Es diferente el precio medio del pollo en las ciudades A y B? Solución Datos: nA = 120 hog. y n2 = 35. X 1 = $ 540. X 2 = $ 530. es decir A .7) 2 (0. S2 = $ 20.B ϵ [-0.11) . nB = 100.50. la diferencia del precio medio del pollo en las ciudades A y B se encuentra entre S/.75. X B = 6.47.95. el precio medio del pollo en Rpta.75) – 1. S1 = $ 25.75) – 1.47 y -0... 209 .B no toma el valor cero.. b) Responder a la pregunta ¿Es diferente el precio medio del pollo en las ciudades A y B? es responder si ¿ A ≠ B? o también ¿A .B ≠ 0 o ambas ciudades es diferente...B ϵ [(6. X A = S/. -0. Rpta. con el 95% de confianza.70..a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del precio medio del pollo en las ciudades A y B. SB = 0.96 X AXB  S A2 S B2 (0. (X A  X B )  Z 2 1  X AXB 2   . 0. Muestras del pago mensual a los obreros en las ciudades 1 y 2 proporcionan los siguientes datos: n1 = 35. Por lo tanto..22] Luego: A .975 = 1. SA = 0. -0..9) 2    = S/.. A ≠ B. 9 y n2 = 50. Solución Datos: n1 = 40.7. b) Responder a la pregunta ¿Difieren los pagos medios a los obreros en las dos ciudades? implica responder si ¿1 ≠ 2? o también ¿1 . X 1 = 14.7. (540 – 530) – 1.60 y 20. 19.975 = 1. y X 2 = $ 530.2 ϵ [-0. Rpta. dos muestras aleatorias de 40 cigarrillos de la marca 1 y 50 de la marca 2. X 2 = 15. Solución Datos: n1 = 35..2 ϵ [(540 – 530) – 1.96  X X  1 2 S12 S 22 (25) 2 (20) 2    = $ 5. X 1 = $ 540.8. S1 = 2...96 (5.b) ¿Difieren los pagos medios a los obreros en las dos ciudades? Explique. a) Construya un intervalo del 99 % de confianza para la diferencia entre las medias del contenido de nicotina para las dos marcas de cigarrillos.2 = 0 o 1 = 2.60] Luego: 1 . Rpta. respecto a su contenido de nicotina en miligramos. . X 2 = 15..41)] = [10 ± 10.41 n1 n2 35 35 Reemplazando valores en (1): 1 ..41) . n2 = 35.. S1 = $ 25.. a) Un intervalo de confianza para la diferencia de pagos medios viene dado por:  1   2  ( X 1  X 2 )  Z  1   X X . los pagos medios a los obreros en las dos ciudades no difieren. Por lo tanto.96 (5.60. b) ¿Difieren las dos marcas en su contenido medio de nicotina? Explique. (1) 1 2 2  Si 1 – α = 0. Interpretación: la diferencia entre los pagos medios a los obreros de las dos ciudades se encuentra entre $ -0..3 mg. S1 = 2. entonces: Z0 = Z 0. es decir 1 .9 y n2 = 50.. S2 = $ 20. 1 y 2.. dieron estos resultados: n1 = 40 cigarros.60] $ con el 95% de confianza. 20.. ( X1  X 2 )  Z 1 2 2  1   X  X  . X 1 = 14..3 mg.2 toma el valor cero.8.2 ≠ 0? Si apreciamos el intervalo de confianza construido en a) 1 . S2 = 3.95. Se compararon dos marcas de cigarrillos. 210 S2 = 3.60 con el 95% de confianza. . sólo 60 estuvieron interesadas. entonces: Z0 = Z 0. 20.2 toma el valor cero.3 – 15.9) 2 (3.. mientras que de 200 mujeres 40 años a más. la diferencia entre las medias del contenido de nicotina para las dos marcas de cigarrillos se encuentra entre -3.a) Un intervalo de confianza para la diferencia de contenido medio viene dado por:  1   2  ( X 1  X 2 )  Z  1   X X .2 ≠ 0? El intervalo de confianza construido en a) 1 .2 ϵ [-3. es decir 1 2 = 0 o 1 = 2.23.. (14.71)] = [-1. ( X1  X 2 )  Z 1 2 2  1   X  X  .8) 2    = 0.3 – 15.71) . b) ¿Es diferente la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por la compra de botas de cuero? Explique. De una muestra de 300 mujeres menores de 40 años. Por lo tanto.71mg. Interpretación: con el 99% de confianza.575 (0.. Solución Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a más.575  X X  1 2 S12 S 22 (2.. (1) 1 2 2  Si 1 – α = 0. 54 mostraron interés. Rpta. con el 99% de confianza.2 ϵ [(14.575 (0. X1 = 60. Datos: n1 = 300.. 0. Rpta.7) + 2. b) Responder a la pregunta ¿Difieren las dos marcas en su contenido medio de nicotina? es responder si ¿1 ≠ 2? o también ¿1 .43 mg.4 ± 1.83] Luego: 1 .43] mg.. a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia entre las verdaderas proporciones de mujeres menores de 40 años y las de 40 años a más que mostraron interés por la compra de botas de cuero. el contenido medio de nicotina para las dos marcas no difiere.995 = 2. n1 n2 40 50 Reemplazando valores en (1): 1 .. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de botas de cuero..99. n2 = 200 211 y X2 = 54 ..7) – 2.23 y 0. 1704 y 0.27) – 0.575 (0.1004 .039) = 0.20)(0.20 – 0..a) El intervalo de confianza para la diferencia de proporciones de mujeres menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por la compra de botas de cuero. se obtuvieron los siguientes resultados: Lima M... Resto del País (2): n2 = 1200.P2  [(0.. Interpretación: la diferencia de proporciones de mujeres menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por la compra de botas de cuero..27 → q2 =  n2 200 0.P2 = 0 o P1 = P2. Rpta. (1): n1 = 800. se entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto del País (2). está entre -0..99. 21...1704 . ( p1  p2 )  Z   p1  p2  . X2 = 300 212 . Además: p1  X1 60 = 0. (1) 1 1 2 2   Si 1 – α = 0.1004] = [-0.P2  [-0.995 = 2.20 – 0. 0. puede ser cero.1004 Reemplazando valores en (1) se tiene que: P1 .80) (0.27)(0.P2 está dado por:   P1  P2  ( p1  p2 )  Z   p1  p2 .07 ± 0.0304] con el 95% de confianza. es decir P1 . b) La pregunta ¿Es diferente la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por la compra de botas de cuero? implica preguntar si ¿P1 ≠ P2? o también ¿P1 . A fin de determinar el nivel de aceptación de la gestión presidencial (X).73  p p = 1 2 p1q1 p2 q2 (0.P2 = 0 está incluida en el intervalo de confianza construido en a). X1 = 280..575. entonces Z0 = Z 0..1004] P1 .. (0.20 → q1 = 0. Rpta. P1 .P2 ≠ 0? La diferencia P1 . Por lo tanto.73) = 0.0304 con el 99% de confianza. no es diferente la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por la compra de botas de cuero..27) + 0.039    n1 n2 300 200 Z0  p1  p2 = 2..80  n1 300 y p2  X2 54 = 0.. .. Interpretación: con el 95% de confianza. entonces Z0 = Z 0.65) (0. Además: p1  X 1 280 = 0.35)(0.10 ± 0. Rpta. la diferencia de proporciones de “limeños” y “no limeños” que están de acuerdo con la gestión presidencial.141.041 Reemplazando valores en (1) se tiene que: P1 .P2 ≠ 0? La diferencia P1 ..141] con el 95% de confianza.041 .. X2 = 300..95. a) El intervalo de confianza para la diferencia de proporciones de “limeños” (P1) y “no limeños” (P2) que están de acuerdo con la gestión presidencial es:   P1  P2  ( p1  p2 )  Z   p1  p2 .059 y 0.25)(0. (1) 1 1 2 2   Si 1 – α = 0. (0.a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las verdaderas proporciones de “limeños” y “no limeños” que están de acuerdo con la gestión presidencial. 213 Rpta.041] = [0.... Por lo tanto. 0.35 – 0.021    n1 n2 800 1200 Z0  p1  p2 = 1. es decir P1 .P2 ≠ 0 o P1 ≠ P2.P2  [(0. (1): n1 = 800..P2 = 0 no está incluida en el intervalo de confianza construido en a).039) = 0.96. .75  p p = 1 2 p1q1 p2 q2 (0. si son diferentes las verdaderas proporciones de “limeños” y “no limeños” que están de acuerdo con la gestión presidencial.975 = 1.25 → q2 =  n2 1200 0.. b) La pregunta ¿Son diferentes las verdaderas proporciones de “limeños” y “no limeños” que están de acuerdo con la gestión presidencial? implica preguntar si ¿P1 ≠ P2? o también ¿P1 .25) + 0..96 (0. X1 = 280.75) = 0.25) – 0. ( p1  p2 )  Z   p1  p2  . b) ¿Son diferentes las verdaderas proporciones de “limeños” y “no limeños” que están de acuerdo con la gestión presidencial? Solución Datos: Lima M.041] P1 .. es diferente de cero. está entre 0.65  n1 800 y p2  X 2 300 = 0..35 → q1 = 0.059.P2  [0.. Resto del País (2): n2 = 1200.35 – 0. P2 = 0 o P1 = P2.032) = 0.55 – 0. entonces Z0 = Z 0. b) ¿Se puede afirmar que son diferentes las verdaderas proporciones de hombres y mujeres que les gusta el programa? Solución Sean: grupo 1 = hombres y grupo 2 = mujeres. es decir P1 . Rpta.05 ± 0.45) (0.55)(0.. (1) 1 1 2 2   Si 1 – α = 0..P2  [-0. Por lo tanto.55 – 0.P2 = 0 está incluida en el intervalo de confianza construido en a). Además: p1  X 1 220 = 0. b) La pregunta ¿Se puede afirmar que son diferentes las verdaderas proporciones de hombres y mujeres que les gusta el programa? implica preguntar si ¿P1 ≠ P2? o también ¿P1 .083 .575 (0.99.22. ( p1  p2 )  Z   p1  p2  ..995 = 2.083 Reemplazando valores en (1) se tiene que: P1 .50) + 0.P2 ≠ 0? La diferencia P1 . (0.50)(0.575. puede ser cero..083] = [0. no son 214 . En una muestra aleatoria de 400 hombres y 600 mujeres que ven cierto programa de TV. Datos: n1 = 400.. P1 ..50) – 0.55 → q1 = 0.083] P1 .033.032    n1 n2 400 600 Z0  p1  p2 = 2. está entre -0.. 220 hombres y 300 mujeres dijeron que les gustaba.. a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia entre las verdaderas proporciones de hombres y mujeres que les gusta el programa. Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres (P2) que les gusta el programa de TV. n2 = 600 y X2 = 300 a) El intervalo de confianza para la diferencia de proporciones de hombres (P1) y de mujeres (P2) que les gusta el programa de TV. 0...50) = 0..033 y 0. X1 = 220.P2  [(0.133 con el 99% de confianza..P2 está dado por:   P1  P2  ( p1  p2 )  Z   p1  p2 .50 → q2 =  n2 600 0.50  p p = 1 2 p1q1 p2 q2 (0.45  n1 400 y p2  X 2 300 = 0..133] con el 99% de confianza.. En una muestra de 400 hombres..60 → q1 = 0.60)(0. ( p1  p2 )  Z   p1  p2  . b) ¿Se puede afirmar que son diferentes las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis? Solución Sean: grupo 1 = alumnos (hombres) y grupo 2 = alumnas (mujeres). X1 = 240. (1) 1 1 2 2   Si 1 – α = 0.063] = [0. Rpta. 240 indican que están a favor de lo mismo. Datos: n1 = 400.60 – 0.163 con el 95% de confianza.P2  [(0.50) – 0.diferentes las proporciones de hombres y mujeres que les gusta el programa..50 → q2 =  n2 600 0. P1 . está entre 0...60 – 0..163] con el 95% de confianza. 0.50) = 0. Rpta..50) + 0.063] P1 . 23.96. n2 = 600 y X2 = 300 a) El intervalo de confianza para la diferencia de proporciones de alumnos (P1) y de alumnas (P2) que están a favor de la titulación con tesis.40) (0.95...50  p p = 1 2 p1q1 p2 q2 (0.P2  [0.10 ± 0.032) = 0.975 = 1. (0.40  n1 400 y p2  X 2 300 = 0... De los alumn@s de la UNAC se toma una muestra aleatoria de 600 mujeres.. Además: p1  X 1 240 = 0.. 215 . 300 de las cuales están a favor de la titulación con tesis.063 Reemplazando valores en (1) se tiene que: P1 .032    n1 n2 400 600 Z0  p1  p2 = 1.. Interpretación: la diferencia de proporciones de alumnos (P1) y de alumnas (P2) que están a favor de la titulación con tesis en la UNAC.063 . entonces Z0 = Z 0. a) Halle un intervalo de confianza del 95% para la verdadera diferencia de proporciones de alumnos y alumnas que están a favor de la titulación con tesis.037.037 y 0.P2 está dado por:   P1  P2  ( p1  p2 )  Z   p1  p2 .50)(0.96 (0.. Además: p1  X 1 200 = 0. .P2 = 0 no está incluida en el intervalo de confianza construido en a).975 = 1. entonces Z0 = Z 0.40)(0. es decir P1 . (1) 1 1 2 2   Si 1 – α = 0.b) La pregunta ¿Se puede afirmar que son diferentes las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis? implica preguntar si ¿P1 ≠ P2? o también ¿P1 ..32)(0.96 (0.68) = 0.96..059] P1 .. b) ¿Son diferentes las verdaderas proporciones de hombres y mujeres que dijeron que les gustaba el nuevo perfume? Explique. ( p1  p2 )  Z   p1  p2  .32) – 0.030    n1 n2 500 500 Z0  p1  p2 = 1.. Solución Sean: grupo 1 = hombres y grupo 2 = mujeres.60  n1 500 y p2  X 2 160 = 0.08 ± 0.P2  [0.021..139] con el 95% de confianza. Por lo tanto.059 .P2 ≠ 0? La diferencia P1 . 216 Rpta. X1 = 200.P2 ≠ 0 o P1 ≠ P2.. Datos: n1 = 500. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca de perfume.P2  [(0...40 → q1 = 0. a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las proporciones de hombres y mujeres que les gusta el nuevo perfume.059 Reemplazando valores en (1) se tiene que: P1 .68  p p = 1 2 p1q1 p2 q2 (0..32 → q2 =  n2 500 0.. P1 . n2 = 500 y X2 = 160 a) El intervalo de confianza para la diferencia de proporciones de hombres (P1) y de mujeres (P2) que les gusta el el nuevo perfume.40 – 0. (0. En una muestra aleatoria de 500 hombres y 500 mujeres. 24.32) + 0. Rpta.95. 200 hombres y 160 mujeres dijeron que les gustaba el nuevo perfume.P2 está dado por:   P1  P2  ( p1  p2 )  Z   p1  p2 ..030) = 0..60) (0. no puede ser cero. son diferentes las proporciones de alumnos y alumnas de la UNAC que están a favor de la titulación con tesis. 0.40 – 0...059] = [0. (1) 1 1 2 2   Si 1 – α = 0.. b) ¿Es diferente la proporción de mujeres y hombres cooperadores? Solución Sean: grupo 1 = hombres y grupo 2 = mujeres.P2 ≠ 0? La diferencia P1 ..52  n1 175 0. se obtuvieron los siguientes resultados: Hombres: n1 = 175. b) La pregunta ¿Son diferentes las verdaderas proporciones de hombres y mujeres que dijeron que les gustaba el nuevo perfume? implica preguntar si ¿P1 ≠ P2? o también ¿P1 .60 → q2 =  n2 250 ...P2 = 0 no está incluida en el intervalo de confianza construido en a)..021 y 0. está entre 0. si son diferentes las proporciones de hombres y mujeres que les gusta el nuevo perfume. no puede ser cero.. 25..575. Rpta..99. Datos: n1 = 175. En un experimento para determinar si las mujeres son más cooperadoras que los hombres.. es decir P1 . Por lo tanto. entonces Z0 = Z 0.139 con el 95% de confianza. Mujeres: n2 = 250.. X1 = 84...P2 ≠ 0 o P1 ≠ P2.995 = 2.Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres (P2) que les gusta el nuevo perfume. Además: p1  X 1 84 = 0. n2 = 250 y X2 = 150 a) El intervalo de confianza para la diferencia de proporciones de mujeres (P2) y de hombres (P1) que coopera respondiendo a cuestionarios de los entrevistadores puerta por puerta.40 217 y p2  X 2 150 = 0. a) Determine un intervalo de confianza del 99 % para la diferencia de mujeres y hombres cooperadores.48 → q1 = 0. X1 = 85.. Es ampliamente conocido que no cualquiera coopera respondiendo a cuestionarios de los entrevistadores puerta por puerta. ( p2  p1 )  Z   p2  p1  .. X2 = 150. P2 – P1 está dado por:   P2  P1  ( p2  p1 )  Z   p2  p1 . 126] = [0.246. a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las verdaderas proporciones de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Burberry”. 0. Datos: n1 = 250. p  p = p  p = 2 1 1 2 p1q1 p2 q2 (0. 26.126 Reemplazando valores en (1) se tiene que: P1 .48) – 0. es decir P2 – P1 = 0 o P2 = P1. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de verano “Burberry”.P2  [(0. b) La pregunta ¿Es diferente la proporción de mujeres y hombres cooperadores? implica preguntar si ¿P2 ≠ P1? o también ¿P2 – P1 ≠ 0? La diferencia P2 – P1 = 0 está incluida en el intervalo de confianza construido en a). Rpta. no es diferente la proporción de mujeres y hombres que cooperan respondiendo a cuestionarios de los entrevistadores puerta por puerta.126.006. la diferencia de proporciones de mujeres (P2) y de hombres (P1) que coopera respondiendo a cuestionarios de los entrevistadores puerta por puerta.48)(0.52) (0. puede ser cero. n2 = 250 y X2 = 120 a) El intervalo de confianza para la diferencia de proporciones de mujeres menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por los polos de verano “Burberry”.049) = 0.P2  [-0. Rpta. mientras que de 250 mujeres de 40 años a más. Interpretación: con el 99% de confianza.006 y 0. X1 = 150. 150 estuvieron interesados. (0.60 – 0. Por lo tanto. b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Burberry”? Explique.40) = 0. sólo 120 mostraron interés.12 ± 0. está entre -0. P1 .575 (0.48) + 0.126] P1 .60)(0. Solución Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a más. De una muestra de 250 mujeres menores de 40 años.60 – 0.246] con el 99% de confianza.P2 está dado por: 218 .049    n1 n2 175 250 Z0  p1  p2 = 2. Rpta.0443) = 0.P2 = 0 no está incluida en el intervalo de confianza construido en a). entonces Z0 = Z 0.95.40) (0.. De los 2000 establecimientos pequeños de una ciudad se extrae una muestra aleatoria de 25 establecimientos y se recolecta información sobre el número de personas empleadas (X) por establecimiento... está entre 0.033 y 0.40  n1 250 y p2  X 2 120 = 0.60)(0..52  p p = 1 2 p1q1 p2 q2 (0.207 con el 99% de confianza.. (0.60 – 0.087.60 – 0.975 = 1. 27..033. b) La varianza del número de empleados por establecimiento. (1) 1 1 2 2   Si 1 – α = 0.60 → q1 = 0.48) – 0. b) La pregunta ¿Es diferente la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Burberry”? implica preguntar si ¿P1 ≠ P2? o también ¿P1 .087] = [0.48) + 0.087 Reemplazando valores en (1) se tiene que: P1 .P2 ≠ 0? La diferencia P1 . Calcule e interprete intervalos de confianza del 95 % para: a) El número medio de empleados por establecimiento en la ciudad. Rpta.96 (0. ( p1  p2 )  Z   p1  p2  . Además: p1  X 1 150 = 0.P2  [(0.76 . no puede ser cero.. es decir P1 .. obteniéndose la siguiente 25 información:  X i  138 y i 1 25 X i 1 2 i  1145 . Por lo tanto.0443    n1 n2 250 250 Z0  p1  p2 = 1...P2 ≠ 0 o P1 ≠ P2.087] P1 ..48)(0.96. 0. 219 ... Interpretación: la diferencia de proporciones de mujeres menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por los polos de verano “Burberry”..52) = 0. no es diferente la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Burberry”.P2  [0.48 → q2 =  n2 250 0.207] con el 95% de confianza.  P1  P2  ( p1  p2 )  Z   p1  p2 .12 ± 0. 064 x 4 .975 = 39. se encuentra entre 3.025 = 12. b) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  . S = 4 y 1 – α = 0. entonces en la Tabla 2: 2 a = x24 .064 x 25 4 ] = [5.76  25 (5. Otros datos: N = 2000 establecimientos.52) 2 = 16 (empleados)2 25  1 S = 4 empleados.4 Reemplazando valores en el intervalo de confianza para la varianza.17 con el 95% de confianza. 1 – α = 0.17] empleados con el 95% de confianza. ²    b a   Como n = 25. t0 = t24 . n = 25.t0 S / n .9 empleados y una confianza del 95 % ¿qué tamaño mínimo de muestra será necesario? Solución Con la información dada se determina el promedio y la varianza muestral de los empleados por establecimiento así: 25 X X i 1 n i  138 = 5.52 – 2. Rpta.52 + 2.95. si 1 – α = 0.4 y 2 b = x24 . 0. El intervalo de confianza para la media se obtiene con la expresión:   [ X . Interpretación: en la ciudad el verdadero número medio de empleados por establecimiento pequeño. 5.52 empleados por establecimiento.064. a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1 de student (n < 30). X + t0 S / n ] Reemplazando valores tenemos:   [5.95. con un margen de error máximo de 0.975 = 2.c) Para estimar en el futuro el número medio de empleados por establecimiento. 7. 25 25 S2  ( X i  X )2 i 1 n 1 25  X i 1 2 i  nX 2  n 1 1145 . 0.87 y 7.87 .65] 25 Por lo tanto:   [3.52 ± 1. 0. se tiene que: 220 .95 → en la Tabla 3. 9.9) 2 = 0. Z = Z0.2. 15. 16. 1 – α = 0. n0  0.9 onzas por caja.90 → en la Tabla 3.8. Solución Con la información dada se determina el promedio y la varianza muestral de los empleados por establecimiento así: 10 X X i 1 i n  10 S2  (X i 1 i 159 = 15.90.1. Las cajas de un cereal producido por una fábrica deben tener un contenido de 16 onzas. si 1 – α = 0.µ | = E = 0.3.97 (empleados)² con el 95% de confianza.4  Por lo tanto: ²  [9.96 y S = 4.8. Rpta.)² con el 95% de confianza.75 . Otros datos: n = 10 cajas.231 onzas.. 221 .7. 15. Interpretación: la varianza del número de empleados por establecimiento pequeño 9. 15. (25  1)(4) 2 (25  1)(4) 2  ²   . 30. 15. 15. con el 95% de confianza y un error máximo de 0. se requiere de 76 establecimientos.9 2 Rpta.95 → en la Tabla 1.6 Calcule e interprete intervalos de confianza del 90 % para la media poblacional y la varianza poblacional de los pesos de las cajas de cereal.9.97 ] (emp.833. 1 – α = 0. 0. 15.4  39.para estimar el número medio de empleados por establecimiento. Un inspector tomó una muestra que arrojó los siguientes pesos en onzas: 15.96 2 4 2 = 76 establecimientos.7.75 y 30.0533 (onzas)2 10  1 S = 0. 28. a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1 de student (n < 30). Reemplazando en la fórmula para n se tiene: 1.9. 16. t0 = t9. c) El tamaño de muestra está dado por: n0  Z 2 2 E2 Donde: | x .9 empleados. Interpretación.975 = 1. 10 10  X )2 n 1  X i 1 2 i  nX 2 n 1  2528 .95 = 1.58  10 (15. 16.  12. 833 x ] = [15.9 – 1. 263. la varianza del peso de las cajas de cereal se encuentra entre 0. 262.9 + 1.33   Por lo tanto: ²  [0.034] onzas con el 90% de confianza. 16. entonces en la Tabla 2: a = x92.231) 2 (10  1)(0. 258. 0. 15.) de una muestra aleatoria de 10 latas de leche fueron los siguientes: 259.9 ± 0.134] 10 10 Por lo tanto:   [15.1442 (onzas)².05 = 3.231 y 1 – α = 0.90.1442] (onzas)² con el 90% de confianza. Interpretación: con el 90% de confianza.95 = 16.034 onzas. Solución El promedio y la varianza muestral de los empleados por establecimiento es: 222 .766 .766 y 16.9 Reemplazando valores en el intervalo de confianza para la varianza. 256. S = 0. Rpta.El intervalo de confianza para la media se obtiene con la expresión:   [ X .0284. 258.231 0. 257.231) 2  ²   .t0 S / n . con el 95% de confianza. 259. Interpretación: el verdadero peso medio de las cajas de cereal.0284 y 0. Rpta. 0. 0.9 3. se tiene que:  (10  1)(0. b) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  .  16. 261 Calcule e interprete intervalos de confianza del 95 % para la media poblacional y la varianza poblacional de los pesos netos.33 y b = x92. X + t0 S / n ] Reemplazando valores tenemos:   [15. 29. ²    b a   Como n = 10. se encuentra entre 15.231 . 257. Los pesos netos (grs.833 x 0. 95.31 .79] (gramos)². ²    b a   Como n = 10. El intervalo de confianza para la media se obtiene con la expresión:   [ X .65] gr.t0 S / n .53.35.10 X X i 1 n i  2590 = 259 gr. t0 = t9.70   Por lo tanto: ²  [2.35 y 260.262 x ] = [259 ± 1. Rpta. b) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  . si 1 – α = 0. se tiene que:  (10  1)(2.70 y b = x92. Rpta.31 gr.262 x 2. 259 + 2.3333 (gr.95 → en la Tabla 3.95.31) 2  ²   .025 = 2.65 gramos.0 Reemplazando valores en el intervalo de confianza para la varianza.975 = 19. se encuentra entre 257. a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1 de student (n < 30). 1 – α = 0. X + t0 S / n ] Reemplazando valores tenemos:   [259 – 2. por lata. Interpretación: con el 95% de confianza. 10 10 S2  ( X i  X )2 i 1 n 1 10  X i 1 2 i  nX 2  n 1 670858  10 (259) 2 = 5. la varianza del peso de las latas de leche se encuentra entre 2.79] (gramos)² con el 95% de confianza. 0. 17.0 2.31 y 1 – α = 0.65] 10 10 Por lo tanto:   [257. 0.)2 10  1 S = 2. entonces en la Tabla 2: a = x92. con el 95% de confianza. Otros datos: n = 10 cajas. Interpretación: el verdadero peso medio de las de leche. con el 95% de confianza. S = 2. 223 .31 2.262.53 y 17.975 = 2.  19. 260. 0.31) 2 (10  1)(2. 995 = 2. si 1 – α = 0.861 x ] = [5.145 (personas)2 20  1 S = 3. X + t0 S / n ] Reemplazando valores tenemos:   [5. con un margen de error máximo de 0.861 x 3. Otros datos: N = 1000 familias.34 personas.t0 S / n .34 3.861.99.25 – 2.25) 2  = 11. 224 . a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1 de student (n < 30). t0 = t19.39] personas con el 99% de confianza. 5. De un área de la ciudad en la que habitan 1000 familias se extrae una muestra aleatoria de 20 familias y se recolecta información sobre el número de personas (X) por familia.6 personas y una confianza del 99 % ¿qué tamaño mínimo de muestra será necesario? Solución Con la información dada se determina el promedio y la varianza muestral de los empleados por establecimiento así: 20 X X i 1 i n  20 S  2 (X i 1 i 105 = 5.25 persona por familia. 0.25 + 2. ¿Aceptaría usted que el tamaño medio de las familias es de 6 personas? b) Número total de personas en el área. d) Para estimar en el futuro el número medio de personas por familia. El intervalo de confianza para la media se obtiene con la expresión:   [ X . 7.34 . n = 20.95 → en la Tabla 3.25 ± 2. obteniéndose la siguiente información: 20 X i 1 i 20 X  105 i 1 2 i  763 Calcule e interprete intervalos de confianza del 99 % para el(la) verdadero(a): a) Número medio de personas por familia. c) La varianza del número de personas por familia en el área.14] 20 20 Por lo tanto:   [3. 1 – α = 0.30. Rpta. 20  X) n 1 20 2  X i 1 2 i  nX 2 n 1 763  20 (5.11 . b) Para hallar el intervalo de confianza para el total (Nμ) se multiplica los límites de la media por N = 1000.con el 99% de confianza. ²    b a   Como n = 20. entonces en la Tabla 2: 2 a = x19 . se encuentra entre 3. 30.575 y S = 3. se tiene que:  (20  1)(3.  38.34) 2  ²   .99 → en la Tabla 1.34) 2 n0  = 205.6. 7390] personas con el 99% de confianza.µ | = 0. Z = Z0.34) 2 (20  1)(3.575) 2 (3.995 = 38.99 (personas)² con el 99% de confianza. Rpta. Rpta.995 = 2.39] = [3110 .34.6 6. así: Total = Nµ ϵ 1000 [3. 0.39 con el 99% de confianza.6 Reemplazando valores en el intervalo de confianza para la varianza.99 ] (personas)² con el 99% de confianza..005 = 6. 7. el verdadero total de personas en el área de la ciudad se encuentra entre 3110 y 7390 personas. c) El intervalo de confianza para la varianza está dado por:  (n  1) S 2 (n  1) S 2  . Reemplazando en la fórmula para n se tiene: (2.11 y 7.Interpretación: en el área de la ciudad el verdadero número medio de personas por familia. Interpretación: la varianza del número de personas por familia se encuentra entre 5.05 es necesario ajustar el tamaño de muestra así: 225 .49 y 30.49 . (0.34 y 1 – α = 0. d) El tamaño de muestra está dado por: n0  Z 2 2 E2 Donde: E = | x . Interpretación.99. 0.84   Luego: ²  [5.84 y 2 b = x19 . S = 3.6) 2 Como f = n0 / N = 205 / 1000 = 0. 1 – α = 0.205 > 0.11 . 0. Como 1 – α = 0.27.98 Interpretación. 14. Muestras del pago semanal a los obreros (1) y obreras (2) proporcionan los siguientes datos: n1 = 15. ¿Son diferentes los pagos medios semanales a obreros y obreras? Explique. 2 0. se encuentra entre 0. se requiere de 170 familias. S 22 = 152 = 225. 0. S1 = $ 25 y n2 = 15.336   2  2. x1 = $ 135.  22 entonces  12 =  22 (las varianzas de los pagos semanales a obreros y obreras son iguales) 226 . Interpretación. ϵ = [0. S2 = $ 15.336.con el 95% de confianza.95. Solución  12  S12 / S 22 S12 / S 22  .025 = 1/ F14. entonces en la tabla 4: d = F14. 0. ¿Son iguales las varianzas de los pagos semanales a obreros y obreras? b) La diferencia entre los pagos medios semanales a obreros y obreras. a) Intervalo de confianza para la razón de varianzas: 2 ϵ   c  2  d Datos: n1 = n2 = 15.98 y c = F14. 31. la razón de varianzas de los pagos semanales a obreros y obreras.6 personas. es decir  12 = 1.para estimar el número medio de personas por familia.. con el 99% de confianza y un error máximo de 0.. x 2 = $ 125. S12 = 252 = 625. 14. Calcule e interprete intervalos de confianza del 95% para: a) La razón de varianzas de los pagos semanales a obreros y obreras. 8. ya  22 que el intervalo para la razón de varianzas toma el valor 1.975 = 1/ 2.98 = 0.975 = 2. Reemplazando valores en el intervalo se tiene que:  12  625 / 225 625 / 225  .27] con el 95% de confianza.93 y 8.93. 14. Preguntar sí: ¿Son iguales las varianzas de los pagos semanales a obreros y obreras? Es similar a preguntar sí: ¿  12 =  22 o  12 = 1? La respuesta es sí.n n0 205  = 170 familias n0 205 1 1 1000 N Rpta. se encuentra comprendida entre $ -5.2 ≠ 0? La respuesta es no. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para secretarias. Preguntar sí.53) ]  1 . Rpta. ¿Es diferente el promedio de palabras por minuto para los dos métodos? 227 . x1 = $ 135. 25.42 ] Por lo tanto: 1 .2 = 0 o 1 = 2. Calcule e interprete intervalos de confianza del 99 % para: a) La verdadera razón de varianzas de los 2 grupos. 1 . Se encuentra que el grupo 1 obtiene en promedio 123 palabras por minuto con una desviación estándar de 15 palabras. Si 1 – α = 0.048(7.42] $ con el 95% de confianza. Interpretación: la diferencia entre los pagos semanales a obreros y obreras.x 2 )  t0 (n1  1)S12  (n2  1)S 22 n1  n2  2 1 1  ] n1 n2 Datos del problema: n1 = 15.975 = 2.2 ϵ [( x1 . x 2 = $ 125.2 ϵ [(135 – 125)  2. S1 = $ 25 y n2 = 15. 32. mientras que el grupo 2 promedia 110 palabras por minuto con una desviación estándar de 10 palabras. es decir. el intervalo de confianza para la diferencia entre los de los pagos semanales a obreros y obreras está dado por: 1 . Reemplazando valores en la fórmula para el intervalo de confianza.b) Considerando que las muestras son pequeñas y que las varianzas de los pagos semanales a obreros y obreras son iguales.42 con el 95% de confianza.42 y 25. ¿Son heterogéneas las varianzas de ambos grupos? b) La diferencia de medias de palabras por minuto de ambos métodos.048. t0 = t28. 0. S2 = $ 15.048 (15  1)(25) 2  (15  1)(15) 2 15  15  2 1 1  ] 15 15  1 .  En la tabla 3. aprenden taquigrafía por dos métodos diferentes y luego se les somete a pruebas de dictado. Los grados de libertad de la t son n1 + n2 – 2 = 15 + 15 – 2 = 28.2 ϵ [10  2.2 ϵ [10  15. ¿Son diferentes los pagos medios semanales a obreros y obreras? Es similar a preguntar sí: ¿1 ≠ 2 o 1 . los pagos medios semanales a obreros y obreras son iguales. ya que el intervalo para su diferencia de medias toma el valor cero.95. tenemos que: 1 .2 ϵ [-5.42 . Entonces. 15] con el 99% de confianza. S1 = 15 y n2 = 16. Reemplazando valores en la fórmula para el intervalo de confianza.75 (16  1)(15) 2  (16  1)(10) 2 16  16  2  1 .75(4.55.15. 2 0. 15. 15. t0 = t30. Como 1 – α = 0. 0. entonces en la tabla 4: d = F15. se encuentra entre 0. 9. 0. tenemos que: 1 . el intervalo de confianza para la diferencia de medias de palabras por minuto de los dos métodos está dado por: 1 .x 2 )  t0 (n1  1)S12  (n2  1)S 22 n1  n2  2 1 1  ] n1 n2 Datos del problema: n1 = 16.55 y 9.07 y c = F15.995 = 1/ 4.2 ϵ [13  2. la razón de varianzas de las palabras por minuto de ambos grupos.4] 228 1 1  ] 16 16 .246   2  4. 0. Los grados de libertad de la t son n1 + n2 – 2 = 16 + 16 – 2 = 30. x1 = 123.Solución Datos: n1 = 16. x1 = 123.995 = 4. .005 = 1/ F15. S2 = 10.99.246. x 2 = 110.99. x 2 = 110. ya que el intervalo para la razón de varianzas toma el valor 1. ϵ  c   22  d Si: n1 = n2 = 16.07 Interpretación. Preguntar sí: ¿Son heterogéneas las varianzas de ambos grupos? Es similar a preguntar sí: ¿  12 ≠  22 o  12 ≠ 1?  22 La respuesta es no.2 ϵ [13  12. S12 = 152 = 225.2 ϵ [(123 – 110)  2. S1 = 15 y n2 = 16.07 = 0. Reemplazando valores en el intervalo se tiene que:  12  225 / 100 225 / 100  ϵ = [0. es decir  12 = 1.995 = 2. entonces  12 =  22 (las varianzas son homogéneas o iguales) 2 2 b) Considerando que las muestras son pequeñas y que las varianzas de las palabras por minuto de ambos grupos son iguales.con el 99% de confianza. Si 1 – α = 0. 15. a) Intervalo de confianza para la razón de varianzas:  12  S12 / S 22 S12 / S 22  .51) ]  1 .75. S2 = 10..  En la tabla 3. S 22 = 102 = 100. 0.2 ϵ [( x1 . entonces en la tabla 4: d = F20. ϵ 2  = [1. 1 . x 2 = 650.407  2  2.96] con el 95% de confianza. 20. a) Intervalo de confianza para la razón de varianzas: 2 ϵ   c  2  d Si: n1 = n2 = 21. Rpta.  12  S12 / S 22 S12 / S 22  . ¿Son diferentes las varianzas de los costos de enseñanza en las 2 universidades? b) La diferencia del costo medio de la enseñanza en las 2 universidades. 0. 50. ya que el intervalo para su diferencia de medias no toma el valor cero. 25.975 = 1/ 2. 0. S 22 = 502 = 2500. Reemplazando valores en el intervalo se tiene que:  12  8100 / 2500 8100 / 2500  .Por lo tanto: 1 . Para determinar el costo medio de la enseñanza en las universidades 1 y 2. Entonces. 20. se toma una muestra al azar de 21 alumnos de la universidad 1 arrojando un costo medio de S/. 20.6 y 25. Una muestra al azar de 21 alumnos de la universidad 2 da una costo medio de S/.2 ≠ 0? La respuesta es sí. Como 1 – α = 0.975 = 2.407. Interpretación: la diferencia de medias de los dos métodos.025 = 1/ F20.46 = 0. 0. 33. Preguntar sí. es decir. se encuentra comprendida entre 0.6 . el promedio de palabras por minuto para ambos métodos sí es diferente.46 y c = F20. 650 y una desviación estándar de S/. x1 = S/. ¿Son diferentes los costos medios de la enseñanza en las universidades 1 y 2? Solución Datos: n1 = 21. 7.4 palabras por minuto con el 95% de confianza.4] palabras por minuto con el 95% de confianza. ¿Es diferente el promedio de palabras por minuto para los 2 métodos? Es similar a preguntar sí: ¿1 ≠ 2 o 1 . S2 = 50. 675.46 229 . 0. S12 = 902 = 8100. Calcule e interprete intervalos de confianza del 95% para: a) La razón de varianzas de los costos de enseñanza en las universidades 1 y 2.2 ≠ 0 o 1 ≠ 2. 675 y una desviación estándar de S/ 90. S1 = 90 y n2 = 21.32.95.2 ϵ [0. -20.96.. Preguntar sí: ¿Son diferentes los costos medios de la enseñanza en las universidades 1 y 2? Es similar a preguntar sí: ¿1 ≠ 2 o 1 .04.83] 21 21 Por lo tanto: 1 . la diferencia de los costos medios de enseñanza en las universidades 1 y 2 se encuentra comprendido entre S/.2 ϵ [-20. 0. x 2 = 650.975 = 2.04 x ] = [25  45. S 22 = 2500.2 ϵ [( x1 .95. es decir  12 ≠ 1. ya que el intervalo para la razón de varianzas no toma el valor 1.2 ϵ [(675 .x 2 )  t0 Datos del problema: n1 = 21. entonces  12 ≠  22 (las varianzas de los costos de enseñanza 2 2 en las 2 universidades son diferentes o heterogéneas) b) Considerando que las muestras son pequeñas y que las varianzas de los costos de enseñanza en las 2 universidades son diferentes.83 . Interpretación: con el 95% de confianza.Interpretación.con el 95% de confianza.  en la tabla 3: t0 = tH. x1 = S/. se encuentra entre 1.83 y S/. la razón de varianzas de los costos de enseñanza en las universidades 1 y 2. el intervalo de confianza para la diferencia de medias de los costos de enseñanza en las 2 universidades está dado por: S12 S 22  ] n1 n2 1 . 2 2  S12 S 22   8100 2500        n1 n2  21 21    Donde: H = = = 31.32 y 7.975 = t31.27 ≡ 31 2 2 2 2  8100   2500   S12   S 22           21    21   n1    n2  21  1 21  1 n1  1 n2  1 Reemplazando valores en el intervalo de confianza propuesto.2 ≠ 0? La 230 . 675.83] S/. Si 1 – α = 0. Rpta. con el 95 % de confianza. 70.650)  2. 0. S12 = 8100 y n2 = 21. Preguntar sí: ¿Son diferentes las varianzas de los costos de enseñanza en las 2 universidades? Es similar a preguntar sí: ¿  12 ≠  22 o  12 ≠ 1?  22 La respuesta es sí. 70. se tiene: 8100 2500  1 .83. S12 = 102 = 100. 11.con el 99% de confianza. se encuentra entre 1.17.24.32 y c = F11. x1 = 505.respuesta es no.. 33. x 2 = 495. Como 1 – α = 0.995 = 5.24] con el 99% de confianza. Preguntar sí: ¿Son diferentes las varianzas de los pesos de las bolsas con detergente de ambas máquinas? Es similar a preguntar sí: ¿  1? 231 2 1 ≠ 2 2  12 o ≠  22 . 2 0. Dos máquinas embolsan diariamente detergente de manera independiente. son iguales.995 = 1/ 5. es decir.188.32 Interpretación. 0.99. Reemplazando valores en el intervalo se tiene que:  12 100 / 16 100 / 16  ϵ = [1. S1 = 10 y n2 = 12. a) Intervalo de confianza para la razón de varianzas:  12  S12 / S 22 S12 / S 22  . ¿Son diferentes los pesos medios de las bolsas con detergente de ambas máquinas? Solución Datos: n1 = 12.32 = 0. ¿Son diferentes las varianzas de los pesos de las bolsas con detergente de ambas máquinas? b) La diferencia de los pesos medios de las bolsas con detergente de ambas máquinas. la razón de varianzas de los pesos de las bolsas con detergente de ambas máquinas. 11. 11.2 = 0 o 1 = 2. 0. S2 = 4. S2 = 4. x1 = 505. 34. 0.005 = 1/ F11. Entonces. Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han obtenido los siguientes resultados sobre el peso de las bolsas (en gramos): n1 = 12. ya que el intervalo para su diferencia de medias toma el valor cero. . S 22 = 42 = 16. S1 = 10 y n2 = 12.17 y 33. ϵ  c   22  d Si: n1 = n2 = 12. entonces en la tabla 4: d = F11. x 2 = 495. Calcule e interprete intervalos de confianza del 99% para: a) La razón de varianzas de los pesos de las bolsas con detergente de ambas máquinas.188   2  5. 1 . los costos medios de la enseñanza en las universidades 1 y 2 no son diferentes. la diferencia de los pesos medios de las bolsas con detergente de ambas máquinas se encuentra comprendido entre 0.  en la tabla 3: t0 = tH.74 y 19.2 ϵ [0.995 = t14. x1 = 505.74 .La respuesta es sí.2 ≠ 0 o 1 ≠ 2.977. el intervalo de confianza para la diferencia de medias de los pesos de las bolsas con detergente de ambas máquinas está dado por: S12 S 22  ] n1 n2 1 . Preguntar sí: ¿Son diferentes los pesos medios de las bolsas con detergente de ambas máquinas? Es similar a preguntar sí: ¿1 ≠ 2 o 1 . 0.2 ϵ [( x1 .43 ≡ 14 2 2 2 2  100   16   S12   S 22          12 12   n n  1   2    12  1 12  1 n1  1 n2  1 Reemplazando valores en el intervalo de confianza propuesto. es decir.99. Rpta. Si 1 – α = 0. entonces  12 ≠  22 (las varianzas de los pesos de las bolsas 2 con detergente de ambas máquinas son diferentes o heterogéneas) b) Considerando que las muestras son pequeñas y que las varianzas de los pesos de las bolsas con detergente de ambas máquinas son diferentes. 19.977 x 12 12 Por lo tanto: 1 . S 22 = 16.995 = 2. 232 .2 ≠ 0? La respuesta es sí. es decir 2 ≠ 1. 2 2  S12 S 22  100 16         n1 n2  12 12    Donde: H = = = 14. ya que el intervalo para la razón de varianzas no toma el valor  12 1.26] 1 . S12 = 100 y n2 = 12. 0. ya que el intervalo para su diferencia de medias no toma el valor cero. se tiene: 100 16  ] = [10  9. 1 . Entonces.2 ϵ [(505 .26] gr. con el 99 % de confianza. Interpretación: con el 99% de confianza.495)  2. x 2 = 495.26 gramos. los pesos medios de las bolsas con detergente de ambas máquinas sí son diferentes.x 2 )  t0 Datos del problema: n1 = 12. 995 = 1/ 4. Interpretación. n2 = 16.658.32 y 5.995 = 4. dos muestras aleatorias de 16 llantas de cada marca. S 22 = 3’515. la razón de varianzas de la duración de las llantas de ambas marcas. x1 = 49. S2 = 1.005 = 1/ F15. Preguntar sí: ¿Son diferentes las varianzas de la duración de las llantas de ambas marcas? Es similar a preguntar sí: ¿  ≠  2 1 2 2  12 o ≠ 1?  22 La respuesta es no. 1 y 2.con el 99% de confianza. S1 = 2.500.34.34] con el 4. 0. a) Intervalo de confianza para la razón de varianzas:  12  S12 / S 22 S12 / S 22  . Reemplazando valores en el intervalo se tiene que:  12 4622500 / 3515625   4622500 / 3515625 ϵ  . 0.  12 es decir 2 = 1.246.99. 5. 233 .625.150 y x 2 = 48. se encuentra entre 0. 15. ϵ  c   22  d Si: n1 = n2 = 16. entonces en la tabla 4: d = F15.125.35. respecto a su duración en Km. 0. x2 = 48. Calcule e interprete intervalos de confianza del 99% para: a) La razón de varianzas de la duración de las llantas de ambas marcas. 2  = [0. dieron estos resultados: n1 = 16.07 = 0..875.07 0. ¿Son diferentes las duraciones medias de las llantas de ambas marcas? Solución Datos: n1 = 16. ¿Son diferentes las varianzas de la duración de las llantas de ambas marcas? b) La diferencia de las duraciones medias de las llantas de ambas marcas.150 y n2 = 16. 15. S12 = 4’622. 15. entonces  12 =  22 (las varianzas de la duración de las llantas 2 de ambas marcas son homogéneas o iguales).125. x1 = 49. Se compararon dos marcas de llantas de automóvil. S2 = 1875. ya que el intervalo para la razón de varianzas toma el valor 1.32. Como 1 – α = 0.246 2  99% de confianza. S1 = 2.658.07 y c = F15. S1 = 2.25] Por lo tanto: 1 .2 ϵ [1533  1961. x1 = 49. S2 = 1. Reemplazando valores en la fórmula para el intervalo de confianza.2 ϵ [( x1 .75(713.x 2 )  t0 (n1  1)S12  (n2  1)S 22 n1  n2  2 1 1  ] n1 n2 Datos del problema: n1 = 16. son iguales.25 Km. la diferencia de duraciones medias de las llantas de las marcas 1 y 2. el intervalo de confianza para la diferencia de medias de la duración de las llantas de ambas marcas está dado por: 1 . es decir.75 1 1  ] 16 16  1 . Preguntar sí. Entonces. 3594. ya que el intervalo para su diferencia de medias toma el valor cero. Los grados de libertad de la t son n1 + n2 – 2 = 16 + 16 – 2 = 30.18) ]  1 .75.2 ≠ 0? La respuesta es no. 3594.125. Rpta.875. Si 1 – α = 0.658. ¿Son diferentes las duraciones medias de las llantas de ambas marcas? Es similar a preguntar sí: ¿1 ≠ 2 o 1 . 0. 234 .2 = 0 o 1 = 2. x 2 = 48. se encuentra comprendida entre -428. 1 .2 ϵ [-428.25] Km.658 (16  1)(2150 ) 2  (16  1)(1875) 2 16  16  2 – 48. tenemos que: 1 - 2 ϵ [(49. con el 99% de confianza.25 . t0 = t30. las duraciones medias de las llantas de ambas marcas no son diferentes.995 = 2.b) Considerando que las muestras son pequeñas y que las varianzas de la duración de las llantas de ambas marcas son iguales.125)  2.25 .2 ϵ [1533  2.150 y n2 = 16. Interpretación: con el 99% de confianza.99.  En la tabla 3. 5 gramos y una desviación típica de 12 gramos. c) ¿Qué tamaño de muestra debe tomarse.µ | < E b) Si 1    P(t1 / 2  T  t1 / 2 ) y T  ( x   ) n / s entonces: s s 1    P( x  t1 / 2    x  t1 / 2 ) n n 2. a) Construya un intervalo de confianza del 95% para el verdadero peso medio de las bolsas de frejol. 5. si se desea que X difiera de µ en menos de 3 gramos con el 95 % de confianza? c) Construya un intervalo de confianza del 95% para la verdadera varianza de los pesos de las bolsas con frejol. una muestra de 50 estudiantes indica que 235 . 4. b) La verdadera varianza (σ2) de los pesos de las manzanas. Para ello se selecciona una muestra aleatoria de 50 manzanas. Calcule e interprete intervalos de confianza del 95 % para: a) El verdadero peso medio de las manzanas y el peso total (Nμ). la cual da una media de 300 gramos y una desviación estándar de 25 gramos. son equivalentes a | x .5. Determine el intervalo de confianza del 95 % para la media y la varianza de las calificaciones.E < x < µ + E. Se toma una muestra aleatoria de 36 bolsas. Un proceso está programado para embolsar la cantidad media de 500 gramos de frejol.12 PROBLEMAS PROPUESTOS 1.000 manzanas. sin reposición de una clase de estadística de 221 alumnos que dan una calificación final media de 70 puntos y una desviación típica de 9 puntos. resultando una media de 496. si se desea que x difiera de µ en menos de 8 gramos con el 95 % 3. Una universidad grande quiere estimar el número medio de días de enfermedad de los estudiantes durante un año. ¿Se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas de frejol? b) ¿Qué tamaño de muestra debe tomarse. Se toma una muestra al azar de 45 alumnos. Demuestre que: a) Las desigualdades µ . Se desea estimar el peso total de una partida de 10. Calcule e interprete intervalos de confianza del 99% para: a) La media μ y la varianza σ2. Calcule e interprete intervalos de confianza del 95% para: a) El verdadero contenido medio μ de nicotina y la verdadera varianza (σ2) del contenido de nicotina. y S = 30 gr. para determinar su contenido medio de nicotina dio x = 25. con el 95 % de confianza? 6. d) El total de establecimientos pequeños que emplean a 2 ó más personas. Se acaba de lanzar al mercado una nueva marca de cigarrillos. Una muestra de 50 animales experimentales reciben una cierta clase de ración por un período de 2 semanas. si se desea que x difiera de µ en menos de 10 gr.x = 3. un estudio en 35 cigarros. con el 95 % de confianza? 8. si se desea que x difiera de µ en menos de 13 mg. 236 . b) El total de empleados en los establecimientos pequeños de la ciudad. b) ¿Qué tamaño de muestra debe tomarse. si se desea que x difiera de µ en menos de 13 gr. con el 99 % de confianza? 7.2 días y S = 5.4 mg. b) ¿Qué tamaño de muestra debe tomarse. obteniéndose los siguientes datos sobre el número de empleados por establecimiento: Empleados por establecimiento (Xi) 0 1 2 3 4 5 Establecimientos (ni) 10 15 12 6 4 3 Calcule e interprete intervalos de confianza del 99 % para: a) El número medio de empleados por establecimiento en la ciudad. y S = 1. c) La proporción de establecimientos pequeños con 2 ó más empleados. De los 500 establecimientos pequeños de una ciudad. Sus aumentos de pesos arrojan los valores x = 480 gr. se ha tomado una muestra aleatoria de 50. b) ¿Qué tamaño de muestra debe tomarse.2 días.9 mg. Calcule e interprete intervalos de confianza del 95% para: a) La media μ y la varianza σ2. 4 millones de hogares) indica que el 35 % de los hogares tiene acceso a internet. b) Con un 99% de confianza y un error máximo del 3%. a) Calcule e interprete un intervalo del 99% de confianza para la proporción verdadera y el total de hinchas que opinan que Perú clasifica al mundial de fútbol. 237 . c) Con un error del 2. c) Con un 95% de confianza y un error máximo del 4%. En una muestra aleatoria de 400 hinchas del fútbol peruano (de un total de 15 millones) se encontró que 140 opinan que Perú clasifica al mundial de fútbol.5 % y una confianza del 95 %. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana (con 1. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción de hogares que tiene acceso a internet? 10.5 millones de ciudadanos. ¿qué tamaño de muestra será necesario para estimar la proporción de ciudadanos que están de acuerdo con la gestión del actual presidente? 12. De una población de 4. ¿qué tamaño de muestra será necesario para estimar la proporción de hinchas que opinan que Perú clasifica al mundial de fútbol? 11.000 fumadores y se encuentra que 350 tienen preferencia por la marca A. b) El total de votantes que están de acuerdo con la gestión del presidente. Calcule e interprete un intervalo de confianza del 95 % para: a) La proporción de hogares limeños que tiene acceso a internet.000 y se halla que 520 están de acuerdo con la gestión del actual presidente.000 fumadores. se selecciona una muestra aleatoria de 2. b) El total de hogares limeños que tiene acceso a internet. b) El total de fumadores que prefieren la marca A. De una población de 100.9. Calcule e interprete intervalos de confianza del 90 % para: a) La proporción de la población de fumadores que prefieren la marca A. se selecciona una muestra aleatoria de 1. Calcule e interprete intervalos de confianza del 95 % para: a) La fracción de la población de ciudadanos que están de acuerdo con la gestión del actual presidente. 4 millones de hogares) indica que el 16. Una muestra al azar de 200 hogares de la ciudad B da una gasto medio de 105 y una desviación estándar de 10. se toma una muestra al azar de 250 hogares de A arrojando un gasto medio de S/.5 % y una confianza del 95 %. 650 y una desviación estándar de S/ 70. b) Con un 95% de confianza.000 ciudadanos y se halla que 1. a) Determine un intervalo de confianza del 99 % para la diferencia del gasto medio mensual en luz en las ciudades A y B.c) Con el 95 % de confianza. b) ¿Será diferente el costo medio de la enseñanza en las universidades A y B? 238 . b) ¿Será diferente el gasto medio mensual en luz en las ciudades A y B? 16. 120 y una desviación estándar de 15. a) Calcule e interprete intervalos de confianza del 90 % para la fracción de la población de ciudadanos y otro para el total que están a favor del actual presidente regional. b) Con un error del 2. a) Calcule e interprete intervalos de confianza del 95% para la diferencia del costo medio de la enseñanza en las universidades A y B. se selecciona una muestra aleatoria de 2. si se desea un error máximo del 5%? 13. Para determinar el costo medio de la enseñanza en las universidades A y B. a) Determine un intervalo de confianza del 95 % para la proporción y otro para el total de hogares limeños que usan tele cable. 90. se toma una muestra al azar de 121 alumnos de la universidad A arrojando un costo medio de S/.140 están contentos con el actual presidente regional. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción de hogares que usa tele cable? 14. 675 y una desviación estándar de S/. ¿qué tamaño de muestra será necesario si desea cometer un error máximo del 5%? 15.3 % de los hogares usa tele cable. Una muestra al azar de 121 alumnos de la universidad B da una costo medio de S/. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana (con 1. De una población de 1’500000 ciudadanos de una región. ¿Qué tamaño de muestra debe tomarse. En un estudio para determinar el gasto medio mensual en luz en las ciudades A y B. 19. 18. Una muestra al azar de 200 pilas para calculadoras de la marca A muestra una vida media de 240 horas y una desviación estándar de 10 horas. aprenden taquigrafía por dos sistemas diferentes y luego se les somete a pruebas de dictado. a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del gasto medio en las ciudades 1 y 2. n1 = 200.17. cada uno de 40 alumnas. Dos grupos escogidos al azar. mientras que el segundo grupo promedia 115 palabras por minuto con una desviación estándar de 10 palabras. En un estudio para determinar el gasto medio semanal en alimentos en las ciudades 1 y 2. 150 y una desviación estándar de 15. Se compararon los gastos mensuales (S/. b) ¿Será igual el gasto medio semanal en alimentos en las ciudades 1 y 2? 20. S1 = 60 S2 = 50. de una escuela para secretarias. muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2. 239 y X 2 = 150. n2 = 150. Se encuentra que el primer grupo obtiene en promedio 120 palabras por minuto con una desviación estándar de 11 palabras. b) ¿Serán diferentes las medias de palabras por minuto con los 2 métodos? Explique.) en educación en las ciudades 1 y 2. se toma una muestra al azar de 200 hogares de la ciudad 1 arrojando un gasto medio de S/. b) ¿Será diferente la duración media de las pilas A y B? Explique. a) Determine un intervalo de confianza del 99 % para la diferencia de la vida media de las pilas A y B. . Una muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 135 y una desviación estándar de 10. Una muestra al azar de 120 pilas de la marca B da una vida media de 225 horas y una desviación estándar de 9 horas. dieron estos resultados: X 1 = 160. a) Determine un intervalo de confianza del 95 % para la diferencia de medias de palabras por minuto con los dos métodos. En una muestra de 400 mujeres. a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia entre las verdaderas proporciones de adultos y jóvenes que están de acuerdo con la gestión presidencial. 300 de las cuales están a favor del cambio curricular. b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por la compra de casacas de cuero. De una muestra de 60 hombres 240 . 23. Se entrevistaron dos grupos de hombres respecto a su interés en una nueva rasuradora eléctrica que tiene cuatro navajas. 300 están de acuerdo con la gestión presidencial. Mientras que en una muestra de 600 jóvenes. Explique. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 hombres. En una muestra aleatoria de 400 adultos. 240 indican que están a favor de lo mismo. b) ¿Se puede afirmar que hay una diferencia entre las verdaderas proporciones de adultos y jóvenes que están de acuerdo con la gestión presidencial? 22. b) ¿Se puede afirmar que hay diferencia entre las verdaderas proporciones de alumnos y alumnas que están a favor del cambio curricular? 24. De una muestra de 300 mujeres de 40 años a más. a) Determine un intervalo de confianza del 99 % para la proporción de alumnas que están a favor del cambio curricular. 220 están de acuerdo con la gestión presidencial. b) ¿Difieren los gastos medios en educación de ambas ciudades? Explique 21. mientras que de 200 mujeres menores 40 años.a) Calcule e interprete un intervalo del 95 % de confianza para la verdadera diferencia entre los gastos medios mensuales en educación de las familias de las dos ciudades. 75 estuvieron interesadas. 80 mostraron interés. a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las verdaderas proporciones de mujeres menores de 40 años y las de 40 años a más que mostraron interés por la compra de casacas de cuero. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de casacas de cuero. sólo 5 mostraron interés. Es ampliamente conocido que no cualquiera coopera respondiendo a los cuestionarios de los entrevistadores puerta por puerta. 26. Explique. 25. sólo 12 estuvieron interesados. b) ¿Existe diferencia entre las verdaderas proporciones de hombres menores de 40 años y mayores de 40 años que mostraron interés? Explique. 241 . sólo 160 estuvieron interesados. Se entrevistaron dos grupos de mujeres respecto a su interés por la transmisión de encuentros de voleibol por TV. a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia entre las verdaderas proporciones de mujeres menores de 40 años y las de 40 años a más que mostraron interés. X1 = 150. se obtuvieron los siguientes resultados: Mayores (1): n1 = 250. mientras que de 100 mujeres menores 40 años. sólo 90 mostraron interés. 27. sólo 40 mostraron interés. a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las verdaderas proporciones de hombres menores de 40 años y mayores de 40 años que mostraron interés. mientras que de 40 hombres mayores 40 años. sólo 30 estuvieron interesadas. b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés. mientras que de 300 puneños. b) ¿Existe diferencia entre las proporciones de mayores y de jóvenes que cooperan? Explique. Se entrevistaron a un grupo de hombres en las ciudades de Cusco y Puno respecto a su interés por la compra de abrigos de lana. En un experimento para determinar si las personas mayores (1) son más cooperadoras que los jóvenes (2). De una muestra de 400 cusqueños. Jóvenes (2): n2 = 200.menores de 40 años. De una muestra de 120 mujeres de 40 años a más. X2 = 110 a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las verdaderas proporciones de personas mayores y de jóvenes que cooperaron con los entrevistadores. ¿Aceptaría usted que el tamaño medio de las microempresas es de 7 empleados? b) Número total de empleados en las micro empresas. 253. 249. Las cajas de un cereal producido por una fábrica deben tener un contenido de 160 gramos. 254. 158. b) ¿Existe diferencia entre la proporción de cusqueños y puneños que mostraron interés por la compra de abrigos de lana? Explique.) de diez latas de conserva fueron los siguientes: 159. 29. 161 Calcule e interprete intervalos de confianza del 90 % para la media poblacional y la varianza poblacional de los pesos netos. 163. 159. 162. 28. c) La varianza del número de empleados por micro empresa. 161. 156. 158.8 empleados y una confianza del 95 % ¿qué tamaño mínimo de muestra será necesario? 31. 157. 157. 30. 250. 248 Calcule e interprete intervalos de confianza del 99 % 242 . 158. 250.157. obteniéndose la siguiente información: 20 20  X i  210 X i 1 i 1 2 i  1526 Calcule e interprete intervalos de confianza del 95 % para el(la) verdadero(a): a) Número medio de empleados por micro empresa en la ciudad. Los contenidos netos (ml.) de una muestra aleatoria de 10 frascos de yogurt fueron los siguientes: 248. 163. d) Para estimar en el futuro el número medio de empleados por establecimiento. 247. con un margen de error máximo de 0. Un inspector tomó una muestra que arrojó los siguientes pesos en gramos: 157. 249. 159. 162. De las 1500 micro empresas de una ciudad se extrae una muestra aleatoria de 20 y se recolecta información sobre el número de personas empleadas (X) por empresa. 156 Calcule e interprete intervalos de confianza del 90 % para la media poblacional y la varianza poblacional de los pesos. 252. 158.a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia entre las verdaderas proporciones de cusqueños y puneños que mostraron interés por la compra de abrigos de lana. Los pesos netos (grs. 159. b) La varianza poblacional de los contenidos netos en los frascos. ¿Son diferentes las varianzas de los pesos de las latas de conservas de ambas máquinas? 243 . dio un promedio de 82 piezas con una desviación estándar de 10. ¿Serán heterogéneas las varianzas de ambos grupos? b) La diferencia de la producción media de ambos grupos. La producción de 13 obreros de la jornada diurna.5 ml. mientras que para 11 obreros de la jornada nocturna. mientras que para 15 estudiantes del turno nocturno. Mediante muestra aleatoria sin reemplazo de 16 latas tomadas de cada máquina se han obtenido los siguientes resultados sobre el peso de las latas (en gramos): n1 = 16. x1 = 495. dio un promedio de 105 con una desviación estándar de 15. dio un promedio de 74 con una desviación estándar de 7. S2 = 7. ¿Son diferentes las producciones medias de ambas jornadas? 33. ¿Son heterogéneas las varianzas de los 2 turnos? b) La verdadera diferencia de las medias de los cocientes de inteligencia de los alumnos de ambos turnos. el cociente de inteligencia de 15 alumnos del turno diurno. c) ¿Qué tamaño de muestra debe tomarse. Calcule e interprete intervalos de confianza del 99 % para: a) La verdadera razón de varianzas de los cocientes de inteligencia de los alumnos de ambos turnos. con el 99 % de confianza? 32. x2 = 505. dio un promedio de 112 con una desviación estándar de 6. S1 = 5 y n2 = 16. Calcule e interprete intervalos de confianza del 99% para: a) La razón de varianzas de los pesos de las latas de conservas de ambas máquinas. En un colegio de secundaria. ¿Son diferentes los cocientes medios de inteligencia de los 2 grupos? 34. Dos máquinas producen diariamente mil latas de conservas cada una independientemente. Calcule e interprete intervalos de confianza del 95% para: a) La razón de varianzas de la producción de ambas jornadas.a) Para la media poblacional de los contenidos netos en los frascos. si se desea que x difiera de µ en menos de 1. S1 = 25 y n2 = 20. Calcule e interprete intervalos de confianza del 95% para: a) La razón de varianzas de los gastos mensuales en seguridad particular realizada por las empresas de ambas ciudades. x 2 = 385. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad particular realizada por las empresas de dos ciudades. ¿Son diferentes las varianzas de los gastos mensuales en seguridad particular realizada por las empresas de ambas ciudades? b) La diferencia de los gastos medios mensuales en seguridad particular realizada por las empresas de ambas ciudades. S2 = 15. x1 = 458. ¿Son diferentes los pesos medios de las latas de conservas de ambas máquinas? 35.b) La diferencia de los pesos medios de las latas de conservas de ambas máquinas. Mediante muestras aleatorias de 20 empresas tomadas en cada ciudad se han obtenido los siguientes resultados: n1 = 20. ¿Son diferentes los gastos medios mensuales en seguridad particular realizada por las empresas de ambas ciudades? 244 . 1 6. Prueba de hipótesis para la diferencia de proporciones.1 etc. la proporción y la diferencia de proporciones. Prueba de hipótesis para la media (con varianza desconocida).12). se presenta los aspectos fundamentales de las pruebas de hipótesis. 245 .6 6.. la razón de varianzas. cuyo contraste pasa muchas veces por el uso de la estadística. Prueba de hipótesis acerca de dos medias (varianzas conocidas).9 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS “El pensamiento estadístico será un día tan necesario para el ciudadano eficiente como la capacidad de leer y escribir. ya que frente a un problema de la realidad tiene que formularse una hipótesis. Ejercicios resueltos.4 6. la tasa de desempleo es del 12% (P = 0. Wells CONTENIDO 6.5 6. prueba o docimasia de hipótesis.G.El contenido medio de las bolsas de arroz es de  = 1 000 gr. En este capítulo. Ejemplo 1.8 6. En el capítulo anterior se ha desarrollado los diferentes aspectos relacionados con la estimación. que han permitido establecer las bases para de una manera sencilla hacer el contraste. Prueba de hipótesis para la razón de varianzas. Prueba de hipótesis acerca de una varianza. Prueba de hipótesis acerca de dos medias (varianzas desconocidas).3 6. así como la propuesta de contrastes de hipótesis estadísticas referidas a parámetros como: la media. Prueba de hipótesis para la proporción. la varianza. la diferencia de medias.” H.7 6. Ejercicios propuestos.2 6.Capítulo 6. Prueba que es fundamental en la investigación científica cuando se usa el modelo hipotético-deductivo.10 Prueba de hipótesis para la media (con varianza conocida). Hipótesis Estadística Es una aseveración que se hace acerca del valor del parámetro o los valores de los parámetros de una población. las notas tienen distribución normal con  = 12 y  = 2. se aleja más de 3.8 ).9] gr. Esta probabilidad es: P( X ≥ 1 005.” embolsa arroz con un contenido medio de 1 000 gr.2 gr. Estos son los elementos fundamentales a tener en cuenta para el contraste de hipótesis. Calculando X = (1 005 + 1 006 + 1 004 + 1 005 + 1 006) / 5 = 1 005.La “Compañía Agrícola Yapatera S. Para contrastar si en cierto momento el proceso se ha desajustado. 246 .87) = 1 – 0.Planteamiento del Problema Contrastar una hipótesis estadística es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella. Ejemplo 2. Se pesan las bolsas obteniendo los siguientes datos: 1 005. con el 95% de confianza.2) = P(Z ≥ 3. Para el ejemplo anterior   [1 001. estandaricemos la variable.2 gr. 1 006. Es decir.2 gr.5 . 1 008.00005 . se toma una muestra al azar de n = 5 bolsas con arroz.005%. 1. está muy alejado del valor central  = 1 000 gr. Por todo ello debemos pensar que el proceso se ha desajustado ya que de ser correcto. la probabilidad de que una muestra de tamaño 5 tome como media 1 005. es muy pequeña. 1 004.). El valor X = 1 005. ¿Podemos decir que el proceso de llenado se ha desajustado? Si el proceso no se ha desajustado al ser X ~ N (1 000 . Para verlo formalmente. Es decir que: La prueba estadística de una hipótesis es una regla que cuando los valores muestrales son observados nos conducen a aceptar o rechazar la hipótesis bajo consideración. .2  1000  = 3. El proceso de llenado tiene distribución N ( = 1 000 gr. 9)  X ~ N (1 000.87.87) = 1 – P(Z  3.  = 3 gr.342 estándar de la media. 9 / 5) = N (1 000 . así como su relación con los intervalos de confianza. 1 005 y 1 006 gr. Sumamente menor al 0.A.8 veces la desviación X 1.99995 = 0. Z X   1005 . Por razones imprevisibles el proceso de llenado se desajusta a veces produciendo un aumento o disminución del llenado medio sin variar la desviación estándar. Es la suposición contraria a la que se quiere contrastar. Ejemplo: H0 : θ = θ0 . 247 . Ello porque la hipótesis nula refleja el comportamiento que ha tenido (tiene o seguirá teniendo) el parámetro..se denota por H1 o Ha y generalmente es especificada con menos precisión.se denota por H0 y es la hipótesis que se contrasta. La hipótesis nula refleja el valor que ha tenido el parámetro en un momento determinado. Tipos de Pruebas Hay dos tipos principales de pruebas: las pruebas unilaterales y la prueba bilateral. y que se ha producido un desajuste en el proceso de llenado de las bolsas con arroz. Hipótesis Alternativa . Al efectuar el contraste. entonces nos lleva a confirmar la hipótesis de que  es diferente de 1 000 gr. Generalmente se establece en forma exacta. hasta que los datos demuestren su falsedad. Hipótesis Nula . Cada una se identifica por la forma en que se formula H1. que se acepta en caso la hipótesis nula se rechace. bajo el supuesto tentativo que la hipótesis nula es cierta. Pruebas Unilaterales o de una Cola  Prueba de la cola inferior o prueba del lado izquierdo (cola izquierda) Ho : θ = θ0 H1 : θ < θ0 Se emplea cuando se tiene alguna evidencia de que el valor del parámetro ha disminuido. pero pueda que haya cambiado dando lugar a la hipótesis alternativa.. θ > θ0 o θ ≠ θ0 . Ejemplo: H1 : θ < θ0 . Es la hipótesis que mantendremos hasta que los datos demuestren su falsedad.Como  = 1 000 no pertenece al intervalo de confianza. hablamos de probar la hipótesis nula contra la hipótesis alternativa. 1. Tipos de Hipótesis Para efectuar el contraste de hipótesis se formula dos tipos de hipótesis: la nula y la alternativa. porque el error debe ser bajo.  Error de tipo II: se comete cuando se acepta una hipótesis Ho siendo esta falsa. en caso de que el valor que se prueba no sea verdadero. todos los demás valores son posibles. Tipo de Errores  Error tipo I: se comete al rechazar la hipótesis nula Ho cuando ésta es verdadera. el nivel de significación sería del 5%. β = P [Aceptar Ho / Ho es falsa ] 248 . Si tuviéramos un nivel de confianza del 95% entonces. Prueba Bilateral o de dos Colas Ho : θ = θ0 H1 : θ ≠ θ 0 Este tipo de prueba se emplea. 2. Significaría que en 5 de cada 100 pruebas nos estaríamos equivocando al rechazar Ho cuando esta es cierta.05 y 0.01. Prueba de la cola superior o prueba del lado derecho (cola derecha) Ho : θ = θ0 H1 : θ > θ0 Se emplea cuando se tiene alguna evidencia de que el valor del parámetro ha aumentado.  = Nivel de significación = P (Error Tipo I) = P [Rechazar Ho / Ho es verdadera Los valores más comunes de  son 0. La probabilidad de cometer este error la denotamos con la letra β. entonces. Xn ) como estadística de prueba.C) y la región de aceptación (R. se hace respecto al rango de ˆ y un resultado particular ˆ de la muestra. ….Decisión (muestral) Aceptar Ho Rechazar Ho Ho es verdadera No hay error Error tipo I Ho es falsa Error tipo II No hay error Los errores tipo I y tipo II se relacionan.A).C. Si ˆ  R. por lo general tiene como resultado un aumento en la probabilidad del otro. Las reglas de decisión sobre la aceptación o rechazo de H0 . Si ˆ  R. por ello escogemos una función ˆ de las n observaciones. La decisión de aceptar o rechazar la hipótesis bajo consideración H0 se hace basándose en pruebas de muestras. Una disminución en la probabilidad de uno. Región Crítica o de Rechazo Es la región que contiene lo valores para los cuales se rechaza la hipótesis H0 bajo consideración. Esto se hace hallando un valor ˆ C llamado valor crítico de la estadística de prueba (a veces hay más de un valor crítico) la cual divide al rango de ˆ en dos regiones: la región crítica o de rechazo (R. rechazamos H0. . X2. 249 . conduce al rechazo de la hipótesis bajo consideración. Es la región del rango de ˆ que de acuerdo con una prueba prescrita. aceptamos H0. ˆ = G(X1. cuya distribución por muestreo sea conocida en el supuesto (tentativo) que la hipótesis nula H0 :  = 0 es cierta.A. Veamos cada una de ellas. con la información de una muestra aleatoria de tamaño n y bajo el supuesto que H0 es cierta.Región de Aceptación Es la región que contiene lo valores para los cuales se acepta la hipótesis H0 bajo consideración. Esta prueba estadística. veremos la aplicación de las pruebas de hipótesis para los parámetros poblacionales como la media. En caso contrario. A continuación. Para ello tomar en cuenta la distribución de la prueba estadística escogida. la igualdad de varianzas. t. diferencia de medias. debe ser función del estimador y del parámetro. Establecer la región crítica. chi-cuadrado. la varianza. F. Cuyas estadísticas de prueba van a estar referidas a distribuciones como la normal estándar. 6. Pasos para el Contraste de Hipótesis 1. H0 : θ = θ0 H1 : θ ≠ θ0 o θ < θ0 o θ > θ0 2. etc. si el valor calculado de la prueba estadística pertenece a la región de aceptación. 4. entonces aceptamos H0 y rechazamos H1. Escoger la prueba estadística apropiada (Z. t de student. 250 . 5. chi cuadrado y F respectivamente. Escoger el nivel de significación . Conclusión: Si el valor calculado de la prueba estadística pertenece a la región crítica. 3. utilizando los resultados de las distribuciones muestrales y de los intervalos de confianza. la proporción y la diferencia de proporciones. al igual que en la construcción de intervalos de confianza. Calcular el valor de la prueba estadística. entonces rechazamos H0 y aceptamos H1. Formular las hipótesis de acuerdo al problema.) cuya distribución por muestreo sea conocida en el supuesto tentativo de que H0 es cierta. A. 2/n). Hipótesis: Ho:  = o . Si se supone verdadera la hipótesis nula: Ho:  = o. cuya distribución es normal N(0. la estadística para la prueba acerca de  con varianza 2 conocida es:  X . / n 4.  Z  Z1 / 2 o Z  Z1 / 2  Por otro lado. entonces. la distribución de X es aproximadamente normal N(. para  cualquier valor de n  30. cuya distribución es exacta o aproximadamente normal estándar Z / n N(0. la región crítica en el rango de variación de Z es: R. 2). Si se necesita el factor de corrección para poblaciones finitas se usa (N –n) / (n-1) Entonces.6. según sea la población normal o no. Escoger el nivel de significación:   X 3. Si la población es normal N(.   Z1 / 2  Z  Z1 / 2  251 . Si la población no es normal.1). 2/n). la distribución de la estadística  X es exactamente normal N(. la probabilidad de aceptar H0 cuando se supone verdadera es: P Z1 / 2  Z  Z1 / 2   1   Resultando la región de aceptación: R.C. Prueba bilateral o de dos colas 1.1). Región crítica: determinar el valor Z1-/2 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: PZ  Z1 / 2    / 2 o PZ  Z1 / 2    / 2 En consecuencia. la estadística especificada  X  0 por esta hipótesis es entonces: Z  / n A. Estadística de prueba: Z  .1 PRUEBA DE HIPÓTESIS PARA LA MEDIA (con varianza conocida)  Sea X la media de una muestra aleatoria de tamaño n seleccionada de una población con media  y con varianza 2 supuestamente conocida. H1:   0 2. C  X  a o X  b  Si se sustituye Z  ( X   0 ) /( / n ) en RC resulta la región crítica en el rango  de variación X con: a  0  Z1 / 2 ( / n ) . A. 6. H1:  > 0 2. cuya distribución es normal N(0. (o si x R. A. se rechazará H0 con un riesgo . Prueba unilateral de la cola derecha 1.  {Z  Z1 } 252 . 5. y b   0  Z1 / 2 ( / n )  La región de aceptación es el intervalo en X :  R.  Nota (Región crítica en X )    Si X es estimador de . Hipótesis: Ho:  = o . Decisión: se rechaza H0 con riesgo igual a .) No se rechazará H0 en caso contrario. si Z calc R.  [ a  X  b]   La regla de decisión es: Si x es el valor de X obtenido a partir de una muestra   aleatoria. se cumple H1:   0 cuando X < a o X > b R. Región crítica: determinar el valor Z1 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: PZ  Z1 | H 0 :   0 verdadera   En consecuencia. Hallar Z calc x  0  con la información muestral y suponiendo que Ho es / n cierta. / n 4. (o si Z calc R. No se rechaza H0 en caso contrario.C. si x R. la región crítica en el rango de variación de Z es: R.A.C. B. ). Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es .1).C. Escoger el nivel de significación:   X 3. Estadística de prueba: Z  . Región crítica: determinar el valor Z1 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: PZ   Z1 / Ho :   0 verdadera   En consecuencia. No se rechazará H0 en caso contrario.A. Prueba unilateral de la cola izquierda Ho:  = o . Hallar Z calc x  0  con la información muestral y suponiendo que Ho es / n cierta. ). A.  {Z  Z1 } . Estadística de prueba: Z  . (o si Z calc R. Decisión: se rechaza H0 con riesgo igual a . La región de aceptación es:  5. se rechazará H0 con un riesgo .R. Hallar Z calc x  0  con la muestra y bajo el supuesto que Ho es cierta. 6. Hipótesis: H1:  < 0 2.A.A. Escoger el nivel de significación:   X 3. (o si x R.  Nota: (Región Crítica en X )   Si X es estimador de .1).A.C. ).C. (o si Z calc R.C. si Z calc R. si x R. No se rechaza H0 en caso contrario. ). 253 . / n 6. cuya distribución es normal N(0. C. si Z calc R.C.  Z   Z1  R.  Z   Z1  La región de aceptación es:  5.  { X  b1} donde: b1   0  z1 ( / n )  La región de aceptación es el intervalo: R. Decisión: se rechaza H0 con riesgo igual a .C.A.  { X  b1}   La regla de decisión es: Siendo x el valor de X obtenido a partir de una muestra   aleatoria de tamaño n. se cumple H1:  > 0 cuando X > b1  R. 1. / n 4. la región crítica en el rango de variación de Z es: R. C. no se rechaza Ho:  = 0 si el valor  Zcalc ϵ R. No se rechazará H0 en caso contrario. Z1-α/2] donde Z calc  ( x  0 ) /( / n )  o. A. Nota: Método del valor P (o P-valor o sig o Probab.C. de manera que: 254 .) del 100(1 )% para el parámetro  y luego rechazar la hipótesis nula Ho:  = 0 si es que 0  I .) del 100(1 -      . (o si x R. etc.A. rechazará H0 con un riesgo  si x R. ).  0  z1 / 2 Esto es.   x Z1 / 2 n n    Por tanto. x Z1 / 2 ) % para :  0  I .A. si  Z1 / 2  x  0   Z1 / 2 n      . Nota: Regla de decisión con el Intervalo de Confianza La prueba de la hipótesis nula Ho:  = 0 contra H1:   0 a un nivel de significación dado . .C. no se rechaza Ho:  = 0 si x  R.C. si x  R. o si 0  I . a partir del valor Zcalc.   0  z1 / 2 n n   o equivalentemente si  0 se encuentra en el intervalo de confianza (I. es calculando el valor P (probabilidad mínima para rechazar Ho).) Otra forma de establecer la regla de decisión.C. se rechaza H0 con riesgo . A.  Nota: (Región crítica en X )   Si X es estimador de . equivale al calcular el intervalo de confianza (I.   En efecto. si x es un valor de X . se cumple H1:  < 0 cuando X < a1  RC  { X  a1} donde: a1 =  0  Z1 ( / n )  Región de aceptación: RA  { X  a1}   Regla de decisión es: Si X es un valor de X obtenido a partir de una muestra   aleatoria de tamaño n.C.No se rechaza H0 en caso contrario. = [-Z1-α/2. entonces. a) ¿Se podría concluir que el proceso está fuera de control al 5% de significación? Halle P-valor.96 Luego. Si en una muestra aleatoria de 100 paquetes del producto se ha encontrado que el peso medio es de 395 gramos. Cálculos. Región crítica: Si la hipótesis nula H0 es cierta. Suponga que el peso de los productos empaquetados se distribuye normalmente con desviación estándar de 20 gramos. ¿Aceptaría usted que  = 400 gr. Entonces: 255 x  395. 3.975 = 1. la región crítica en la variable Z está dada por: RC  Z calc  1. 1. se encuentra el valor crítico: Z1-/2 = Z0. Ejemplo 3.1). Se supone que la distribución de X es N(. Hipótesis: H0:  = 400 (proceso controlado) H1:   400 (proceso fuera de control). b) Construya un intervalo de confianza del 95% para el peso medio del producto empaquetado.Un proceso de empaquetar un producto está controlado. de los datos se tiene: n = 100. para  = 0. Z / n 4.   20 . en la distribución de Z  ( X  400) /(20 / 100 ) . (proceso controlado)? Solución a) Sea X la variable aleatoria definida como el peso de los paquetes del producto. se rechaza H0. la estadística es  X cuya distribución es normal N(0. Nivel de significación:  = 0. Se acepta H0. Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] Si el valor de P < . (20)2). en caso contrario. Estadística de prueba: Población normal con varianza conocida. 2. si el peso medio del producto empaquetado es 400 gr.96 o Z calc  1.05.05 y la alternativa  bilateral.96  5. P-valor = P[|Z| > |-2.5] = 2 P[Z < -2.92}  Por el hecho que x  395 R.00621) = 0. .96 x2 o X  400  1.5|] = P[|Z| > 2.5  R.  Nota: En el rango de variación de X . Cálculos utilizando Minitab (versión 15. .C. la región crítica es:     R.05 se rechaza Ho y se acepta H1:   400 y se concluye también con un 5% de significación que el proceso de empaquetado no está controlado.C.5 2 / n 6.08 o X  403.01242 <  = 0. se debe rechazar H0 y concluir con un riesgo de 5 % que el proceso de empaquetado no está controlado. debemos rechazar H0 y concluir con un 5% de significación que el proceso de empaquetado no está controlado.96 x2}  { X  396.0 en español) Del menú escoger Estadísticas → Estadísticas básicas → 1Z Z de 1 muestra y aparece la Ventana Z de 1 muestra (prueba e intervalo de confianza) siguiente: 256 . Z calc x  0 395  400    2.C.  { X  400  1. Como el valor-P = 0. Decisión: Puesto que Zcalc = -2.5] = 2(0.01242. 08. por lo tanto. Escoger Opciones… → Nivel de confianza: 95.95 → En la Tabla 1.92] = [391. porque no pertenece al intervalo de confianza. 398.96 20 = 3.92 . (1) Datos: n = 100.08 . Seleccionar Realizar prueba de hipótesis y escribir en Media hipotética: 400.0. X Z   1  2  n ………….92] gr. σ = 20. Zo = Z0. Escoger en Hipótesis alterna: no es igual a. El error de estimación para la media es: E= Z  1  2 n  1. con el 95% de confianza. 398. Escribir la Desviación estándar: 20. 1 – α = 0.975 = 1.012 y el intervalo de confianza del 95% para la media µ obtenido a continuación en b). No se acepta que  = 400 gr.Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 100 y en Media: 395 (la media muestral). Lo que sigue es igual para ambos casos. b) El intervalo de confianza del 95% para el peso medio  del producto empaquetado viene dado por:    X  Z   1  2 n .00 IC de 95% (391.92 gr. no = 400 La desviación estándar supuesta = 20 N 100 Media del Error estándar 2. se escoge Muestras en columnas: y se ingresa dicha columna.50 P 0.00 Media 395. 100 Reemplazando en (1) se tiene: µ ϵ [395 – 3. Nota: Si los datos muestrales aparecen en una columna. 395 + 3. Luego escoger Aceptar y Aceptar En la hoja de Sesión aparecen los resultados siguientes: Z de una muestra Prueba de mu = 400 vs.92) Z -2. se debe rechazar H0 y concluir con un 95 % de confianza que el proceso de empaquetado no está controlado.5.012 Aparecen los resultados antes obtenidos: Zcalc = -2. X = 395.96. el valor-P = 0. 257 . 2 PRUEBA DE HIPÓTESIS desconocida) PARA LA MEDIA (con varianza Población no normal Si la población no tiene distribución normal y si la varianza es desconocida. el tamaño de la muestra es grande  X  0 (n  30).6. Prueba bilateral o de dos colas 1. Escoger el nivel de significación:   x  3. H1:   0 2.1) Luego.2). n 1 . se suele utilizar la estadística: Z  / n N(0. Ho:  = o . salvo que el valor de  se estima por S y la distribución normal estándar se sustituye por la distribución t de Student con n-1 grados de libertad. A. Región crítica: determinar los valores  t1 / 2. la estadística  x  0 especificada por esta hipótesis es: T  S/ n Nota: La estructura de la prueba es idéntica que en el caso de  conocida . Hipótesis: Ho:  = o. sólo si. las regiones críticas de las pruebas de Ho:  = 0 contra cualquiera de las tres alternativas H1:  > 0 H1:  < 0 o o H1:   0 son las mismas (aproximadamente) de la sección anterior. tales que la probabilidad de rechazar Ho cuando se supone verdadera sea: 258 . donde  y 2 son parámetros desconocidas. Estadística de prueba: T  S/ n  t n 1 4. para probar hipótesis acerca de la media . Población normal Si la población tiene distribución normal N(. para 2 ≤ n < 30 la estadística de la prueba acerca de la media  es:  x  T S/ n Si se  t n 1 supone verdadera la hipótesis nula. 1.P(T  t1 / 2. B. la región crítica en el rango de variación de T es: R.C. Escoger el nivel de significación:   x  3. 6. Decisión: se rechaza H0 con riesgo igual a . H1:  < 0 259 . si Tcalc R. En consecuencia. Estadística de prueba: T  S/ n  t n 1 4. n1} .A. A. Decisión: se rechaza H0 con riesgo igual a . la región crítica en el rango de variación de T es: R. Región crítica: determinar el valor t1 .  5.  {T  t1 . (o si Tcalc R. n1} La región de aceptación es: R. No se rechaza H0 en caso contrario. Prueba unilateral de la cola izquierda 1. Si se rechaza Ho se dice que la prueba es significativa con riesgo igual . n 1 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: P [T  t1 .C.n1} La región de aceptación es: R. Hallar Tcalc x  0  con la información muestral y suponiendo que Ho es S/ n cierta. Hipótesis: H1:  > 0 2. 6. si Tcalc R. Hallar Tcalc x  0  con la información muestral y suponiendo que Ho es S/ n cierta.  {t1 / 2.C. C. ). ). Hipótesis: Ho:  = o . (o si Tcalc R.n1 )   / 2 o P(T  t1 / 2. No se rechaza H0 en caso contrario. A.n1 o T  t1 / 2. n1}  5. n1  T  t1 / 2.A.C. n1 | H 0 :    0 verdadera]   En consecuencia.  {T  t1 / 2. n 1 )   / 2 .  {T  t1 . Prueba unilateral de la cola derecha Ho:  = o. Escoger el nivel de significación:   x  3. la región crítica en el rango de variación de T es: R. = {T < -t1 . de manera que:  Para dos colas: P = P[|Tn-1| > |Tcalc|] = P[Tn-1 < -|Tcalc|] + P[Tn-1 > |Tcalc|] = = 2 P[Tn-1 < -|Tcalc|] = 2 P[Tn-1 > |Tcalc|]  Para cola a la derecha: P = P[Tn-1 > Tcalc]  Para cola a la izquierda: P = P[Tn-1 < Tcalc] Si el valor de P < .C. No se rechaza H0 en caso contrario. Decisión: se rechaza H0 con riesgo igual a . Nota: Regla de decisión con el Intervalo de Confianza La prueba de la hipótesis nula Ho:  = 0 contra H1:   0 a un nivel de significación dado .A. = {T > -t1 . si Tcalc R.C.t1 . 6. Hallar Tcalc x  0  con la información muestral y suponiendo que Ho es S/ n cierta.) Otra forma de establecer la regla de decisión. es calculando el valor P (probabilidad mínima para rechazar Ho). entonces.α. a partir del valor Tcalc. ).A. Región crítica: determinar el valor .C. Nota: Método del valor P (o P-valor o sig o Probab. equivale al calcular el intervalo de confianza (I. en caso contrario. 260 .α. (o si Tcalc R. n1 | H 0 :    0 verdadera]   En consecuencia. etc. Se acepta H0.C. se rechaza H0.2. n 1 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: P [T  t1 .) del 100(1 )% para el parámetro  y luego rechazar la hipótesis nula Ho:  = 0 si es que 0  I . n -1}  5. Estadística de prueba: T  S/ n  t n 1 4. n -1} La región de aceptación es: R. 2. 3.Un fabricante produce un cable de alambre de cierto tipo. ¿Debería el fabricante adoptar el nuevo proceso.982 .25   S/ n 10 / 25 6.711 Luego. la región crítica en la variable T está dada por: R. Solución 1.5  300 = 2. de los datos se tiene: n = 25. x = 304.25 x  2. Hipótesis: H0:  ≤ 300 (proceso antiguo) H1:  > 300 (proceso nuevo).492 (con probabilidad 0.5 Kg.064 (con probabilidad 0.711}  5. 24 = 1. P-valor = P[T24 > 2.064 2. no está el valor 2.25  2. siempre que el cable así producido tenga una resistencia media a la ruptura mayor de 300 kg. que tiene una resistencia a la ruptura no mayor de 300 kg. debemos rechazar H0 y concluir con un 5% de significación que conviene adoptar el nuevo proceso. T de student.492 0. Decisión: puesto que Tcalc = 2.05 y la alternativa unilateral derecha. n-1 = t0.975) y 2.25 ϵ R.975 2. S = 10 y  = 300  Entonces: Tcalc x  304.5 kg.064 0.975 28.186  261 x = 0.27.25] = 1 .99) se determina x interpolando de la siguiente manera: Tα P 2.C = {T > 1. Si una muestra aleatoria de 25 cables producidos con el nuevo proceso ha dado una media 304.Ejemplo 4.975 x  0. y una desviación estándar S = 10 kg..990  2. si está dispuesto a asumir un error tipo I del 5%? Hallar el Pvalor.95. pero éste se encuentra entre los valores 2. Región crítica: para  = 0.C.25] = 1 – x ………… (1) Como en la tabla 3. Cálculos.25. Nivel de significación:  = 0.53 = 0.82 = 0. Se descubre un proceso nuevo y más barato que desea emplearse. para 24 grados de libertad. Estadística de prueba:  x  T S/ n  t 24 4. se encuentra el valor crítico en la Tabla 3: t1-.492  2.P[T24 ≤ 2.064  28.53x .05.990  0.186  0.975 x  0. Luego escoger Aceptar y Aceptar En la hoja de Sesión aparecen los resultados siguientes: 262 . Seleccionar Realizar prueba de hipótesis y escribir en Media hipotética: 300.05 se rechaza Ho y se acepta H1:  > 300.982 en (1) se obtiene: P-valor = 1 – 0.018 Rpta.982 = 0. Escoger en Hipótesis alterna: mayor que. Nota: Si los datos muestrales aparecen en una columna. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → 1t t de 1 muestra y aparece la Ventana t de 1 muestra (prueba e intervalo de confianza) siguiente: Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 25 y en Media: 304. Como el valor-P = 0. se concluye también con un 5% de significación que es conveniente adoptar el nuevo proceso. Por lo tanto.5 (la media muestral). Escribir la Desviación estándar: 10 (desviación estándar muestral).0.018 <  = 0. Lo que sigue es igual para ambos casos. se escoge Muestras en columnas: y se ingresa dicha columna.Reemplazando x = 0. Escoger Opciones… → Nivel de confianza: 95. 00 Desv. En consecuencia.00 Errorestándar 2. X = 304.064 x ] = [304. Xn una muestra aleatoria de tamaño n.25.63) Aparecen los resultados antes obtenidos: Tcalc = 2. X2.5 + 2. El intervalo de confianza para la media es:   [ X .018 encontrado con aproximación usando la Tabla 3) y el intervalo de confianza del 95% para la media µ obtenido a continuación.37 .064. parámetros desconocidos. con el 95% de confianza.63] Kg.50 Media del Error estándar 2.975 = 2. el valor-P = 0.. 6. y sea la n varianza muestral.064 x 10 10 . t0 = t24 .. 304. S 2  ( X i 1 i  X )2 n 1 Entonces. se rechaza H0:  = 300 kilos porque no pertenece al intervalo de confianza y se acepta H1:  > 300 Kg.50 10.. 308.5 Kg.  2  (n  1)S 2  263 2   n21 .5 ± 4. ..08 T 2.37. siendo conveniente adoptar el nuevo proceso con un 95% de confianza.95 → en la Tabla 3.00 IC de 95% (300.Est.128] 25 25 Por lo tanto:   [300.t0 S / n .3 PRUEBA DE HIPÓTESIS ACERCA DE UNA VARIANZA Sea Xk. seleccionada de una población normal con media  y varianza 2.017 (ligeramente diferente al 0. 10.T de una muestra Prueba de mu = 300 vs. 308. y S = 10. X + t0 S / n ] Luego:   [304. Además: n = 25.00 95% Límite inferior 301. 304.017 Para prueba bilateral: N 25 Media Desv. > 300 N 25 Media 304. la variable aleatoria.Si se construye el intervalo de confianza del 95% para la media . con 1 – α = 0.Est.5 – 2.25 P 0. Nota. 0. n 1 . Región crítica: determinar los valores X 2 / 2 .n1 ≤ X2 ≤ 12 / 2. ). 2 2  R.n1 o X2 > 12 / 2.C. tales que la probabilidad de rechazar la hipótesis nula H0 cuando se supone verdadera sea: P [  2  2 / 2.n1 } La región de aceptación es: R. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . Prueba bilateral o de dos colas 1.n1 } 2  5. = {X2 <  2 / 2. Decisión: se rechaza H0 con riesgo igual a . se usa para la prueba de H0. Hipótesis: Ho: σ2 =  02 . (o si  calc  R. A. H1: σ2   02 2.n1 ]   / 2 o P [  2  2 / 2. 264 .n1 ]   / 2 La Región crítica de la prueba es: R. la estadística es: 2  2  El valor  calc (n  1) S 2  02 (n  1) S 2  02   n21 que resulta de la muestra aleatoria. n 1 y X12 / 2 . si  calc No se rechaza H0 en caso contrario. 6. Si se supone verdadera la hipótesis nula Ho: σ2 =  02 . contra una alternativa unilateral o bilateral. A.Esta estadística se utiliza para probar hipótesis acerca de una varianza. Hallar  calc (n  1) S 2  02 con la información muestral y suponiendo que Ho es cierta. Escoger el nivel de significación:  3. = {  2 / 2.A.C. Estadística de prueba:  2  (n  1)S 2  2   n21 4. Hallar  2 calc  (n  1) S 2  02 R. Estadística de prueba:  2  (n  1)S 2  2   n21 4.C. Prueba unilateral de la cola izquierda 1. Decisión: se rechaza H0 con riesgo igual a . Región crítica: determinar el valor X12 . n 1 tal que la probabilidad de rechazar P[  2  12 . Escoger el nivel de significación:  3. (o si  calc  R. Hipótesis: 2. Hipótesis: Ho: σ2 =  02 .C. Región crítica: determinar el valor  2 .A. 6. n1 La región de aceptación es: 5. Prueba unilateral de la cola derecha Ho: σ2 =  02 .n1 ]   H0 cuando se supone verdadera sea: La Región crítica de la prueba es: R. Escoger el nivel de significación:  3.B. H1: σ2 >  02 1.n1 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: 265 .  calc No se rechaza H0 en caso contrario. n1 } con la muestra y suponiendo que Ho es cierta. n1 } 12 . = {X2 < 12 . ). A. H1: σ2 <  02 2. 2 2  R. C. Estadística de prueba:  2  (n  1)S 2  2   n21 4. = {X2 > 12 . A. se “acepta” la hipótesis nula Ho: σ2 =  02 .C. 266 . Nota: Regla de decisión con el Intervalo de Confianza La prueba de la hipótesis nula Ho: σ2 =  02 contra H1: σ2 ≠  02 a un nivel de significación dado . 6.C. n1 } La región de aceptación es: 5. Nota: Método del valor P (o P-valor o sig o Probab. = {X2 < 2. Decisión: se rechaza H0 con riesgo igual a .P[  n21 <  calc ]} 2  Para cola a la derecha: P = P[  n21 >  calc ] 2  Para cola a la izquierda: P = P[  n21 <  calc ] Si el valor de P < . si  02 ϵ I. etc.P[  2  2.) del 100(1 )% para el parámetro σ2 y luego rechazar la hipótesis nula Ho: σ2 =  02 si es que  02  I . se rechaza H0. Se acepta H0. a partir del valor  calc .C. equivale al calcular el intervalo de confianza (I.  calc No se rechaza H0 en caso contrario. entonces. de manera que:  Para dos colas: 2 2 Si  calc < n – 1 → P = 2 P[  n21 <  calc ] 2 2 2 Si  calc > n – 1 → P = 2 P[  n21 >  calc ] = 2 {1 . n1 ]   La Región crítica de la prueba es: R. Hallar  2 calc  (n  1) S 2  02 con la muestra y suponiendo que Ho es cierta.C.A. ). = {X2 > 2. 2 2  R. en caso contrario. n1 } R. es calculando el valor P (probabilidad 2 mínima para rechazar Ho). (o si  calc  R.C.) Otra forma de establecer la regla de decisión. Caso contrario. (1) Como en la tabla 2. 66.0 mm.23 4 4 4 2 6.n1   02. En una muestra de diez tornillos elegidos al azar del proceso de producción se han encontrado las siguientes longitudes en milímetros: 71. 64. con el 5% de significación. 67.95) se determina p interpolando de la siguiente manera: 267 . de chi-cuadrado. con n = 10. 2  Como la prueba es bilateral y  calc = 15.02} 5.Ejemplo 5. y suponiendo verdadera la hipótesis (n  1)S 2 H 0 :   4 .05 3. 72.9 (con probabilidad 0. Solución: 1.02 Luego. la estadística de prueba:     92 4 2 2 4.En un proceso de fabricación.025. no está el valor 15. 69.P[  n21 <  calc ]} = 2 {1 .77.C. 68. se plantea la hipótesis que la desviación estándar de las longitudes de cierto tipo de tornillo es 2.23  R. Nivel de significación:  = 0.23 > n – 1 = 9 el valor-P se obtiene así: 2 P = 2 {1 . Halle el valor-P.x} …….90) y 16.A. Rpta. H1 :  2  4 2. 70.  2 calc (n  1)S 2 9S 2 9 (6. entonces.05 y para un contraste bilateral.70 o X2 > 19. {X2 < 2. 9  2. Estadística de prueba: población normal. para 9 grados de libertad.70 y 12 / 2. Cálculos: De los datos de la muestra resulta S2 = 6. Hipótesis : H 0 :  2  4. Decisión: Como  calc = 15.23. pero éste se encuentra entre los valores 14. 65.00 mm? Use el nivel de significación  = 0. y suponga que la distribución de las longitudes es normal.23]} = 2 {1 .05. ¿se justifica la suposición que la desviación estándar verdadera es 2.975. en la tabla 2 de chicuadrado se encuentran los siguientes valores críticos: 2 / 2.P[  92 < 15. Región crítica: Para  = 0.9  19. la región crítica es: R.7 (con probabilidad 0.77)     15.n1   02. se acepta H 0 :  2  4 y concluimos que la desviación estándar es de 2 mm. 69 Con estos datos. X2α P 14.7 0.90 15.23 x 16.9  0.95  16.9  14.7 15.23  14.7  0.95  0.90 x  0.90 44x – 39.6 = 0.53   44 = 0.53 x  0.90 x = 0.912 Reemplazando x = 0.9815 en (1) se obtiene: P = P-valor = 2{1 – 0.912} = 0.176 Rpta. Como el valor-P = 0.176 >  = 0.05 se acepta H 0 :  2  4 . Por lo tanto, se concluye también con un 5% de significación que la desviación estándar es de 2 mm. Cálculos utilizando Minitab En la Ventana de Datos (Hoja de trabajo), columna C1 definir la variable Longitud (de los tornillos) e ingresar los 10 valores de la muestra. Del menú escoger Estadísticas → Estadísticas básicas → σ2 1 varianza y aparece la Ventana 1 varianza siguiente: En vez de ingresar desviación estándar, escoger ingresar varianza. Como los datos muestrales aparecen en la columna C1 Longitud, se escoge Muestras en columnas: y se selecciona en dicho recuadro la columna C1 Longitud. 268 Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y escribir el Tamaño de muestra: y la Varianza de la muestra: correspondientes. Lo que sigue es igual para ambos casos. Seleccionar Realizar prueba de hipótesis y escribir en Varianza hipotética: 4. Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna: no es igual a. Luego escoger Aceptar y Aceptar En la hoja de Sesión aparecen los resultados siguientes: Prueba e IC para una varianza: Longitud Método Hipótesis nula Hipótesis alterna Sigma-cuadrado = 4 Sigma cuadrado no = 4 El método estándar se utiliza sólo para la distribución normal. El método ajustado se utiliza para cualquier distribución continua. Estadísticas Variable Longitud N 10 Desv.Est. 2.60 Varianza 6.77 Intervalos de confianza de 95% IC para Variable Método Desv.Est. Longitud Estándar (1.79, 4.75) Ajustado (1.93, 3.98) IC para varianza (3.20, 22.55) (3.73, 15.85) Pruebas Variable Longitud Método Estándar Ajustado Chicuadrada 15.23 26.47 GL 9.00 15.65 Valor P 0.170 0.084 2 Aparecen los resultados antes obtenidos:  calc = 15.23, el valor-P = 0.17 (ligeramente diferente al 0.176 encontrado con aproximación usando la Tabla 2) y el intervalo de confianza del 95% para la varianza analizado a continuación. Nota.Si se construye el intervalo de confianza del 95% para la varianza σ2, éste resultará ser: σ2 ϵ [3.20; 22.55] mm2 con el 95% de confianza. En consecuencia, se acepta H 0 :  2  4 porque pertenece al intervalo de confianza. Por lo tanto, se concluye también que la desviación estándar es de 2 mm. con un 95% de confianza. 269 6.4 PRUEBA DE HIPÓTESIS PARA LA RAZÓN DE VARIANZAS Sean S12 y S 22 las varianzas de dos muestras aleatorias independientes de tamaños respectivos n1 y n2, escogidas de dos poblaciones normales con varianzas respectivas  12 y  22 . Entonces, la estadística, F S12 /  12  f n1 1, n2 1 S 22 /  22 tiene distribución de probabilidad F con grados de libertad n1 – 1 y n2 – 1. Esta estadística se utiliza para probar igualdad de varianzas. Si se supone verdadera la hipótesis nula Ho:  12   22 estadística de la prueba es: F  Su valor Fcalc  o  12 /  22 = 1, la S12  f n1 1, n2 1 S 22 S12 que resulta de dos muestras aleatorias, se utiliza para S 22 probar la hipótesis nula Ho contra cualquiera alternativa unilateral o bilateral. A. Prueba bilateral o de dos colas 1. Hipótesis: Ho : 12   22 , H1 :  12   22 2. Escoger el nivel de significación:  3. Estadística de prueba: F  S12 /  12  f n 11, n2 1 S 22 /  22 4. Región crítica: determinar los valores f  / 2 , n 11, n 21 y X 12 / 2 , n 11, n 21 , tales que la probabilidad de rechazar la hipótesis nula H0 cuando se supone verdadera sea: P[ F  f / 2, n 11, n 21 ]   / 2 o P[ F  f1 / 2, n 11, n 21 ]   / 2 La Región crítica es: R.C. = {F < f  / 2, n 11, n 21 o F > f1 / 2, n 11, n 21 } La región de aceptación es: R.A. = { f  / 2, n 11, n 21 ≤ F ≤ f1 / 2, n 11, n 21 } 5. Hallar Fcalc S12  2 con la información muestral y suponiendo que Ho es cierta. S2 6. Decisión: se rechaza H0 con riesgo igual a , si Fcalc R.C. (o si Fcalc R.A. ). No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . 270 B. Prueba unilateral de la cola derecha 1. Hipótesis: Ho: 12   22 , H1 :  12   22 2. Escoger el nivel de significación:  3. Estadística de prueba: F  S12 /  12  f n 11, n2 1 S 22 /  22 4. Región crítica: determinar el valor f1 , n 11, n 21 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: P[ F  f1 , n 11, n 21 ]   La Región crítica de la prueba es: R.C. = {F > f1 , n 11, n 21 } f1 , n 11, n 21 La región de aceptación es: 5. Hallar Fcalc  R.A. = {F < f1 , n 11, n 21 } S12 con la muestra y suponiendo que Ho es cierta. S 22 6. Decisión: se rechaza H0 con riesgo igual a , Fcalc R.C. (o si Fcalc R.A. ). No se rechaza H0 en caso contrario. C. Prueba unilateral de la cola izquierda 1. Hipótesis: Ho : 12   22 , H1 :  12   22 2. Escoger el nivel de significación:  3. Estadística de prueba: F  S12 /  12  f n 11, n2 1 S 22 /  22 271 4. Región crítica: determinar el valor f  , n 11, n 21 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea: P [ F  f , n 11, n 21 ]   La Región crítica de la prueba es: R.C. = {F < f  , n 11, n 21 } R.A. = {F > f  , n 11, n 21 } La región de aceptación es: 5. Hallar Fcalc S12  2 con la muestra y suponiendo que Ho es cierta. S2 6. Decisión: se rechaza H0 con riesgo igual a , Fcalc R.C. (o si Fcalc R.A. ). No se rechaza H0 en caso contrario. Nota: Regla de decisión con el Intervalo de Confianza La prueba de la hipótesis nula Ho:  12   22 o  12 /  22 = 1 contra H1 :  12   22 o  12 /  22 ≠ 1 a un nivel de significación dado , equivale a determinar el intervalo de confianza (I.C.) del 100(1 - )% para la razón de varianzas  12 /  22 y luego rechazar la hipótesis nula Ho:  12   22 si es que  12 /  22 = 1  I .C. Por el contrario, si  12 /  22 = 1 ϵ I.C. se “acepta” la hipótesis nula Ho:  12   22 . Nota: Método del valor P (o P-valor o sig o Probab, etc.) Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad mínima para rechazar Ho), a partir del valor Fcalc , de manera que:  Para dos colas: Si Fcalc < 1 → P = 2 P[ f n 11, n 21 < Fcalc ] Si Fcalc > 1 → P = 2 P[ f n 11, n 21 > Fcalc ] = 2 {1 - P[ f n 11, n 21 < Fcalc ]}  Para cola a la derecha: P = P[ f n 11, n 21 > Fcalc ]  Para cola a la izquierda: P = P[ f n 11, n 21 < Fcalc ] Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario. Ejemplo 6.Una compañía diseña un nuevo proceso de moldeo para reducir la variabilidad en el diámetro de las piezas producidas. Se cree que la varianza del nuevo proceso es menor que la varianza del proceso antiguo. Para una muestra de 8 piezas del proceso 272 antiguo y una muestra de 6 piezas del proceso nuevo se obtienen los siguientes diámetros en milímetros: Antiguo (1): 17, 23, 21, 18, 22, 20, 21, 19 Nuevo (2): 13, 16, 14, 12, 15, 14 ¿Confirman estos datos que la varianza de los diámetros con el nuevo proceso es menor que con el proceso antiguo? Suponga poblaciones normales y use  = 0.05 Solución Sean X1 y X2 las variables que representan los diámetros de las piezas con el proceso antiguo y nuevo respectivamente. Las dos poblaciones se distribuyen normalmente con varianzas desconocidas. 1. Hipótesis: H0:  12 =  22 H1:  12 >  22 2. Nivel de significación:  = 0.05 3. Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera la hipótesis nula Ho, para n1 = 8 y n2 = 6, la estadística de prueba es: S12 F  2  f 7 ,5 S2 4. Región crítica: para  = 0.05 y la prueba unilateral derecha, f7,5, 0.95 = 4.88 es: R.C. = {F > 4.88} 5. Cálculos: con los datos de la muestra se obtiene: S12 = 4.125, S 22 = 2 y Fcalc  6. S12 4.125  = 2.0625 2 S 22 Decisión. Como Fcalc = 2.0625  R.A. se acepta Ho y concluimos que la varianza de los diámetros con el nuevo proceso no es menor que con el proceso antiguo, sino las dos varianzas son iguales con el 5% de significación. Nota. Si se construye el intervalo de confianza del 95% para la razón de varianzas, éste resultará ser:  12 /  22 ϵ [0.301; 10.91] con el 95% de confianza. Entonces, se acepta que  12 /  22 = 1, porque pertenece al intervalo de confianza. Por lo tanto, se concluye que  12   22 con el 95% de confianza, es decir que la varianza de los diámetros con el nuevo proceso es igual a la del proceso antiguo.  Para hallar el valor-P, como Fcalc = 2.0625 > 1 se obtiene así: 273 P = 2 P[f7,5 > 2.0625] = 2{1 - P[f7,5 ≤ 2.0625]} > 0.10 (en Excel = 0.4428). Rpta. Ya que en la Tabla 4, de la distribución F, para 7 y 5 grados de libertad la probabilidad acumulada hasta 2.0625 es menor a 0.95 (en Excel es 0.7786). Como P = 0.4428 >  = 0.05, se acepta la hipótesis nula y se concluye también con el 5% de significación, que la varianza de los diámetros con el nuevo proceso no es menor que con el proceso antiguo, sino las varianzas son iguales. Cálculos utilizando Minitab En la Ventana de Datos (Hoja de trabajo), en la columna C1 definir la variable diámetro Antiguo-1 e ingresar los 8 valores de la muestra y en la columna C2 definir la variable diámetro Nuevo-2 e ingresar los 6 valores de la muestra. Del menú escoger Estadísticas → Estadísticas básicas → σ21 σ22 2 varianzas y aparece la Ventana 2 varianzas siguiente: Como los datos muestrales aparecen en las columnas C1 y C2, se escoge Muestras en diferentes columnas y se selecciona en el recuadro de Primera: la columna C1 Antiguo-1 y en el recuadro de Segunda: la columna C2 Nuevo-2. Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y escribir el Tamaño de muestra: y la Varianza: (de la muestra) correspondiente a la Primera: y Segunda: muestra. Lo que sigue es igual para ambos casos. 274 Escoger Opciones… → Nivel de confianza: 95.0. Colocar un Título: (del gráfico) Varianza antigua vs Varianza nueva. Luego escoger Aceptar y Aceptar En la hoja de Sesión aparecen los resultados siguientes: Prueba de varianzas iguales: Antiguo-1, Nuevo-2 Intervalos de confianza de Bonferroni de 95% para desviaciones estándares Antiguo-1 Nuevo-2 N 8 6 Inferior 1.27062 0.82920 Desv.Est. 2.03101 1.41421 Superior 4.65199 4.04599 Prueba F (distribución normal) Estadística de prueba = 2.06, valor p = 0.443 Prueba de Levene (cualquier distribución continua) Estadística de prueba = 1.25, valor p = 0.286 Aparecen los resultados antes obtenidos: Fcalc = 2.0625 y el valor-P = 0.4428. Si se observan los intervalos de confianza de Bonferroni, en la gráfica de Varianza antigua vs Varianza nueva, se puede apreciar que estos se entre cruzan, indicando que las varianzas (y desviaciones estándar) son iguales. Varianza antigua vs Varianza Nueva Prueba F Estadística de prueba Valor P Antiguo-1 2.06 0.443 Prueba de Levene Estadística de prueba Valor P Nuevo-2 1 2 3 4 5 Intervalos de confianza de Bonferroni de 95% para Desv.Est. Antiguo-1 Nuevo-2 12 14 16 18 Datos 20 275 22 24 1.25 0.286 X 1 . contra H1: 1  2 o 1 .Z1-/2 o Z > Z1-/2} 276 . la estadística de prueba es: Z  X1  X 2  12 n1 Su valor Zcalc = X1  X 2  12 n1   22   22  N (0. pero n1 y n2 son suficientemente grandes (n1 > 30 y n2 > 30)./n1) y N(2. la estadística de prueba es: Z X 1  X 2  (1   2 )  12 n1   22 → N(0. entonces.  22 . se n2 utiliza para probar Ho: 1 = 2 contra cualquiera de las hipótesis alternativas H1: 1  2 ó H1: 1 > 2 ó H1: 1 < 2 La estructura de la prueba es similar a los casos descritos usando la distribución Z. Entonces: X 1 .2. con medias 1 y 2 y varianzas 12 y 22 conocidas. = {Z < .1) n2 que resulta de dos muestras independientes.C. entonces.2 ≠ 0. Prueba bilateral o de dos colas Si se prueba H0: 1 = 2 o 1 .X tiene distribución normal N(1 . Si las dos poblaciones son normales. Según sean las dos poblaciones normales o no./n2) para n1 > 2. n2 Si suponemos verdadera la hipótesis nula H0: 1 = 2 ó 1 . 2 12 /n1+  22 /n2).2 = 0.5 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas conocidas) Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones independientes. la región crítica en el rango de variación de Z es: R.1).2. y n2 > 2. 12 /n1+  22 /n2).2 = 0.6. 12 . A.X 2 tiene aproximadamente distribución normal N(1 . Si las dos poblaciones no son normales. las estadísticas X 1 y X 2 tienen respectivamente distribución normal N(1. entonces.2 < 0. Se acepta H0. = {Z < .C.Cuando las hipótesis son de la forma: 1) H0: 1 . 277 .C.A.Z1- } Nota 1. en caso contrario. de manera que:  Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] Si el valor de P < .2 = d0 contra H1: 1 ..2 = 0.2 > d0 3) H0: 1 .C.Se usa el intervalo de confianza I.2 = d0 contra H1: 1 . a partir del valor Zcalc. la región critica en la variación de Z es: R. 1) según sean las dos poblaciones normales o no.2 < d0 La estadística de la prueba es: Z X 1  X 2  d0  12 n1   22 n2 Cuya distribución es aproximadamente normal N(0. Prueba unilateral de la cola derecha Si se prueba H0: 1 = 2 o 1 .2 = d0 ϵ I. Otra forma de establecer la regla de decisión.C.C. Prueba unilateral de la cola izquierda Si se prueba H0: 1 = 2 o 1 .2 = 0. Nota 2. contra H1: 1 < 2 o 1 .) o su diferencia asume un valor determinado (si ocurre que 1 . (o si Z calc R. a fin de verificar si las medias son iguales (cuando se cumple que 1 . Se rechaza H0 con riesgo igual a .B.2 = d0 contra H1: 1 . No se rechaza H0 en caso contrario. la región critica en la variación de Z es: R. al 100(1– α)% para la diferencia de medias 1 2. contra H1: 1 > 2 o 1 .2  d0 2) H0: 1 .2 = 0 ϵ I.C.).2 > 0. = {Z > Z1- } C. es calculando el valor P (probabilidad mínima para rechazar Ho). ). se rechaza H0. si Z calc R. 190   2.190 segundos. a) Al nivel de significación del 5%. la región crítica es: R.si se supone verdadera la hipótesis Ho y para muestras grandes. b) Al nivel de significación del 5%.230  1. para fabricar un tipo de artículo. Hipótesis: H0: A = B contra H1: A > B 2. ¿se puede inferir que la media de B es menor que la media de A en menos de 7 segundos? Hallar el valor P.Un fabricante quiere comparar los tiempos de proceso de dos marcas de máquinas A y B.Ejemplo 7. en la Tabla 1. = Error estándar = Z calc   A2 nA   B2 nB 120 2 90 2   = 19.05. B sus medias respectivas. distribución de Z se encuentra el valor Z0.05 y una prueba unilateral de la cola derecha.230 y 1.C. Estadística de prueba. Región Crítica. Al observar dos muestras aleatorias de 60 artículos procesados por A y B respectivamente. de los datos se tiene: nA = nB = 60.S. Para determinar si la máquina B es más rápida que la A. 1) nB 4. Luego. 3. Para = 0.95 = 1..365 278 .645. encuentra que las medias respectivas son 1. pero las muestras son grandes (nA = nB = 60 > 30).365 60 60 x A  x B 1. = {Z > 1. Se desconocen las distribuciones de probabilidades de XA y XB. Suponga A = 120 y B = 90 segundos. A = 120 y B = 90 E. Solución Sean XA y XB los tiempos de proceso con las máquinas A y B respectivamente y A. la estadística apropiada es: XA XB Z  A2 nA   B2  N (0. se comparan sus tiempos promedios de proceso: A > B.07 ES 19. Cálculos. Nivel de significación: = 0. x B = 1190.645} 5. a) 1. ¿se puede inferir que la máquina B es más rápida que la máquina A? Hallar el valor P. x A = 1230. entonces se rechaza la Ho y se acepta H1: A > B. Decisión: ya que Zcalc = 2. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y aparece la Ventana t de 2 muestras (prueba e intervalo de confianza) siguiente: Recordar que cuando las muestras son grandes t se aproxima a la normal estándar.07) = 1 – 0. Se concluye también con el 5% de significación que el equipo B utiliza menos tiempo promedio en el proceso de fabricación.07  R..C. la Media: y la Desviación estándar: correspondiente a la Primera: y Segunda: muestra respectivamente.01923 Rpta. debemos rechazar Ho y concluir con el 5% de significación que el equipo B utiliza menos tiempo en el proceso de fabricación. 279 .07] = 1 – Ф(2.6. Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:.05. Como P = 0.98077 = 0.01923 < = 0. El valor P para la cola derecha es: P = P[Z > Zcalc] = P[Z > 2. 0 Límite inferior 95% de la diferencia: 7.mu (2) Estimado de la diferencia: 40.7 ES 19.1) nB La región crítica de la prueba unilateral de la cola derecha al nivel  = 0.B > 7.A < – 7 o A . Escoger Opciones… → Nivel de confianza: 95.7  R. Lo que sigue es igual para ambos casos.B > 7.645 } ( x1  x 2 )  7 (1.021 (muy próximo al 0. Si H0 es verdadera.. En Diferencia de la prueba: dejar el 0.C.Nota: Si los datos muestrales aparecen en columnas.190)  7   1.365 Ya que Zcalc = 1.0.9 Prueba T de diferencia = 0 (vs. En la hoja de Sesión aparecen los resultados siguientes: Prueba T de dos muestras e IC Muestra 1 2 N 60 60 Media 1230 1190. >): Valor T = 2. se escoge Muestras en diferentes columnas: y se ingresa la Primera: y Segunda: columna en el recuadro correspondiente.0 Media del Error estándar 15 12 Diferencia = mu (1) .07 = T y el valor-P = 0. Escoger en Hipótesis alterna: mayor que.C.Est. debemos rechazar Ho y concluir que el tiempo promedio que utiliza la máquina B en el proceso es menor que el tiempo promedio de A en menos de 7 segundos.07 Valor P = 0.01923 encontrado con Z). es equivalente a plantear: B < A .0 Desv. = {Z > 1.230  1. Se debe probar H0: A . b) Probar que la media de B es menor que la media de A en menos de 7 segundos. la estadística de la prueba es: Z  (X A  X B )  7  A2 nA   B2  N (0.B = 7 contra H1: A .021 GL = 109 Aparecen los resultados antes obtenidos: Zcalc = 2.05 es 260 misma del caso a): Z calc  R. 280 . 120 90.7 o B . Luego escoger Aceptar y Aceptar. Se concluye también. >): Valor T = 1.04457 < = 0. entonces.6 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas desconocidas) Si las dos muestras aleatorias independientes de tamaños n1 y n2 se seleccionan respectivamente de dos poblaciones cuyas distribuciones no son normales con varianzas  12 y  22 supuestas desconocidas. Como P = 0.04457 Rpta. siempre que los tamaños de las muestras sean grandes. Luego escoger Aceptar y Aceptar.70 Valor P = 0. En Diferencia de la prueba: escribir 7.70 = T y el valor-P = 0.7] = 1 – Ф(1.Est.04457 encontrado con Z). 6.0 Media del Error estándar 15 12 Diferencia = mu (1) . n1  30 y n2  30 los parámetros  12 y  22 se estiman respectivamente por S12 y S22 .9 Prueba T de diferencia = 7 (vs. que el tiempo promedio que utiliza la máquina B en el proceso es menor que el tiempo promedio de A en menos de 7’’.046 GL = 109 Aparecen los resultados antes obtenidos: Zcalc = 1. entonces se rechaza la Ho y se acepta H1: A . 281 .0. En la hoja de Sesión aparecen los resultados siguientes: Prueba T de dos muestras e IC Muestra 1 2 N 60 60 Media 1230 1190. con el 5% de significación. Cálculos utilizando Minitab Los pasos son idénticos hasta antes de escoger Opciones… → Nivel de confianza: 95.046 (muy próximo al 0.95543 = 0. 120 90. Escoger en Hipótesis alterna: mayor que.B > 7.El valor P para la cola derecha es: P = P[Z > Zcalc] = P[Z > 1.0 Desv.7) = 1 – 0.0 Límite inferior 95% de la diferencia: 7.05.mu (2) Estimado de la diferencia: 40. Sean X 1 y X 2 las medias y S12 y S22 las varianzas de dos muestras aleatorias independientes pequeñas (n1 < 30 y n2 < 30 respectivamente) seleccionadas de dos poblaciones normales con medias 1 y 2 y varianzas  12 y  22 desconocidas.1) Las regiones críticas y las reglas de decisión para las pruebas de la hipótesis nula H0 : 1  2  0 (o H0 : 1  2  d0 ) contra una alternativa unilateral o bilateral son las mismas del método con varianzas conocidas. la estadística de prueba es: T X 1   X 2  ( 1  2 ) Sc2 Sc2  n1 n2  tn1  n2 2 donde el estimador de la varianza común  2 es: Sc2   n1  1 S12  (n2  1)S22 n1  n2  2 Si la hipótesis nula H0 : 1  2 es verdadera. 282 . y con varianzas desconocidas pero iguales 12   22 =  2 . Varianzas desconocidas pero iguales ( 12   22 ) Si las poblaciones son normales. entonces. entonces. A. se usa para probar H0 con una alternativa unilateral o bilateral. Veamos ambos casos. se utiliza la estadística: Z  X 1   X 2  ( 1  2 ) S12 / n1  S22 / n2  N (0. ya que pueden ser iguales (homogéneas) o diferentes (heterogéneas) cuya prueba se realiza mediante el test de hipótesis para la razón de varianzas del acápite 6.Para probar la hipótesis nula H0 : 1  2  0 contra una alternativa bilateral o unilateral. Estas varianzas desconocidas presentan dos casos.4. independientes. T Su valor: t  calc X1  X 2 S c2 S c2  n1 n2  t n1  n2 2 x1  x 2  n1  1 S12  (n2  1)S22  1    n1 n1  n2  2 1  n2  que resulta de dos muestras aleatorias. la estadística. S1 = 2.01 Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera la hipótesis nula Ho. para n1 = 16 y n2 = 16.125. S2 = 1. Hipótesis: H 0 :  12   22 .C. la estadística de prueba es: S12 F  2  f15.658.  R.125. Solución Datos: n1 = 16. n1  n2 2 o T  t1 / 2. dieron estos resultados: n1 = 16. x1 = 49. = {T   t1 . S2 = 1875. x 2 = 48. x 2 = 48.La estructura de la prueba es similar a la usada con la distribución de t. Con el 1% de significación. S1 = 2. Prueba bilateral o de dos colas Si se prueba H0 : 1  2 contra H1 : 1  2 la región crítica es el intervalo. 1 y 2.658.n1  n2 2 } 3. Hallar el valor-P. n1 n2 2 } Ejemplo 8 Se compararon dos marcas de llantas de automóvil. R.C. x1 = 49. H 1 :  12   22 .  Primero se debe probar si las varianzas de las duraciones de las llantas de ambas marcas son iguales o no.150 y n2 = 16.875. Prueba unilateral de cola a la derecha Si se prueba H0 : 1  2 contra H1 : 1  2 la región crítica es el intervalo R. dos muestras aleatorias de 16 llantas de cada marca. 1. Prueba unilateral de cola a la izquierda Si se prueba H0 : 1  2 contra H1 : 1  2 la región crítica es el intervalo.  = 0. = T  t1 / 2. n1  n2 2  2.15 S2 283 . respecto a su duración en Km.150 y n2 = 16.C. = {T  t1 . probar si son diferentes las duraciones medias de las llantas de ambas marcas. Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 16 y 16.31 S 22 1875 2 Decisión: como Fcalc = 1.01 y la prueba bilateral. Escoger Opciones… → Nivel de confianza: 95.27 1329.603 >  = 0. Hipótesis: H0 : 1  2 contra H1 : 1  2 284  = 0.603 Aparece el Fcalc = 1.60 3108.31. f15. para  = 0.Región crítica. así como la Varianza: (de la muestra) 4622500 y 3515625 correspondiente a la Primera: y Segunda: muestra respectivamente.C.246.07} Cálculos: con los datos de la muestra se obtiene: Fcalc  S12 2150 2  = 1.A. 15. Entonces: R. con el 1% de significación.31 de Desv.07 = 0.07.995 = 4. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → σ21 σ22 2 varianzas y aparece la Ventana 2 varianzas. con el 1% de significación. = {F < 0. en la Tabla 4 de la distribución F.01 y se concluye también que las varianzas de las duraciones de las llantas de ambas marcas son iguales. se obtiene los valores críticos: f15.0.246 o F > 4.  A continuación se prueba si son diferentes las duraciones medias de las llantas de ambas marcas. Luego escoger Aceptar y Aceptar. 0.005 = 1 / 4. 15. se acepta Ho y concluimos que las varianzas de las duraciones de las llantas de ambas marcas son iguales. 2150 1875 Bonferroni de 95% para Superior 3564.31 antes obtenido y el valor-P = 0. valor p = 0.Est. En la hoja de Sesión aparecen los resultados siguientes: Prueba de varianzas iguales Intervalos de confianza desviaciones estándares Muestra 1 2 N 16 16 Inferior 1524. 0.31  R.01 .66 Prueba F (distribución normal) Estadística de prueba = 1. x1 = 49. R.15  R. (1) En la Tabla 3. y bajo el supuesto que Ho es cierta se determina: Sc2   n1 1 S12  (n2 1)S22  15x21502  15x18752 tcalc  n1  n2  2 x1  x 2  Sc2 Sc2      n1 n2   16  16  2 49658  48125  4069062. S1 = 2.457 0.457  2.75} Con la información muestral: n1 = 16.108  0.042 0.975 2.975 x  0.15)] = 2[1 – x] …….0422 >  = 0.15] = 2[1 – P(T30 ≤ 2.5     16 16   = 4’069062.01 se acepta Ho y se concluye también que las duraciones medias de las llantas de ambas marcas son iguales.La estadística de prueba es: T  X1  X 2 S c2 S c2  n1 n2  t16162  t 30 Región crítica.108  x = 0.15 Decisión: como tcalc = 2.042 2. en la Tabla 3: t30. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y aparece la Ventana t de 2 muestras (prueba e intervalo de confianza) siguiente: 285 . = {T < -2. se determina x interpolando así: Tα P 2.990  0. para  = 0. 16. se acepta Ho y se concluye que las duraciones medias de las llantas de ambas marcas no son diferentes.5  2.15.990  2.9789 en (1) se obtiene: P-valor = 2 [1 – 0.  Para dos colas: P = 2P[T30 > 2.0422 Rpta.975 = 0.67 = 0.67x – 26..15 x 2.658.75.5 4069062.125.9789] = 0.150 x 2 = 48.01 y la prueba bilateral.A. no está el valor 2. Como el valor-P = 0. y n2 = S2 = 1875.995 = 2. 0.15  2.042  27.975  27.9789 Reemplazando x = 0. con el 1% de significación.C. T de student.75 o T > 2.975 x  0. no =): Valor T = 2. En la hoja de Sesión aparecen los resultados siguientes: Prueba T de dos muestras e IC Muestra 1 2 N 16 16 Media 49658 48125 Desv.15 Valor P = 0. la Media: y la Desviación estándar: correspondiente a la Primera: y Segunda: muestra respectivamente. 2150 1875 Media del Error estándar 538 469 Diferencia = mu (1) . Escoger Opciones… → Nivel de confianza: 95.01 y se concluye también que las duraciones medias de las llantas de ambas marcas son iguales.mu (2) Estimado de la diferencia: 1533 IC de 95% para la diferencia: (76. 2990) Prueba T de diferencia = 0 (vs.Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:.0. Luego escoger Aceptar y Aceptar. 286 .1917 Aparecen los resultados antes obtenidos tcalc = 2. con el 1% de significación. En Diferencia de la prueba: dejar el 0.Est. Seleccionar Asumir varianzas iguales.Est.040 GL = 30 Ambos utilizan Desv.040 >  = 0.15 y el valor-P = 0. Escoger en Hipótesis alterna: no es igual a. agrupada = 2017. S1 = 10 y n2 = 12.01 Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera la hipótesis nula Ho. Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han obtenido los siguientes resultados sobre el peso de las bolsas (en gramos): n1 = 12. Solución Datos: n1 = 12. para n1 = 12 y n2 = 12. entonces. la estadística de prueba usada es: T X 1   X 2  (1  2 ) S12 S22  n1 n2  tH 2  S12 S22     n n2  Donde: H   12 representa los grados de libertad.  Primero se debe probar si las varianzas de los pesos de las bolsas con detergente de ambas máquinas son iguales o no.11 S2 287 . con el 1% de significación ¿son diferentes los pesos medios de las bolsas con detergente de ambas máquinas? Hallar el valor-P.B. H 1 :  12   22 . 2  S12   S22       n1    n2  n1  1 n2  1 Dado que H rara vez es un entero. S2 = 4. x 2 = 495. se toma la parte entera (entero mayor de H). la estadística de prueba es: S12 F  2  f11. Hipótesis: H 0 :  12   22 . x 2 = 495. La prueba de hipótesis es similar a las trabajadas anteriormente con la distribución t. S1 = 10 n2 = 12. x1 = 505.  = 0. Ejemplo 9 Dos máquinas embolsan diariamente detergente de manera independiente. Varianzas desconocidas supuestas distintas  12   22 Si las varianzas de las dos poblaciones normales independientes son desconocidas supuestas diferentes. S2 = 4. y Asumiendo distribución normal para el peso de las bolsas. x1 = 505. 005 <  = 0. Luego escoger Aceptar y Aceptar.Región crítica.32. 11.47510 Desv.  A continuación se prueba si son diferentes los pesos medios de las bolsas con detergente de ambas máquinas.188 o F > 5.25 S 22 16 Decisión: Como Fcalc = 6.25  R.Est.18776 2.1991 8. valor p = 0.C.25 antes obtenido y el valor-P = 0.188.C.01 y la prueba bilateral. En la hoja de Sesión aparecen los resultados siguientes: Prueba de varianzas iguales Intervalos de confianza de Bonferroni de 99% para desviaciones estándares Muestra 1 2 N 12 12 Inferior 6. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → σ21 σ22 2 varianzas y aparece la Ventana 2 varianzas. 10 4 Superior 22. para  = 0. Escoger Opciones… → Nivel de confianza: 99. con el 1% de significación.25.005 Aparece el Fcalc = 6. con el 1% de significación. 0.995 = 5. 0. R.01 . así como la Varianza: (de la muestra) 100 y 16 correspondiente a la Primera: y Segunda: muestra respectivamente.32} Cálculos: con los datos de la muestra se obtiene: Fcalc  S12 100  = 6.005 = 1 / 5. 11.8796 Prueba F (distribución normal) Estadística de prueba = 6. Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 12 y 12. en la Tabla 4 de la distribución F se obtiene los valores críticos: f11. f11.0. se rechaza Ho y concluimos que las varianzas de los pesos de las bolsas con detergente de ambas máquinas son diferentes (  12   22 ).32 = 0. Hipótesis: H0 : 1  2 contra H1 : 1  2 288  = 0.01 y se concluye también que las varianzas de los pesos de las bolsas con detergente de ambas máquinas son diferentes (  12   22 ). = {F < 0. 0062 Como el valor-P (hallado interpolando en T) = 0. al 1% de significación. 505  495 = 3. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y aparece la Ventana t de 2 muestras (prueba e intervalo de confianza). en la Tabla 3: t14. x 2 = 495. Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:.22 100 16  12 12 Decisión: como tcalc = 3. En la hoja de Sesión aparecen los resultados siguientes: 289 .977} Datos del problema: n1 = 12.22] = 2[1 – P(T30 ≤ 3. S 22 = 16.C. En Diferencia de la prueba: dejar el 0. Escoger en Hipótesis alterna: no es igual a.01 y la prueba bilateral.La estadística de prueba es: T  X1  X 2 S12 S 22  n1 n2  t H  t14 2 2  S12 S 22   100 16         12 12   n1 n2  Donde: H = = = 14.0062 <  = 0.977 R.0. x1 = 505.995 = 2. Se concluye que los pesos medios de las bolsas con detergente de ambas máquinas sí son diferentes. Luego escoger Aceptar y Aceptar.22)] = 2[1 – 0. para  = 0. = {T < -2. 0. S12 = 100 y Tcalc  X1  X 2 2 1 2 2 S S  n1 n2  n2 = 12.43 ≡ 14 2 2 2 2 2 2 100 16      S1   S2          12 12   n n  1   2    12  1 12  1 n1  1 n2  1 Región crítica.  Para dos colas: P = 2P[T14 > 3. No seleccionar Asumir varianzas iguales.977 o T > 2. se rechaza Ho y se acepta H1 : 1  2 . Escoger Opciones… → Nivel de confianza: 99.9969] = 0.22  R.C. la Media: y la Desviación estándar: correspondiente a la Primera: y Segunda: muestra respectivamente.01 se rechaza Ho y se concluye también que los pesos medios de las bolsas con detergente de ambas máquinas son diferentes. al 1% de significación. al 1% de significación. Escoger el nivel de significación:  3.C. para realizar contrastes acerca de p se sigue los siguientes pasos: 1.C.22 Valor P = 0.00 Media del Error estándar 2. 1) pq n 4.00 Desv.0 495. = {Z < Zα = -Z1-α} para H1: p < p0 para H1: p > p0 5. los grados de libertad igual a 14 y el valor-P = 0. Con la información muestral y suponiendo que H0: p = p0 es cierta.Z1. = {Z > Z1-α}  R.7 PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN Suponga que se dispone de una muestra aleatoria de n observaciones.C. 19. Estadística de prueba: Z  pˆ  p → N(0. no =): Valor T = 3. Hipótesis: H0: p = p0 H1: p ≠ p0 o H1: p > p0. o H1: p < p0.74.Est.mu (2) Estimado de la diferencia: 10. = {Z < Zα/2 = .9 1. 6.α/2 o Z > Z1.α/2 } para H1: p ≠ p0  R.26) Prueba T de diferencia = 0 (vs.01 y se concluye también que los pesos medios de las bolsas con detergente de ambas máquinas son diferentes. obtenida de una población con una proporción p de éxitos (elementos que poseen un atributo particular). Si el número de observaciones de la muestra es grande y la proporción muestral observada es pˆ .Prueba T de dos muestras e IC Muestra 1 2 N 12 12 Media 505.00 IC de 99% para la diferencia: (0. La Región crítica de la prueba es:  R.006 <  = 0.006 GL = 14 Aparecen los resultados antes obtenidos tcalc = 3. 2.2 Diferencia = mu (1) .0 4. 10.22. hallar: Z calc  290 pˆ  p0 p0 q0 n . Asimismo.Donde pˆ  X # de éxitos en la muestra  = proporción de elementos que n n poseen un atributo particular en la muestra. es calculando el valor P (probabilidad mínima para rechazar Ho). (o si Z calc R.28 H1: p < 0. No se rechaza H0 en caso contrario. la hipótesis nula de que al menos la mitad de los compradores son capaces de decir el precio correcto.90 = -1. 6. n = 800. en caso contrario. = {Z < -1. X = 378 pˆ  378 / 800  0. Contrastar. se rechaza H0. Método del valor P (o P-valor o sig o Probab. etc. frente a la alternativa de que la proporción poblacional es menor de la mitad.56 p0 q0 0. Z calc  pˆ  p0 0. Decisión: se rechaza H0 con riesgo igual a . de manera que:  Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] Si el valor de P < . hallar el p-valor.28} Datos: p0 = 0.50.5 x0.C.50 La región crítica es R. ). 378 fueron capaces de decir el precio correcto de un artículo inmediatamente después de ponerlo en el carro. a partir del valor Zcalc.10 → Zα = -Z1-α = -Z0. Ejemplo 10 Una muestra aleatoria de 800 clientes de supermercados.4725 El estadístico del contraste es. Se acepta H0.C. Solución Denotemos por p la proporción poblacional de compradores capaces de decir el precio correcto en estas circunstancias.50  = 0.A. entonces.5 800 n 291 . entonces.) Otra forma de establecer la regla de decisión. Z calc R. Queremos contrastar las hipótesis:  H0: p ≥ p0 = 0. al nivel de significación del 10%.50  = -1.4725  0. Marcar Realizar prueba de hipótesis y escribir en Proporción hipotética: 0. se rechaza la hipótesis nula con el 10% de significación.C. Habilitar la opción Datos resumidos y escribir el Número de eventos: 378 (número de éxitos) y el Número de ensayos: 800 (tamaño de la muestra). Como el valor-P = 0.5 vs.Decisión: como Zcalc = –1.10 entonces se rechaza la hipótesis nula y se concluye también que menos de la mitad de los compradores son capaces de decir el precio correcto. Aparecen los resultados antes obtenidos Zcalc = -1. Escoger Opciones… → Nivel de confianza: 90. con el 10% de significación. Lo que sigue es igual para ambos casos.10 se rechaza la hipótesis nula y se concluye también que menos de la mitad de los compradores son capaces de decir el precio correcto.06 <  = 0.56] = Ф(-1. Escoger en Hipótesis alterna: menor que. p < 0. con el 10% de significación. Nota: Si los datos muestrales aparecen en una columna (1 para cada éxito y 0 para cada fracaso). Seleccionar Utilice la prueba y el intervalo basado en la distribución normal.56) = 0.06 <  = 0.495121 Valor Z -1.64 ϵ R. se escoge Muestras en columnas: y se ingresa dicha columna.05938 Rpta. En la hoja de Sesión aparecen los resultados siguientes: Prueba e IC para una proporción Prueba de p = 0. 292 .5 Muestra 1 X 378 N 800 Muestra p 0. Luego escoger Aceptar y Aceptar.56 y el valor-P = 0.472500 Límite superior 90% 0.56 Valor P 0.50. Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → 1P 1proporción y aparece la Ventana 1 proporción (prueba e intervalo de confianza).  P = P[Z < Zcalc] = P[Z < -1. Se concluye que menos de la mitad de los compradores son capaces de decir el precio correcto.060 Uso de la aproximación normal. n2 son grandes es: Z pˆ 1  pˆ 2  p1q1 p2 q2  n1 n2 pˆ 1  pˆ 2 1 1 pq    n1 n2  Para calcular Z. Donde: n2 X1: Es el número de éxitos en la muestra de tamaño n1 X2: Es el número de éxitos en la muestra de tamaño n2 El valor de la normal estándar Z. siendo estos parámetros las proporciones de éxito de dos poblaciones binomiales.p2 ≠ 0 o H1: p1 . Z pˆ 1  pˆ 2  ( p1  p2 ) → N(0. 293 . se estima el valor de p que aparece dentro del radical así: pˆ  X1  X 2 n1  n2 → qˆ = 1. La estadística de prueba en la cual se basa los criterios de decisión es la variable aleatoria: pˆ 1  pˆ 2 . es: Z calc  pˆ 1  pˆ 2 1 1  pˆ qˆ     n1 n2  Luego usando los puntos críticos de la curva normal estándar se puede hallar la región crítica para cada hipótesis alternativa. que tiene distribución normal.pˆ Entonces el valor de la estadística Z.8 PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES Contrastar las hipótesis: Ho: p1 = p2 = p o p1 . esto se cumple para muestras grandes la cual se aproxima a la distribución normal estándar.p2 = 0 Contra: H1: p1 < p2 o H1: p1 > p2 o H1: p1 ≠ p2 H1: p1 .p2 > 0 o H1: p1 . 1) p1q1 p2 q2  n1 n2 Si se selecciona muestras aleatorias independientes de tamaño n1 y n2 de una población binomial. cuando Ho es verdadera y n1. se calcula la proporción de éxitos pˆ 1 y pˆ 2 de cada muestra: pˆ 1  X1 n1 pˆ 2  y X2 .6.p2 < 0 Donde: p1 y p2 son parámetros. H1: p1 < p2 o H1: p1 > p2 o H1: p1 ≠ p2 H1: p1 . Escoger un nivel de significación . en caso contrario aceptar Ho. 4.C. de manera que:  Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] Si el valor de P < . La estadística de prueba es la variable aleatoria Pˆ1  Pˆ2 . Método del valor P (o P-valor o sig o Probab. Se acepta H0. 3.α/2 o Z > Z1. Para los cálculos se halla: pˆ 1  X1 . = {Z > Z1-α} para H1: p1 > p2  R.p2 = 0 puede ser una de las alternativas. se rechaza H0.p2 < 0 o H1: p1 .α/2 } para H1: p1 ≠ p2  R. si Z pertenece a la región crítica.C.C. 294 .p2 > 0 o H1: p1 . CUANDO LAS MUESTRAS SON GRANDES: 1. en caso contrario.) Otra forma de establecer la regla de decisión. entonces. 1) p1q1 p2 q2  n1 n2 Z Suponiendo que Ho es verdadera. Ho: p1 = p2 H1: o p1 . = {Z < Zα = -Z1-α} para H1: p1 < p2 5. Región Critica:  R. que tiene una distribución aproximadamente normal cuando n1 y n2 son grandes. = {Z < Zα/2 = . a partir del valor Zcalc.Z1. etc. Decisión: Rechazar: Ho.p2 ≠ 0 2. Es decir: pˆ 1  pˆ 2 → N(0.PASOS PARA PROBAR LA HIPOTESIS DE DOS PROPORCIONES. es calculando el valor P (probabilidad mínima para rechazar Ho). n1 pˆ 2  Luego: Z calc  X2 n2 pˆ  y X1  X 2 n1  n2 pˆ 1  pˆ 2 1 1  pˆ qˆ     n1 n2  6. entonces se desea probar las hipótesis:  Ho: p1 = p2 H1: p1 ≠ p2 y con α = 0.C.25 Decisión: como Zcalc = 1.96} pˆ 1  Datos: n1 = 203.975 = 1. la hipótesis nula de que las proporciones de anuncios cómicos de las revistas británicas y americanas son iguales. de que las proporciones poblacionales de anuncios humorísticos son la misma puede rechazarse para niveles de significación mayores que 20.228 x0.2113 La hipótesis nula Rpta.256  0.  n2 270 pˆ  X 1 52 = 0.2113 >  = 0. 56 eran humorísticos. X1  X 2 52  56 108 = 0. X2 = 56. = {Z < -1. no se rechaza la hipótesis nula con el 5% de significación.  n1 203 n2 = 270.772    203 270  = 1.96 o Z > 1.25) = 2 (0.772 El estadístico del contraste es: Z calc  pˆ 1  pˆ 2 1 1  pˆ qˆ     n1 n2   0.207 1   1 0. con el 5% de significación.10565) = 0. Contrastar. con el 5% de significación. 295 .96 La región crítica es R. pˆ 2  X2 56 = 0.207.05 → Z1 – α/2 = Z0. Se concluye que las proporciones de anuncios cómicos de las revistas británicas y americanas son iguales.8%. Como el valor-P = 0.25 ϵ R. De una muestra aleatoria independiente de 270 anuncios publicados en revistas americanas.228 y qˆ =   n1  n2 2 0 3 2 7 0 4 7 3 0. Solución Sea las proporciones poblacionales de anuncios humorísticos en revistas británicas y americanas: p1 y p2.256. Hallar p-valor. 52 eran humorísticos. X1 = 52.A. frente a una alternativa bilateral.05 no se rechaza la hipótesis nula y se concluye también que las proporciones de anuncios cómicos de las revistas británicas y americanas son iguales.Ejemplo 11 De una muestra aleatoria de 203 anuncios publicitados en revistas británicas.  P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = = 2 P[Z < -1.25] = = 2 Ф(-1. con el 5% de significación. Habilitar la opción Datos resumidos y escribir para la Primera: y Segunda: muestra en Eventos: 52 y 108 (número de éxitos) y en Ensayos: 203 y 403 (tamaño de la muestra).0283508. Nota: Si los datos muestrales aparecen en diferentes columnas (1 para cada éxito y 0 para cada fracaso). Dejar Diferencia de la prueba: 0.05 entonces no se rechaza la hipótesis nula y se concluye también que las proporciones de anuncios cómicos de las revistas británicas y americanas son iguales.p (2) diferencia: 0.0487502 la diferencia: (-0.125851) diferencia = 0 vs. Lo que sigue es igual para ambos casos.211 >  = 0.25 y el valor-P = 0.25 Valor P = Prueba exacta de Fisher: Valor P = 0. Seleccionar Utilice el cálculo agrupado de p para la prueba. se escoge Muestras en diferentes columnas: y se ingresa dichas columnas en Primera: y Segunda:. En la hoja de Sesión aparecen los resultados siguientes: Prueba e IC para dos proporciones Muestra 1 2 X 52 56 N 203 270 Diferencia = p Estimado de la IC de 95% para Prueba para la 0. 296 . Luego escoger Aceptar y Aceptar. Escoger en Hipótesis alterna: no es igual a.207407 (1) .256158 0.Cálculos utilizando Minitab Del menú escoger Estadísticas → Estadísticas básicas → 2P 2proporciones y aparece la Ventana 2 proporciones (prueba e intervalo de confianza).0. no = 0: Z = 1. 0.225 Aparecen los resultados antes obtenidos Zcalc = 1.211 Muestra p 0. Escoger Opciones… → Nivel de confianza: 95. μ2 = μ0 H1: Caso Estadístico de prueba Rechazar H0 si: μ1 . PARA LA MEDIA POBLACIONAL H0 : μ = μ0 Caso Estadístico de prueba Rechazar H0 si: Cuando la muestra es aleatoria de X ~ Zc > Z1 – α X  0 2 2 Z  c N (μ.H. Se toman dos muestras aleatorias Zc > Z1 – α X 1  X 2  0 Z  c μ1 .μ2 > μ0 2. n < 30.μ2 < μ0 independientes de poblaciones Tc < tα 1 2 1 2 2   μ1 . PARA LA PROPORCIÓN POBLACIONAL H0 : p = p0 Caso Estadístico de prueba La muestra es aleatoria y su tamaño es pˆ  p0 Zc  grande (n ≥ 30) p0q0 n Rechazar H0 si: Zc > Z1 – α Zc < Zα |Zc| > Z1 – α/2 PRUEBAS DE HIPÓTESIS PARA DOS PARÁMETROS H1:  12 >  22  12 <  22  12 ≠  22 P.μ2 ≠ μ0 |Tc| > t1 – α/2 Sp   normales. Zc < Zα / n |Zc| > Z1 – α/2 Cuando la muestra es aleatoria de X ~ Tc > t1 – α X  0 Tc   tn 1 N (μ. 297 . Fc < fα 1 2 S22 Fc <f α/2 o Fc > f1 – α/2 P.H. n  1 poblaciones normales. μ1 . σ ) con σ conocida o n ≥ 30.μ2 ≠ μ0 |Zc| > Z1 – α/2 normales con  1 y 2 n1 n2 conocidas o n1 y n 2 ≥ 30. Se toman dos muestras aleatorias Tc > t1 – α X 1  X 2  0 T   t c n  n  2 1 2 μ1 . con  1 y 2 n n 2   1 desconocidas pero iguales (varianzas homogéneas). PARA LA VARIANZA POBLACIONAL H0 : σ2 =  02 Caso Estadístico de prueba Rechazar H0 si: 2 La muestra es aleatoria de una población χ2c > χ21 – α (n  1)S 2 2 C    n 1 normal o aproximadamente normal.μ2 < μ0 independientes. χ2c < χ2α 2 0 χ2c < χ2 α/2 o χ2c > χ21 – α/2 P. de poblaciones Zc < Zα  12  22 2 2  μ1 . Tc < tα S/ n |Tc| > t1 – α/2 P. σ2) con σ2 desconocida.PRUEBAS DE HIPÓTESIS PARA UN SOLO PARÁMETRO H1: μ > μ0 μ < μ0 μ ≠ μ0 μ > μ0 μ < μ0 μ ≠ μ0 H1: σ >  02 2 σ2 <  02 σ2 ≠  02 H1: μ > μ0 μ < μ0 μ ≠ μ0 P. PARA LA IGUALDAD DE VARIANZAS POBLACIONALES H0 :  12 =  22 Caso Estadístico de prueba Rechazar H0 si: 2 Dos muestras aleatorias independientes de Fc > f1 – α S1 F   f c n  1 . PARA LA DIFERENCIA DE MEDIAS POBLACIONALES H0 : μ1 .H.H.μ2 > μ0 1.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 .p2 > p0 Dos muestras aleatorias independienZc > Z1 – α pˆ1  pˆ 2  p0 Z  c p1 . PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 .p2 = p0 H1: Caso Estadístico de prueba Rechazar H0 si: p1 .    n n2  Con: H   12 2  S12   S22       n1    n2  n1  1 n2  1 Tc > t1 – α Tc < tα |Tc| > t1 – α/2 P.H.p2 = 0 H1: Caso Estadístico de prueba Rechazar H0 si: p1 .p2 < p0 tes con n1 y n2 ≥ 30. Dos muestras aleatorias X 1  X 2  0  tH μ1 .p2 ≠ p0 |Zc| > Z1 – α/2 n1 n2 298 . Zc < Zα pˆ1qˆ1 pˆ 2qˆ2  p1 .p2 < 0 tes con n1 y n2 ≥ 30.p2 > 0 Dos muestras aleatorias independienZc > Z1 – α pˆ1  pˆ 2 Z  c p1 .μ2 ≠ μ0 normales con  12 y  22 n1 n2 desconocidas pero diferentes 2  S12 S22  (varianzas heterogéneas).H.μ2 > μ0 3.μ2 < μ0 independientes de poblaciones Tc  2 2 S S 1  2 μ1 .p2 ≠ 0 |Zc| > Z1 – α/2 pˆ qˆ    n1 pˆ 1  n2 pˆ 2 Con pˆ  n1 n2   n1  n2 P.μ1 . Zc < Zα 1 1 p1 . 1).0801. H1:   250 2. Nivel de significación:  = 0.75] = 2 P[Z < -1. ˆ  S  12 . Decisión: Puesto que Zcalc = -1. Solución a) Sea X la variable aleatoria definida como el peso de las bolsas de gelatina.975 = 1.75 ϵ R. no debemos rechazar H0 y concluir con un 5% de significación que se está cumpliendo con el contenido medio en las bolsas de gelatina. de los datos se tiene: n = 36..5  250  1. 299 . Región crítica: para  = 0. b) ¿Aceptaría usted que σ2 ≠ 250 gr2 por bolsa? Use α = 0. resultando una media de 246.6. en la Tabla 1 de la distribución normal estándar.05. Z / n 4. Cálculos. x  246.96 Luego. a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas? Hallar p-valor. Las bolsas de cierta marca de gelatina indican un contenido medio de 250 gramos.75|] = P[|Z| > 1. Halle p-valor.5.A. Se toma una muestra aleatoria de 36 bolsas. 3. Entonces:  Z calc  x   n  246.  P-valor = P[|Z| > |-1.05.96 o Z calc  1.  = 250. Hipótesis: H0:  = 250 gr.04006) = 0.75] = 2(0.9 PROBLEMAS RESUELTOS 1.05 y la alternativa bilateral. se encuentra el valor crítico: Z1-/2 = Z0. 1.5 gramos y una desviación típica de 12 gramos. Estadística de prueba: para muestras grandes (n ≥ 30) es:  X cuya distribución es N(0. la región crítica en la variable Z está dada por: RC  Z calc  1.96  5.75 12 36 6. 01 x  0.2.C. Hipótesis : H0: σ2 = 250 2.025  0. no está el valor 20. {X2 < 20.2 < n – 1 = 35 el valor-P se obtiene así: 2 2 P = 2 P[  n21 <  calc ] = 2 P[  35 < 20.6  18. la región crítica es: R. en la tabla 2 de chi-cuadrado se encuentran los siguientes valores críticos: 2 / 2.2 x  20.5 (con probabilidad 0. 35  20.n1   02.05 3.5 20.2  R. se rechaza H0: σ2 = 250 y concluimos que la varianza de las bolsas de gelatina es diferente a 250 gr2 por bolsa. con el 5% de significación. para 35 grados de libertad.5  140 = 1.7  0.01 300 .975.5 0.6 (con probabilidad 0.01 x  0. la estadística de prueba es: (n  1)S 2 2   35 250 4. entonces.0801 >  = 0. y suponiendo verdadera 2  la (n  1)S 2 2 hipótesis  H0. (1) Como en la tabla 2. de chi-cuadrado.35  53.05 y para un contraste bilateral.6 y 12 / 2. pero éste se encuentra entre los valores 18. con n = 36.6 o X2 > 53.025) se determina x interpolando de la siguiente manera: X2 P 18.Como el valor-P = 0.01 20.2 250 250 250 2 6. Cálculos: De los datos de la muestra resulta S2 = 122 = 144. se siguen los siguientes pasos: H1: σ2  250 1.2 Luego. Decisión: Como  calc = 20. 2  Como la prueba es bilateral y  calc = 20.2] = 2 x ……. 2  calc  (n  1)S 2 35S 2 35 (144)    20.01) y 20.n1   02. Nivel de significación:  = 0.2} 5. Estadística de prueba: población normal.05 no se rechaza Ho y se concluye también con un 5% de significación que se está cumpliendo con el contenido medio en las bolsas de gelatina. b) Para verificar la hipótesis acerca de la varianza.C. Región crítica: Para  = 0.2  18.025. / n 171 / 31 6. Decisión: se acepta H0.0443 <  = 0. Como el valor-P = 0.0113. en la Tabla 1 de la distribución normal estándar. Luego.  P-valor = P = P[Z < -2.70  x = 0. a) Aceptaría usted que el verdadero tiempo promedio de vida de los artículos de la empresa es menor de 45 090 horas.01. De los datos se tiene: n = 31.01 y determine p-valor.C = {Zcalc < -2.A. Halle p-valor.01 = -Z0. Región crítica: para  = 0. se tomó una muestra aleatoria de 31 artículos. 3.28 ϵ R.01 y la alternativa unilateral izquierda.33}  x  45020 .02214 en (1) se obtiene: P = P-valor = 2{0. Por lo tanto.28] = 0.0443 Rpta.1). Use  = 0.40 = 1.025  140 x – 1.20. encontrándose los resultados siguientes: x = 45020 horas y S = 171 horas. la región crítica está dada por: R. Hipótesis: H0:  = 45090 horas H1:  < 45090 2. Rpta. 5.  = 45090. 301 . b) ¿Aceptaría usted que σ ≠ 200 horas por artículo? Use α = 0.05. se encuentra el valor crítico: Z = -Z1- → Z0.99 = -2.  Entonces: Z calc x  45020  45090    2. 1. En un estudio para determinar si ha disminuido el tiempo de vida (en horas) del artículo producido por una empresa.05 se rechaza H0: σ2 = 250. Solución a) Sea X la variable aleatoria definida como el tiempo de vida del artículo.6 0.33. se concluye al 1% de significación que el tiempo promedio de vida de los artículos de la empresa es igual a 45 090 horas.02214 Reemplazando x = 0. Z / n 4.02214} = 0. ˆ  S  171 . Nivel de significación:  = 0. Estadística de prueba: para muestras grandes (n ≥ 30) es:  X cuya distribución es N(0. 2. se concluye también con un 5% de significación que la varianza de las bolsas de gelatina es diferente a 250 gr2 por bolsa. 2  Como la prueba es bilateral y  calc = 21. para 30 grados de libertad.n1   02.6 21.8 y 12 / 2.10 302 .9.6  28 = 1. 30  16. Cálculos: De los datos de la muestra resulta S2 = 1712 = 29 241. de chi-cuadrado. se siguen los siguientes pasos: 1.8 o X2 > 47.6 0.025.05 3. 2  calc  (n  1)S 2 30S 2 30 (29241)    21. no se rechaza H0: σ = 200 y concluimos que la desviación estándar del tiempo de vida de los artículos de la empresa es igual a 200 horas. se determina x interpolando de la siguiente manera: X2 P 20.01 se acepta Ho y se concluye también con  = 0.9 x  23.10 x  0.4  20.01 que el tiempo medio de vida de los artículos de la empresa es de 45 090 horas. Región crítica: Para  = 0. y suponiendo verdadera 2  H0. Decisión: Como  calc = 21.10 21.0 Luego.9 40000 40000 40000 2 6. {X2 < 16.A.C.10 x  0. (n  1)S 2 2  la estadística de prueba es: (31  1)S 2 2   30 40000 4.30  47. Hipótesis: H0: σ = 200 → σ2 = 40000 H1: σ  200 → H1: σ2  40000 2. Estadística de prueba: población normal.9  20. b) Para verificar la hipótesis acerca de la varianza. en la tabla 2 de chi-cuadrado se encuentran los siguientes valores críticos: 2 / 2. la región crítica es: R. entonces.9  R.0} 5. no está el valor 21.9] = 2 x …….9 < n – 1 = 30 el valor-P se obtiene así: 2 2 P = 2 P[  n21 <  calc ] = 2 P[  30 < 21. (1) Como en la tabla 2.05 y para un contraste bilateral. con el 5% de significación.20  0.n1   02. con n = 31.0113 >  = 0. Nivel de significación:  = 0.975.Como P = 0.3  0. resultando una media de 495 gr. se concluye al 5% de significación que no se está cumpliendo con el contenido medio en las bolsas de sal.05 y la alternativa bilateral.23. Un proceso está programado para embolsar la cantidad media de 500 gramos de sal. Estadística de prueba: para muestras grandes (n ≥ 30) es:  X cuya distribución es N(0. Región crítica: para  = 0.96 Luego. b) ¿Aceptaría usted que σ2 < 200 gr2 por bolsa? Use α = 0.  = 500.32|] = P[|Z| > 2.20 28 x – 2.32] = 2 P[Z < -2.32] = 2(0. en la Tabla 1 de la normal estándar. De los datos se tiene: n = 41. a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas de sal? Halle p-valor. Z / n 4. Solución a) Sea X la variable aleatoria definida como el contenido de sal en las bolsas.02034.32 ϵ R.1). Decisión: se rechaza H0 y se acepta H1:  ≠ 500. y una desviación típica de 12 gr. Hipótesis: H0:  = 500 gr.3  x = 0.2928 Rpta.96 o Z calc  1.C. Nivel de significación:  = 0.05 se acepta H0: σ = 200. la región crítica en la variable Z está dada por: RC  Z calc  1. H1:  ≠ 500 2.8 = 1. 3. 303 .1464 Reemplazando x = 0.975 = 1. Se toma una muestra aleatoria de 41 bolsas.01017) = 0.2928 >  = 0. ˆ  S  12 .  Entonces: Z calc x  495  500    2.4  0. se concluye también con un 5% de significación que la desviación estándar del tiempo de vida de los artículos de la empresa es igual a 200 horas.  / n 12 / 31 6. 1. 5. se encuentra el valor crítico: Z1-/2 = Z0.01.96  x  495. Como el valor-P = 0.1464 en (1) se obtiene: P = P-valor = 2{0.  P-valor = P[|Z| > |-2. Rpta. Halle p-valor.05 3. Por lo tanto.1464} = 0. 8] = x …….10  52 x – 2.3  0.01 y para un contraste unilateral izquierdo.0942 304 Rpta.6 = 2.Como P = 0.8  26. Hipótesis: H0: σ2 = 200 gr2 H1: σ2 < 200 gr2 2.5 0.01 3.01.0942 en (1) se obtiene: P = P-valor = 0.8 x  29.2} 5.1 0.1  26. de chi-cuadrado.8. (1) Como en la tabla 2.05 se rechaza Ho y se concluye también con  = 0. la región crítica es: R.0942 Reemplazando x = 0. y suponiendo verdadera   2 (n  1)S 2 2 H0. se siguen los siguientes pasos: 1.10  0. con n = 41. la estadística de prueba es: (41  1)S 2 2    40 200 4.A.05 x  0.  Como la prueba es unilateral a la izquierda el valor-P se obtiene así: 2 2 P = P[  n21 <  calc ] = P[  40 < 28.05.5 28. Cálculos: De los datos de la muestra resulta S2 = 122 = 144. b) Para verificar la hipótesis acerca de la varianza. que no se está cumpliendo con el contenido medio en las bolsas de sal.8  R.05 29. no está el valor 28. entonces. para 30 grados de libertad.3  x = 0.05 x  0.05 28. {X2 < 22. no se rechaza H0: σ2 = 200 y concluimos que la varianza del contenido en las bolsas de sal es igual a 200 gr2. con el 1% de significación. Decisión: Como  calc = 28. Estadística de prueba: población normal.5  52 = 2.C.02034 <  = 0. n1   02. . se determina x interpolando de la siguiente manera: X2 P 26. 40  22. Región crítica: Para  = 0. en la tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente: 2.  2 calc (n  1)S 2 40S 2 40 (144)     28.2 Luego. Nivel de significación:  = 0.8 200 200 200 2 6. Decisión: no se rechaza H0:  = 410 y se concluye al 1% de significación. Halle p-valor.01.01 no se rechaza Ho y se concluye también con  = 0. que el aumento de peso neto medio de los animales es igual a 410 gr.  / n 60 / 50 6.18] = 1 . Sus aumentos de pesos arrojan los valores x = 420 gr. b) Con α = 0. 5.P[Z ≤ 1.99 = 2. y S = 60 gr.01 y la alternativa unilateral derecha. 4.05 se acepta H0: σ2 = 200. ˆ  S  60 . Z / n 4.0942 >  = 0. H1:  > 410 2.01 ¿Será rechazada la hipótesis σ2 = 2500 gr2 a favor de σ2 > 2500? Halle p-valor. se concluye también con el 1% de significación. Como valor-P = 0.Como el valor-P = 0. se encuentra el valor crítico: Z1- = Z0. que la varianza del contenido en las bolsas de sal es igual a 200 gr2. Región crítica: para  = 0.33  x  420.119 >  = 0.18 ϵ R.1). a) ¿Hay razón para creer que el aumento de peso neto medio poblacional es mayor a 410 gr? Use α = 0.119 Rpta. que el aumento de peso neto medio de los animales es igual a 430 gr. en la Tabla 1 de la normal estándar. Nivel de significación:  = 0.01 3. Solución a) Sea X la variable aleatoria definida como el aumento de peso en los animales.  P = P[Z > 1. Estadística de prueba: para muestras grandes (n ≥ 30) es:  X cuya distribución es N(0. De los datos se tiene: n = 50. Hipótesis: H0:  = 410 gr.01. 1. la región crítica en la variable Z está dada por: RC  Z calc  2. 305 .  Entonces: Z calc x  420  410    1.33 Luego.  = 410.18] = 1 – 0. Por lo tanto.881 = 0.A. Una muestra de 50 animales experimentales reciben una cierta clase de ración por un período de 2 semanas. 6  R. Cálculos: De los datos de la muestra resulta S2 = 602 = 3600.9 Luego.99.6] = 1 . se determina x interpolando de la siguiente manera: X2 70.b) Para verificar la hipótesis acerca de la varianza.5 = 0.6  313.9763 . no está el valor 70.99  0.9} 5.9 Reemplazando x = 0.A.975 74.2 P 0.P[  49 ≤ 70. de chi-cuadrado. Decisión: Como  calc = 70. no se rechaza H0: σ2 = 2500 y se concluye que la varianza del aumento del peso neto de los animales es igual a 2500 gr2. Región crítica: Para  = 0.4 x  0.01 3.2 70.3 = 0.0237 306 Rpta.  Como la prueba es unilateral a la derecha el valor-P se obtiene así: 2 2 2 P = P[  n21 >  calc ] = P[  49 > 70. Estadística de prueba: población normal.6  70. la región crítica es: R.6.3 x – 305.975 x  74. entonces.6] = 1 .  la estadística de prueba es: (50  1)S 2 2   49 2500 4. en la tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente: 12 .  x = 0. n1   02. con el 1% de significación.4 70.C.9  70. para 49 grados de libertad. se siguen los siguientes pasos: 1. 2  calc  (n  1)S 2 49S 2 49 (3600)    70.01 y para el contraste unilateral derecho.x …….9763 = 0.9763 en (1) se obtiene: P = P-valor = 1 – 0.975 0.2  0. Hipótesis: H0: σ2 = 2500 gr2 H1: σ2 > 2500 gr2 2.975 x  0.6 2500 2500 2500 2 6. (1) Como en la tabla 2. con n = 50. Nivel de significación:  = 0. 49  74. y suponiendo verdadera 2  (n  1)S 2 2 H0. {X2 > 74.99  313. Decisión: se rechaza H0 y se acepta H1:  ≠ 6. en la Tabla 1 de la normal estándar.2 días).975 = 1. b) Con α = 0.96 o Z calc  1. / n 4.  Entonces: Z calc x  3.96  x  3.2  6    3. Una universidad grande quiere estimar el número medio de días de enfermedad de los estudiantes durante un año.1).05 y la alternativa bilateral. Halle p-valor.05.96 Luego. Nivel de significación:  = 0. Solución a) Sea X la variable aleatoria definida como el número de días de enfermedad de los estudiantes durante un año. Por lo tanto.  / n 5.01 se acepta H0: σ2 = 2500.  = 6. ˆ  S  5. 5. la región crítica en la variable Z está dada por: RC  Z calc  1.2 / 50 6. que la varianza del aumento del peso neto de los animales es igual a 2500 gr2. a) ¿Hay razón para creer que el verdadero número medio de días de enfermedad es diferente a 6 días? Use α = 0.C. se concluye también con el 1% de significación. De los datos se tiene: n = 50.Como el valor-P = 0.2. Hipótesis: H0:  = 6 días H1:  ≠ 6 2. Estadística de prueba: para n ≥ 30 es: Z  → N(0. 5.2 días. 1. se concluye con el 5% de significación.01 ¿Será rechazada la hipótesis σ2 = 50 a favor de σ2 < 50? Halle p-valor. Región crítica: para  = 0. se encuentra el valor crítico: Z1-/2 = Z0.05  X 3.81 ϵ R.2 días y S = 5. 307 .2 . que el número medio de días de enfermedad de los estudiantes es diferente a 6 días (de acuerdo a los resultados estimados es de 3. una muestra de 50 estudiantes indica que x = 3.0237 >  = 0. 2  calc  (n  1)S 2 49S 2 49 (27. se siguen los siguientes pasos: 1. en la tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente: 2. {X2 < 28.000.01 se rechaza H0: σ2 = 50.0041 Como el valor-P = 0. Estadística de prueba: población normal.C. Por lo tanto. Nivel de significación:  = 0. 308 .01 y el contraste unilateral izquierdo. la región crítica es: R.04.5 50 50 50 2 6.000 <  = 0. y suponiendo verdadera 2  (n  1)S 2 2 H0. entonces.81|] = P[|Z| > 3. Hipótesis: H0: σ2 = 50 días2 H1: σ2 < 50 días2 2.C. con el 1% de significación (de acuerdo a los resultados estimados es de 27.81] = 2 P[Z < -3. 49  28. Región crítica: para  = 0. Cálculos: De los datos de la muestra resulta S2 = 5.81] = 2(0.0041 <  = 0.04 días2). b) Para verificar la hipótesis acerca de la varianza.9 Luego. Rpta. que la varianza del número de días de enfermedad de los estudiantes es diferente a 50 días2.9} 5.5  R. Como P = 0. se rechaza H0: σ2 = 50 y concluimos que la varianza del número de días de enfermedad de los estudiantes es diferente a 50 días2. con n = 50. n1   02.04)    26. P = P[|Z| > |-3.  la estadística de prueba es: (50  1)S 2 2   49 50 4. se concluye también con el 1% de significación.22 = 27.000) = 0.5] = 0.01. que el número medio de días de enfermedad de los estudiantes es diferente a 6. Decisión: Como  calc = 26.01 3.  Como la prueba es unilateral a la izquierda el valor-P se obtiene interpolando: 2 2 P = P[  n21 <  calc ] = P[  49 < 26.05 se rechaza Ho y se concluye también con  = 0.05. 70. se acepta H0 y se concluye con un 5% de significación que la nota promedio de los alumnos es de 70 puntos.  x  3. Halle p-valor. 79.05. 85.67]} = 2 (1 – 0.  Siendo la prueba bilateral. Suponga que estas calificaciones proceden de una población normal.50 >  = 0. con un nivel de significación del 5%.67] = 2{1 .262 Luego. 1. Solución a) Sea X la variable aleatoria definida como las calificaciones de los alumnos.08 / 10 6.75) = 0. T de student. Halle p-valor.262}  5.C = {T < -2. Como el valor-P = 0.67 ϵ R. 76. Hipótesis: H0: μ = 70 H1: μ ≠ 70 2. al valor 0. 309 . 74. Cálculos.05 y la alternativa bilateral. con un 5% de significación.50 Rpta. x = 73.75. Nivel de significación:  = 0.A.05. Decisión: puesto que Tcalc = 0. Región crítica: para  = 0..08 y μ= 70  Entonces: Tcalc x  73  70 = 0.262 o T > 2.P[T9 ≤ 0.975. n-1 = t0. 70. con un nivel de significación de 0. le corresponde una probabilidad acumulada de 0. con los datos se obtiene: n = 10. 67. b) Ponga a prueba H0: σ2 = 500 contra H1: σ2 ≠ 500. entonces p-valor = P es: P = P[|T9| > |0. Ya que en la tabla 3. 9 = 2. 94 y 81.05. a) Ponga a prueba H0: μ = 70 contra H1: μ ≠ 70. se encuentra el valor crítico en la Tabla 3: t1-/2.67   S / n 14. para 9 grados de libertad. 61. S = 14.67|] = 2 P[T9 > 0. que la nota promedio de los alumnos es de 70 puntos. la región crítica en la variable T es: R.6. Estadística de prueba: T  S/ n  t9 4. se acepta Ho: μ = 70 y se concluye también. Las calificaciones de diez estudiantes en un examen de estadística fueron: 43.67 = 0. 57 500 500 500 2 6.05 3. de chi-cuadrado.57.  la estadística de prueba es: (10  1)S 2   92 500 4. 2  Como la prueba es bilateral y  calc = 3.10  16.70 o X2 > 19.33 0. 2  calc  (n  1)S 2 9S 2 9 (198.064 .25)    3.0} 5.n1   02.05 3.25. {X2 < 2. y suponiendo verdadera 2  (n  1)S 2 2 H0.57  R.0 Luego.8 x – 0. para 9 grados de libertad. Nivel de significación:  = 0.57 x  4.57 < n – 1 = 9 el valor-P se obtiene así: 2 P = 2 P[  n21 <  calc ] = 2 P[  92 < 3. en la tabla 2 de chi-cuadrado se encuentran los siguientes valores críticos: 2 / 2.17  3. Región crítica: Para  = 0.064 en (1) se obtiene: P = P-valor = 2{0.24 Reemplazando x = 0.128 Rpta. Cálculos: De los datos de la muestra resulta S2 = 14. 9  2.9  19.57] = 2 x …….C. (1) Como en la tabla 2. no está el valor 3.05 y para un contraste bilateral.84 = 0. Estadística de prueba: población normal.05 x  0. se siguen los siguientes pasos: 1.n1   02. Hipótesis: H0: σ2 = 500 H1: σ2 ≠ 500 2. 310  x = 0.57  3.975.10  0. la región crítica es: R. no se rechaza H0: σ2 = 500 y se concluye que la varianza de las notas de los alumnos es igual a 500 puntos2. con el 5% de significación.33  16.24  0.025.8 = 0.70 y 12 / 2. entonces. se determina x interpolando de la siguiente manera: X2 P 3.082 = 198.05 x  0. Decisión: Como  calc = 3.05 4.33 3.A.17 0.b) Para verificar la hipótesis acerca de la varianza.064} = 0. con n = 10. con los datos se obtiene: n = 8.365}  5. se concluye también con un 5% de significación. 7 = 2.3  15 = 0. y una desviación típica de 1. Una muestra aleatoria de 8 paquetes da una media de 15. Halle p-valor. Suponga que los pesos se distribuyen normalmente. la región crítica en la variable T es: R.75) = 0. Decisión: puesto que Tcalc = 0.70 ϵ R.3 Kg. a) Con una significación del 5 % pruebe si el verdadero peso medio de los paquetes de arroz es distinto de 15 Kg. 7.365 Luego. S = 1.211 / 8 6. b) Ponga a prueba H0: σ2 = 5 contra H1: σ2 ≠ 5. Los pesos de los paquetes de arroz embolsado es de 15 Kg.70]} = 2 (1 – 0.05 se acepta H0: σ2 = 500. Nivel de significación:  = 0. Halle p-value. n-1 = t0.75. Por lo tanto. Cálculos. se acepta H0 y se concluye con un 5% de significación que el peso medio de los paquetes de arroz es igual a 15 Kg.Como el valor-P = 0. para 7 grados de libertad.70   S / n 1.50 Rpta. le corresponde una probabilidad acumulada cercana a 0. Región crítica: para  = 0. Solución a) Sea X la variable aleatoria definida como el peso de los paquetes de arroz. al valor 0. que la varianza de las notas de los alumnos es igual a 500 puntos2.70. 311 . 1.  x  3.3. T de student.C = {T < -2..05. con un α = 0. Hipótesis: H0: μ = 15 H1: μ ≠ 15 2.211 y μ= 15  Entonces: Tcalc x  15. Estadística de prueba: T  S/ n  t7 4.975.05 y la alternativa bilateral.P[T7 ≤ 0.  Siendo la prueba bilateral.211 Kg.A.05.70|] = 2 P[T7 > 0.70] = 2{1 .365 o T > 2. Ya que en la tabla 3. se encuentra el valor crítico en la Tabla 3: t1-/2. x = 15. entonces p-valor = P es: P = P[|T7| > |0.128 >  = 0. 05 y para un contraste bilateral.7  16.  2 calc (n  1)S 2 7S 2 7 (1.2 = . para 7 grados de libertad.05 3. Región crítica: Para  = 0. Nivel de significación:  = 0. con n = 8. Cálculos: De los datos de la muestra resulta S2 = 1. Decisión: Como  calc = 2. (1) Como en la tabla 2.36 x  0.69 o X2 > 16.0} 5.A.025 0. la región crítica es: R.975.025 312  19.025 x  0.05  0. se acepta Ho: μ = 15 y se concluye también.0 Luego.025 2. con el 5% de significación. 7  1. en la tabla 2 de chi-cuadrado se encuentran los siguientes valores críticos: 2 / 2.05. de chi-cuadrado. que el peso medio de los paquetes de arroz es igual a 15 Kg. la estadística de prueba es: (8  1)S 2    72 5 4. Hipótesis: H0: σ2 = 5 H1: σ2 ≠ 5 2. Estadística de prueba: población normal. no se rechaza H0: σ2 = 5 y se concluye que la varianza de los pesos de los paquetes de arroz es igual a 5 Kg2.69  0. entonces. b) Para verificar la hipótesis acerca de la varianza. se determina x interpolando de la siguiente manera: X2 1.2112 = 1.n1   02.05 < n – 1 = 7 el valor-P se obtiene así: 2 P = 2 P[  n21 <  calc ] = 2 P[  72 < 2.467. 2  Como la prueba es bilateral y  calc = 2.467)     2.05  R.05  1.025.C.05 x  2. y suponiendo verdadera   2 (n  1)S 2 2 H0. se siguen los siguientes pasos: 1. con un 5% de significación. {X2 < 1.05] = 2 x …….69 2.69 P 0. no está el valor 2.05.69 y 12 / 2.Como el valor-P = 0.n1   02.50 >  = 0.05 5 5 5 2 6.17  1. ¿Será rechazada la hipótesis σ2 = 30 amp2 a favor de σ2 < 30? Halle p-valor.0] = {1 . 8. 32. a) ¿Hay razón para creer que el verdadero punto medio de ruptura es mayor de 22 amperes? Use α = 0. n-1 = t0. 24 y 36.0 ϵ R.C = {T > 3.01.01..044} = 0.01. Como el valor-P = 0.05 se acepta H0: σ2 = 5. se rechaza H0 y se concluye con el 1% de significación que el punto medio de ruptura es mayor de 22 amperes. Solución a) Sea X la variable aleatoria definida como el punto de ruptura de los fusibles.  Siendo la prueba unilateral derecha.9915) = 0.48 = 0. 1. que la varianza de los pesos de los paquetes de arroz es igual a 5 Kg2.044 en (1) se obtiene: P = P-valor = 2{0. entonces p-valor = P es: P = P[T4 > Tcalc] = P[T4 > 4.0   S / n 4.99.C. se concluye también con un 5% de significación.36  x = 0. Región crítica: para  = 0. con los datos se obtiene: n = 5.2 x – 0. x = 30. la región crítica en la variable T es: R. Hipótesis: H0: μ = 22 amperes H1: μ > 22 2.0]} = (1 – 0. se encuentra el valor crítico en la Tabla 3: t1-.17 0. 4 = 3.0085 Rpta. Halle p-valor. Decisión: puesto que Tcalc = 4.747}  5. Los puntos de ruptura medidos en amperes fueron: 28.088 >  = 0. Cálculos. 313 .472 / 5 6.  x  3. Estadística de prueba: T  S/ n  t7 4.044 Reemplazando x = 0. S = 4.088 Rpta. Nivel de significación:  = 0.P[T4 ≤ 4. Por lo tanto.05  19. b) Con α = 0.2.01 y la alternativa unilateral derecha. Se prueba una muestra aleatoria de 5 fusibles de cierta marca para determinar el punto medio de ruptura.747 Luego.472 y μ= 22  Entonces: Tcalc x  30  22 = 4. 30. b) Para verificar la hipótesis acerca de la varianza. no se rechaza H0: σ2 = 30 y se concluye que la varianza de los puntos de ruptura de los fusibles es igual a 30 amp2. con el 1% de significación. {X2 < 0.67.0.67] = 0. la región crítica es: R. Nivel de significación:  = 0.3857 Como el valor-P = 0. n1   02. se rechaza Ho: μ = 22 y se concluye también. Como el valor-P = 0. 4  0. se concluye también con el 1% de significación.0085 <  = 0. con el 1% de significación. con n = 5.01.01 y para un contraste de la cola izquierda. se interpola y obtiene una probabilidad acumulada de 0. para 4 grados de libertad. se interpola y obtiene una probabilidad acumulada de 0.67 30 30 30 2 6. Decisión: Como  calc = 2. para 4 grados de libertad.297 Luego.01 3. T de student.67. 2  calc  (n  1)S 2 4S 2 4 (20)    2. entonces. no está el valor 4.  la estadística de prueba es: (5  1)S 2   42 30 4.01.67  R. Región crítica: Para  = 0. 2  Como la prueba es unilateral izquierda y  calc = 2. se siguen los siguientes pasos: 1. de chi-cuadrado. Estadística de prueba: población normal. no está el valor 2. 314 . Hipótesis: H0: σ2 = 30 amp2 H1: σ2 < 30 2.3857 Rpta. el valor-P se obtiene así: 2 P = P[  n21 <  calc ] = P[  42 < 2.3857 >  = 0.01 se acepta H0: σ2 = 30.C. en la tabla 2 de chi-cuadrado se encuentra el siguiente valor crítico: 2. y suponiendo verdadera 2  (n  1)S 2 2 H0.9915. Por lo tanto. que la varianza de los puntos de ruptura de los fusibles es igual a 30 amp2. que el punto medio de ruptura de los fusibles es mayor de 22 amperes.A. Cálculos: De los datos de la muestra resulta S2 = 20.Ya que en la tabla 3.297} 5. Ya que en la tabla 2. se interpola y obtiene una probabilidad acumulada de 0.61.25 y μ= 2. Halle pvalor. S = 0. con una desviación estándar de 0.25 / 25 6. Ya que en la tabla 3.25 galones.01. para 24 grados de libertad. entonces p-valor = P es: P = P[|T24| > |2.2|] = 2 P[T24 > 2. n-1 = t0.5 galones H1: μ ≠ 2.797 Luego.797 }  5. 24 = 2. no está el valor 2.01.2. T de student. Región crítica: para  = 0.01.995. con los datos se obtiene: n = 25. 1.5  Entonces: Tcalc x  2. Cálculos.61 galones cada 100 Km.P[T24 ≤ 2. y no puede dudarse de lo sustentado por el fabricante.. x = 2.2 ϵ R. Solución a) Sea X la variable definida como el número galones consumidos cada 100 Km. Decisión: puesto que Tcalc = 2.9.01 y la prueba es bilateral.98.50 = 2.50 galones de gasolina cada 100 Km. no se rechaza H0 y se concluye con el 1% de significación que el consumo medio de gasolina en los autos es de 2. la región crítica en la variable T es: R.2   S / n 0. Un vendedor de la compañía comprueba el consumo de gasolina de 25 autos y encuentra que el consumo medio es de 2. Halle p-valor.797 o T > 2.A. se encuentra el valor crítico en la Tabla 3: t1-/2.61  2. Un fabricante sostiene que sus autos consumen en promedio 2.2]} = 2 (1 – 0. Nivel de significación:  = 0. Hipótesis: H0: μ = 2. a) ¿puede dudarse de lo sustentado por el fabricante? Use α = 0.38? Use α = 0. Estadística de prueba: T  S/ n  t 24 4. b) ¿Será rechazada la hipótesis σ2 ≠ 0.04 Rpta.98) = 0.2] = 2{1 .5 galones cada 100 Km.C = {T < -2. 315 .  Siendo la prueba bilateral.5 2.  x  3. 95] = 2 (0. entonces.38 2.01.38 y se concluye que la varianza del consumo de gasolina en los autos por cada 100 Km. 316 .0005 ≡ 0.00) = 0.5 y se concluye también.89 o X2 > 45.0625)    3. Por lo tanto. de chi-cuadrado.38 0. Decisión: Como  calc = 3. con el 1% de significación. para 24 grados de libertad.95  R.000 Como el valor-P = 0. tiene una probabilidad acumulada menor de 0. Nivel de significación:  = 0. que la varianza del consumo de gasolina en los autos por cada 100 Km. con el 1% de significación.n1   02.C.89 y 12 / 2. es diferente a 0. y suponiendo verdadera 2  H0.95 0. Estadística de prueba: población normal.Como el valor-P = 0.C.38 galones2.995. Región crítica: Para  = 0. no se rechaza Ho: μ = 2. 24  45.95.252 = 0. con n = 5.6} 5.38.95 < n – 1 = 24 el valor-P se obtiene así: 2 2 P = 2 P[  n21 <  calc ] = 2 P[  24 < 3.005.000 Ya que en la tabla 2. Hipótesis: H0: σ2 = 0. que el consumo medio de gasolina en los autos es de 2.01 y para un contraste bilateral. la región crítica es: R. es diferente a 0. Cálculos: De los datos de la muestra resulta S2 = 0. en la tabla 2 de chi-cuadrado se encuentran los siguientes valores críticos: 2 / 2.38 galones2.04 >  = 0.38 4.01 se rechaza H0: σ2 = 0.0625. se rechaza H0: σ2 = 0. el valor 3.5 galones cada 100 Km.6 Luego. se concluye también con el 1% de significación.000 <  = 0.38 2 6.38 0. 2  calc  (n  1)S 2 24S 2 24 (0.n1   02. 2  Como la prueba es bilateral y  calc = 3. b) Para verificar la hipótesis acerca de la varianza. {X2 < 9. 24  9.38 galones2 H1: σ2 ≠ 0. (n  1)S 2 2  la estadística de prueba es: (25  1)S 2 2   24 0.01 3. se siguen los siguientes pasos: 1. 10. Una muestra de 25 clientes de cierta gasolinera indica que el número medio de galones comprados a la semana es de x = 14.3 y la desviación estándar de S = 2.7 galones. a) Con el 5 % de significación. ¿Hay razón para creer que el verdadero número medio de galones comprados a la semana por cliente es menor de 15.6? Determine el p-valor. b) Con α = 0.05 ¿Aceptaría usted que σ2 > 4.1? Determine el p-valor. Solución a) Sea X la variable definida como el número de galones de gasolina comprados a la semana por un cliente. 1. Hipótesis: H0: μ = 15.6 galones H1: μ < 15.6 2. Nivel de significación:  = 0.05.  x  3. Estadística de prueba: T  S/ n  t 24 4. Región crítica: para  = 0.05 y la prueba de la cola izquierda, se encuentra el valor crítico en la Tabla 3: t, n-1 = -t1-, n-1 → t0.05, 24 = -t0.95, 24 = -1.711. Luego, la región crítica en la variable T es: R.C = {T < -1.711}  5. Cálculos, con los datos se obtiene: n = 25, x = 14.3, S = 2.7 y μ= 15.6  Entonces: Tcalc x  14.3  15.6 = -2.41   S/ n 2.7 / 25 6. Decisión: puesto que Tcalc = -2.41 ϵ R.C., se rechaza H0 y se concluye con el 5% de significación, que el consumo medio semanal de gasolina por cliente es menor a 15.6 galones.  Siendo la prueba unilateral izquierda, entonces p-valor = P es: P = P[T24 < -2.41] = 1 - P[T24 ≤ 2.41] = 1 – 0.987 = 0.013 Rpta. Ya que en la tabla 3, T de student, para 24 grados de libertad, no está el valor 2.41, se interpola y obtiene una probabilidad acumulada de 0.987. Como el valor-P = 0.013 <  = 0.05, rechaza Ho: μ = 15.6 y se concluye también, con el 5% de significación, que el consumo medio semanal de gasolina por cliente es menor a 15.6 galones. 317 b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos: 1. Hipótesis: H0: σ2 = 4.1 galones2 H1: σ2 > 4.1 2. Nivel de significación:  = 0.05 3. Estadística de prueba: población normal, con n = 25, y suponiendo verdadera 2  (n  1)S 2 2 H0,  la estadística de prueba es: (25  1)S 2 2   24 4.1 4. Región crítica: Para  = 0.05 y para un contraste unilateral derecho, en la tabla 2 de chi-cuadrado se encuentran el siguiente valor crítico: 12 ,n1   02.95, 24  36.4 Luego, la región crítica es: R.C. {X2 > 36.4} 5. Cálculos: De los datos de la muestra resulta S2 = 2.72 = 7.29, entonces, 2  calc  (n  1)S 2 24S 2 24 (7.29)    42.7 4.1 4.1 4.1 2 6. Decisión: Como  calc = 42.7  R.C. se rechaza H0: σ2 = 4.1 y se concluye que la varianza de las compras de gasolina por cliente es mayor de 4.1 galones2, con el 5% de significación.  Como la prueba es unilateral derecha el valor-P se obtiene así: 2 2 2 P = P[  n21 >  calc ] = P[  24 > 42.7] = 1 - P[  24 ≤ 42.7] = 1- 0.99 = 0.01 Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor 42.7, tiene una probabilidad acumulada cercana a 0.99. Como el valor-P = 0.01 <  = 0.05 se rechaza H0: σ2 = 4.1. Por lo tanto, se concluye también con el 5% de significación, que la varianza de las compras de gasolina por cliente es mayor de 4.1 galones2. 11. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración en Km. Dos muestras aleatorias de 31 llantas de cada marca, dieron estos resultados: x1 = 46300, n1 = 31, S1 = 5000 y x 2 = 48100, n2 = 31, S2 = 6100. ¿Son diferentes las duraciones medias de las llantas de ambas marcas? Use α = 0.01. Determine p-valor. 318 Solución Sean X1 y X2 la duración (en Km.) de las llantas marca 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce la distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1 = n2 = 31 > 30). Para determinar si son diferentes las duraciones medias de las llantas de ambas marcas, se comparan sus duraciones medias: 1 ≠ 2. 1. Hipótesis: H0: 1 = 2 contra H1: 1 ≠ 2 2. Nivel de significación: = 0.01. 3. Estadística de prueba.- si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada es: Z X1  X 2  12 n1   22  N (0, 1) n2 4. Región Crítica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.995 = 2.575 Luego, la región crítica en la variable Z está dada por: RC = {Zcalc < -2.575 o Zcalc > 2.575} 5. Cálculos, de los datos se tiene: n1 = 31, x1 = 46300, S1 = 5000 y n2 = 31, x 2 = 48100, S2 = 6100. E.S. = Error estándar = Z calc  S12 S 22 5000 2 6100 2    = 1416.61 n1 n2 31 31 x1  x 2 46300  48100   1.27 ES 1416.61 6. Decisión: ya que Zcalc = -1.27  R.A., no se rechaza Ho y se concluye con el 1% de significación, que la duración media de las llantas marca 1 y 2 es la misma.  El valor P para la prueba bilateral es: P = P[|Z| > |-1.27|] = P[|Z| > 1.27] = 2P[Z < -1.27] = 2(0.10204) = 0.2041 Rpta. 319 Como P = 2041 >  = 0.01 no se rechaza Ho y se concluye también que la duración media de las llantas de marcas es la misma, con el 1% de significación. 12. Muestras del pago por hora para los choferes de camiones en las ciudades 1 y 2 proporcionan los siguientes datos: n1 = 35, x1 = $ 5.30, S1 = $ 0.16 y n2 = 40, x 2 = $ 5.40, S2 = $ 0.15. Con un nivel de significación del 1 %, probar si el pago medio por hora a los choferes de camión de la ciudad 1 es menor que el pago medio por hora a los choferes de camión de la ciudad 2. Hallar p-valor. Solución Sean X1 y X2 el pago por hora a los choferes de camión en las ciudades 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce las distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30). Para probar si el pago medio por hora a los choferes de camión de la ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2, se compara: 1 < 2. 1. Hipótesis: H0: 1 = 2 contra H1: 1 < 2 2. Nivel de significación: = 0.01. 3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada es: Z X1  X 2  12 n1   22  N (0, 1) n2 4. Región Crítica. Para = 0.01 y la alternativa unilateral izquierda, en la Tabla 1 de la normal estándar, el valor crítico es: Z = -Z1- → Z0.01 = -Z0.99 = -2.33. Luego, la región crítica está dada por: R.C = {Zcalc < -2.33} 5. Cálculos, de los datos se tiene: x1 = $ 5.30, n1 = 35, S1 = $ 0.16 0.15. 320 y x 2 = $ 5.40, n2 = 40, S2 = $ E.S. = Error estándar = S12 S 22 0.16 2 0.15 2    = 0.036 n1 n2 35 40 Z calc  x1  x 2 5.30  5.40   2.78 ES 0.036 6. Decisión: ya que Zcalc = -2.78  R.C., se rechaza Ho y se concluye con el 1% de significación, que el pago medio por hora a los choferes de camión de la ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2.  El valor P para la prueba unilateral izquierda es: P = P[Z < -2.78] = 0.0027 Rpta. Como P = 0.0027 <  = 0.01 se rechaza Ho y se concluye también que el pago medio por hora a los choferes de camión de la ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2, con el 1% de significación. 13. En un estudio para determinar el gasto medio semanal en alimentos en los hogares de las ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la ciudad 1 arrojando un gasto medio de S/. 150 y una desviación estándar de 35. Una muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 140 y una desviación estándar de 30. Probar si es diferente el gasto medio semanal en alimentos en las ciudades 1 y 2. Use α = 0.05. Hallar p-valor. Solución Sean X1 y X2 el gasto semanal en alimentos en los hogares de las ciudades 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce la distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30). Para determinar si es diferente el gasto medio semanal en alimentos en ambas ciudades, se comparan sus gastos medios: 1 ≠ 2. 1. Hipótesis: H0: 1 = 2 vs H1: 1 ≠ 2 2. Nivel de significación: = 0.05. 3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada es: Z X1  X 2  12 n1   22 n2 321  N (0, 1) 4. Región Crítica. Para = 0.05 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 = 1.96 Luego, la región crítica en la variable Z está dada por: RC = {Zcalc < -1.96 o Zcalc > 1.96} 5. Cálculos, de los datos se tiene: n1 = 200, x1 = 150, S1 = 35 E.S. = Error estándar = y n2 = 180, x 2 = 140, S2 = 30. S12 S 22 35 2 30 2    = 3.34 n1 n2 200 180 Z calc  x1  x 2 150  140 = 2.99  ES 3.34 6. Decisión: ya que Zcalc = 2.99  R.C., se rechaza Ho y se concluye con el 5% de significación, que el gasto medio semanal en alimentos en las ciudades 1 y 2 es diferente.  El valor P para la prueba bilateral es: P = P[|Z| > |2.99|] = P[|Z| > 2.99] = 2Ф(-2.99) = 2(0.00139) = 0.00278 Rpta. Como P = 0.00278 <  = 0.05 se rechaza Ho y se concluye también que el gasto medio semanal en alimentos de ambas ciudades es diferente, con el 5% de significación. 14. Se compararon los gastos mensuales (S/.) en educación en las ciudades 1 y 2; muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron estos resultados: n1 = 200, X 1 = 160, S1 = 60 y n2 = 150, X 2 = 150, S2 = 50. Use α = 0.05, para determinar si el gasto medio mensual en educación de la ciudad 1 es mayor que el gasto medio mensual en educación de la ciudad 2. Hallar el p-valor. Solución Sean X1 y X2 el gasto mensual en educación realizado por las familias de las ciudades 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce las distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30). Para determinar si el gasto medio mensual en educación de la ciudad 322 1 es mayor que el gasto medio mensual en educación de la ciudad 2, se comparan sus gastos medios: 1 > 2. 1. Hipótesis: H0: 1 = 2 contra H1: 1 > 2 2. Nivel de significación: = 0.05. 3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada es: Z X1  X 2  12 n1   22  N (0, 1) n2 4. Región Crítica. Para = 0.05 y la alternativa unilateral derecha, en la Tabla 1 de la normal estándar, se encuentra el valor crítico: Z1- = Z0.95 = 1.645. Luego, la región crítica en la variable Z está dada por: RC = { Zcalc > 1.645} 5. Cálculos, de los datos se tiene: n1 = 200, X 1 = 160, S1 = 60 E.S. = Error estándar = y n2 = 150, X 2 = 150, S2 = 50. S12 S 22 60 2 50 2    = 5.89 n1 n2 200 150 Z calc  x1  x 2 200  150 = 1.70  ES 5.89 6. Decisión: ya que Zcalc = 1.70  R.C., se rechaza Ho y se concluye con el 5% de significación, que el gasto medio mensual en educación de la ciudad 1 es mayor que el gasto medio mensual en educación de la ciudad 2.  El valor P para la prueba unilateral derecha es: P = P[Z > 1.70] = 1 – Ф(1.70) =1 – 0.95543 = 0.04457 Rpta. Como P = 0.04457 <  = 0.05 se rechaza Ho y se concluye también que el gasto medio mensual en educación de la ciudad 1 es mayor que el gasto medio mensual en educación de la ciudad 2, con el 5% de significación. 15. Para determinar el costo medio mensual de la enseñanza en las universidades A y B, se toma una muestra al azar de 121 alumnos de la universidad A arrojando un costo medio de S/. 650 y una desviación estándar de S/ 70. Una muestra al azar de 121 alumnos de la universidad B da una costo medio de S/. 675 y una desviación estándar de S/. 90. Con α = 0.01, probar si es diferente el costo medio mensual de la enseñanza en las universidades A y B. Hallar p-valor. 323 Solución Sean XA y XB el costo mensual de la enseñanza en las universidades A y B respectivamente y A, B sus respectivas medias. Se desconoce la distribución de probabilidades de XA y XB, pero las muestras son grandes (nA y nB > 30). Para determinar si es diferente el costo medio mensual de la enseñanza en ambas universidades, se comparan sus gastos medios: A ≠ B. 1. Hipótesis: H0: A = B vs H1: A ≠ B 2. Nivel de significación: = 0.01. 3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada es: Z XA XB  A2 nA   B2  N (0, 1) nB 4. Región Crítica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.995 = 2.575 Luego, la región crítica en la variable Z está dada por: RC = {Zcalc < -2.575 o Zcalc > 2.575} 5. Cálculos, de los datos se tiene: nA = 121, x A = 650, SA = 70 E.S. = Error estándar = y nB = 121, x B = 675, SB = 90. S A2 S B2 70 2 90 2    = 10.37 n A nB 121 121 Z calc  x A  x B 650  675 = -2.41  ES 10.37 6. Decisión: ya que Zcalc = -2.41  R.A., no se rechaza Ho y se concluye con el 1% de significación, que es igual el costo medio mensual de la enseñanza en las universidades A y B.  El valor P para la prueba bilateral es: P = P[|Z| > |-2.41|] = P[|Z| > 2.41] = 2Ф(-2.41) = 2(0.00798) = 0.01596 Rpta. 324 H1:  12 ≠  22 2. para según ello probar si las medias son diferentes.C.10 S 22 4.01596 >  = 0. probar si: a) ¿Son heterogéneas las varianzas de ambos turnos? Halle p-valor. dio un promedio de 74 con una desviación estándar de 7. La producción de 13 obreros de la jornada diurna. la estadística de prueba es: F S12  f12.975 = 3. = {F < 0. 0. 10.297 o F > 3.975 = 1/ 3. b) ¿Es diferente la producción media de los dos turnos? Halle p-valor. Con el 5% de significación (α = 0. Cálculos: con los datos de la muestra se obtiene: S12 = 100. dio un promedio de 82 piezas con una desviación estándar de 10. con el 1% de significación.62} 5. mientras que para 11 obreros de la jornada nocturna.05 3.297 y f12. 12.37 = 0. 0. Solución Sean X1 y X2 las variables que representan el número de piezas producidas en los turnos diurno (1) y nocturno (2) respectivamente.Como P = 0.05 y la prueba bilateral en la Tabla 4. S 22 = 49 y Fcalc  S12 100  = 2. 16. Región crítica. Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son heterogéneas. S1 = 10 a) 1. R. Datos: n1 = 13. 10. S2 = 7. los valores críticos F son: f12. para n1 = 13 y n2 = 11. Para  = 0. X 1 = 82. 0. Hipótesis: H0:  12 =  22 y n2 = 11. Nivel de significación:  = 0.025 = 1/ f10.62. X 2 = 74. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis nula cierta.05).01 se acepta Ho y se concluye también que el costo medio mensual de la enseñanza en ambas universidades es igual.04 49 S 22 325 . 074} 5.C. se acepta la hipótesis nula y se concluye también que las varianzas del número de piezas producidas en los turnos diurno y nocturno son homogéneas. Entonces: R.05 3.59 83. X 2 = 74. Rpta. X 1 = 82. para  = 0.04]} > 0. para 12 y 10 grados de libertad.P[f12. Nivel de significación:  = 0. con el 5% de significación. se acepta Ho y concluimos que las varianzas del número de piezas producidas en los turnos diurno y nocturno son iguales (homogéneas).05 y la prueba bilateral.04 > 1 se obtiene así: P = 2 P[f12. Región crítica.04] = 2 {1 . S1 = 10 y n2 = 11.10 > 2.A. Hipótesis: H0: 1 = 2 y H1: 1 ≠ 2 2.59  2.59   13  11    = 83.C. S2 = 7. Decisión.10 (en Excel 0. = {T < -2. Como P > 0. 0.6. en la Tabla 3: t22. con el 5% de significación. se rechaza Ho y se concluye con el 5% de significación.10 >  = 0. b) A continuación se prueba si es diferente la producción media de los dos turnos.0745 o T > 2. y bajo el supuesto que Ho es cierta se determina: S 2 c n1  1 S12  (n2  1)S22 13x102  11x72    tcalc  n1  n2  2 x1  x 2  Sc2 Sc2      n1 n2   13  11  2 82  74  83. Decisión: como tcalc = 2. 1.14  R. que la producción media de los dos turnos son diferentes.04  R.8663).975 = 2. Ya que en la Tabla 4 de la F. Con la información muestral: n1 = 13.  El valor P para la prueba bilateral y como Fcalc = 2.2674).04 es menor a 0.14 6.05.95 (en Excel es 0. 326 .074. Como Fcalc = 2. La estadística de prueba cuando las varianzas son homogéneas es: T X1  X 2 S c2 S c2  n1 n2  t13112  t 22 4.10 ≤ 2. la probabilidad acumulada hasta 2. Solución Sean X1 y X2 las variables que representan el peso de las latas con café (en gr.05 se rechaza Ho y se concluye también que la producción media de los dos turnos son diferentes.066 x  0. con el 5% de significación. X 1 = 495.05.14 x  2.0452 Rpta. S2 = 5.990  0. Para dos colas: P = 2P[T22 > 2.93x – 28. Como el valor-P = 0. a) ¿Son diferentes las varianzas de los pesos de las latas con café de ambas máquinas? Use  = 0. S2 = 5.14)] = 2[1 – x] ……. de latas con café tomadas de cada máquina. Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son diferentes.14] = 2[1 – P(T22 ≤ 2.15.0452 <  = 0. Halle p-valor. H1:  12 ≠  22 327 X 2 = 505.074 0.990  x = 0.9774 Reemplazando x = 0. se han obtenido los siguientes resultados sobre el peso de las latas (en gramos): n1 = 16.01 y determine p-valor. para según ello probar si es mayor el peso medio de las latas con café de la máquina 2 que el de la máquina 1.066  28. 17. X 2 = 505.508 0. .93 = 0.975 x  0. S1 = 9 y n2 = 16. Dos máquinas enlatan café independientemente. (1) En la Tabla 3. T de student. no está el valor 2..074  0. b) ¿Es mayor el peso medio de las latas con café de la máquina 2 que el de la máquina 1? Use  = 0. Mediante muestras aleatorias sin reemplazo. Hipótesis: H0:  12 =  22 y n2 = 16.074 2. X 1 = 495.21 = 0.975 2.508  2. se determina x interpolando así: Tα P 2.14  2. Datos: n1 = 16.) de las máquinas 1 y 2 respectivamente.9774 en (1) se obtiene: P-valor = 2 [1 – 0.975  28.9774] = 0.975 2. S1 = 9 a) 1. 15.975) y 3. 0. con el 5% de significación.984 en (1) se tiene: P = 2 {1 – 0. Como P = 0. la estadística de prueba es: F S12  f15. Decisión. se rechaza la hipótesis nula y se concluye también que las varianzas de los pesos de las latas con café de ambas máquinas son diferentes (heterogéneas). los valores críticos F son: f15. Como Fcalc = 3.99  44 x – 42.995 = 2. para n1 = n2 = 16. 328 . Cálculos: con los datos de la muestra se obtiene: S12 = 81.24  R. para 15 y 15 grados de libertad.05.2.24  2.24] = 2 {1 .86 = 0.15 ≤ 3.975 3.38  0.C.  El valor P para la prueba bilateral y como Fcalc = 3.9 = 0.975 x  0. 15.86 3.P[f15.35 o F > 2.99) para hallar x se interpola así: Fα P 2.24 > 1 se obtiene así: P = 2 P[f15. con el 5% de significación.24 x  3. S 22 = 25 y Fcalc  S12 81  = 3.52 0.38  x = 0. 0. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis nula cierta.86} 5.86 0.032 Rpta.15 > 3.C.05 3.15 S 22 4. no está el valor 3. (1) Como en la Tabla 4 de la distribución F.35 y f15.025 = 1/ f15. Región crítica.86 (con probabilidad 0.86  44 = 0.984 Reemplazando x = 0.975 = 1/ 2.99  0.975 3.24.24 S 22 25 6. = {F < 0.05 y la prueba bilateral en la Tabla 4. R.984} = 0. Para  = 0.975 x  0. se rechaza Ho y concluimos que las varianzas de los pesos de las latas con café de ambas máquinas son diferentes (heterogéneas). pero éste se encuentra entre los valores 2.86.52  2. 15.032 <  = 0.52 (con probabilidad 0. Nivel de significación:  = 0. 0.24]} = 2{1 – x} …….  Para la cola del lado derecho: P = P[T23 > 3. = {T > 2.01 y la prueba unilateral derecha.99 = 2.C. La estadística de prueba cuando las varianzas son heterogéneas es: T X 2  X1 S12 S 22  n1 n2  t H  t 23 2 2  S12 S 22   81 25        n1 n2   16 16   Donde: H = = = 23.0004) Rpta. S2 = 5. para  = 0.89 es mayor a 0. es mayor que el peso medio de las latas con café de la máquina 1. S1 = 9. Nivel de significación:  = 0. y bajo el supuesto que Ho es cierta se determina: tcalc  X 2  X1 S12 S22  n1 n2  505  495  3. Ya que en la Tabla 3 de la T.0005 <  = 0.50. con el 1% de significación. Decisión: como tcalc = 3. en la Tabla 3 el valor crítico es: t23.89  R. X 2 = 505. que el peso medio de las latas con café de la máquina 2 es mayor que el peso medio de las latas con café de la máquina 1.9995 (en Excel es 0. Región crítica. 1. Con la información muestral: n1 = 16. n2 = 16. X 1 = 495.89] = 1 .9996).01 se rechaza Ho y se concluye también que el peso medio de las latas con café de la máquina 2 es mayor que el peso medio de las latas con café de la máquina 1. se rechaza Ho y se concluye con el 1% de significación. Como el valor-P < 0.C. 329 .89] < 0.01 3.89 81 25  16 16 6.b) A continuación se prueba si el peso medio de las latas con café de la máquina 2. la probabilidad acumulada hasta 3.P[T23 ≤ 3.45 ≡ 23 2 2 2 2  81   25   S12   S 22           16    16   n1    n2  16  1 16  1 n1  1 n2  1 4.0005 (en Excel 0. 0. Hipótesis: H0: 1 = 2 H1: 2 > 1 y 2. Entonces: R.50} 5. para 23 grados de libertad. Solución Sean X1 y X2 las variables que representan el cociente de inteligencia de los alumnos del turno diurno (1) y del turno nocturno (2) respectivamente.18.005 = 1/ f14.30 = 0. S2 = 15. X 1 = 112.233 y f14.995 = 4. dio un promedio de 112 con una desviación estándar de 6. S1 = 6 a) 1. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis nula cierta. X 2 = 105. Como Fcalc = 0. = {F < 0.16  R. 14. para n1 = n2 = 15.30} 5. 0. Nivel de significación:  = 0. Decisión. el cociente de inteligencia de 15 alumnos del turno diurno. 14. R.C.01 y la prueba bilateral en la Tabla 4. 0. Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son heterogéneas. dio un promedio de 105 con una desviación estándar de 15. S 22 = 225 y Fcalc  S12 36  = 0. Datos: n1 = 15. para según ello probar si son diferentes los cocientes medios de inteligencia de los 2 turnos.C. H1:  12 ≠  22 2.30.14 S 22 4. Para  = 0. Con el 1% de significación pruebe sí: a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor. 330 . En un colegio de secundaria. la estadística de prueba es: F S12  f14. Región crítica. b) ¿Son diferentes los cocientes medios de inteligencia de los 2 turnos? Halle pvalor. con el 1% de significación. se rechaza Ho y concluimos que las varianzas de los cocientes de inteligencia de los 2 turnos son diferentes (heterogéneas). 0. mientras que para 15 estudiantes del turno nocturno.01 3. los valores críticos F son: f14. Cálculos: con los datos de la muestra se obtiene: S12 = 36.995 = 1/ 4. Hipótesis: H0:  12 =  22 y n2 = 15.16 2 S 2 225 6. 14.233 o F > 4. 14 ≥ 6. 331 . Entonces: R. para 14 y 14 grados de libertad.01 (en Excel 0. = {T < -2. Con la información muestral: n1 = 15. Región crítica. Ya que en la Tabla 4 de la F. X 1 = 112.9992). la probabilidad acumulada hasta 6.25] = = 2 {1 . Como P < 0. 0.68  R. que los cocientes medios de inteligencia de los 2 turnos son iguales. en la Tabla 3 el valor crítico es: t18.01 y la prueba bilateral.16] = 2 P[f14. n2 = 15. Hipótesis: H0: 1 = 2 H1: 1 ≠ 2 y 2.16 < 1 se obtiene así: P = 2 P[f14. S2 = 15. La estadística de prueba cuando las varianzas son heterogéneas es: T X1  X 2 S12 S 22  n1 n2  t H  t18 2 2  S12 S 22  36 225         n1 n2  15 15    Donde: H = = = 18.14 ≥ 1/ 0. Decisión: como tcalc = 1.25]} < 0. Rpta.14 < 0. con el 1% de significación. y bajo el supuesto que Ho es cierta se determina: tcalc  X1  X 2 2 1 2 2 S S  n1 n2  112  105  1.878} 5.25 es mayor a 0.01.995 = 2.37 ≡ 18 2 2 2 2  36   225   S12   S 22          15 15     n n  1   2   15  1 15  1 n1  1 n2  1 4. S1 = 6.A.0016). b) A continuación se prueba si son diferentes los cocientes medios de inteligencia de los 2 turnos. para  = 0. 1.01 3. Nivel de significación:  = 0.878.16] = 2 P[1/ f14. se rechaza la hipótesis nula y se concluye también que las varianzas de los cocientes de inteligencia de ambos turnos son diferentes (heterogéneas).878 o T > 2. El valor P para la prueba bilateral y como Fcalc = 0.995 (en Excel es 0. se acepta Ho y se concluye con el 1% de significación.68 36 225  15 15 6.P[f14.01 <  = 0.C. X 2 = 105.14 ≤ 6. 114 Rpta..35  0. Nivel de significación:  = 0.68  1. Para dos colas: P = 2P[T18 > 1.01.01 332 n2 = 20.68] = 2[1 – P(T18 ≤ 1.68)] = 2[1 – x] …….330 0. Halle p-valor. con 18 grados de libertad. Hipótesis: H0:  12 =  22 H1:  12 ≠  22 2. no está el valor 1.330 1. X 2 = $ 530. S2 = $ 15.95  0. Hallar p-valor. Solución Sean X1 y X2 las variables que representan el sueldo de los hombres (1) y de las mujeres (2) respectivamente.90 1. X 1 = $ 540.943 Reemplazando x = 0. S1 = $ 16 y 15. 19. con el 1% de significación.01 no se rechaza Ho y se concluye también que los cocientes medios de inteligencia de ambos turnos son iguales. probar si el sueldo medio de las mujeres es menor que el de los hombres.943 en (1) se obtiene: P-valor = 2[1 – 0.68  x 1.35  x = 0. a) 1.114 >  = 0. T de student. X 1 = $ 540.08x – 7. b) Con un nivel de significación del 5%.08 = 0. Como el valor-P = 0.68. S1 = $ 16 y n2 = 20.90  1.330  8. (1) En la Tabla 3.272 = 0. Datos: n1 = 20. para según ello probar si el sueldo medio de las mujeres es menor que el de los hombres. a) ¿Son heterogéneas las varianzas de los sueldos de ambos grupos? Use  = 0.734 0. Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son heterogéneas. se determina x interpolando así: Tα P 1.943] = 0.90 x  0.95 8. Muestras del sueldo de hombres (1) y mujeres (2) de una compañía proporcionan los siguientes datos: n1 = 20.90 x  0. X 2 = $ 530. S2 = $ .734  1. 995 = 3. no se rechaza Ho y concluimos que las varianzas de los sueldos de ambos grupos son iguales (homogéneas). 0.10 >  = 0.05 3.43 = 0. Como P > 0. Como Fcalc = 1.19 S2 4.14]} > 0. 0.10 (en Excel 0. 0.14 > 1 se obtiene así: P = 2 P[f19. Para  = 0.  El valor P para la prueba bilateral y como Fcalc = 1. 19. 19.t38. Región crítica. los valores críticos F son: f19. Rpta.95 = -1.292 y f19. Ya que en la Tabla 4 de la F.05 = . Entonces: 333 . 0. 19. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis nula cierta.C. para  = 0. b) A continuación se prueba si el sueldo medio de las mujeres es menor que el de los hombres.43. 1.A. con el 1% de significación.686. con el 1% de significación.01.292 o F > 3. R.14 S 2 225 6.05 y la prueba unilateral izquierda. Hipótesis: H0: 1 = 2 y H1: 2 < 1 2. = {F < 0. la probabilidad acumulada hasta 1.19 ≤ 1.778).14] = 2 {1 .43} 5.14  R. no se rechaza la hipótesis nula y se concluye también que las varianzas de los sueldos de ambos grupos son iguales (homogéneas). Nivel de significación:  = 0.995 = 1/ 3.14 es menor a 0. la estadística de prueba es: S12 F  2  f19.01 y la prueba bilateral en la Tabla 4.19 > 1. S = 225 y Fcalc S12 256  2  = 1. Cálculos: con los datos de la muestra se obtiene: 2 1 2 2 S = 256.3. Decisión.005 = 1/ f19. para n1 = n2 = 20.611). para 19 y 19 grados de libertad. Región crítica.95 (en Excel es 0. 0. en la Tabla 3: t38.P[f19. La estadística de prueba cuando las varianzas son homogéneas es: T X 2  X1 S c2 S c2  n1 n2  t 20 202  t 38 4. x1 = 402. X 1 = $ 540. = {T < -1. b) ¿Son diferentes los gastos medios mensuales en seguridad particular realizada por las empresas comerciales de ambas ciudades? Use  = 0.04) = 1 – 0. S2 = 15. es menor que el sueldo medio de los hombres. Solución Sean X1 y X2 las variables que representan los gastos mensuales en seguridad particular de las empresas comerciales en las ciudades 1 y 2 respectivamente.05 se rechaza Ho y se concluye también que el sueldo medio de las mujeres. x 2 = 385.976 = 0. Como el valor-P = 0. n2 = 20.R. S1 = 25 y n2 = 20.686} 5.04] = 1 – P(T38 ≤ 2.024 <  = 0. Mediante muestras aleatorias sin reemplazo de 20 empresas tomadas en cada ciudad se han obtenido los siguientes resultados: n1 = 20. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad particular realizada por las empresas comerciales de dos ciudades. X 2 = $ 530. Con la información muestral: n1 = 20.5 240. S1 = $ 16. S2 = $ 15.05. con el 5% de significación.04 240. Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas 334 .05 y halle pvalor. se rechaza Ho y se concluye con el 5% de significación.C. Decisión: como tcalc = -2.024 Rpta. a) ¿Son diferentes las varianzas de los gastos mensuales en seguridad particular realizada por las empresas comerciales de las dos ciudades? Use  = 0. y bajo el supuesto que Ho es cierta se determina: Sc2   n1 1 S12  (n2  1)S22  19 x162  19 x152 tcalc  n1  n2  2 X 2  X1  Sc2 Sc2      n1 n2   20  20  2 = 240.5 530  540  2. Halle p-valor. que el sueldo medio de las mujeres es menor que el sueldo medio de los hombres.C.04  R. 20.  Para la prueba unilateral izquierda: P = P[T38 < -2.5  20 20 6. 33 = 0. Cálculos: con los datos de la muestra se obtiene: 2 1 2 2 S = 625.53} 5. S2 = 15.19 > 2.19 ≤ 2. x1 = 402. S = 225 y Fcalc S12 625  2  = 2.03  2. para n1 = n2 = 20.78 x  3.975 x  0. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis nula cierta. 15.25  0. la estadística de prueba es: S12 F  2  f19.78 > 1 se obtiene así: P = 2 P[f19. H1:  12 ≠  22 2. Hipótesis: H0:  12 =  22 n2 = 20.53  33. R.99  0. para según ello. 0. Como Fcalc = 2.  El valor P para la prueba bilateral y como Fcalc = 2.78] = 2 {1 .975 335 . con el 5% de significación. = {F < 0.975 = 1/ 2.025 = 1/ f19.78  R.975) y 3. S1 = 25 y a) 1.99) para hallar x se interpola así: Fα P 2. n1 = 20.19 S2 4. (1) Como en la Tabla 4 de la distribución F.395 y f15. los valores críticos F son: f19.P[f19.03 (con probabilidad 0. Nivel de significación:  = 0.395 o F > 2.C. pero éste se encuentra entre los valores 2.78  2. 0.78. Para  = 0.05 y la prueba bilateral en la Tabla 4.53 0. no está el valor 2.78 S 2 225 6.53 (con probabilidad 0. probar si son diferentes los gastos medios mensuales en seguridad particular de las empresas comerciales de ambas ciudades.53 = 0. x 2 = 385. Región crítica.995 = 2. 19.desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son diferentes.78]} = 2{1 – x} …….975 2. Decisión.53 2. 0.975 x  0. 19.C. se rechaza Ho y concluimos que las varianzas de los gastos mensuales en seguridad particular realizada por las empresas comerciales de las dos ciudades son diferentes (heterogéneas).53.05 3. para 19 y 19 grados de libertad. 034 <  = 0. Con la información muestral: n1 = 20. 1. Región crítica. Entonces: R.33 x – 32.983 Reemplazando x = 0. en la Tabla 3 el valor crítico es: t31. = {T < -2. se rechaza Ho y se concluye con el 5% de significación..C.5 = 0. Nivel de significación:  = 0.05 3.04 o T > 2.61] = 2[1 – P(T31 ≤ 2.05 y la prueba bilateral. se rechaza la hipótesis nula y se concluye también que las varianzas de los gastos mensuales en seguridad particular realizada por las empresas comerciales de ambas ciudades son diferentes (heterogéneas). 0. x1 = 402. con el 5% de significación.99  33.25  x = 0.11 ≡ 31 2 2 2 2  625   225   S12   S 22          20 20     n n  1   2   20  1 20  1 n1  1 n2  1 4. Como P = 0.983 en (1) se tiene: P = 2 {1 – 0. x 2 = 385.03 0. para  = 0. y bajo el supuesto que Ho es cierta se determina: tcalc  X1  X 2 S12 S22  n1 n2  402  385  2.05. La estadística de prueba cuando las varianzas son heterogéneas es: T X1  X 2  t H  t 31 S12 S 22  n1 n2 2 2  S12 S 22  625 225         n1 n2  20 20    Donde: H = = = 31. Decisión: como tcalc = 2.61)] = 2[1 – x] …….983} = 0.04 } 5. que los gastos medios mensuales en seguridad particular de las empresas comerciales de ambas ciudades son diferentes.034 Rpta.  Para dos colas: P = 2P[T31 > 2. b) A continuación se prueba si son diferentes los gastos medios mensuales en seguridad particular de las empresas comerciales de ambas ciudades. S1 = 25 y n2 = S2 = 15.975 = 2.61 625 225  20 20 6.61  R.C. Hipótesis: H0: 1 = 2 H1: 2 ≠ 1 y 2. (1) 336 .04.3. 20. 744 0.61. Con la información muestral: n = 1000. = {Z < -1.95 = -1. Nivel de significación:  = 0.645.34 es cierta.618 = 0.990 2.610  2.993 en (1) se obtiene: P-valor = 2[1 – 0.05 y la prueba unilateral izquierda.990 2.34 2.99) y 2. Se quiere contrastar las hipótesis si menos del 34 % (0. Como el valor-P = 0.993 Reemplazando x = 0.453 (con probabilidad 0.990  58. Solución Denotemos con p la proporción (%) poblacional de hogares que compra periódicos y revistas. con 31 grados de libertad.645} pˆ  0. para  = 0.C.34.305 y bajo el supuesto que . con el 1% de significación.En la Tabla 3.157 x  0.2 x – 57.34) de hogares limeños compra periódicos y revistas.453 0.453  0.05 3. Entonces: 5. 1. Ho: p = p0 = 0. Halle p-valor. Estadística de prueba: Z  pˆ  p0  N (0.014 <  = 0.453 2. no está el valor 2.995) para hallar x se interpola así: Tα P 2.014 Rpta.157  58.5 % de los hogares compra periódicos y revistas.61 x  2.05 se rechaza Ho y se concluye también que los gastos medios mensuales en seguridad particular de las empresas comerciales de ambas ciudades son diferentes. se determina: 337 R.995  x = 0.05. que menos del 34 % de hogares limeños compra periódicos y revistas? Use α = 0. Hipótesis: H0: p ≥ p0 = 0. H1: p < 0.993] = 0.1) p0 q0 n 4.744 (con probabilidad 0. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana (con 1’700 000 hogares) indica que el 30.744  2. Región crítica. en la Tabla 1 el valor crítico es: Zα = -Z1-α = -Z0. Aceptaría Ud.990 x  0. T de student.995  0.2 = 0. pero éste se encuentra entre los valores 2. 21. 575.01 3.575 o Z > 2. Como el valor-P = 0.33 ϵ R.75. Región crítica.5%). se determina: 338 .05 se rechaza la hipótesis nula y se concluye también que menos del 34 % de hogares limeños compra periódicos y revistas.75 1.33] = Ф(-2.75). Una “Encuesta de Opinión” realizada en 800 hogares de Lima Metropolitana (con 1. Hipótesis: H0: p = p0 = 0. pˆ  X 644  = 0.34) de hogares limeños compra periódicos y revistas (la estimación muestral indica que es el 30.75 o 75% (p ≠ 0. ¿Aceptaría usted que la verdadera proporción de hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda difiere de 0.34 x0.0099 <  = 0. Decisión: como Zcalc = –2. X = 644.33) = 0.01. en la Tabla 1 el valor crítico es: Z1-α/2 = Z0. para  = 0. se rechaza la hipótesis nula y se concluye con el 5% de significación.  P = P[Z < Zcalc] = P[Z < -2. Solución Denotemos con p la proporción (%) poblacional de hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda. 22.34  = -2. Entonces: R. H1: p ≠ 0. Se quiere contrastar las hipótesis si la proporción de hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda difiere de 0.75 es cierta.C. que menos del 34 % (p < 0.01 y la prueba bilateral. Estadística de prueba: Z  pˆ  p0  N (0.995 = 2. 2. con el 5% de significación. Halle p-valor.C.33 p0 q0 0. Con la información muestral: n = 800.575} 5.7 millones de hogares) 644 hogares indicaron que tienen abastecimiento de agua de la red pública dentro de la vivienda.0099 Rpta.805 y n 800 bajo el supuesto que Ho: p = p0 = 0.Z calc  pˆ  p0 0. Nivel de significación:  = 0. = {Z < -2.1) p0 q0 n 4.305  0.75 (75%)? Use α = 0.66 1000 n 6. 05 3. se rechaza la hipótesis nula y se concluye con el 1% de significación.645.75) de los ciudadanos limeños perciben que hay problemas de seguridad. 23. Explique el error tipo II.645} .25 800 n 6.1) p0 q0 n 4.05.75 o 75%.805  0.00034 Rpta. Entonces: 339 R.75.5%).00034 <  = 0. Decisión: como Zcalc = 3. Se quiere contrastar las hipótesis si más del 75 % (p > 0.Z calc  pˆ  p0 0.75 2. Nivel de significación:  = 0. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima Metropolitana. ¿Indica esta evidencia que más del 75 % de los ciudadanos limeños perciben que hay problemas de seguridad? Use el nivel de significación de 0.C.01 se rechaza la hipótesis nula y se concluye también que la proporción de hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda difiere de 0.59 ϵ R. H1: p > 0.  Como la prueba es bilateral.59) = 2(0.75 x0. que la proporción de hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda difiere de 0. 1. para  = 0. con el 1% de significación. Región crítica. Estadística de prueba: Z  pˆ  p0  N (0. Hipótesis: H0: p = p0 = 0.59] = 2Ф(-3.05 y la prueba unilateral derecha.75 o 75% (la estimación muestral señala que es 0. Como el valor-P = 0.C. 400 indicaron que hay problemas de seguridad. Solución Denotemos con p la proporción (%) poblacional de ciudadanos de Lima Metropolitana que indican que hay problemas de seguridad. el valor-P se determina así: P = P[|Z| > |Zcalc|] = P[|Z| > 3.00017) = 0.95 = 1.59 p0 q0 0.805 o el 80. Halle p-valor. = {Z > 1. en la Tabla 1 el valor crítico es: Z1-α = Z0.75  = 3. 65 2. se determina: Z calc  pˆ  p0 0. que más del 75 % (p > 0.99506 = 0.80  0.75 es cierta. 24.05 340 . X = 400.75 x0.05.58 p0 q0 0.C.65. H1: p < 0.65) de los compradores están a favor de un horario más extenso en el centro comercial.00494 Rpta.  Como la prueba es unilateral derecha.75) de los ciudadanos limeños perciben que hay problemas de seguridad (la estimación muestral señala que es 0.  Error tipo II..58) = 1 – 0. el valor-P se determina así: P = P[Z > Zcalc] = P[Z > 2. Con la información muestral: n = 500.00494 <  = 0. 1. ¿Esta evidencia es suficiente para concluir que menos del 65 % de los compradores están a favor de un horario más extenso? Use un nivel de significación de 0. Hipótesis: H0: p = p0 = 0. se rechaza la hipótesis nula y se concluye con el 5% de significación. con el 1% de significación.58] = 1 – Ф(2.75  = 2.80 o el 80%).80 y bajo n 800 el supuesto que Ho: p = p0 = 0. Se tomó una muestra aleatoria de 300 compradores en un centro comercial y se encontró que 182 están a favor de un horario más amplio para las compras.25 500 n 6. Como el valor-P = 0.05 se rechaza la hipótesis nula y se concluye también que más del 75 % (p > 0.75) de los ciudadanos limeños perciben que hay problemas de seguridad.5.consiste en aceptar Ho (que el 75% de los ciudadanos limeños percibe que hay problemas de seguridad) cuando es falsa (este porcentaje realmente es de más del 75%). Halle p-valor. Solución Denotemos con p la proporción (%) poblacional de compradores en el centro comercial que responden que están a favor de un horario más amplio para las compras. Decisión: como Zcalc = 2.58 ϵ R. Nivel de significación:  = 0. pˆ  X 400  = 0. Se quiere probar las hipótesis si menos del 65 % (p < 0. 65) de los compradores están a favor de un horario más extenso en el centro comercial. 375 indicaron que no están de acuerdo con el servicio militar obligatorio. Hipótesis: H0: p = p0 = 0. para  = 0. Decisión: como Zcalc = -1. X = 182.05938 >  = 0. Estadística de prueba: Z  pˆ  p0  N (0. en la Tabla 1 el valor crítico es: Zα = -Z1-α = -Z0.80) de los ciudadanos no están de acuerdo con el servicio militar obligatorio. el valor-P se determina así: P = P[Z < Zcalc] = P[Z < -1.01.645} 5. Se quiere probar las hipótesis si menos del 80% (p < 0. ¿Indica esta evidencia que menos del 80 % de los ciudadanos no están de acuerdo con el servicio militar obligatorio? Use el nivel de significación de 0.65 es cierta.65) de los compradores están a favor de un horario más extenso en el centro comercial.80. Halle p-valor. no se rechaza la hipótesis nula y se concluye con el 5% de significación.3. Región crítica.95 = -1.65 x0.56] = Ф(-1. pˆ  X 182  = 0. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima Metropolitana. se determina: Z calc  pˆ  p0 0. H1: p < 0.65  = -1. Solución Denotemos con p la proporción (%) poblacional de ciudadanos entrevistados que responden que indican que no están de acuerdo con el servicio militar obligatorio.35 300 n 6. Con la información muestral: n = 300.C. 25. Nivel de significación:  = 0. que el 65 % (p = 0. Entonces: R. 1.  Como la prueba es unilateral izquierda.05 no se rechaza la hipótesis nula y se concluye también que el 65 % (p = 0.56 p0 q0 0.56 ϵ R.A.645. Como el valor-P = 0.01 341 .607  0.80 2.05938 Rpta. = {Z < -1. con el 5% de significación.56) = 0.05 y la prueba unilateral izquierda.1) p0 q0 n 4.607 y n 300 bajo el supuesto que Ho: p = p0 = 0. 3.80  = -2. Región crítica. en la Tabla 1 el valor crítico es: Zα = -Z1-α = -Z0.01 se rechaza la hipótesis nula y se concluye también que menos del 80% (p < 0. las proporciones poblacionales de empresarios de Lima Metropolitana (1) y del Resto del País (2) que aceptan la revista de negocios.80 x0. con el 1% de significación.C. se determina: Z calc  pˆ  p0 0. A fin de determinar el nivel de aceptación de una revista de negocios.80 p0 q0 0. X1 = 280. Como el valor-P = 0.01 y la prueba unilateral izquierda. Estadística de prueba: Z  pˆ  p0  N (0. Resto del País (2): n2 = 1200.33. X = 375.75  0.1) p0 q0 n 4. 342 .05 ¿Son diferentes las verdaderas proporciones de empresarios “limeños” y “no limeños” que aceptan la revista de negocios? Determine pvalor. pˆ  R. que menos del 80% (p < 0.80 ) = 0.80 ϵ R. Con α = 0. (1): n1 = 800.80 es cierta.  Como la prueba es unilateral izquierda. para  = 0.80] = Ф(-2. Decisión: como Zcalc = -2. el valor-P se determina así: P = P[Z < Zcalc] = P[Z < -2. Entonces: 5. Solución Sean p1 y p2. se entrevistaron dos grupos de empresarios: de Lima Metropolitana (1) y del Resto del País (2).00256 Rpta. se desea probar si son diferentes las verdaderas proporciones de empresarios “limeños” y “no limeños” que aceptan la revista de negocios.80) de los ciudadanos no están de acuerdo con el servicio militar obligatorio. 26.C.99 = -2.00256 <  = 0. Entonces.20 500 n 6. Con la información muestral: n = 500.80) de los ciudadanos no están de acuerdo con el servicio militar obligatorio. X2 = 300.33} X 375  = 0. = {Z < -2. se rechaza la hipótesis nula y se concluye con el 1% de significación.75 y bajo n 500 el supuesto que Ho: p = p0 = 0. se obtuvieron los siguientes resultados: Lima M. 220 están de acuerdo con la gestión presidencial.83) < 0. En una muestra aleatoria de 400 adultos. Región crítica. Nivel de significación:  = 0.01. Halle p-valor.83] = = 2 Ф(-4.0001 (en Excel 0.05 3. Se concluye que son diferentes las verdaderas proporciones de empresarios “limeños” y “no limeños” que aceptan la revista de negocios. se rechaza la hipótesis nula y se concluye también que son diferentes las verdaderas proporciones de empresarios “limeños” y “no limeños” que aceptan la revista de negocios.C.83 6. Ya que en la Tabla 1 de la distribución normal estándar. Solución 343 .C.71. Como P < 0.96 o Z > 1. = {Z < -1. con el 5% de significación.  P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -4. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 800.35  0.0001 (en Excel es 0. es mayor que la proporción de jóvenes que está de acuerdo con dicha gestión? Use α = 0.05.96} 5. se determina:   n1  n2 800  1200 2000 pˆ 1  pˆ 2 1 1 pˆ qˆ     n1 n2   0. Estadística de prueba: Z  pˆ 1  pˆ 2  ( p1  p2 ) → N(0.25 1   1 0. 1) p1q1 p 2 q2  n1 n2 4.00000068).83 es menor a 0. Entonces: R.05 y la prueba bilateral. pˆ  Z calc  X 1 280 X 300 = 0. Rpta. Mientras que en una muestra de 600 jóvenes. 27. = 0. n2 = 1200.975 = 1. 1. ¿Se puede afirmar que la verdadera proporción de adultos que está de acuerdo con la gestión presidencial.0000014). la probabilidad acumulada hasta -4. se rechaza la hipótesis nula con el 5% de significación. pˆ 1  X1 = 280.83 ϵ R.25. Decisión: como Zcalc = 4.29 y qˆ = 0. Hipótesis: Ho: p1 = p2 y H1: p1 ≠ p2 2.96.29 x0.71   800 1200  = 4. pˆ 2  2   n1 800 n2 1200 X 1  X 2 280  300 580 = 0. 300 están de acuerdo con la gestión presidencial. X2 = 300. en la Tabla 1 el valor crítico es: Z1-α/2 = Z0.0001 <  = 0.35. para  = 0. C. Como P = 0.50 1   1 0. en la Tabla 1 el valor crítico es: Z1-α = Z0.01.48. Hipótesis: Ho: p1 = p2 y H1: p1 > p2 2. se desea probar si la verdadera proporción de adultos que está de acuerdo con la gestión presidencial. pˆ  Z calc  pˆ 1  X 1 220 X 300 = 0.05 y la prueba unilateral derecha.06057 Rpta. En una muestra de 200 hombres. Decisión: como Zcalc = 1.48   400 600  = 1. no se rechaza la hipótesis nula con el 5% de significación.05 3.55  0. 150 de las cuales están a favor de la titulación con tesis. Halle p-valor 344 . se determina:   n1  n2 400  600 1000 pˆ 1  pˆ 2 1 1 pˆ qˆ     n1 n2   0. con el 5% de significación. Nivel de significación:  = 0. Región crítica.55. es mayor que la proporción de jóvenes que está de acuerdo con dicha gestión. X1 = 220. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 400.06057 >  = 0.  Para la prueba es unilateral derecha: P = P[Z > Zcalc] = P[Z > 1. = {Z > 1.52 y qˆ = 0.645. pˆ 2  2  =  n1 400 n2 600 X 1  X 2 220  300 520 = 0.93943 = 0.A. para  = 0. se “acepta” la hipótesis nula y se concluye también que son iguales las verdaderas proporciones de adultos y de jóvenes que están de acuerdo con la gestión presidencial. Entonces: R. Se concluye que son iguales las verdaderas proporciones de adultos y de jóvenes que están de acuerdo con la gestión presidencial. 1) p1q1 p 2 q2  n1 n2 4.05.  1.645} 5. n2 = 600.95 = 1.55 6. 0. 28.Sean p1 y p2.55 ϵ R.50. De los alumnos de la UNAC se toma una muestra aleatoria de 300 mujeres.55) = 1 – 0. 120 indican que están a favor de lo mismo. ¿Se puede afirmar que hay una diferencia significativa entre las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis? Use α = 0. Estadística de prueba: Z  pˆ 1  pˆ 2  ( p1  p2 ) → N(0. X2 = 300.52 x0. Entonces. las proporciones poblacionales de adultos (1) y de jóvenes (2) que están de acuerdo con la gestión presidencial.55] = 1 – Ф(1. se “acepta” la hipótesis nula y se concluye también que son iguales las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis.20 ϵ R.20) = 2 (0. X1 = 120. Entonces. Una empresa desea determinar la proporción de hogares que adquiere su producto en las ciudades 1 y 2.0139) = 0.20] = = 2 Ф(-2. con el 1% de significación. pˆ 1  X 1 120 X 150 = 0. Región crítica.60  0. Se concluye que son iguales las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis.54 x0. 29. n2 = 300. pˆ 2  2  =  n1 200 n2 300 0. las proporciones poblacionales de estudiantes hombres (1) y mujeres (2) que están a favor de la titulación con tesis. = {Z < -2. Como P = 0.01 y la prueba bilateral.Solución Sean p1 y p2. Estadística de prueba: Z  pˆ 1  pˆ 2  ( p1  p2 ) → N(0.  P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2. 1) p1q1 p 2 q2  n1 n2 4. Nivel de significación:  = 0.20 6. no se rechaza la hipótesis nula con el 1% de significación. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 200. Una muestra al azar de 600 hogares en cada 345 .01. Decisión: como Zcalc = 2.50.C. se determina:   n1  n2 200  300 500 Z calc  pˆ 1  pˆ 2 1 1 pˆ qˆ     n1 n2   0.0278 Rpta.01 3. pˆ  X 1  X 2 120  150 270 = 0.A. se desea probar si son diferentes las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis.575.995 = 2. para  = 0. en la Tabla 1 el valor crítico es: Z1-α/2 = Z0. Entonces: R.46   200 300  = 2.575} 5.  1. Hipótesis: Ho: p1 = p2 y H1: p1 ≠ p2 2. X2 = 150.0278 >  = 0.54 y qˆ = 0.50 1   1 0.575 o Z > 2.60.46. A.01 y la prueba unilateral. Solución Sean p1 y p2.01831 Rpta. Región crítica. se “acepta” la hipótesis nula y se concluye también que las proporciones poblacionales de hogares que adquiere el producto en las ciudades 1 y 2 son iguales. Entonces: R. Nivel de significación:  = 0. Decisión: como Zcalc = -2. = {Z < -2. se determina:   n1  n2 600  600 1200 pˆ 2  pˆ 1 1 1 pˆ qˆ     n1 n2   0.33} 5. n2 = 600.09 6. para  = 0. 1) p1q1 p 2 q2  n1 n2 4. Halle p-valor.C. Entonces.09) = 0. pˆ 2  2  =  n1 600 n2 600 X 1  X 2 288  252 540 = 0. no se rechaza la hipótesis nula con el 1% de significación. 0.42. Hipótesis: Ho: p1 = p2 y H1: p2 < p1 2.09 ϵ R.01. X1 = 288.45 y qˆ = 0.  1.55.01831 >  = 0.01 3.  Para la prueba es unilateral izquierda: P = P[Z < Zcalc] = P[Z < -2. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 600.42  0.33.55   600 600  = -2. en la Tabla 1 el valor crítico es: Zα = -Z1-α = -Z0. y se concluye que las verdaderas proporciones poblacionales de hogares que adquiere el producto en las ciudades 1 y 2 son iguales. Estadística de prueba: Z  pˆ 2  pˆ 1  ( p2  p1 ) → N(0.48. Como P = 0.48 1   1 0. las proporciones poblacionales de hogares que adquiere el producto en las ciudades 1 y 2 respectivamente. ¿Será la proporción de hogares que adquiere el producto en la ciudad 2 menor que la proporción de hogares que adquiere el producto en la ciudad 1? Use  = 0.99 = -2. pˆ  Z calc  pˆ 1  X 1 288 X 252 = 0. con el 5% de significación.ciudad arroja que 288 lo adquiere en la ciudad 1 y 252 en la ciudad 2. 346 .01.45 x0. se desea probar si la verdadera proporción de hogares que adquiere el producto en la ciudad 2 menor que la proporción de hogares que adquiere el producto en la ciudad 1.09] = Ф(-2. X2 = 252. para  = 0. ¿existe diferencia entre la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Sol y mar”? Halle p-valor.54 x0. mientras que de 250 mujeres de 40 años a más.05 3.00714. Entonces. n2 = 250. se rechaza la hipótesis nula y se concluye también que son diferentes las verdaderas proporciones .60  0. Estadística de prueba: Z  pˆ 1  pˆ 2  ( p1  p2 ) → N(0.54 y qˆ = 0. Decisión: como Zcalc = 2. pˆ  Z calc  pˆ 1  X 1 150 X 120 = 0. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de verano “Sol y mar”.  1. Región crítica.96} 5. 0.46.69 ϵ R. Nivel de significación:  = 0. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 250. Como P = 0.975 = 1. las proporciones poblacionales de mujeres menores de 40 años (1) y las mujeres de 40 años a más (2) que muestran interés por los polos de verano “Sol y mar”.05 y la prueba bilateral. X2 = 120. se desea probar si son diferentes ambas proporciones .96. en la Tabla 1 el valor crítico es: Z1-α/2 = Z0. y se concluye que son diferentes las verdaderas proporciones de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Sol y mar”.00357) = 0.69) = 2 (0.00714 <  = 0. Entonces: R. 150 estuvieron interesados.96 o Z > 1. Solución Sean p1 y p2.48 1   1 0.30.  P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2. sólo 120 mostraron interés. De una muestra de 250 mujeres menores de 40 años.48. Con el 5% de significación.C. se determina:   n1  n2 250  250 500 pˆ 1  pˆ 2 1 1 pˆ qˆ     n1 n2   0. 1) p1q1 p 2 q2  n1 n2 4. = {Z < -1. se rechaza la hipótesis nula con el 5% de significación. X1 = 150.60.46    250 250  = 2. 347 . pˆ 2  2  =  n1 250 n2 250 X 1  X 2 150  120 270 = 0. Hipótesis: Ho: p1 = p2 H1: p1 ≠ p2 y 2.05.C.69] = 2 Ф(-2.69 6. Se toma una muestra aleatoria de 41 botellas. b) ¿Aceptaría usted que σ2 > 300 gr2 por bolsa? Use α = 0. b) Ponga a prueba H0: σ2 = 120 contra H1: σ2 ≠ 120. Halle p-valor. Se toma una muestra aleatoria de 36 bolsas.05. use α = 0. 2. 5. y una desviación típica de 12 ml.05. Un proceso está programado para embotellar la cantidad media de 750 mililitros de gaseosa. 3. Halle p-valor. b) ¿Aceptaría usted que σ2 ≠ 250 gr2 por bolsa? Use α = 0.05. b) ¿Aceptaría usted que σ2 ≠ 250 gr2 por bolsa? Use α = 0.05.05. Halle p-valor.5 y una desviación estándar muestral de 12. Halle p-valor. a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el contenido medio en las botellas de gaseosa? Halle p-valor. resultando una media de 996. Un proceso está programado para embolsar la cantidad media de 250 gramos de café.05. Se toma una muestra aleatoria de 36 bolsas.10 PROBLEMAS PROPUESTOS 1.5 gramos y una desviación típica de 15 gramos. Se tiene la siguiente prueba de hipótesis: Ho: µ ≥ 100 y H1: µ < 100. Halle p-valor. resultando una media de 253. a) ¿Se puede afirmar que el contenido medio en las bolsas de café es mayor de 250 gramos? Use α = 0. Una muestra de 50 elementos produce una media muestral de 95. Se toma una muestra aleatoria de 35 bolsas.6. 348 . resultando una media de 745 ml. 4. Halle p-valor. a) Al 5% de significación ¿se puede afirmar que el contenido medio en las bolsas de frejol es menor de 500 gramos? Halle p-valor. Un proceso está programado para embolsar la cantidad media de 500 gramos de frejol.5 gramos y una desviación típica de 10 gramos.5 gramos y una desviación típica de 13 gramos. resultando una media de 496. ¿Aceptaría usted que σ2 < 200 ml2 por botella? Use α = 0. a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el contenido medio en la bolsa? Halle p-valor.05. Halle p-valor. a) Realice la prueba de hipótesis usando α = 0. Un proceso está programado para embolsar la cantidad media de 1000 gramos de lenteja. Use α = 0. 15. 15. 14. 246.6. pero hay una gran variabilidad. 12. 20. 16. 84. 9. 245.9. 93 y 82. 15. Se prueba una muestra aleatoria de 9 bolsas de cierta marca para determinar el peso medio de llenado.3. 25. 251.01. con un α = 0. Las latas de duraznos de la Compañía “La dulzura” deben contener un peso neto de 16 onzas.1. Halle p-valor. fueron: 18. 80. Una muestra aleatoria de 10 bolsas dio estos pesos: 248. 75.4. 10. 7. Suponiendo que los pesos se distribuyen normalmente. 250. 247. en onzas. Halle p-valor. a) Use α = 0.5. use α = 0.) fueron: 60.6. b) ¿Será rechazada la hipótesis σ2 > 3. Los pesos netos (grs. a) Ponga a prueba H0: μ = 70 Kg. 248. a) Con una significación del 5 % pruebe si el peso medio de las cajas de galleta es distinto de 14 Kg. 12. 44.7 y 14. b) Ponga a prueba H0: σ2 = 15 contra H1: σ2 ≠ 15. Determine p-valor. 246. Los pesos en kilos de una muestra aleatoria de 8 cajas de galleta son: 14. contra H1: μ ≠ 70. con un α = 0.05. 19. Halle p-valor. 247.1. 24 y 23.25 gr2 por bolsa? Use α = 0. a) Será la media poblacional de los pesos netos menor a 250gr. a) ¿Hay razón para creer que el verdadero peso medio de llenado es mayor de 18 onzas? Use α = 0. Halle pvalor.) de las bolsas de detergente es de 250. Una muestra aleatoria de seis latas revela los pesos netos siguientes en onzas: 15. b) Ponga a prueba H0: σ2 = 5 contra H1: σ2 ≠ 5. 22.1. Los pesos de diez estudiantes (en Kg.9.8. Halle p-valor. 349 . 21.5 onzas2? Use α = 0.1 y 15.4.01 para determinar si el verdadero peso neto de las latas de duraznos es menor de 16 onzas. Los pesos de las bolsas.05.05. Halle p-valor. b) ¿Aceptaría usted que σ2 < 1.1. 71.05. Suponga que estos pesos proceden de una población normal.05. Halle pvalor.01. 8. b) Ponga a prueba H0: σ2 = 80 Kg2 contra H1: σ2 > 80. 26.05. 66. Halle p-valor. 252. con un nivel de significación de 0. 16. 75. 13. 16. Halle p-valor. 12. 14. 1 y 2. se toma una muestra al azar de 200 hogares de A arrojando un costo medio de $ 250 y una desviación estándar de 15. para probar si el gasto medio mensual en frutas en la ciudad B es menor que el gasto medio en A.7 partes por hora. Se pide probar si es diferente el rendimiento medio de ambos turnos. probar si el costo medio de los televisores en las ciudades A es mayor que el costo medio de los televisores en la ciudad B. Una muestra al azar de 180 hogares de la ciudad B da una costo medio de $ 235 y una desviación estándar de 10. con una desviación estándar de 17. con una desviación estándar de 14 artefactos.3 partes por hora. dos muestras aleatorias de 40 cigarrillos de la marca 1 y 50 de la 350 . Hallar p-valor. mientras que otra muestra de 60 obreros de la noche alcanza un promedio de 89. Hallar p-valor.05. 15. Halle p-valor. mientras que otra muestra de 60 hombres alcanza un promedio de 89 artefactos mensuales. respecto a su contenido de nicotina en miligramos. Con α = 0. 13. Se comparan dos marcas de cigarrillos. En un estudio para determinar el costo medio de los televisores en las ciudades A y B. Una muestra aleatoria de 80 mujeres arroja una venta media de 95 artefactos mensuales. con una desviación estándar de 17. con una desviación estándar de 14 partes por hora.11. ¿son diferentes las ventas medias realizadas por hombres y mujeres (µm ≠ µh)? Determine el p-valor.01. Una muestra al azar de 100 hogares de la ciudad B da una gasto medio de 75 y una desviación estándar de 10. En un estudio para determinar el gasto medio mensual de los hogares en frutas para las ciudades A y B. Con α = 0. se toma una muestra al azar de 100 hogares de A arrojando un gasto medio de S/. Use α = 0. Una muestra aleatoria de 80 obreros del turno diurno alcanza una producción media de 94.05. 82 y una desviación estándar de 15. El departamento de marketing desea determinar si hay diferencia entre las ventas mensuales promedio realizadas por hombres y mujeres. Un departamento de producción desea determinar si hay diferencia en el rendimiento entre el turno diurno y el nocturno. Use α = 0.01. Halle p-valor. ¿Es diferente el contenido medio de nicotina de las dos marcas? Use α = 0.01 y determine p-valor.8. Hallar p-valor.): n1 = 16. probar si los gastos mensuales en publicidad de las empresas de la ciudad 1 es mayor que el de las empresas de la ciudad 2. Halle p-valor. X 1 = $ 950. S2 = 7. X 2 = 505. 351 .01. Halle p-valor. Con el 1% de significación probar si: a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor. a) ¿Son heterogéneas las varianzas de los gastos mensuales en publicidad de ambas ciudades? Use  = 0. b) Con un nivel de significación del 5 %. Mediante muestra aleatoria sin reemplazo de botellas tomadas de cada máquina se han obtenido los siguientes resultados sobre el contenido de las botellas (en ml. S1 = 2. S2 = 60. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para secretarias.9 y x2 = 15. S2 = 3.05. a) ¿Son diferentes las varianzas de los contenidos de las botellas con jugo de ambas máquinas? Use  = 0. dieron estos resultados: x1 = 14. 17. n1 = 40. X 2 = $ 850. X 1 = 495. Mediante muestras aleatorias sin reemplazo tomadas independientemente en cada ciudad se han obtenido los siguientes resultados: n1 = 20. Se ha llevado a cabo un estudio para analizar los gastos mensuales en publicidad (en dólares) realizado por las empresas comerciales de dos ciudades. mientras que el grupo 2 promedia 110 palabras por minuto con una desviación estándar de 10 palabras. Dos máquinas embotellan jugo independientemente.3. S1 = 5 y n2 = 16.marca 2. Se encuentra que el grupo 1 obtiene en promedio 123 palabras por minuto con una desviación estándar de 15 palabras. 18. aprenden taquigrafía por dos métodos diferentes y luego se les somete a pruebas de dictado. n2 = 50. b) ¿Son diferentes los contenidos medios de las botellas con gaseosa de ambas máquinas? Use  = 0.7. S1 = 95 y n2 = 18. 16. b) ¿Es diferente el promedio de palabras por minuto para los dos métodos? Halle p-valor.01. Dos máquinas embolsan diariamente detergente de manera independiente. b) Con un nivel de significación del 5 %.01.) en alquiler de local realizado por las empresas comerciales de dos ciudades grandes. x1 = 505.000 fumadores de cigarro. De una población de 100. x 2 = 495. De una muestra aleatoria de 500 hombres entrevistados. S2 = 62. Use un nivel de significación del 5%. probar si los gastos mensuales en alquiler de las empresas de la ciudad 1 es menor que el de las empresas de la ciudad 2.05. Indica esta evidencia que menos del 45% de los ciudadanos están de acuerdo con la gestión del alcalde. Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han obtenido los siguientes resultados sobre el peso de las bolsas (en gramos): n1 = 12. b) ¿Son diferentes los pesos medios de las bolsas con detergente de ambas máquinas? Halle p-valor. ¿Esta evidencia es suficiente para concluir que más del 25 % de los fumadores de cigarro prefieren la marca A? Use un nivel de significación del 1%. S1 = 96 y n2 = 20. x 2 = 856. y Con el 1% de significación probar si: a) ¿Son diferentes las varianzas de los pesos de las bolsas con detergente de ambas máquinas? Halle p-valor. Hallar p-valor. 352 . ¿Indica esta evidencia que más del 20 % de los televidentes hombres ven el fútbol los lunes por la noche? Use el nivel de significación de 0. a) ¿Son diferentes las varianzas de los gastos mensuales en alquiler de ambas ciudades? Use  = 0. Halle p-valor. Se ha llevado a cabo un estudio para analizar los gastos mensuales (S/. Mediante muestras aleatorias sin reemplazo tomadas independientemente en cada ciudad se han obtenido los siguientes resultados: n1 = 20. 23. Halle p-valor. 125 indicaron que ven fútbol los lunes en la noche por televisión. En una muestra aleatoria de 500 de los 100 000 ciudadanos de un distrito se encontró que 200 están de acuerdo con la gestión del alcalde. Halle p-valor. 22. x1 = 938. Halle p-valor.19. S1 = 10 n2 = 12. se selecciona una muestra aleatoria de 800 fumadores y se encuentra que 240 tienen preferencia por la marca A. 21. 20. S2 = 4. 75 estuvieron interesadas. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca de perfume. 240 indican que están a favor de lo mismo. 28. En una muestra de 400 mujeres.24. Halle p-valor. Explique el error tipo I. 300 de las cuales están a favor del cambio curricular. 26. ¿Se puede afirmar que es menor la proporción de hombres que están a favor del cambio curricular. X2 = 300 Con α = 0. ¿Indica esta evidencia que más del 20 % de los ciudadanos no están de acuerdo con el voto electrónico? Use el nivel de significación de 0. (1): n1 = 800. 220 hombres y 300 mujeres dijeron que les gustaba el nuevo perfume. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de casacas de cuero. 200 indicaron que no están de acuerdo con el voto electrónico. que la proporción de mujeres a favor del cambio curricular? Use α = 0. Indica esta evidencia que menos del 45% de los hogares consumen leche. Con el 5% de significación.05 ¿Existe diferencia entre las verdaderas proporciones de “limeños” y “no limeños” que están de acuerdo con la gestión presidencial? Determine pvalor. Resto del País (2): n2 = 1200. Con el 1% de significación. 80 mostraron interés. A fin de determinar el nivel de aceptación de la gestión presidencial. En una muestra aleatoria de 400 hombres y 600 mujeres. En una muestra aleatoria de 600 de los 20000 hogares de un distrito se encontró que 240 consumen leche. Halle p-valor. Halle pvalor. 27. ¿será mayor la proporción de 353 . Use un nivel de significación del 5%. De los alumnos de la UNAC se toma una muestra aleatoria de 600 hombres. se entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto del País (2). ¿existe diferencia entre las verdaderas proporciones de hombres y mujeres que dijeron que les gustaba el nuevo perfume? Halle p-valor.01. 25. 29. De una muestra aleatoria de 800 ciudadanos entrevistados en Lima Metropolitana. X1 = 280. De una muestra de 300 mujeres de 40 años a más.01. mientras que de 200 mujeres menores 40 años. se obtuvieron los siguientes resultados: Lima M. mujeres menores de 40 años interesadas en la compra de casacas de cuero. 354 . 300 están de acuerdo con la suscripción de TLC’s. 220 están de acuerdo con la suscripción de los Tratados de Libre Comercio (TLC’s). Mientras que en una muestra de 600 adultos. que la proporción de las de 40 años a más interesadas en dicha compra. 30. Halle p-valor. Halle p-valor. Halle p-valor.05. a) ¿Está Ud.01. b) ¿Se puede afirmar que hay una diferencia significativa entre las verdaderas proporciones de jóvenes y adultos que están de acuerdo con la suscripción de TLC’s? Use α = 0. En una muestra aleatoria de 400 jóvenes. de acuerdo que más del 50% de jóvenes está de acuerdo con la suscripción de TLC’s? Use α = 0. Ejercicios resueltos.4 7. Test de independencia. Las desventajas de estos métodos son: - Se vuelven complicadas para muestras grandes. las mismas que no requieren la verificación de algunos supuestos como la normalidad y homogeneidad de varianzas. A continuación se desarrollan las principales pruebas estadísticas no paramétricas con sus correspondientes aplicaciones.Capítulo 7. Test de Wilcoxon. Los métodos no paramétricos son una serie de procedimientos que no requieren supuestos acerca de la distribución de probabilidad por ello son llamados métodos de libre distribución y son empleados con datos medidos en escala nominal u ordinal. Test de la mediana.5 7. PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS “Ser culto. se presenta algunos métodos para la realización de pruebas estadísticas no paramétricas. Test de bondad de ajuste. Test de signos. - Se desperdicia información usando métodos no paramétricos si se puede emplear procedimientos paramétricos.6 7. 355 . - Se usa en datos de escala nominal u ordinal. Ejercicios propuestos. asi como con datos de intervalo o razón sin suponer distribución alguna. para la realización de pruebas paramétricas. es el único modo de ser libre” José Martí CONTENIDO 7. Entre las ventajas del uso de los métodos no paramétricos se tiene: - Se emplean cuando se desconoce la distribución de la población estudiada.3 7.7 Uso de la distribución Chi-cuadrado. - Las hipótesis se formulan sin considerar valores para los parámetros.1 7.2 7. - Se usan cuando las muestras son pequeñas (n < 30). En este capítulo. ∑ O. . . . Af Of1 …. =  Oij . en las casillas se presenta las frecuencias observadas para las distintas combinaciones y los totales en los márgenes derecho e inferior. . .1 …. . . …. O. Las categorías (cualidades.. B1 …. . . . Suponga que se desea determinar si las variables A y B son dependientes.. . . . . . O1j …. . . . . …. . O. 2. . Ai Oi1 …. . Oic Oi. Sean Ai las categorías de A (i = 1. . . . . . . Bj …. 2. f) y Bj las categorías de B (j = 1. Bc ∑ A1 O11 …. Ofc Of.j = j 1 c f j 1 i 1 total de observaciones para el estudio n   O j   Oi  . Hipótesis: Ho: A y B son variables independientes H1: A y B son variables dependientes 356 f O i 1 ij y el . . c) las que se muestra en la tabla de contingencia pxq siguiente: Obs. los totales de cada columna O. . . TEST DE INDEPENDENCIA En muchos estudios surge el interés por determinar si existe alguna relación de dependencia entre variables cualitativas. cuyos resultados son presentados en tablas de contingencia de f filas por c columnas. O1c O1. . Oij …. . En la tabla anterior se muestra también las frecuencias observadas Oij.c n . . Los pasos a seguir para la prueba de hipótesis son: 1. . .j …. .7. . Ofj …. . atributos o modalidades) de las variables se presentan en los márgenes superior e izquierdo.1 USO DE LA DISTRIBUCIÓN CHI-CUADRADO. . los c totales de cada fila Oi. . ( f 1) (c 1) } 12 . . .c n . . es decir que A y B son independientes. .1 …. . . Bc ∑ A1 e11 …. Escoger el nivel de significación:  f c 3. . . . efj …. Ai ei1 …. B1 …. . . Región crítica: hallar el valor crítico 12 . . . Af ef1 …. . e1c O1.j …. . . . . eij …. . . . . . O. Bj …. suponiendo que Ho es cierta. e1j ….2. . . . . . efc Of. ∑ O. ( f 1) (c 1) tal que la probabilidad de rechazar H0 cuando se supone cierta sea: P [  2  12 .( f 1)(c1) ]   La Región crítica de la prueba es: R. O. 4. . . eic Oi. . . . . . . . . Estadística de prueba:  2   (Oij  eij ) 2 eij i 1 j 1 Donde eij  Oi  x O j n   (2f 1)(c 1) son las frecuencias esperadas obtenidas con las frecuencias observadas. Las frecuencias esperadas se muestran en la tabla de contingencia pxq siguiente: Esp. = {X2 > 12 . .C. . . ( f 1) (c 1) 357 . ).La región de aceptación es: R.C. (o si 6. se usa el índice de masa corporal (peso/talla2) para determinar la condición del peso del alumno (delgado. 358 . ( f 1) (c 1) } 5. Solución 1. H1: La condición del peso de los estudiantes depende del género de este (Existe relación entre la condición del peso y el genero del estudiante). No se rechaza H0 en caso contrario. 2  R. H0: La condición del peso de los estudiantes es independiente del género de este. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . si  calc 2  calc  R.A. = {X2 < 12 . normal o con sobrepeso) y ver si existe alguna relación de dependencia con el sexo (hombre o mujer) del estudiante. A. Hallar  f 2 calc c   (Oij  eij ) 2 i 1 j 1 eij con las tablas anteriores. Los resultados observados obtenidos con el SPSS v21. (NO existe relación entre la condición del peso y el género del estudiante). Decisión: se rechaza H0 con riesgo igual a . se muestran en la siguiente tabla: Tabla de contingencia CONDICIÓN DEL PESO * SEXO Valores Observados CONDICIÓN DEL PESO SEXO Total Hombre Mujer Delgado 0 7 7 Normal 33 66 99 Sobrepeso 5 9 14 Total 38 82 120 Con el 5% de significación probar si hay una relación de dependencia entre la condición del peso del alumno y su sexo (género). el año 2012. Ejemplo 1 En un estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC. 4 0. Región crítica: en la Tabla 2 de Chi-cuadrado.5 Density 0.05 3 2 3.0 0. ( f 1) (c 1) = X 02. Mujer-sobrep = 14x82 / 120 = 9.4. df=2 0.4 9. Mujer-delgada = 7x82 / 120 = 4.3 0. Entonces.4.6 359 .2.95 .1 0. 2 = 5.8 Hombre-normal = 99x38 / 120 = 31.4 67.2 0. Mujer-normal = 99x82 / 120 = 67.05 0 5. Hallar  calc con la tabla de valores observados y la de valores esperados siguiente: Tabla de contingencia CONDICIÓN DEL PESO * SEXO Valores Esperados CONDICIÓN DEL PESO SEXO Total Hombre Mujer Delgado 2. = {X2 > 5. hallar el valor crítico X 12 .8 7 Normal 31.99} Distribution Plot Chi-Square.C.2. R.6 Hombre-sobrep = 14x38 / 120 = 4. Nivel de significación:  = 0.99.6 99 Sobrepeso 4.6 14 Total 38 82 120 Los valores esperados se obtienen con los totales observados así: Hombre-delgado = 7x38 / 120 = 2.99 X Valor crítico de chi-cuadrado en Minitab 2 5.2 4. Estadística de prueba:    2 (Oij  eij ) 2 eij i 1 j 1   22 4. 724 1 . Estando definidas las variables sexo y condición del peso. ingresar en Filas: la variable condición del peso y en Columnas: la variable sexo.561 2 .062 Asociación lineal por 1. Los resultados son similares.6) 2 = 3. En la ventana de Tablas de contingencia.22. pues chi-cuadrado = 3.477 lineal N de casos válidos 120 a. con el 5% de significación. . los resultados en el programa SPSS se obtienen así: Analizar → Estadísticos descriptivos → Tablas de contingencia.45   67.4 (66  67.8) 2 (33  31. escoger Chi-cuadrado.4 9. es equivalente al 2  calc  3. Decisión: como  calc H0. La frecuencia mínima esperada es 2.2) 2 (7  4. Luego Continuar y Aceptar. 3 2 calc 2   (Oij  eij ) 2 i 1 j 1  eij  (0  2.6 4. por lo tanto la condición del peso de los estudiantes es independiente del género de este.0%) tienen una frecuencia esperada inferior a 5. = 0. En Estadísticos.05 no se rechaza Ho y se concluye también que la condición del peso de los estudiantes es independiente del género.6) 2 (5  4. con el 5% de significación no se rechaza 6. los resultados son la Tabla de contingencia de valores observados y las Pruebas de chi-cuadrado siguientes: Pruebas de chi-cuadrado Valor gl Sig. (NO existe relación entre la condición del peso y el género del estudiante).8 31.45 y como el valor-P = Sig.176 >  = 0. es decir no hay diferencias significativas entre el sexo y el peso de los alumnos.45  R.189 Chi-cuadrado de Pearson 3. 3 casillas (50.477. A. 360 .4) 2 (9  9.176 Razón de verosimilitudes 5.6 2  3.4) 2    2. asintótica (bilateral) a 2 .2 4. Valor P = 0. 361 . GL = 2. Aceptar y en la ventana de Sesión aprece el resultado siguiente: Estadísticas tabuladas: Condición.176 Chi-cuadrada de la tasa de verosimilitud = 5. Sexo Filas: Condición Delgado Normal Sobrepeso Todo Columnas: Sexo Hombre Mujer Todo 0 33 5 38 7 66 9 82 7 99 14 120 Contenido de la celda: Conteo Chi-cuadrada de Pearson = 3.477.561.062 * NOTA * 3 celdas con conteos esperados menores que 5 Resultados similares a los ya encontrados. Valor P = 0. GL = 2. definir las columnas para la variables sexo y condición (del peso).De manera similar en el programa Minitab. Escoger del menú Estadísticas → Tablas → Tabulación cruzada y chi-cuadrada. tal como se aprecia a continuación: Con el botón chi-cuadrada … escoger Análisis de chi-cuadrada. Luego Aceptar. En Para filas: seleccionar condición y en Para columnas: sexo. Escoger el nivel de significación:  (Oi  ei ) 2 3. . Hipótesis: Ho: Los datos se ajustan a un modelo de probabilidades H1: Los datos no se ajustan al modelo de probabilidades 2. . . . . La tabla es: Ai Oi ei (Oi – ei)2 /ei A1 O1 e1 (O1 – e1)2 /e1 A2 O2 e2 (O2 – e2)2 /e2 . . Ak Ok ek (Ok – ek)2 /ek ∑ n n ∑ (Oi – ei)2 /ei 12 . . Estadística de prueba:      (2k  p 1) ei i 1 k 2 Los datos se presentan en una tabla de frecuencias.7. siguen una distribución de probabilidades determinada con p parámetros. Las probabilidades pi = P(Ai) se obtienen con el modelo de probabilidades al que se ajustan los datos. Los pasos a seguir para la prueba de hipótesis son: 1.2 TEST DE BONDAD DE AJUSTE Esta prueba es utilizada cuando se desea verficar si es razonable que los datos observados de una variable. . . con sus correspondientes frecuencias observadas Oi y frecuencias esperadas ei = npi. con k categorías o intervalos Ai. . . k  p 1 362 . Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . Hipótesis: Ho: El dado está equilibrado → P(i) = 1/6. ei 2  R. Hallar  calc  i 1 (Oi  ei ) 2 con la anterior tabla de frecuencias. k  p 1 } k 2 5.C. Solución 1. 6 H1: El dado no está equilibrado → P(i) ≠ 1/6. 5 = 11. pi = 1/6. i = 1. Estadística de prueba:      621 ei i 1 6 2 4. i = 1.1} 2 5. Región crítica: en la Tabla 2 de Chi-cuadrado.4. = {X2 > 11. Decisión: se rechaza H0 con con el 100 % de significación.05 (Oi  ei ) 2 3.95 . 2. hallar el valor crítico 12 . ….C. k  p 1 tal que la probabilidad de P [  2  12 . si  calc No se rechaza H0 en caso contrario. 6 2.1. Ejemplo 2 Con el fin de estudiar si un dado está o no equilibrado. Nivel de significación:  = 0. k  p 1 = X 02.C. k  p1 ]   rechazar H0 cuando se supone cierta sea: La región crítica es: R. es decir. por lo tanto las frecuencias esperadas son ei = npi = 300x1/6 = 50. R. Hallar  calc con la información muestral n = 300 y bajo el supuesto que Ho es cierta. Entonces. …. se arroja el dado 300 veces en forma independiente. Región crítica: hallar el valor crítico 12 . 2. = {X2 < 12 . obteniéndose los siguientes resultados: Resultado 1 2 3 4 5 6 Oi 55 42 53 46 47 57 Con el 5% de significación se puede decir que el dado no esta equilibrado. La Tabla de frecuencias observadas y esperadas es: Resultado 1 2 3 4 5 6 Oi 55 42 53 46 47 57 ei 50 50 50 50 50 50 363 . 6. 01.44  R. sin tomar en cuenta el signo (en valor absoluto).05 o 0. c) Asignar los signos de las diferencias di a sus respectivos rangos. la observación asociada se elimina y el tamaño efectivo de la muestra disminuye.3 TEST DE WILCOXON Es una prueba de RANGOS CON SIGNOS propuesta por Wilcoxon (1945) y se usa para contrastar una hipótesis referida al valor de la mediana de la población (Me). Para la verificación de la hipótesis no se hace ningún supuesto sobre la distribución de la población y las observaciones Xi requieren al menos una escala de intervalo ya que la prueba toma la diferencia entre cada valor muestral y el valor hipotético de la mediana. . es el 364 . se concluye que el dado está equilibrado. de Wilcoxon para n ≤ 40 y  = 0. Los pasos a seguir en la prueba son: 1. (Oi  ei ) 2 (55  50) 2 (42  50) 2 (53  50) 2 (46  50) 2 = +     ei 50 50 50 50 i 1 6 2 calc  (47  50) 2 (57  50) 2 = 3. d) Obtener la suma de los rangos para las diferencias positivas y para las negativas por separado. b) Ranquear las diferencias di en forma ascendente. La suma de los rangos positivos = Wcalc. por lo tanto. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto que Ho es cierta. Si alguna diferencia es cero. con el 5% de significación no se rechaza 6. Decisión: como  calc H0. Hipótesis: Ho: Me = Me0 H1: Me ≠ Me0 o Me < Me0 o Me > Me0 2. Escoger el nivel de significación:  3. mediante el siguiente procedimiento: a) Hallar las diferencias di = Xi – Me0 con el signo correspondiente. 7. 5.44  50 50 2  3. Si dos o más diferencias son iguales se asume el rango promedio de esas diferencias empatadas. Región crítica: buscar los valores críticos en la Tabla 5. Estadística de prueba: W = suma de los rangos positivos 4. A. mediante el siguiente procedimiento: 365 .5)  W W  N (0. 321. en la tabla 5. es calculando el valor P.C. 273. 413. Hipótesis: Ho: Me = 300 H1: Me ≠ 300 2. se acepta H0.A. 233. si Wcalc  R. = {W < 25 o W > 95} → R. 290.valor calculado del estadístico de prueba y sirve para hallar el valor-P y compararlo con el nivel de significación . Nivel de significación:  = 0. a partir del valor Zcalc. 305 y 250. = {25 ≤ W ≤ 95} 5. 276. Otra forma de establecer la regla de decisión. se rechaza H0.) de 15 obreros arroja los siguientes resultados: 303.C. Solución 1. No se rechaza H0 en caso contrario. de Wilcoxon la región crítica es: R. de manera que:  Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] Si el valor de P < .05. 285. Probar si la mediana de los salarios es diferente de S/. Decisión: se rechaza H0 con el 100 % de significación. Use α = 0. En caso contrario.05. e) Si el tamaño de muestra es grande el valor-P se obtiene mediante la aproximación a la distribución Normal con: Z calc  Con W  (W  0. 1) n(n  1)(2n  1) n(n  1) y W  24 4 6. 300. 329. 306. Región crítica: para n = 15 y  = 0. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . 380. Estadística de prueba: W = suma de los rangos positivos 4. Ejemplo 3 Una muestra de los salarios semanales (S/.05 3. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto que Ho es cierta. 375. 297. Escoger del menú Estadísticas → No paramétricos → 1W Wilcoxon de 1 muestra. con el 5% de significación no se rechaza H0 y por lo tanto la mediana de los salarios es de S/.40.. En el programa Minitab.5)  W W  (67. en Mediana de la prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna: escoger no es igual a.05.61 P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -0. el valor-P es: 17.5 13 9 7 15 12 6 8 10 4 5 14 3 11 67.5  0. definir la variable salarios con sus datos.5 6.5)  60 = 0. Para la aproximación a la distribución normal. en Variables: seleccionar Salarios. Como el valor-P = 0. con el 5% de significación no se rechaza H0.69 >  = 0. Decisión: como Wcalc = 67.61   4 4 24 24 Z calc  (W  0. Para dos colas.5 -3 1.69.3446) = 0.5 Wcalc = suma de los rangos positivos = 67. Al abrir la ventana de diálogo. tal como se aprecia a continuación: 366 .5 1.5 75 13 -27 9 21 7 113 15 -67 12 -15 6 -24 8 29 10 6 4 -10 5 80 14 5 3 -50 11 Rangos con signo (+) (-) 1.40] = 2(0. 300. con n = 15 se obtiene: W  n(n  1)(2n  1) 15(16)(31) n(n  1) 15(16) = 60 y  W  = 17.Obreros 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Salarios (Xi) 303 297 375 273 321 413 233 285 276 329 306 290 380 305 250 Total Diferencias Rango de di = Xi – 300 |di| 3 1.5 52. Finalmente escoger Aceptar.A.5 ϵ R. 0 Resultados y conclusiones similares a los antes obtenidos: W = 67.5 y P = 0.En la ventana de Sesión aprece el resultado siguiente: Prueba de clasificación con signos de Wilcoxon: Salarios (Xi) Prueba de la mediana = 300. 300. 7.691 Mediana estimada 304.0 vs.0 339.0 Como la mediana hipotética cae en el intervalo de confianza.4 TEST DE SIGNOS Es una prueba basada en los signos que surgen de la diferencia de comparar los datos de una población con respecto a su mediana o entre sí (en investigación de mercados para identificar la preferencia hacia una de dos marcas de un producto). La mediana no = 300.0 Confianza lograda 95. 367 . El Minitab proporciona el intervalo de confianza del 95% para la mediana: IC de clasificación con signos de Wilcoxon: Salarios (Xi) Salarios (Xi) N 15 Mediana estimada 304.0 Intervalo de confianza Inferior Superior 281.0 N 15 Salarios (Xi) Número de prueba 15 Estadística de Wilcoxon 67.5 P 0. también se acepta que la mediana de los salarios es S/.691. b) Hallar Scalc = número de veces que se repite el signo menos frecuente.5)  0.5. La estadística de prueba S = número de veces que se repite el signo menos frecuente.C. 5. Si algún valor es igual a la mediana hipotética Me0. mediante el siguiente procedimiento: a) Aplicar un signo más (+) a cada valor observado en la muestra mayor que la mediana hipotética Me0 y un signo menos (-) a cada valor menor. Escoger el nivel de significación:  3. a partir del valor Zcalc. de valores críticos para la prueba del signo S: n ≤ 25 y  = 0. 1) 0. Región crítica: buscar el valor crítico en la Tabla 6.5n  N (0. si S calc  R. Decisión: se rechaza H0 con el 100 % de significación.25n) entonces Z calc  ( X  0.5 n 6.PRUEBA PARA COMPARAR LOS VALORES CON LA MEDIANA Los pasos a seguir en la prueba son: 1.5n. 0. no se aplica signo alguno y el tamaño efectivo de la muestra disminuye.05. es el valor calculado del estadístico de prueba y sirve para hallar el valor-P y compararlo con el nivel de significación . S se basa en la distribución Binomial con probabilidad de éxito ½ ya que la probabilidad que un valor sea mayor o menor que la mediana es ½. de manera que: 368 . La hipótesis nula se rechaza si S es menor o igual al valor de la tabla. Determinar S = número de veces que se repite el signo menos frecuente. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . 4. c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante la aproximación Normal de la Binomial S = X = número de veces que se repite el signo menos frecuente con p = q = 0. es calculando el valor P. con la información muestral y bajo el supuesto que Ho es cierta. Otra forma de establecer la regla de decisión. Hipótesis: Ho: Me = Me0 H1: Me ≠ Me0 o Me < Me0 o Me > Me0 2.01 o 0. No se rechaza H0 en caso contrario. Si S = X → N(0.  Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] Si el valor de P < . 297. Probar si la mediana de los salarios es diferente de S/. En caso contrario. Región crítica: para n = 15 y  = 0. 4. Use α = 0.05 3. = {S ≤ 3} → R. 329.) de 15 obreros del ejemplo 3. 285. 375. se rechaza H0. 305 y 250. Ejemplo 4 Para la muestra de los salarios semanales (S/. = {S > 3} 5. la región crítica es: R. 380. 276. Nivel de significación:  = 0. 306.05. 233. Hipótesis: Ho: Me = 300 H1: Me ≠ 300 2. 413. 290. en la tabla 6 de valores críticos para la prueba del signo. mediante el siguiente procedimiento: Obreros 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Salarios (Xi) 303 297 375 273 321 413 233 285 276 329 306 290 380 305 250 Signo Diferencia Xi – 300 + + + + + + + + 369 . 321. siguientes: 303.A.05. Estadística de prueba: S = número de veces que se repite el signo menos frecuente.C. Determinar Scalc con la información muestral y bajo el supuesto que Ho es cierta. 300. se acepta H0. Solución 1. 273. 5 n 0.5)  0. en Variables: seleccionar Salarios. 6.0000.Scalc = número de veces que se repite el signo menos frecuente = 7.A. en Mediana de la prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna: escoger no es igual a.00  0.. con el 5% de significación no se rechaza H0 y por lo tanto la mediana de los salarios es de S/.5)  0. Para la aproximación a la distribución normal de S = X = número de veces que se repite el signo menos frecuente. con n = 15. Al abrir la ventana de diálogo. Decisión: como Scalc = 7 ϵ R.5000) = 1. el valor-P es: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < 0. 300.5x15 = 0.5n (7  0. Escoger del menú Estadísticas → No paramétricos → 1± Señal de 1 muestra. Como el valor-P = 1.5 se obtiene: Z calc  ( X  0. tal como se aprecia a continuación: En la ventana de Sesión aprece el resultado siguiente: 370 . p = q = 0.5 15 Para dos colas.0] = 2(0. En el programa Minitab.00 >  = 0. definir la variable salarios con sus datos. Finalmente escoger Aceptar. con el 5% de significación no se rechaza H0.05. Escoger el nivel de significación:  371 . 2.0 Arriba 8 P 1. también para hacer comparaciones entre los valores de los grupos A y B (asignando signo positivo cuando el valor de A es superior al valor de B y signo negativo en caso contrario.0 Resultados y conclusiones similares a los obtenidos: S = Debajo = 7 y P = 1.0000 Mediana 303.0 279. no = 300.0 321. Los pasos a seguir en la prueba son: 1. 300.50 H1: p ≠ 0.9500 0.50 o p > 0.0 329.0 276.0 Posición 5 NLI 4 Como la mediana hipotética cae en el intervalo de confianza. si son iguales se descarta las observaciones y n disminuye). Hipótesis: Ho: p = 0.0 Confianza lograda 0. también se acepta que la mediana de los salarios es S/.9648 Intervalo de confianza Inferior Superior 285.50.50 o p < 0. El Minitab proporciona también el siguiente intervalo de confianza del 95% para la mediana: IC de signos: Salarios Intervalo de confianza del signo para la mediana Salarios N 15 Mediana 303.0000.4 326.0 vs.8815 0. PRUEBA PARA COMPARAR LOS VALORES ENTRE SI En investigación de mercados sirve para identificar la preferencia hacia una de dos marcas de un producto (se asigna signo positivo cuando la preferencia es por la marca de interés y signo negativo en caso contrario).50.Prueba de signos para mediana: Salarios (Xi) Prueba del signo de la mediana = Salarios (Xi) N 15 Debajo 7 Igual 0 300. Probar si las preferencias son iguales para ambas marcas o que el número de signos positivos es igual al número de signos negativos es equivalente a probar si p = 0. 3. La estadística de prueba S = número de veces que se repite el signo menos frecuente. S se basa en la distribución Binomial con probabilidad de éxito ½ ya que la probabilidad que se prefiera una u otra marca (o que un valor sea mayor o menor que otro) es ½. 4. Región crítica: buscar el valor crítico en la Tabla 6 para la prueba del signo S. La hipótesis nula se rechaza si S es menor o igual al valor de la tabla. 5. Determinar S = número de veces que se repite el signo menos frecuente, con la información muestral y bajo el supuesto que Ho es cierta, mediante el siguiente procedimiento: a) Si se comparan dos marcas de un bien o servicio: aplicar signo positivo (+) cuando la preferencia es por la marca de interés y signo negativo (-) en caso contrario. Si se hace comparaciones entre los valores de los grupos A y B asignar signo positivo (+) cuando el valor de A es superior al valor de B y signo negativo (-) en caso contrario. Si son iguales los valores no se aplica signo alguno, se descarta las observaciones y el tamaño efectivo de la muestra disminuye. b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es el valor calculado del estadístico de prueba y sirve para hallar el valor-P y compararlo con el nivel de significación . c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante la aproximación Normal de la Binomial S = X = número de veces que se repite el signo menos frecuente con p = q = 0.5. Si S = X → N(0.5n, 0.25n) entonces Z calc  ( X  0.5)  0.5n  N (0, 1) 0.5 n 6. Decisión: se rechaza H0 con el 100 % de significación, si S calc  R.C. por lo tanto no son iguales las preferencias por ambos productos o los valores comparados de los grupos A y B no son iguales. Otra forma de establecer la regla de decisión, es calculando el valor P, a partir del valor Zcalc, de manera que:  Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]  Para cola a la derecha: P = P[Z > Zcalc]  Para cola a la izquierda: P = P[Z < Zcalc] 372 Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0. Ejemplo 5 En un estudio para determinar si la marca de frugo B es más preferida por las amas de casa que la marca A, se hizo degustar aleatoriamente las marcas A y B a 16 amas de casa siendo sus preferencias las siguientes: B, B, B, B, A, B, B, B, B, B, B, A, B, B, A y B. Con el 5% de significación pruebe si la preferencia de las amas de casa por la marca de frugo A es inferior a la marca B. Solución 1. Hipótesis: si la preferencia de las amas de casa por las marcas de frugo A y B es la misma es equivalente a postular Ho: p = 0.50 frente a la alternativa que la preferencia por la marca A es inferior a la marca B, H1: p < 0.50 2. Nivel de significación:  = 0.05 3. Estadística de prueba: S = número de veces que se repite el signo menos frecuente. 4. Región crítica: para n = 16 y  = 0.05, en la tabla 6 de valores críticos para la prueba del signo, la región crítica es: R.C. = {S ≤ 3} → R.A. = {S > 3} 5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es cierta, mediante el siguiente procedimiento: Ama de casa Frugo preferido 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 B B B B A B B B B B B A B B A B 373 Signo + + + + + + + + + + + + + Scalc = número de veces que se repite el signo menos frecuente = 3. 6. Decisión: como Scalc = 3 ϵ R.C., con el 5% de significación se rechaza H0 y por lo tanto se acepta que la preferencia por la marca A es inferior a la marca B. 7.5 TEST DE LA MEDIANA En el acápite 6.5 y 6.6 se trataron las pruebas estadísticas paramétricas Z o T para la verificación de la igualdad de medias de dos poblaciones, extrayendo muestras independientes de dichas poblaciones con varianzas conocidas o desconocidas. La prueba de la mediana es la contraparte no paramétrica para la verificación de la igualdad de medianas de dos poblaciones, extrayendo muestras independientes. La escala de medida de la variable es cuando menos ordinal. El procedimiento a seguir en la prueba es el siguiente: 1. Hipótesis: Ho: Me1 = Me2 H1: Me1 ≠ Me2 o Me1 > Me2 o Me1 < Me2 2. Escoger el nivel de significación:  2 2 3. Estadística de prueba:    2 (Oij  eij ) 2 i 1 j 1 eij   [21, 1 ) Donde Oij son las frecuencias observadas y eij son las frecuencias esperadas obtenidas con las frecuencias observadas, suponiendo que Ho es cierta. 4. Región crítica: hallar el valor crítico  [21, 1 ] tal que la probabilidad de rechazar H0 cuando se supone cierta sea: P [  2  [21,1 ] ]   La Región crítica de la prueba es: R.C. = {X2 >  [21, 1 ] } 2 5. Determinar  calc , con la información muestral y bajo el supuesto que Ho es cierta, mediante el siguiente procedimiento: a) Calcular la mediana común Me con toda la información de las dos muestras. b) Para cada muestra determinar el número de observaciones que son menores o iguales a la mediana común y las que son mayores a dicha mediana y las frecuencias observadas resultantes se colocan en una tabla de contingencia 2x2 como la siguiente: 374 Muestra 1 2 Total ≤ Me O11 O21 O.1 Muestra 1 2 Total ≤ Me e11 e21 O.1 (Oij  eij ) 2 > Me Total O12 O1. O22 O2. O..2 n Oi  x O j c) Hallar las frecuencias esperadas eij  y colocarlas en la tabla: n 2 2 2   d) Determinar  calc > Me e12 e22 O..2 Total O1. O2. n eij i 1 j 1 2  R.C. No se rechaza 6. Decisión: se rechaza H0 con riesgo igual a  si si  calc H0 en caso contrario. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es . Ejemplo 6 Con la información del número de unidades vendidas por hombres y mujeres en la tabla, determinar si la mediana del número de unidades vendidas por las mujeres es mayor que la mediana de las unidades vendidas por los hombres. Usar el 5% de significación. Hombres (1) 39 43 25 31 45 44 26 25 23 24 38 25 20 Mujeres (2) 30 28 32 48 42 35 48 21 40 30 40 45 28 Solución 1. Hipótesis: Ho: Me2 = Me1 y H1: Me2 > Me1 375 2. Nivel de significación:  = 0.05. 2 2 3. Estadística de prueba:  2   (Oij  eij ) 2 eij i 1 j 1   [21, 1 ) 4. Región crítica: el valor crítico es  [21, 0.95] = 3.84 y R.C. = {X2 > 3.84}. 2 5. Determinar  calc , con la información muestral y bajo el supuesto que Ho es cierta, de la siguiente manera: a) Con toda la información de las dos muestras se calcula la mediana común y resulta Me = 31.5. b) Para cada muestra se determina el número de observaciones que son menores o iguales (orden 1) a la mediana común 31.5 y las que son mayores (orden 2) a dicha mediana: Unid. Vendidas 39 43 25 31 45 44 26 25 23 24 38 25 20 30 28 32 48 42 35 48 21 40 30 40 45 28 Me = 31.5 Sexo 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 376 Orden 2 2 1 1 2 2 1 1 1 1 2 1 1 1 1 2 2 2 2 2 1 2 1 2 2 1 Las frecuencias observadas resultantes se colocan en una tabla de contingencia 2x2 como la siguiente: Muestra 1 = hombres 2 = Mujeres Total ≤ Me (Ord. 1) 8 5 O.1 = 13 Muestra 1 = hombres 2 = Mujeres Total ≤ Me (Ord. 1) 6.5 6.5 O.1 = 13 2 2 (O  e ) 2 ij ij > Me (Ord. 2) Total 5 O1. = 13 8 O2. = 13 O.2 =13 n = 26 Oi  x O j c) Hallar las frecuencias esperadas eij  y colocarlas en la tabla: n 2   d) Determinar:  calc i 1 j 1 2  calc  > Me (Ord. 2) 6.5 6.5 O.2 =13 Total O1. = 13 O2. = 13 n = 26 eij (8  6.5) 2 (5  6.5) 2 (5  6.5) 2 (8  6.5) 2     = 1.385 6.5 6.5 6.5 6.5 P-valor = P( 12 > 1.385) = 1 - P( 12 ≤ 1.385) = 1 – 0.761 = 0.239. 2 6. Decisión: como  calc = 1.38 ϵ R.A. y P-valor = 0.239 >  = 0.05, no se rechaza H0 por lo tanto con el 5% de significación se acepta que la mediana del número de unidades vendidas por las mujeres y los hombres son iguales. 377 En el programa Minitab, definir las variables Unidades vendidas y Sexo con sus datos. Escoger del menú Estadísticas → No paramétricos → Prueba de la mediana de Mood. Al abrir la ventana de diálogo, en Respuesta: seleccionar Unid. vendidas, en Factor: seleccionar Sexo. Finalmente escoger Aceptar, tal como se aprecia en la ventana de diálogo de la página anterior. En la ventana de Sesión aprece el resultado siguiente: Prueba de mediana de Mood: Unid. vendidas en funcion de Sexo Prueba de la mediana de Mood para Unid. vendidas Chi-cuadrada = 1.38 GL = 1 P = 0.239 ICs de 95.0% individuales Sexo 1 2 N<= 8 5 N> 5 8 Mediana 26.0 35.0 Q3-Q1 16.5 14.5 -+---------+---------+---------+----(--*----------------------------) (----------*---------------) -+---------+---------+---------+----25.0 30.0 35.0 40.0 Mediana general = 31.5 Un IC de 95.0% para la mediana(1) - mediana(2): (-15.8,8.4) 2 Resultados y conclusiones similares a los obtenidos:  calc = 1.38 y P = 0.239. Por lo tanto con el 5% de significación se acepta que la mediana del número de unidades vendidas por las mujeres y los hombres son iguales. 378 7.7 PROBLEMAS RESUELTOS 1. En el estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC, el año 2012, con el 5% de significación probar si existe relación entre el hobby (pasatiempo) del alumno y su sexo (género). Los resultados observados obtenidos con el SPSS v21, se muestran en la siguiente tabla: Tabla de contingencia HOBBY * SEXO Valores Observados SEXO HOBBY Total Hombre Mujer Deportes 18 6 24 Música 12 33 45 Baile 1 9 10 TV / Cine 2 27 29 Otros Total 5 38 7 82 12 120 Solución 1. H0: El hobby de los estudiantes es independiente del género de este. (NO existe relación entre el hobby y el género del estudiante). H1: El hobby de los estudiantes depende del género de este (Existe relación entre el hobby y el genero del estudiante). 2. Nivel de significación:  = 0.05 5 2 3. Estadística de prueba:    2 (Oij  eij ) 2 eij i 1 j 1   42 4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico X 12 , ( f 1) (c 1) = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49} 2 5. Hallar  calc con la tabla de valores observados y la de valores esperados. Tabla de contingencia HOBBY * SEXO Valores Esperados SEXO HOBBY Total Hombre Mujer Deportes 7.6 16.4 24 Música 14.3 30.8 45 Baile 3.2 6.8 10 TV / Cine 9.2 19.8 29 Otros Total 3.8 38 8.2 82 12 120 379 232 0.4 Hombre-música = 45x38 / 120 = 14.2 14. los resultados son la Tabla de contingencia de valores observados del enunciado y las Pruebas de chi-cuadrado siguientes: 380 .293 2 6.8.604 0. escoger Chi-cuadrado.2.4 30. ingresar en Filas: la variable hobby y en Columnas: la variable sexo.8 6.8 Hombre-tv/cine= 29x38 / 120 = 9.6.482 5.293 2 = 32. Luego Continuar y Aceptar.3. por lo tanto el hobby de los estudiantes depende del género de este.8 19.687 2. Mujer-baile = 10x82 / 120 = 6. con el 5% de significación se rechaza H0. Mujer-otros = 12x82 / 120 = 8.8 Hombre-baile = 10x38 / 120 = 3.2 2 Para hallar  calc ordenamos los valores observados y esperados en la tabla: Hobby-sexo Deporte-hombre Música-hombre Baile-hombre Tv/cine-hombre Otros-hombre Deporte-mujer Música-mujer Baile-mujer Tv/cine-mujer Otros-mujer Oij eij (Oij .8 Hombre-otros = 12x38 / 120 = 3.2 9. En la ventana de Tablas de contingencia.6 14. (Existe relación entre el hobby y el género del estudiante). Mujer-tv/cine = 29x82 / 120 = 19.355 1.619 0. Estando definidas las variables sexo y hobby. En Estadísticos.379 6.Los valores esperados se obtienen con los totales observados así: Hombre-deportes = 24x38 / 120 = 7.595 0.293 ϵ R.C.eij)2/ eij 18 12 1 2 5 6 33 9 27 7 7.176 2  calc  ∑ 5 2 2   Luego  calc i 1 j 1 (Oij  eij ) eij 32. Mujer-música = 45x82 / 120 = 30. Mujer-deportes = 24x82 / 120 = 16. los resultados en el programa SPSS se obtienen así: Analizar → Estadísticos descriptivos → Tablas de contingencia. Decisión: como  calc = 32.2 3.8 16..2.3 3.165 0.8 8. 000 Razón de verosimilitudes 33. que el hobby de los estudiantes depende del género. y como el valor-P = Sig.05 se rechaza Ho y se concluye también.000 <  = 0.000 Chi-cuadrado de Pearson 32. se muestran en la siguiente tabla: Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO Valores Observados SEXO IMPORTANCIA DE TUS Total Hombre Mujer Poca 0 1 1 Media 2 4 6 Mucha 21 43 64 Muchísima 15 34 49 Total 38 82 120 ESTUDIOS Solución 1.17. pues  calc = 32. La frecuencia mínima esperada es 3. En el estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC. 2 Los resultados son similares. H0: No existe relación entre la importancia de los estudios y el género del estudiante (son independientes). = 0. con el 5% de significación probar si hay una relación de dependencia entre la importancia de sus estudios para el alumno y su sexo (género).293. Los resultados observados obtenidos con el SPSS v21. con el 5% de significación. el año 2012.0%) tienen una frecuencia esperada inferior a 5.05 381 . 2.191 1 . H1: Existe relación entre la importancia de los estudios y el genero del estudiante.Pruebas de chi-cuadrado Valor gl Sig. asintótica (bilateral) a 4 . Nivel de significación:  = 0. 2 casillas (20.297 4 . 2.293 lineal N de casos válidos 120 a.000 Asociación lineal por 12. 9 20.1 6 Mucha 20.1 43.eij)2/ eij 0.3 1.5. Región crítica: en la Tabla 2 de Chi-cuadrado.012 0.7 Hombre-media = 6x38 / 120 = 1. Entonces.7 64 Muchísima 15.81} 2 5.3.5 0.3 0.535 382 (Oij . 3 = 7.5 2  calc  ∑ Luego  4 2 calc 2   i 1 j 1 (Oij  eij ) 2 eij = 0. Mujer-media = 6x82 / 120 = 4. Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO Valores Esperados SEXO IMPORTANCIA DE TUS Total Hombre Mujer Poca 0.4 2 3.7 1 Media 1. Mujer-mucha = 64x82 / 120 = 43.5 2 Para hallar  calc ordenamos los valores observados y esperados en la tabla: Oij Imp.3 15.7 Hombre-muchísima = 49x38 / 120 = 15.81.3 43.017 0.317 0.95 . ( f 1) (c 1) = X 02.002 0. Estadística de prueba:    2 (Oij  eij ) 2 eij i 1 j 1   32 4. hallar el valor crítico X 12 .3.9. R. Hallar  calc con la tabla de valores observados y la de valores esperados.535 .008 0.005 0.147 0.027 0.7 4. Mujer-muchísima = 49x82 / 120 = 35.1 Hombre-mucha = 64x38 / 120 = 20. Mujer-poca = 1x82 / 120 = 0.5 35. = {X2 > 7.5 49 38 82 120 ESTUDIOS Total Los valores esperados se obtienen con los totales observados así: Hombre-poca = 1x38 / 120 = 0.C.7 33.estudio-sexo Poca-hombre Media-hombre Mucha-hombre Muchisima-hombre Poca-mujer Media-mujer Mucha-mujer Muchísima-mujer eij 0 2 21 15 1 4 43 34 0.9 4. 4 casillas (50.833 3 .535 120 a. por lo tanto la importancia de los estudios es independiente del género del alumno. con el 5% de significación no se rechaza H0.. H0: No existe relación entre el nivel de ingreso de los representantes industriales y el nivel de su empleo (son independientes). medianas o grandes. con el 5% de significación. 3. Decisión: como  calc = 0.842 Asociación lineal por lineal .996 Chi-cuadrado de Pearson N de casos válidos . Estando definidas las variables importancia de los estudios y sexo.911 Razón de verosimilitudes . (La importancia de los estudios no depende del género del alumno). se encontró los siguientes resultados: Valores Observados TIPO DE EMPRESA Cuenta propia Pequeñas Medianas Grandes Total < 20 9 12 40 89 150 INGRESOS (miles $) 20 .A.05. En una encuesta de Mason y Lind (1998) respecto a los ingresos de representantes industriales que trabajan por su cuenta o son empleados de empresas pequeñas.40 > 40 11 10 10 13 45 50 104 107 170 180 Total 30 35 135 300 500 Examine la hipótesis de que no existe relación entre el nivel de ingreso de los representantes industriales y el nivel de su empleo (trabajando por su cuenta o empleados en empresas pequeñas. asintótica (bilateral) a 3 . Resultados similares a los obtenidos. 383 . Realice la prueba al nivel 0.535 ϵ R. los resultados en el programa SPSS son la Tabla de contingencia de valores observados del enunciado y las Pruebas de chi-cuadrado siguientes: Pruebas de chi-cuadrado Valor gl Sig. medianas o grandes). es decir que la importancia de los estudios es independiente del género del alumno. Solución 1.0%) tienen una frecuencia esperada inferior a 5.000 1 .2 6. eij)2/ eij 0. 6 = 12. Hallar  calc con la tabla de valores observados y la de valores esperados.05 4 3 3.> 20 Pequeña .9 102. Entonces.20 a 40 C.6 48.2. ( f 1) (c 1) = X 02.> 20 Oij eij 9 12 40 89 11 10 45 104 10 13 50 107 9.C.006 0. Región crítica: en la Tabla 2 de Chi-cuadrado. Valores Esperados TIPO DE EMPRESA Cuenta propia Pequeñas Medianas Grandes Total INGRESOS 20 .20 a 40 Mediana .0 170 180 < 20 9.6.5. 35x170/500 = 11.8 Pequeñas: 35x150/500 = 10. 30x180/500 = 10.9. = {X2 > 12. hallar el valor crítico X 12 .20 a 40 Pequeña .0 108. Estadística de prueba:    2 (Oij  eij ) 2 i 1 j 1 eij   62 4.214 0.0.6 45. propia .> 20 Grande .5 90.013 0.059 0.040 0.9.5 40.40 > 40 10. propia .< 20 Mediana .0 2  calc  ∑ 384 (Oij .< 20 Grande . 30x170/500 = 10. 300x180/500 = 108 2 Para hallar  calc ordenamos los valores observados y esperados en la tabla: Tipo emp. 300x170/500 = 102.039 0.9 45.8 11.20 a 40 Grande .95 .> 20 Mediana .303 0.9 48.0 10.< 20 C.2 11.6 102.0 150 Total 30 35 135 300 500 Los valores esperados se obtienen con los totales observados así: Cuenta propia: 30x150/500 = 9.9 12.0 10.776 .063 0.0 10.5.-ingresos C.6 Medianas: 135x150/500 = 40.< 20 Pequeña .0 10. propia .018 0.5 40.011 0. 35x180/500 = 12. 135x180/500 =48.H1: Existe relación entre el nivel de ingreso de los representantes industriales y el nivel de su empleo.6 Grandes: 300x150/500 = 90.2 10.6 108.000 0. Nivel de significación:  = 0.009 0. 135x170/500 = 45.8 12.6} 2 5.5 90. R. 2. 05 3 3 3.1 11.2 100 PROVEEDOR B C 173. ¿Qué dice el resultado de su análisis al departamento de compras? Solución 1.49. hallar el valor crítico X 12 . R.C. = {X2 > 9.776 2 6. 4 = 9. Estadística de prueba:    2 (Oij  eij ) 2 eij i 1 j 1   42 4. con el 5% de significación no se rechaza H0. Entonces.1 133.. Los datos de partes defectuosas procedente de tres proveedores [Anderson y Otros (2004)] son los siguientes: Valores Observados: CALIDAD DE PARTES Buena Defectos pequeños Defectos graves Total PROVEEDOR B C 170 135 18 6 7 9 195 150 A 90 3 7 100 Total 395 27 23 445 Use α = 0.49} 2 5.1 5. por lo tanto el nivel de ingreso de los representantes industriales es independiente del nivel de su empleo (El nivel de ingreso de los representantes industriales no depende del tipo de empresa donde labora).8 9. H1: Existe relación entre el proveedor y la calidad de las partes ofrecidas.95 . ( f 1) (c 1) = X 02.A.776 ϵ R. Valores Esperados CALIDAD DE PARTES Buena Defectos pequeños Defectos graves Total A 88. Decisión: como  calc = 0. Nivel de significación:  = 0.Luego  4 2 calc 3   (Oij  eij ) 2 i 1 j 1 eij = 0.05 y demuestre si hay independencia entre proveedor y calidad de las partes. 4. Región crítica: en la Tabla 2 de Chi-cuadrado. H0: No existe relación entre el proveedor y la calidad de las partes ofrecidas (son independientes).8 195 150 385 Total 395 27 23 445 .1 10. 2.1 7. Hallar  calc con la tabla de valores observados y la de valores esperados.8 6. B Def.: 23x100/445 = 5. Decisión: como  calc = 7. peq.A Buena .5) H1: El juego no se ajusta al azar (X no es binomial) 2. . peq. 395x195/445 = 173.proveedor Buena . grave . Estadística de prueba:  2   i 1 (Oi  ei ) 2   521 ei 386 .712 ϵ R.: 27x100/445 = 6.C Def. 23x150/445 = 7. El experimento de lanzar 4 monedas al aire se repite 500 veces.1 11.8 6.712 = 7.2 173.8 2 Para hallar  calc ordenamos los valores observados y esperados en la tabla: Oij Calidad .1 Def.017 1.A Def.B Def.8 2  calc  ∑ Luego  3 2 calc 3   i 1 j 1 (Oij  eij ) 2 (Oij .C Def.8.712 eij 2 6. graves.B Buena .8 10.05 5 3. ¿se ajusta el juego al azar? Solución 1.1 Def.1. . pequeños. grave . por lo tanto la calidad de las partes ofrecidas es independiente del proveedor (La calidad de las partes ofrecidas no depende del proveedor).A Def. Nivel de significación:  = 0. peq.1 9.C eij 90 3 7 170 18 7 135 6 9 88.026 1. 23x195/445 = 10.eij)2/ eij 0.2.216 0.1 133.Los valores esperados se obtienen con los totales observados así: Buena: 395x100/445 = 88. 27x195/445 = 11. Se recomienda al departamento de compras 5.A.8.1. 0.055 3. Hipótesis: Ho: El juego se ajusta al azar → X ~ B(4. grave ..1 7.057 0. el resultado de observar el número de sellos es el siguiente: N° de sellos (Xi) 0 1 2 3 4 Total Frecuencias (ni = Oi) 25 129 192 118 36 500 Con el 5% de significación. 27x150/445 = 9.551 0.1 5.1.649 0.201 7. 395x150/445 = 133. . con el 5% de significación no se rechaza H0.940 0. 6  R.0625 ei = npi 31.0625 Por lo tanto las frecuencias esperadas son ei = npi = 500 pi.25) 2 = 2. 0. Hipótesis: Ho: No hay diferencia en la importancia del físico de los alumnos H1: Si hay diferencia en la importancia del físico de los alumnos 2.25) 2 (129  125) 2 (192  187 .2500 0. . Decisión: como  calc H0. 4 = 9.00 31.25 125 187 . opinaron sobre la importancia de su físico.05 387 . por lo tanto.2500 P(4) = 4C4 (0.95 .0625 0. 6.3750 P(3) = 4C3 (0.00 187.2500 P(2) = 4C2 (0. con el 5% de significación no se rechaza 6. Solución 1. Región crítica: en la Tabla 2 de Chi-cuadrado.5)4 = 0. Entonces.25 2  2. el año 2012.4.6   125 31. A. k  p 1 = X 02.5)4 = 0.C.5)4 = 0. con los siguientes resultados: Imp.25 (Oi  ei ) 2 (25  31. Hallar  calc con la información experimental n = 500 y bajo el supuesto que Ho es cierta. luego: P(0) = 4C0 (0.5) 2 =     ei 31.2500 0.3750 0. = {X2 > 9.49} 2 5. hallar el valor crítico 12 .5)4 = 0. del físico Alumnos (ni = Oi) Poca Media Mucha Muchísima Total 19 48 46 7 120 Con el 5% de significación probar si existe diferencia significativa entre la importancia del físico de los alumnos. se concluye que el juego se ajusta al azar.5).25 125. Nivel de significación:  = 0. es decir X ~ B(4.50 125. Los 120 alumnos de la asignatura de Estadística Básica de la FCE-UNAC.5 i 1 5 2 calc (118  125) 2 (36  31.5)4 = 0. La Tabla de frecuencias observadas y esperadas es: N° Sellos (Xi)  0 1 2 3 4 Oi 25 129 192 118 36 pi 0.0625 P(1) = 4C1 (0. R.49. 5 33 12 .14 13.95 .C.C.12 11.81.5 19 14 .16 15.5 7 10 .11 10.5 3 Probar si las notas se distribuyen normalmente. fueron las siguientes: NOTAS Xi ni 7-8 7. del físico  Poca Media Mucha Muchísima Oi 19 48 46 7 ei 24 24 24 24 (Oi  ei ) 2  ei i 1 4 2 calc (19  24) 2 (48  24) 2 (46  24) 2 (7  24) 2 = =    24 24 24 24 2  calc = 57.(Oi  ei ) 2 3. el año 2012. Hipótesis: Ho: Las notas de los alumnos se distribuyen normalmente H1: Las notas de los alumnos no se distribuyen normalmente 388 . = {X2 > 7. hallar el valor crítico 12 .25 2 6.5 6 9 .05. Solución 1. Las notas de los 120 alumnos de la asignatura de Estadística Básica de la FCEUNAC. Decisión: como  calc = 57. R.10 9. se concluye que si existe diferencia significativa entre la importancia del físico de los alumnos. Estadística de prueba:      421 ei i 1 4 2 4.15 14.5 2 8-9 8. 3 = 7.25 ϵ R. La Tabla de frecuencias observadas y esperadas es: Imp.13 12. Use α = 0.5 7 15 . Hallar  calc con la información observada de los 120 alumnos y bajo el supuesto que Ho es cierta (la importancia del físico es la misma para los alumnos) es decir.5 22 13 .81} 2 5. k  p 1 = X 02. con la misma frecuencia esperada igual a 120/5 = 24. Región crítica: en la Tabla 2 de Chi-cuadrado. Entonces. con el 5% de significación se rechaza H0.5 21 11 .. 7. por lo tanto. 0.2.14686 .77. P(9 ≤ X < 10) = P(-1.0.06433.73) = = 0.04947 .0.14) = = 0.77) 2  2. Nivel de significación:  = 0.33) = = 0.73) – Ф(0.17590.65) – Ф(-2.05 ≤ Z < -0.05) – Ф(-1. P(X ≥ 15) = P(Z ≥ 1. luego: Z X  11.32276 = 0.05) = = 0. Hallar 2  calc con la información observada de los 120 alumnos.02743.14 ≤ Z < 0. La nota promedio de los alumnos es: ˆ  X n i n i  1412  11.65) = Ф(-1.0.65) = = 0. Región crítica: en la Tabla 2 de Chi-cuadrado.73 ≤ Z < 1.0.14686 = 0.55567 .46) = Ф(-0.90824 = 0. P(13 ≤ X < 14) = P(0.25 ≤ Z < -1.14094.46) – Ф(-1. hallar el valor crítico 12 . Entonces.09739.21163.01222 = 0. R.92) = Ф(1.77 120 La varianza de las notas es: ˆ 2 X  2 i ni  nˆ 2 n 1  116950  120(11.33 ≤ Z < 1. 1) permite calcular las probabilidades pi para los 9 1.73) = Ф(0. P(14 ≤ X < 15) = P(1. P(11 ≤ X < 12) = P(-0.679 120  1 Bajo el supuesto que Ho es cierta.25) = = 0.95 .92) = 1 – Ф(1.65 ≤ Z < -1.14) – Ф(-0.33) = Ф(1.679 intervalos considerados así: P(X ≤ 8) = P(Z ≤ -2.25) = Ф(-2.C. X = notas ~ N(11.0. P(12 ≤ X < 13) = P(0.23291.46) = = 0. = {X2 > 12.55567 = 0.97257 = 0.82 → σ = 1.76730 = 0. 2.25) = 0.32276 .82). 389 . Estadística de prueba:  2   i 1 (Oi  ei ) 2   92 21 ei 4.05) = Ф(-1. P(10 ≤ X < 11) = P(-1.92) – Ф(1.76730 .92) = 1 .05 9 3. k  p 1 = X 02.46 ≤ Z < 0. 6 = 12.0.90824 .01222 P(8 ≤ X < 9) = P(-2.03725.97257 .0.6.33) – Ф(0.04947 = 0.14) = Ф(0.6} 5.77  N (0. 10 10 . Probar si la mediana de los gastos de estudio es diferente de S/. Estadística de prueba: W = suma de los rangos positivos 4.11 11 .7 3. 100. 250.16 Total Xi 7.32 ϵ R. = {29 ≤ W ≤ 107} 5. Use α = 0.05.06433 0.C. tal como se aprecia en la tabla de la página siguiente.3 120. 200. 160 y 300.2576 0.A.32 ei 2 6.5 11.7 21. de Wilcoxon la región crítica es: R.0 (Oi . Una muestra de los gastos de estudio mensual (S/.9127 0. Wcalc = suma de los rangos positivos = 45.14094 0. = {W < 29 o W > 107} → R. 200. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto que Ho es cierta.12 12 . Nivel de significación:  = 0. 180.ei)2/ei 0.5 12. se concluye que las notas de los alumnos se distribuyen normalmente.4540 0. 250. 8.5 ni = O i 2 6 7 21 33 22 19 7 3 120 pi 0. con el 5% de significación no se rechaza H0. Región crítica: para n = 16 y  = 0.5 13.5 11..03725 0.9 25. 140.17590 0.9 7.5 10.8796 0.05. Solución 1.5 8.14 14 . Decisión: como  calc = 4.00000 ei = npi 1.3152 En la última columna se tiene: 9 2  calc  i 1 (Oi  ei ) 2 = 4.05 3. 300.5 14.A.1 27.01222 0.4 16.09739 0. 200. en la tabla 5.0006 0.5 15.21163 0. Hipótesis: Ho: Me = 220 H1: Me ≠ 220 2. por lo tanto.13 13 .5237 1.Las probabilidades pi y las frecuencias esperadas ei = n pi = 120 pi se presentan en la siguiente tabla: NOTAS 7-8 8-9 9 .0258 4.1942 0. 120.15 15 . 300. 220. 150.23291 0.) de 16 alumnos arroja los siguientes resultados: 120.5 390 . 210.5 9.0671 0.02743 1.5 4. En el problema 8.5 11. = {S > 3} 5.5 3 8 11. = {S ≤ 3} → R.A.5 ϵ R. Determinar Scalc con la información muestral y bajo el supuesto que Ho es cierta.5 11.5 45. Estadística de prueba: S = número de veces que se repite el signo menos frecuente.05. Use α = 0.5 90. 9. en la tabla 6 de valores críticos para la prueba del signo. 220. Nivel de significación:  = 0.C.5 3 3 7 5.5 -10 1 -120 16 -70 9 -100 14. use la prueba de los signos para probar si la mediana de los gastos de estudio es diferente de S/. mediante el siguiente procedimiento: 391 ..5 6.05.5 30 5. Solución 1.5 Rangos con signo (+) (-) 14.5 80 11. Región crítica: para n = 16 y  = 0. 4.05 3.5 -20 3 -20 3 -40 7 30 5.Gastos (Xi) Alumnos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 120 210 100 150 120 200 200 180 250 300 250 140 300 200 160 300 Total Diferencia Rango de di = Xi |di| 220 -100 14.5 1 16 9 14. 220.5 -20 3 -60 8 80 11. con el 5% de significación no se rechaza H0 y por lo tanto la mediana de los gastos de estudio es de S/. Hipótesis: Ho: Me = 220 H1: Me ≠ 220 2.5 5.5 80 11. la región crítica es: R. Decisión: como Wcalc = 45.5 -80 11.5 11.A. 220 1 120 2 210 3 100 4 150 5 120 6 200 7 200 8 180 9 250 + 10 300 + 11 250 + 12 140 13 300 + 14 200 15 160 16 300 + Scalc = número de veces que se repite el signo menos frecuente = 5.05. Hombres (1) 68 55 70 73 58 59 74 65 66 69 Mujeres (2) 54 42 54 51 43 64 56 47 52 65 Solución 1. 10.Signo Diferencia di = Xi . Decisión: como Scalc = 5 ϵ R.. con el 5% de significación no se rechaza H0 y por lo tanto la mediana de los salarios es de S/. Usar el 5% de significación. determinar si la mediana del peso de los hombres es mayor que la mediana del peso de las mujeres. 392 . 220. Con la información del peso de los hombres y mujeres en la tabla. Hipótesis: Ho: Me1 = Me2 y H1: Me1 > Me2 2. Alumnos Gastos (Xi) 6. Nivel de significación:  = 0.A. 0.1 = 10 393 > Me (Ord. b) Para cada muestra se determina el número de observaciones que son menores o iguales (orden 1) a la mediana común 58.84}. Estadística de prueba:    2 (Oij  eij ) 2 i 1 j 1 eij   [21.84 y R. = 10 O2.2 =10 Total O1. 1) 2 8 O.5 Las frecuencias observadas resultantes se colocan en una tabla de contingencia 2x2 como la siguiente: Muestra 1 = hombres 2 = Mujeres Total ≤ Me (Ord. Región crítica: el valor crítico es  [21. = {X2 > 3.2 2 3.95] = 3.C. 2) 8 2 O. Determinar  calc . con la información muestral y bajo el supuesto que Ho es cierta. 2 5.5. de la siguiente manera: a) Con toda la información de las dos muestras se calcula la mediana común y resulta Me = 58.5 y las que son mayores (orden 2) a dicha mediana: Peso Sexo Orden 68 1 2 55 1 1 70 1 2 73 1 2 58 1 1 59 1 2 74 1 2 65 1 2 66 1 2 69 1 2 54 2 1 42 2 1 54 2 1 51 2 1 43 2 1 64 2 2 56 2 1 47 2 1 52 2 1 65 2 2 Me = 58. = 10 n = 20 . 1 ) 4. 007 ICs de 95.0.007 <  = 0.0 56. Decisión: como  calc = 7. = 10 n = 20 eij i 1 j 1 2 calc Oi  x O j (2  5) 2 (8  5) 2 (8  5) 2 (2  5) 2      = 7. 2 6.0% para la mediana(1) .20) = 1 .P( 12 ≤ 7. 1) 5 5 O.c) Hallar las frecuencias esperadas eij  Muestra 1 = hombres 2 = Mujeres Total ≤ Me (Ord. se rechaza H0 y se acepta H1. = 10 O2. y P-valor = 0.0 53.23.05.0 Q3-Q1 12.20) = 1 – 0.2 =10 Total O1.5 Un IC de 95.0 63.C.20 5 5 5 5 P-valor = P( 12 > 7. por lo tanto con el 5% de significación se aceta que la mediana del peso de los hombres es mayor que la mediana del peso de las mujeres.0 12.0 Mediana general = 58.0) 394 .993 = 0.0 -----+---------+---------+---------+(-----------*----) (----------*-------) -----+---------+---------+---------+49.0% individuales Sexo 1 2 N<= 2 8 N> 8 2 Mediana 67.mediana(2): (3.20 ϵ R.1 = 10 2 2 (O  e ) 2 ij ij 2   d) Determinar:  calc  n y colocarlas en la tabla: > Me (Ord. 2) 5 5 O.007.20 GL = 1 P = 0. Los resultados en el Minitab para la prueba de medianas es el siguiente: Prueba de mediana de Mood: Peso en funcion de Sexo Prueba de la mediana de Mood para Peso Chi-cuadrada = 7.0 70. se realiza una encuesta a 500 adultos.8 PROBLEMAS PROPUESTOS 1. Los resultados observados obtenidos. el año 2012. con el 5% de significación probar si hay una relación de dependencia entre la especialización profesional del alumno de economía y su sexo (género). se muestran en la siguiente tabla: Tabla de contingencia ESPECIALIZACIÓN * SEXO SEXO 3.7. con el 5% de significación probar si existe relación entre la importancia del aspecto físico del alumno y su sexo (género). Los resultados observados obtenidos con el SPSS v21. obteniéndose los siguientes resultados: Consume licor Sí No Total Hombre 195 65 260 Mujer 40 200 240 Total 235 265 500 Use α = 0. se muestran en la siguiente tabla: Tabla de contingencia IMPORTANCIA DE TU FÍSICO * SEXO IMPORTANCIA DE TU FÍSICO 2. 395 . el año 2012. En el estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC.05 y demuestre si el género de las personas adultas es determinante para que consuman licor. SEXO Total Hombre Mujer Poca 12 7 19 Media 14 34 48 Mucha 10 36 46 Muchísima 2 5 7 Total 38 82 120 En el estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC. Total ESPECIALIZACIÓN Hombre Mujer Teoría Económica 8 10 18 Gestión Empresarial 30 72 102 Total 38 82 120 Para determinar si el sexo (género) de las personas adultas es determinante para que estas consuman licor. fueron las siguientes: PESO (Kg) Menos 45 45 . 7. Una encuesta de opinión a 300 clientes de un supermercado. Probar con el 5% de significación si el resultado de la evaluación semestral (aprobado o desaprobado) en la asignatura de estadística básica depende del profesor.4. Los pesos de los 120 alumnos de la asignatura de Estadística Básica de la FCEUNAC.80 80 a más ni = Oi 2 18 20 25 31 9 7 4 4 Con el 5% de significación. Aprobados Desaprobados 33 17 49 11 15 37 97 65 Total 50 60 52 162 Se lanzan 2 dado 500 veces.50 50 . arroja los siguientes resultados: 396 . ¿se ajusta el juego al azar? 6. el resultado de observar la suma del número de puntos en los 2 dados es la siguiente: Suma (Xi) 2 3 4 5 6 7 8 9 10 11 12 Frecuencia (Oi) 6 20 45 42 72 98 75 44 48 35 15 Con el 5% de significación. el año 2012.65 65 . probar si los pesos se distribuyen normalmente.70 70 . sobre la calidad del servicio. con los resultados del semestre 2012-A en la Facultad de Ciencias Económicas de la UNAC siguientes: Profesor P1 P2 P3 Total 5.75 75 .55 55 -60 60 . 11. 2500. 75. Una muestra de los ingresos familiares (S/. 50. 13.) de 20 empleados arroja los siguientes resultados: 1300.00. 11. determinar si la mediana de la talla de los hombres es mayor que la mediana de la talla de las mujeres.80. Probar si la mediana de los pesos es diferente de 65 kilos con la prueba de Wilcoxon y de los signos. 1000. 54.) del kilo de carne pagado por 12 amas de casa arroja los siguientes resultados: 12. Probar si la mediana de los ingresos es diferente de S/. 12. 59. 1500. 1200. 1000. Con la información de la talla de los hombres y mujeres en la tabla. 14.20.40. 11. Los precios (S/. 700.80. 1500. 1000. 11. 1800. 13.00. 44. Usar el 5% de significación. 11. Use α = 0.05. 1500. Los pesos de 15 personas arroja los siguientes resultados: 59. 58. Probar si la mediana de los precios es diferente de S/. 1400 con la prueba de Wilcoxon y de los signos. 700.05. 8.10 con la prueba de Wilcoxon y de los signos.05.30 y 13. 90.50. 10. 12.00.30. 9. 1500. 12. 65 y 43. Use α = 0.50. 1500. 700. 74. 1500. 1400. Hombres (1) 171 167 160 165 168 176 174 169 168 176 Mujeres (2) 152 150 152 165 158 150 155 158 165 149 397 . Use α = 0. 51. 12. 700. 1840 y 2000. 73.Calidad servicio Excelente Bueno Regular Malo Pésimo Frecuencias (Oi) 72 67 52 56 53 Con el 5% de significación probar si existe diferencia significativa entre la opinión de los clientes sobre la calidad del servicio en el supermercado.50. 42. 71. Bogota. Editorial Thomson. Ecoe Ediciones. Editorial Pirámide S. “Estadística para Administración y Economía”. "Probabilidad e Inferencia Estadística". D. Octava edición. (2004). Perú.. Meendenhall. 8. y Otros (2004). 13. Hoog & Craig (1981).. 11.. “Estadística para Administración y Economía”. J. 3. 14.A. "Estadística para Administradores". "Problemas de Estadística". (1997). George (1995). y Otros (2007). 4. Anderson. Editorial Alfaomega. Décimo segunda edición. Colombia. 2. Séptima edición. México. Berenson & Levin (1992). Lima. Resultados del II Censo Nacional de Talla en Escolares 1999. 15. Moya y Saravia (1988). Sexta edición. Ciro (2005). “Probabilidad y Estadística: Aplicaciones y métodos”.A. (1996). "Introduction to Mathematical Statistics". López de la Manzanara (1977). México. Levin R. 10. Bazán. Ministerio de Educación (2000). México. México. México. Kohler. “Estadística para Administración y Economía”. 6. Madrid. México. “Nutrición y Retardo en el Crecimiento”.A. Levin R. Editorial San Marcos. Callao.. Mason. & Rubin D. J. “Estadística y Muestreo”. R. 9. 398 . 5. Prentice Hall Hispanoamericana S.REFERENCIAS BIBLIOGRÁFICAS 1. Octava edición. “Estadística para Negocios y Economía”. Universidad Nacional del Callao: Trabajo de investigación para la Facultad de Ciencias Económicas.A. Canovas.A. México. Compañía Editorial Continental S. 7. (1998). Prentice–Hall Hispanoamericana S. Martínez. Mc Graw Hill. Mc Graw –Hill. y Corbera. "Estadística para Administradores". Heinz (1996). 12. D. J. Editorial Pearson Prentice-Hall. William (1990). y Lind. “Problemas de probabilidad”. Lima. Grupo Editorial Iberoamérica S. Fondo Editorial Universidad de Lima. México. "Estadística para Administración y Economía". Lima. & Rubin D. Chué. “Estadística descriptiva y probabilidades”. México. “Estadística aplicada a los negocios y la economía”. Mood & Graybill (1978). España. 18.org/wiki/William_Sealy_Gosset. http://www. Lima. Editorial McGraw-Hill. http://es. Webster. Universidad del Pacífico: Apuntes de estudio 69. “Pruebas no paramétricas”. Callao.edu.edu%2Fe acuna%2Fminiman11sl.pe/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&c d=6&sqi=2&ved=0CEoQFjAF&url=http%3A%2F%2Facademic.rae. Madrid. “Estadística aplicada”. Mc Graw-Hill.es/drae/ Real Academia Española © Todos los derechos reservados. J. REFERENCIAS WEB 22.wikipedia. Editorial PearsonPrentice Hall. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010. Spiegel.unac. Acuña.16. 25. Ministerio de Salud (2011). http://www. Perú. César (2002). 399 . (2000). Colección Schaum. Murray (1991). Minitab y SPSS” (PDF). España. Allen. Segunda parte. Informe del estado nutricional en el Perú. Universidad Nacional del Callao: Trabajo de investigación para la Facultad de Ciencias Económicas. CENAN – INEI. "Estadística". (2008). Vigésima segunda edición (2001). 21. revisado en agosto de 2012. Toma. "Introducción a la Teoría Estadística". Juan (2011).google. Madrid. 20. “Texto de estadística computacional con R.com.pdf 24. México.pdf&ei=e7dpUov5Foj28wTn8oCYAQ&usg=AFQjCNE -MH9RWOglMaHg479MiFrk0l_FJA 23. “Estadística aplicada a través de Excel”. Editorial Aguilar. J. Universidad de Puerto Rico. 17. 2011. Edgar (2012). Bogota. Bazán.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_ Investigacion/Enero_2011/BAZAN_BACA_FCE/Estad%EDstica%20computaci onal. y Rubio. 19. http://buscon. Tercera edición.uprm. Colombia. Pérez. Excel. Lima. APÉNDICE 400 . 67 -1.38 -1.01831 0.33 -3.01618 0.65 -1.00054 0.00181 0.00074 0.43251 0.00144 0.31 -2.70 F(z) 0.28 -0.22363 0.72 -1.72 -0.00038 0.37 -1.59 -1.04 -3.92 -1.15 -3.00060 0.15 -1.33 -1.07 -0.00020 0.75 -1.30 0.29806 0.14 -3.13 -2.00118 0.01355 0.31 -3.01287 0.00676 0.22065 0.21 -0.83 -0.24196 -0.85 -2.86 -0.04648 0.00066 0.01578 0.27 -1.43 -1.25 -0.00272 0.00466 -2.01 -3.15 -2.23 -2.34090 0.91 -2.44433 0.00030 0.43 -3.30 0.53 -3.82 -0.36 -2.11507 -0.85 -1.00017 0.44 -2.81 -2.74 -1.36 -0.00079 0.02385 0.46 -3.01500 0.00050 0.03216 0.02619 0.00480 0.18406 -0.66 -2.20 0.69 -0.24510 0.06178 0.56 -1.34 -2.00028 0.86 -1.29460 0.77 -2.06681 -0.57 -3.63 -2.60 0.81 -0.03144 0.45224 0.61 -1.51 -0.29116 0.16602 0.04846 0.96 -2.20327 0.00 0.48405 0.01 0.73 -1.23 -3.00939 0.00317 0.55 -3.48 -2.35 -2.96 -0.33724 0.00026 0.57 -0.00021 0.50 F(z) 0.66 -0.52 -3.01786 -1.02118 0.07 -2.00052 0.22 -0.19 -3.75 -2.18 -2.34458 -3.12 -3.54 -0.03 -1.58 -3.01255 0.00104 0.90 0.01191 0.00039 0.61 -0.10935 0.36 -1.29 -3.00379 0.00440 0.37828 0.00570 0.00027 0.00357 0.00695 0.98 -1.01876 0.47 -2.11 -0.10 0.44 -3.93 -2.00048 -2.00058 0.14231 0.12100 0.05705 0.14686 0.00082 0.00233 0.28 -2.50 0.00034 -2.09510 0.70 0.28774 0.00554 0.32 -3.01463 0.07780 0.84 -2.91 -0.23 -0.00164 0.34 -1.02743 0.00842 0.00226 0.44 -0.37070 0.63 -0.07 -3.04272 0.00064 0.50 0.78 -1.79 -1.00062 0.72 -2.00022 0.00131 0.03 -3.28 -3.12302 0.76 -1.12 -2.88 -2.00036 0.68 -0.00122 0.06 -1.16 -3.45 -2.40905 0.17619 0.00402 0.07927 0.02938 0.45 -1.51 -1.74 -2.16 -2.28434 0.83 -2.00604 0.66 -1.02169 0.41 -1.00022 0.40 0.00368 0.61 -2.02018 0.14917 0.17 -3.00187 z -2.23 -1.37448 0.54 -1.42858 0.32636 0.64 -1.82 -1.32 -1.93 -0.56 -0.06301 0.79 -2.56 -2.46 -2.07215 0.23576 0.18141 0.13 -3.00866 0.16 -1.09 -3.08 -0.39358 0.00193 0.95 -2.27760 0.48803 0.00047 0.00264 0.87 -0.21476 0.31 -0.04551 0.48 -3.80 0.33 -2.02 -0.17106 0.31 -1.38 -3.00639 0.20 0.17 -0.09 -1.69 -1.41683 0.18 -0.32 -0.21 -3.08 -3.58 -1.14457 0.51 -2.11702 0.27 -0.00090 0.06944 0.03515 0.32276 0.39 -1.38974 0.26 -1.06811 0.00415 0.18 -3.08692 0.42 -0.04746 0.00032 0.09680 -0.26 -0.79 -0.07353 0.71 -0.10565 0.25 -3.00175 0.37 -3.59 -3.98 -2.86 -2.36317 0.00114 0.42 -2.44038 0.13567 z -0.00025 0.49 -1.42 -1.00714 0.23270 0.00 0.00587 0.68 -1.38209 -3.12 -1.62 -0.17 -2.46414 0.13 -1.00657 0.54 -3.47210 0.06 -3.43 -0.35 -1.15625 0.26 -2.25 -1.92 -0.34 -0. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR z F(z) = Φ (z) = P [Z ? z] =   1 t 2 / 2 e dt 2 z -3.00755 0.76 -2.05821 0.04182 0.41 -2.19 -2.65 -0.15866 -0.00097 -2.00964 0.19 -1.03920 0.39 -0.00539 0.19766 0.89 -1.12924 0.32997 0.76 -0.87 -2.01743 0.25 -2.01 -1.42074 -3.14007 0.26 -3.47 -3.25463 0.01700 0.09342 0.01923 0.52 -0.00212 0.05480 -1.00199 0.01044 0.31561 0.98 -0.03 -0.02559 0.05 -0.77 -0.14 -1.17 -1.67 -0.88 -0.00135 -2.05155 0.40 0.00149 0.40 0.71 -1.00056 0.46812 0.01970 0.10749 0.26763 0.64 -2.19215 0.22 -2.48006 0.52 -2.01101 0.00990 0.53 -1.82 -2.30854 -3.00126 0.59 -0.53 -0.39743 0.26435 0.94 -1.10 0.57 -2.05 -1.40517 0.93 -1.10027 0.96 -1.15 -0.85 -0.13350 0.11 -2.91 -1.49 -0.00326 0.54 -2.00018 0.00494 0.00071 0.01222 0.00169 0.42465 0.04363 0.09 -0.53 -2.49601 0.00111 0.25143 0.75 -0.00889 0.40 0.00391 0.00024 0.44 -1.06 -2.94 -2.08851 0.00798 0.00154 0.02068 0.00 0.01659 0.20 0.30 0.04 -2.01130 0.03754 0.22663 0.02680 0.26109 0.08379 0.06426 0.35 -0.19489 0.16 -0.02500 0.90 0.00508 0.00069 -2.10 F(z) 0.50 F(z) 0.01072 z -1.70 0.00734 0.99 -2.10 0.35 -3.71 -2.23885 0.00307 0.49 -2.14 -2.29 -1.38 -2.46 -0.19 -0.07078 0.00017 0.00219 0.00427 0.83 -1.11314 0.35569 0.78 -0.00084 0.20 0.24 -3.87 -1.09853 0.00042 0.59 -2.45 -3.27093 0.21 -2.33 -0.41294 0.05262 0.13136 0.00523 0.09176 0.21770 0.10204 0.00347 -2.73 -2.46017 -3.03288 0.17361 0.41 -3.02330 0.52 -1.03074 0.55 -0.00045 0.00107 0.28 -1.28096 0.11 -3.36 -3.47608 0.34827 0.03 -2.00031 0.05938 0.29 -0.35942 0.05370 0.00240 0.06552 0.27 -3.08534 0.51 -3.01017 0.01 -2.84 -1.07636 0.13 -0.00298 0.30503 0.48 -0.02442 0.21 -1.60 0.06057 0.02222 0.89 -2.02807 0.02275 -1.15386 0.73 -0.00914 0.00621 -1.65 -2.16109 0.05050 0.02 -1.22965 0.42 -3.29 -2.13786 0.20045 0.03438 0.95 -0.56 -3.00159 0.17879 0.69 -2.01390 -1.49202 0.78 -2.36693 0.16853 0.43644 0.47 -1.01426 0.04 -0.39 -3.58 -2.00076 0.90 F(z) 0.43 -2.02 -2.50000 401 .10383 0.00256 -2.00029 0.81 -1.00205 0.14 -0.00280 0.00019 0.97 -0.11900 0.24825 0.04947 0.00453 0.62 -1.00776 0.18 -1.30153 0.97 -2.45 -0.99 -0.27425 -0.58 -0.95 -1.05 -3.00100 0.00019 0.47 -0.37 -2.24 -0.TABLA 1.49 -3.05592 0.38591 0.31918 0.41 -0.00087 0.39 -2.08226 0.16354 0.46 -1.18943 0.63 -1.00023 z -2.24 -2.08076 -0.04006 0.45620 0.03005 0.89 -0.99 -1.04 -1.12 -0.01160 0.15151 0.48 -1.03836 0.40129 0.24 -1.55 -1.00248 0.11123 0.04457 z -1.07493 0.27 -2.08 -1.80 0.03673 0.74 -0.77 -1.32 -2.22 -1.07 -1.33360 0.00289 0.38 -0.25785 0.92 -2.97 -1.02872 -1.04093 0.60 0.21186 -0.94 -0.05 -2.35197 0.67 -2.22 -3.64 -0.57 -1.06 -0.37 -0.00820 -1.01539 0.00139 0.03362 0.02 -3.00336 0.62 -2.20611 0.18673 0.31207 0.30 F(z) 0.55 -2.34 -3.01321 0.11 -1.80 0.00094 0.00040 0.84 -0.03593 -1.00043 0.44828 0.09 -2.68 -2.08 -2.12507 0.12714 0.20897 0.00035 0.09012 0.88 -1.00 0. 81327 0.99573 0.57 3.99961 0.14 1.62172 0.99158 0.87698 0.76 0.82894 0.83398 0.60 0.25 2.99942 0.31 1.99906 0.91621 0.98645 0.99946 0.50 0.25 0.25 1.70 0.12 1.99886 0.28 2.99957 0.08 2.96164 0.54776 0.23 3.96995 0.34 0.54380 0.50399 0.21 1.34 3.57142 0.09 0.70194 0.99896 0.88100 0.99869 0.41 3.99825 0.92 1.08 1.92220 0.77 2.21 3.58 1.99621 0.03 2.85543 0.99720 0.50 F(z) 0.03 0.85083 0.99520 0.50 0.71 2.99976 0.89065 0.56 2.99931 0.24 3.30 0.80511 0.55 2.11 0.92073 0.99598 0.98610 2.48 3.55567 0.88298 0.89796 0.99744 3.94062 0.68082 0.99938 0.99396 0.68 0.64058 0.24 1.61791 0.64 1.15 0.69146 1.62930 0.99983 0.28 3.73891 0. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR z F(z) = Φ (z) = P [Z ? z] =   1 t 2 / 2 e dt 2 continuación z 0.79 2.91 0.99913 0.72 0.23 0.99984 402 .69 1.63 0.85769 0.20 0.99361 0.27 0.88493 1.82 0.86214 0.98300 0.57926 0.41 1.07 1.99962 0.87076 0.80785 0.02 3.56 0.99609 0.63307 0.92507 0.32 1.99966 0.11 3.85314 0.96784 0.98679 0.94179 0.79955 0.46 1.56 3.73237 0.90490 0.33 1.93 2.08 3.48 1.16 3.97 1.87 0.67364 0.55172 0.59483 0.99940 0.99305 0.44 1.63 2.96926 0.03 1.91466 0.60642 0.09 1.57535 0.61026 0.51 1.77 1.51197 0.54 0.92922 0.54 2.27 1.46 3.99856 0.97670 0.09 2.26 0.19 3.99836 0.96712 0.99674 0.57 0.03 3.86864 0.89 0.61 2.59 3.27 3.10 0.78 0.39 1.14 2.94845 0.99980 0.05 3.97778 0.88877 0.99934 0.99929 0.49 3.67 2.67724 0.95053 0.32 3.99547 0.73 2.55962 0.48 2.99983 0.96638 0.36 0.93319 2.98574 0.99889 0.99952 0.89973 0.24 2.36 1.75490 0.04 1.22 0.22 3.53 2.51 0.07 3.45 1.52 3.98870 0.98124 0.93943 0.98809 0.16 1.86 1.99846 0.58317 0.94520 2.79673 0.55 1.64431 0.97500 0.30 0.84134 1.91 1.43 2.71566 0.93 1.52 1.30 0.89 2.48 0.99893 0.65910 0.99900 0.81594 1.79103 0.64 0.38 2.98077 0.13 1.44 0.32 2.97193 0.18 1.34 1.99841 0.53 1.22 1.80 0.93056 0.86433 1.11 2.81859 0.87286 0.95543 2.81 0.90658 0.83 2.33 0.97257 0.89617 0.95352 0.90147 0.99781 0.14 3.98 2.99916 0.99632 0.98257 0.40 0.99874 0.99506 0.98983 0.43 1.07 0.84375 0.99767 0.50798 0.96 1.75804 z 1.29 0.99972 0.99010 0.35 3.98713 0.99955 0.71 1.93448 0.87900 0.65 1.57 2.15 2.71226 0.59 2.99878 0.53586 0.74 1.52790 0.99819 0.64 2.60 0.13 3.68793 0.53 3.99964 0.99979 0.95449 0.99245 0.42 3.99861 0.26 1.68 2.95254 0.91308 0.99585 0.83891 0.12 0.46 0.84 1.05 0.63 1.01 1.63683 0.99865 3.99492 0.79389 0.37 2.97831 0.45 0.51595 0.99831 0.94738 0.98382 0.19 0.94 2.94630 0.99982 0.74 0.23 2.99 1.85993 0.88 0.40 0.20 0.17 3.90 0.99061 0.95728 0.47 1.75 1.95907 0.79 1.97932 0.04 3.01 3.99711 0.99944 0.44 3.73 0.97 0.86650 0.89435 0.49 2.14 0.55 0.02 2.68439 0.92785 0.99693 0.06 2.89 1.88 1.45 3.99788 0.91149 0.85 2.67 0.29 3.99343 0.11 1.85 1.77935 0.74215 0.51994 0.90988 0.77337 0.95994 0.90 F(z) 0.99134 0.73 1.97882 0.79 0.62 0.95 0.95637 0.99653 3.99086 0.32 0.99918 0.82121 0.91 2.76115 0.99882 0.29 1.65 2.80 0.84849 0.35 0.99851 0.93822 0.99461 0.92 2.99950 0.99958 0.52392 0.56749 0.99324 0.99813 3.99379 z 3.23 1.40 0.47 2.86 0.71 0.93699 0.19 1.42 1.82 1.64803 0.TABLA 1.94408 0.95 2.77637 0.66640 0.99801 0.38 1.17 2.13 2.99965 0.98537 0.60 0.72 2.99180 2.29 2.83147 0.47 3.89251 0.21 0.44 2.74857 0.59 1.84614 0.97062 0.99446 0.82381 0.96080 0.99969 0.56 1.91774 0.07 2.99971 0.17 0.94950 0.58706 0.20 0.62552 0.06 3.05 1.99903 0.43 0.06 1.33 2.88686 0.39 0.04 0.35 1.99760 0.31 3.43 3.10 F(z) 0.80 0.99036 0.55 3.90824 0.98214 2.52 0.70 F(z) 0.90320 z 1.26 2.98 1.54 1.65542 0.69497 0.76 2.99795 0.18 0.18 2.99977 0.28 1.24 0.13 0.98956 0.99774 0.59 0.99970 0.99111 0.25 3.83 0.12 2.28 0.21 2.91924 1.99921 0.96 0.56356 0.69847 0.99430 0.15 1.10 0.87 1.99 2.92364 0.58 0.01 0.00 0.33 3.98341 0.92 0.94 1.99975 0.97441 0.97982 0.69 0.99981 0.97558 0.60 0.96856 0.67003 0.99702 0.99960 0.99752 0.62 1.39 3.59095 0.81057 0.36 3.31 2.31 0.72575 1.61409 0.98745 0.61 0.83 1.99202 0.72 1.54 3.16 2.65 0.94 0.58 2.75 2.99266 0.84 2.98461 0.42 2.08 0.99224 0.99534 3.95818 0.99936 0.47 0.85 0.00 0.81 2.96485 0.77 0.99968 0.30 F(z) 0.34 2.99286 0.90 0.99807 0.78 1.96327 0.98899 0.74537 0.99981 0.37 1.98840 0.98422 0.66 2.78 2.05 2.88 2.74 2.26 3.00 0.40 0.69 2.99978 0.99560 0.70 0.96246 0.99477 0.36 2.39 2.87 2.02 0.99948 0.61 1.18 3.59871 0.73565 0.42 0.58 3.38 0.97381 0.99 3.22 2.62 2.97 2.70884 0.51 2.98 0.78230 0.53188 0.60257 0.04 2.95 1.97128 z 2.97320 0.99683 0.99736 0.70540 0.66 0.98030 0.81 1.97615 0.71904 0.93189 0.38 3.17 1.52 2.99910 0.75 0.80234 0.41 2.49 0.76730 0.16 0.96562 0.98778 0.98500 0.35 2.95154 0.66 1.82 2.82639 0.53 0.83646 0.86 2.96407 2.75175 0.99413 0.94295 0.68 1.76 1.57 1.99974 0.41 0.96 2.15 3.99953 0.02 1.37 0.50 0.97725 2.27 2.93 0.72907 0.66276 0.99978 0.76424 0.45 2.51 3.12 3.10 F(z) 0.98928 2.72240 0.77035 0.09 3.98169 0.46 2.99926 0.84 0.37 3.78814 1.99643 0.20 0.65173 0.19 2.99664 0.49 1.67 1.92647 0.87493 0.06 0.99924 0.99973 0.99728 0.53983 z 0.78524 0.01 2.93574 0. 7 16.2 35.21 2.6 19.7 21.4 403 0.60 5.8 31.972 1.9 46.6 21.5 14.4 43.26 9.6 40.6 26.9 22.4 13.56 8.48 1.4 28.2 18.8 25.36 8.17 4. G.2 10.91 7.82 4.3 15.5 27.0 30.0 33.8 21.57E-04 9.4 12.43 8.23 5.41 5.9 44.6 21.1 36.207 0.3 13.34 1.6 31.3 31.27 8.216 0.99 8.9 17.1 13.90 6.484 0.016 0.1 19.03 9.14 5.1 22.8 13.49 4.0 42.03 8.1 24.4 30.92 7.3 33.6 40.024 0.93 10.8 20.11 3.80 10.2 30.3 25.8 30.5 27.96 8.40 0.989 1.91 5.9 26.82 4.0 29.4 32. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0. DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO P Los valores en la tabla son de Chi-cuadrado.3 11.4 22.2 35.09 2.8 27.2 26.93E-05 1.002 0.064 0.554 0.6 39.0 19.0 11.9 34.9 19.01 0 PROBABILIDAD P 0.6 30.1 18.9 16.297 0.4 15.73 2.59 1.3 16.0 14.33 3.10 0.015 0.64 2.5 27.713 1.1 20.63 8.148 0.5 13.2 22.45 7.9 11.4 16.4 25.39 7.6 23.0 24.3 28.62 3.6 32.3 24.0 25.0 41.9 37.24 1.57 4.07 3.0 43.8 38.1 35.57E-06 3.2 35.9 21.57 5.6 15.8 Xα 0.2 13.5 11.92 6.381 0.5 20.59 10.0 24.20 2.15 1.01 5.001 0.9 19.6 12.5 18.9 13.7 21.42 7.8 15.8 26.0005 0.54 9.57 7.8 14.65 9.091 0.15 9.9 45.06 1.6 32.5 26.710 0.79 8.67 5.9 11.9 34.9 13.6 12.857 1.7 21.6 15.9 27.2 10.18 2.5 22.5 31.8 36.4 14.9 21.39 10.54 10.115 0.87 5.3 32.1 29.8 18.40 5.91 9.9 17.83 2.598 0.711 1.22 9.9 29.831 1.48 3.0 20.7 0.9 17.8 31.7 23.6 14.412 0.2 11.4 11.210 0.7 0.1 26.2 30.0 15.872 1.0 14.40 5.05 3.9 23.1 32.59 5.1 20.83 3.4 16.3 20.9 18.2 12.1 12.34 3.7 39.93E-07 1.60 3.4 28.2 17.8 14.5 41.8 37.8 18.04 3.9 23.5 41.66 4.5 33.0 14.485 0.89 6.7 0.02 1.0 12.0 26.2 28.8 20.70 6.5 23.0 11.8 11.1 33.84 7.299 0.24 1.2 36.9 23.7 24.23 5.2 28.7 18.3 17.1 13.2 31.2 19.6 24.7 24.8 14.89 10.53 8.5 26.41 7.1 29.584 1.1 10.3 18.58 6.98 4.5 23.0 16.5 19.4 24.93E-03 0.8 16.56 3.6 21.1 18.5 42.3 21.5 19.3 34.3 33.0 15.5 25.3 29.7 22.7 22.1 40.1 17.3 24.9 20.2 12.9 20.8 22.6 13.7 12.30 9.66 10.4 34.9 15.7 26.93 2.53 6.6 28.9 35.26 6.8 12.3 11.6 22.94 4.3 23.44 4.19 3.6 23.3 16.2 37.7 38.2 29.61 2.4 22.3 0.81 8.57 5.38 6.2 12.005 0.7 15.94 4.2 14.7 20.8 14.8 19.65 2.1 22.18 6.63 9.1 14.8 17.1 22.4 32.47 10.65 2. siendo la probabilidad p el área en el extremos inferior.30 0.064 0.8 11.6 19.6 17.7 29.4 16.275 1.8 28.49 6.7 16.0 16.75 3.020 0.103 0.70 3.82E-04 3.2 18.1 33.3 25.07 3.54 3.4 0.3 19.66 5.446 1.3 33.09 9.9 36.31 10.6 16.1 13.55 9.6 13.7 21.57 4.0 0.2 16.17 2.1 25.2 20.4 25.6 24.26 1.31 2.TABLA 2.8 20.7 12.6 25.6 15.001 0.4 29.04 7.67 9.1 15.69 2.9 .16 2.8 19.7 14.010 0.3 17.64 9.42 4.23 8.051 0.45 6.0 12.0 20.5 12.676 0.08 8.3 22.7 27.211 0.5 0.26 7.352 0.3 20.81 6.4 17.90 5.4 22.158 0.26 8.1 38.40 6.5 17.2 18.0 36.83 4.9 11.4 29.99 7.4 44.24 10.3 28.5 17.1 13.1 39.L.9 25.072 0.4 15.0 26.01 1.3 16.15 1.5 18.73 3.4 27.00 3.5 15.98 7.6 24.5 27.0 19.87 2.05 3.7 12.1 24.9 18.70 3.30 7.90 9.0 43.4 28.1 10.3 34.8 37.26 6.9 30.01 7.8 23.07 4.25 3.2 11.3 17.11 4.63 6.025 0.20 0.4 13.42 2. 0 73.TABLA 2.3 18.5 11.7 36.9 51.3 27.0 22.6 30.3 20.3 21.7 41.9 19.0 71.7 31.49 11.2 66.0 12.1 12.9 34.29 8.7 44.3 32.4 49.1 12.5 37.5 22.4 36.999 0.3 32.7 72.975 0.6 53.1 81.7 43.6 54.3 16.9 23.2 44.0 53.6 50.9 1.1 31.6 72.2 53.71 4.2 79.6 43.1 77.1 40.8 52.7 38.3 49.3 12.9 52.3 25.7 65.2 19.5 56.3 33.0 17.2 67.4 42.9 39.3 29.7 37.3 32.3 49.8 56.5 82.9 48.995 0.7 22.1 69.6 47.39 2.3 17.99 7.4 35.4 32.2 7.90 0.8 17.9 25.0 26.6 28.3 15.1 57.0 57.7 1.5 78.5 5.1 27.5 19.2 70.0 27.8 23.5 36.4 66.3 13.4 63.6 25.7 45.2 47.3 47.3 70.2 6.3 0.0 17.8 56.1 25.0 22.3 28. siendo la pro0 babilidad p el área en el extremos inferior.3 42.9 26.2 89.6 52.5 50.5 19.70 0.8 47.9 73.6 38.1 77.8 36.9 62.9 44.0 70.4 33.8 42.0 33.8 51.4 35.3 11.5 32.9 58.6 40.9 34.2 34.4 34.8 54.6 43.6 36.0 33.7 29.4 54.1 39.34 10.84 5.5 51.56 9.1 36.2 28.8 16.3 42.9 39.7 77.3 45.88 6.3 61.0 56.2 29.7 26.35 5.6 15.8 63.3 60.07 2.9995 0.0 64.6 52.1 28.7 51.9 61.5 58.1 59.3 43.9 43.9 84.7 33. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Xα 0.81 9.5 39.2 52.2 28.5 10.0 63.3 13.06 7.0 85.1 55.2 81.8 17.6 59.0 43.7 62.8 14.0 15.9 64.9 40.3 29.7 84.21 7.2 26.9 30.7 56.5 51.8 49.3 20.7 21.4 29.5 28.3 37.9 40.3 57.8 48.0 23.0 46.21 11.3 33.0 78.0 52.36 4.7 39.6 22.5 36.6 32.0 52.5 52.52 10.1 16.4 57.5 39.2 27.2 53.8 38.6 12.3 59.8 18.3 24.3 19.2 47.5 20.1 26.8 32.1 27.38 9.22 4.8 64.8 28.4 55.0 18.7 70.5 61.3 35.9 29.8 42.0 65.6 35.5 50.1 44.5 16.3 22.3 38.7 12.7 25.8 18.8 44.6 71.60 0.3 60. G.9 58.3 27.3 41.5 63.8 12.6 12.9 21.9 46.2 63.2 29.2 49.9 54.2 72.5 38.7 51.3 19.8 14.2 65.5 12.2 65.7 23.3 40.0 50.0 27.5 34.6 404 3.3 30.3 48.3 53.1 37. DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO P Los valores en la tabla son de Chi-cuadrado.2 31.2 37.3 45.6 30.99 7.7 47.4 86.02 7.1 24.7 76.6 62.4 49.2 71.4 32.6 31.35 11.80 Probabilidad P 0.6 14.3 42.4 75.6 41.3 48.7 54.3 24.3 44.3 28.3 32.6 46.0 69.3 26.61 6.8 80.5 24.0 23.9 16.708 1.7 37.2 35.1 73.4 14.9 76.7 16.3 41.4 42.0 41.0 60.8 21.1 15.4 19.L.4 23.7 61.41 10.7 11.3 58.6 49.9 44.0 24.8 45.04 5.2 36.35 7.6 65.38 9.7 80.5 20.4 46.3 14.88 10.6 42.2 17.8 68.0 47.9 56.95 4.4 14.0 48.7 26.4 57.3 48.8 38.34 8.9 35.3 70.9 58.4 37.7 53.9 56.3 34.0 42.7 31.8 30.1 34.7 62.3 39.3 18.0 53.2 27.8 26.2 46.9 65.6 21.0 45.50 0.25 7.5 68.4 73.35 9.4 82.8 32.9 18.83 2.2 45.5 24.95 0.9 29.3 41.1 55.5 54.3 67.8 60.34 9.2 13.1 21.7 46.3 47.1 30.3 46.5 21.0 20.8 50.9 59.1 41.8 13.6 13.4 16.4 48.6 14.9 14.0 66.2 62.3 18.0 26.8 69.3 49.0 13.3 31.2 2.80 11.3 43.4 67.99 0.5 20.6 68.6 61.35 6.1 59.6 59.4 49.8 36.3 22.41 3.2 24.5 50.4 78.8 34.64 5.1 26.3 26.9 34.2 45.4 38.6 59.1 15.7 20.7 74.2 30.3 23.2 85.7 76.6 40.1 46.64 3.0 66.5 21.78 9.1 62.2 66.6 67.2 48.6 51.8 48.4 .0 44.8 69.4 74.2 30.6 55.23 8.5 20.1 39.4 74.1 27.2 17.1 22.9 88.1 58.9 24.6 40.0 35.63 9.7 16.3 37.2 56.2 54.3 46.13 6.28 8.1 16.66 4.4 34.6 43.3 31.24 10.7 15.5 66.5 54.6 86.3 31.4 40.9 41.5 38.455 1.7 18.3 23.3 15.8 45.3 36.1 47.3 49.7 52.5 49.7 37.37 3.3 60.7 44.0 48.7 41.2 38.8 31.3 18.8 23.2 74.3 40.5 50.5 33.4 29.7 55.3 35.0 22.6 41.0 27.5 45. 6 75.1 69.0 36.2 39.4 63.5 66.6 50.2 75.9 48.8 55.7 79.8 53.4 40.8 76.3 52.2 77.5 52.5 44.3 48.0 50.4 59.0 74.5 67.01 30.1 44.7 43.8 62.9 74.8 44.6 82.0 84.2 65.6 80.0 87.0 72.4 85.2 56.8 77.5 31.8 52.1 86.0 58.2 77.3 46.5 83.5 70.1 60.3 45.3 49.6 69.8 62.4 67.5 28.6 57.7 77.4 41.0 42.2 38.6 58.8 33.1 59.5 80.8 69.2 34.7 49.6 28.4 64.7 63.2 48.4 82.6 78.5 46.3 50.6 38.6 71.2 84.7 57.0 76.0 88.1 49.8 60.0 67.9 34.2 60.7 42.9 29.9 36.3 59.6 53.9 73.8 38.8 59.7 56.5 49.2 32.1 87.5 38.1 83.0 67.4 26.0 48.3 31.4 36.8 35.9 55.8 38.5 81.0 72.2 42.9 41.1 50.2 75.4 53.2 33.1 65.5 33.3 37.9 34.5 76.2 52.7 54.4 47.2 49.2 28.9 73.5 51.6 80.1 0 PROBABILIDAD P 0.8 74.2 45.2 54.4 48.8 54.6 64.7 37.0 51.2 52.1 66.5 57.1 59.8 54.2 73.2 48.9 29.5 39.1 81.1 56.7 37.6 58.9 61.3 44.1 66.6 41.7 79.20 42.2 68.4 66.8 51.7 50.3 31.3 64.4 71.8 68.1 44.1 47.3 44.2 85.1 51.6 46.8 57.4 43.2 40.4 34.8 25.2 47.4 69.0 47.4 77.2 71.30 45.7 45.4 42.6 38.9 43.8 78.0 61.3 48.2 78.3 41.3 65.9 52.6 34.8 27.7 53.2 92.4 64.6 79. 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 0.7 32.6 47.0 60.9 90.9 93.5 36.7 55.7 61.2 90.7 76.5 59.6 35.1 64.4 61.9 60.6 45.9 52.05 33.2 76.1 76.8 37.6 56.5 47.7 32.6 30.8 75.2 47.9 89.1 80.5 54.9 53.9 56.0 71.40 47.1 0.1 50.001 25.3 46.8 40.L.4 65.3 0.8 46.1 58.4 55.5 41.4 82.9 43.9 67.3 83.4 68.9 52.8 .7 63.3 68.8 57.5 53.8 48.1 36.5 60.7 32.8 75.6 50.2 28.5 61.3 60.7 42.1 67.3 51.8 51.9 0.8 69.0 36. G.4 0.4 67.4 63.9 39.2 65.1 61.6 51.2 91.0 37.1 70.2 66.4 54.4 87.9 48.8 48.8 51.0 59.6 46.5 63.0 48.0 39.1 44.7 52.0 43.0 56.2 74.4 54.8 56.9 77.6 62.2 43.1 55.3 66.6 58.2 67.9 0.9 74.5 43.0 87.7 53.6 52.1 36.3 74.9 91.1 46.4 62.8 41.9 0.2 57.1 41.6 39.5 38.4 46.8 49.0 34.7 67.5 63.0 88.9 40.5 63.1 51.5 65.2 56.5 72.9 27.9 92.6 34.9 48.2 70.8 37.3 39.5 64.8 44.2 26.0 45.0 40.005 28.3 56.6 43.2 70.0 47.2 57.5 43.1 58.6 81.8 94.3 39.0 45.0 32.2 33.1 24.4 69.5 58.8 49.9 59.1 35.0 42.4 55.5 55.6 59.6 58.9 68.6 39.0 53.6 52.5 84.8 49.9 66.5 62.6 38.5 54.025 0.4 73.3 70.8 45.4 59.6 68.7 53.6 57.2 41.3 53.3 35.0 59.0005 24.7 56.7 56.8 62.0 47.4 39.3 71.3 44.1 39.1 72.0 50.8 43.4 64.8 61. siendo la probabilidad p el área en el extremos inferior.2 60.8 55.1 79.9 68.1 53.8 50.8 46.3 72.4 58.2 35.5 47.7 29.6 50.3 56.8 61.10 38.6 63.3 40.0 86.0 72.6 60.5 26.1 82. DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO P Los valores en la tabla son de Chi-cuadrado.6 60.6 44.3 58.6 40.7 70.4 81.6 63.4 55.0 31.8 45.9 50.3 47.5 33.3 54.2 31.5 33.0 47.4 64.4 45.6 30.4 70.6 69.5 61.9 73.1 72.2 65.2 58.8 49.6 58.2 47.3 72.0 58.9 405 Xα 0.1 50.3 35.0 31.3 56.0 56.5 50.2 64.1 37.4 51.7 66.9 51.5 57.3 44.5 30.0 51.0 60.0 52.TABLA 2.5 70.6 35.6 54.3 88.1 42.9 61.3 51.7 49.3 89.0 31.3 73.7 78.4 86.3 42.8 57.8 95.3 65.6 59.4 40.0 85.3 69.3 36.9 65.6 62.9 54.8 42.5 63.3 55.1 26.7 62.1 71. 5 78.8 110.9 58.7 86.7 90.3 85.6 107.0 71.9 127.6 79.0 103.8 97.6 98.80 Probabilidad P 0.3 65.6 107.9 82.8 132.8 103.1 87.3 126.995 0.3 73.5 124.2 93.1 82.2 106.6 94.2 64.1 103.0 84.6 73.2 90.2 104.0 85.3 68.7 65.3 95.3 97.1 132.3 75.4 106.9 109.4 95.8 92.9 93.2 89.3 82.2 105.9 80.8 122.9 102.4 120.6 99.0 57.1 118.1 82.0 131.9 82.4 75.8 99.7 78.4 116.9 110.7 109.8 71.7 113.4 74.3 72.3 129.7 92.9 53.2 94.5 112.1 62.2 90.8 147.6 114.2 116.1 105.3 105.6 83.8 147.2 135.9 113.4 89.5 97.0 122.2 124.7 82.6 100.7 87.1 123.3 134.8 56.7 127.2 73.6 121.4 82.99 0.2 65.0 62.0 72.8 104.5 107.4 101.2 88.0 114.0 87.0 104.7 84.9 103.5 76.8 95.8 93.8 79.3 117.4 70.0 126.3 87.5 71.5 134.7 68.0 148.7 101.7 91.8 139.0 133.5 106.3 92.1 61.3 144.3 90.6 85.3 91.5 84.0 93.0 59.8 81.8 90.3 71.TABLA 2.3 74.6 76.0 105.5 90.7 98.4 98.7 77.8 75.3 106.2 65.3 94.5 81.0 104.0 87.4 93.3 51.6 91.8 131.3 62.7 93.3 74.1 86.0 91.5 85.8 96.9 84.3 100.2 73.5 93.2 104.4 107.7 92.5 111.1 96.3 80.5 86.7 121.1 103.3 61.6 109.0 88.8 88.3 84.2 66.3 129.4 107.3 128.4 104.2 60.8 97.8 67.2 149.3 67.8 81.60 0.5 77.5 95.2 88.7 89.0 61.1 72.0 101.0 72.1 128.8 102.5 82.8 104.1 80.1 110.0 96.0 56.2 103.9 100.2 94.6 96.0 140.0 114.8 80.999 0.1 83.5 125.2 94.4 78.9 118.1 134.0 89.9 100.1 122.3 111.5 108.6 74.3 93.3 123.8 96. DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO P Los valores en la tabla son de Chi-cuadrado.3 89.4 62.3 91.9 55.8 111.3 57.1 112.3 66.9995 50.3 65.4 102.3 96.3 68.8 86.9 59.4 120.4 113.1 86.9 71.5 127.3 61.2 83.1 112.70 0.3 54.5 150.1 117.3 115.5 110.9 79.7 115.9 98.3 84.3 67.9 121.3 52.3 144.0 118.5 130.4 129.0 85.0 76.1 143.3 113.4 90.4 90.0 113.3 89.6 101.2 149.5 130.0 99.5 109.3 128.7 66.3 71.2 77.7 76.3 120.7 92.4 121.9 98.7 96. 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 Xα 0.7 88.1 115.1 119.4 85.7 101.3 70.0 81.6 90.3 64.95 0.8 105.5 92.7 86.8 130.6 145.7 88.3 74.9 123.8 142.9 117.6 84.6 79.9 55.3 91.3 115.4 118.9 133.9 121.5 63.5 99.9 101.2 97.3 98.3 53.1 102.0 107.0 98.3 69.5 92.8 108.1 125.9 92.4 98.4 78.1 64.3 90.9 115.8 110.6 108.2 66.2 105.0 132.2 97.4 66.9 102.5 77.3 99.3 69.0 105.50 0.7 69.1 116.5 109.2 104.6 124.6 108.3 108.8 80.3 106.4 69.7 95. G.9 124.3 86.7 80.3 81.4 73.6 97.3 94.3 88.3 133.6 100.9 112.3 84.2 112.5 99.5 72.3 59. siendo la pro0 babilidad p el área en el extremos inferior.8 57.6 129.L.1 101.6 135.5 96.5 98.3 52.3 74.2 124.3 99.4 75.7 125.9 111.0 70.1 63.8 119.3 56.6 75.3 90.0 83.7 131.1 127.0 111.3 70.0 93.3 113.3 72.5 117.3 117.3 89.6 119.7 102.9 99.9 69.1 87.3 83.3 105.8 110.9 121.0 143.6 78.8 126.3 83.1 114.2 97.6 128.9 60.6 111.1 127.5 94.7 106.7 104.4 76.6 96.7 119.7 136.0 58.2 68.6 73.9 82.975 0.3 84.9 98.6 79.4 108.9 101.6 86.3 133.1 60.90 0.6 122.4 94.4 77.9 80.8 69.3 106.1 88.2 93.2 89.9 125.9 109.2 67.5 91.5 80.5 114.6 .5 114.3 78.8 78.3 139.2 119.0 137.2 406 68.9 142.9 95.6 77.6 87.5 118.3 72.8 93.2 100.8 97.9 153.4 139.7 123.3 92.3 60.8 117.3 76.7 64.6 87.1 119.2 88.2 138.7 140.5 134.4 106.6 107.6 100.8 98.3 79.5 140.1 122.5 96.5 67.6 118.1 92.6 137.6 116.2 110.3 77.2 73.7 100.3 123.3 58.7 151.6 64.5 85.8 94.4 136.2 88.1 111.7 113.3 63.8 103.0 89.4 76.8 116.9 95.5 145.4 107.0 148.4 91.3 55.9 106.5 79.0 102.5 135.8 100.1 63.6 102.4 95.8 77.1 99.5 83.4 95.8 137.2 81.0 83.4 75.5 75.0 128.3 118.4 95.7 115.0 138. TABLA 3.315 1.035 1.473 2.898 2.340 3.492 2.291 1.336 2.045 1.683 0.592 2.677 0.408 5.990 1.763 2.059 1.703 0.292 1.947 2.108 1.747 3.310 3.310 1.692 2.333 1.779 2.843 0.330 1.849 0.706 2.855 0.042 1.717 2.682 0.318 1.262 1.055 3.390 2.551 3.684 0.632 2.675 0.721 2.854 0.479 2.066 1.093 1.462 2.842 0.738 2.622 3.728 2.853 0.965 3.668 2.9995 636.685 0.675 0.500 2.816 0.587 4.088 1.645 1.707 3.079 1.776 1.695 0.050 1.756 2.078 6.680 0.649 1.978 0.994 1.943 2.110 1.870 0.80 1.675 0.052 1.052 1.586 2.056 1.966 1.678 0.221 4.676 2.684 0.843 0.306 1.675 0.868 0.690 0.327 t 0.086 1.812 2.323 3.691 0.030 1.403 2.156 1.963 1.132 2.038 1.048 1.601 3.365 3.700 0.657 9.850 0.038 1.508 2.060 1.706 0.741 0.653 1.611 3.055 1.449 2.701 2.042 1.311 1.518 2.323 1.303 1.860 2.765 0.771 2.297 1.440 1.682 0.064 1.984 1.599 12.694 2. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 40 45 50 55 60 70 80 90 100 200 300 400 500 1000 5000 0.145 1.687 0.058 1.056 1.718 2.925 5.368 2.662 1.650 2.995 63.441 2.689 0.727 0.750 2.707 3.437 4.L.782 2.318 4.037 PROBABILIDAD P 0.90 0.021 1.541 3.686 0.049 1.771 2.140 4.853 0.921 2.667 1.889 0.965 1.733 2.604 4.485 2.906 0.681 2.878 2.708 2.855 0.313 1.690 3.402 3.120 1.499 3.376 1.699 2.724 2.093 1.883 3.987 1.438 2.673 2.856 0.688 0.041 4.697 0.292 .975 3.861 0.583 2.962 407 1.319 1.684 2.533 2.042 1.848 0.052 1.691 2.688 0.009 1.390 3.601 2.646 3.861 2.423 2.032 3.046 1.842 0.032 1.85 1.764 2.447 1.076 1.415 1.740 2.639 2.365 1.303 1. 0 G.386 1.690 2.704 2.664 1.044 1.683 0.047 1.674 3.858 0.301 1.416 3.753 2.807 2.528 2.282 1.857 0.083 1.284 1.004 1.337 1.283 1.714 2.309 1.015 2.697 2.734 2.057 1.061 0.684 0.678 2.457 2.567 2.682 0.064 1.744 2.683 0.619 31.581 2.941 0.879 0.296 1.922 3.696 2.819 3.679 0.453 2.396 2.306 1.040 1.339 2.676 0.768 3.591 3.250 3.179 1.000 1.706 1.866 0.055 1.648 1.821 6.965 4.552 2.134 1.330 2.865 0.119 1.845 0.846 0.75 1.309 1.686 0.571 1.711 2.314 1.660 2.677 0.250 1.831 2.821 2.860 0.610 6.711 0.703 2.990 31.833 2.725 2.998 2.650 1.694 0.321 1.856 0.972 1.290 1.000 0.383 1.412 2.182 1.364 2.648 2.363 1.854 0.959 5.069 1.787 2.201 1.852 0.520 3.679 0.315 3.920 0.729 2.100 1.895 2.968 1.282 1.843 0.058 1.886 2.476 2.071 1.853 0.037 1.761 2.353 3.679 0.460 3.435 3.037 1.325 1.692 0.850 3.080 1.660 1.675 0.063 1.633 3.054 1.846 0.638 2.876 0.061 1.626 2.374 2.682 0.797 2.858 0.863 0.106 3.286 1.847 0.496 3.131 1.074 1.792 3.372 1.038 1. siendo la probabilidad p el área acumulada en el extremos inferior.190 1.350 1.896 2.841 4.397 1. DISTRIBUCIÓN ACUMULATIVA T DE STUDENT p Los valores en la tabla son valores t.682 0.054 1.781 4.718 0.356 1.476 3.883 0.671 2.169 3.014 1.039 1.308 1.960 0 0.334 2.685 0.073 4.862 0.345 2.681 0.074 1.445 2.284 1.067 1.646 1.745 3.314 12.300 3.294 1.920 4.659 3.873 0.796 2.053 1.577 0.467 2.859 0.678 0.539 2.869 5.345 1.746 2.328 1.316 1.679 2.143 2.015 3.101 1.299 1.381 2.602 2.588 2.845 2.355 3.848 0.624 2.043 1.977 2.95 0.012 2.160 1.045 1.896 0.924 8.690 2.307 1.069 1.341 1.819 2.228 1.852 0.725 3.060 1.842 0.851 0. 60 3.19 4.03 10.59 4.03 5.26 4.30 14.80 5.44 4.81 3.26 2.06 2.35 5.92 2.68 14.34 19 248 992 6201 24803 19.48 2.51 4.80 2.03 3.35 13.24 4.22 4.31 3.85 6.85 5.24 3.41 9.56 6.81 2.58 3.46 2.68 14.98 2.44 4.40 9.96 2.63 2.38 2.26 6.32 .66 3.45 3.02 3.51 3.69 6.98 3.17 4.22 3.14 4.00 39.68 4.53 15.995 0.79 3.33 2.87 2.91 4.35 2.16 3.975 0.67 10.12 8.89 2.84 2.77 5.19 3.25 199.41 6.52 5.99 6.64 2.67 14.995 0.09 408 Grados 9 2.36 39.58 3.80 14.71 4.26 7.01 3.10 3.95 3.63 6.80 3.25 4.56 9.96 9.80 8.09 3.25 2.83 2.09 3.950 0.11 5.86 4.02 3.16 19.65 4.21 2.975 0.86 2.96 de libe rtad de l nume rador 10 11 12 13 2.00 5.30 39.93 7.21 26.14 6.90 2.36 9.05 2.31 7.61 5.38 4.87 2.94 3.16 7.07 3.68 3.76 4.41 4.87 8.27 7.54 12.75 2.06 5.44 5.43 4.63 14.07 2.48 2.40 19.08 5.82 2.37 3.62 3.56 4. G.52 2.57 3.57 2.63 4.96 5.99 4.23 3.90 5.18 3. DISTRIBUCIÓN ACUMULATIVA F: P [F ≤ f] Los valores en la tabla son valores F.60 6.04 6.20 2.29 4.12 2.44 39.25 2.68 2.87 3.85 4.04 6.46 10.78 5.29 13.70 3.56 4.01 3.08 3.95 4.77 2.26 8 2.22 2.70 3.75 8.72 3.10 3.67 4.50 99.13 43.45 39.53 15 246 985 6157 24630 19.86 2.06 3.38 5.58 6.44 99.98 18.10 4.22 4.90 21.77 3.55 12.88 4.975 0.35 2.97 6.03 3.65 9.53 2.50 4.28 9.20 4.81 3.35 2.10 9.77 13.990 0.05 3.46 2. 1 2 3 4 5 6 7 8 9 10 P 0.17 5.75 8.59 3.15 6.54 2.79 8.80 3.60 3.28 2.88 2.43 3.61 4.995 0.66 3.98 3.44 4.92 9.67 3.89 5.82 3.44 6.87 3. De nom.63 3.31 16.81 3.16 4.64 3.83 2.86 2.20 4.950 0.96 3.51 3.94 8.62 6.31 4.56 5.01 3.01 6.43 2.96 2.37 2.20 4.48 2.15 3.91 3.87 43.76 3.79 3.80 4.50 4.48 4.22 7.59 3.80 4.24 4.61 4.43 2.03 2.56 4.50 4.975 0.28 27.975 0.62 3.50 2.84 4.08 7.83 8.990 0.98 14.23 6.95 7.94 3.19 3.77 4.990 0.84 44.37 99.37 14.48 3.05 3.16 2.950 0.40 3.41 5.59 2.55 9.89 8.42 2.75 4.61 5.07 2.73 3.50 5.60 3.990 0.59 3.03 4.70 3.69 43.56 7.53 4.32 5.46 4.27 P [F ≤ f] Los valores en la tabla son valores F.10 3.02 5.49 5.48 9.64 6.03 3.64 13.34 3.59 4.86 6.62 3.30 2.31 3.99 3.25 99.43 8.90 4.10 2.62 3.32 6.12 4.72 13.20 7.58 4.88 4.51 7.37 3.07 10.07 8.33 2.34 14.98 6.65 3.33 26.13 3.45 99.29 4.76 3.52 9.83 43.56 8.30 2.01 8.41 99.55 3.20 4.62 6.11 3.37 2.45 3.TABLA 4.76 3.76 6 3.74 3.36 199.01 3.05 4.56 3.26 4.12 3.12 9.85 2.66 31.63 3.46 3.36 7.82 29.995 0.07 6.11 3.60 10.49 4.70 3.37 3.30 19.30 4.17 39.53 4.55 14.24 4.64 3.73 4.86 3.51 3.09 6.08 3.99 3 3.72 2.18 4.91 3.66 4.92 3.67 4.28 2.57 6.35 5.46 5.09 3.51 4.70 20.12 3.96 3.53 4.975 0.03 2.96 13.49 27.16 4.94 5.26 2.74 8.54 6.24 5.950 0.86 3.95 3.07 6.20 4.97 4.27 8.56 14.13 10.66 4.99 5.75 3.64 4.89 4.45 2.22 10.10 4.69 3.995 0.20 2.51 3.21 5.33 11.44 4.94 4.70 14.44 16.90 2.79 10.995 0.55 3.67 6.70 2.91 14.41 39.47 7 3.32 5.L.40 10.71 3.85 3.02 20.41 6.63 4.950 0.82 4.84 6.56 2.18 26.98 8.72 2.67 2.38 4.46 10.69 42.42 6.81 5.72 4.23 4.59 6.04 5.975 0.68 4.23 27.39 4.25 10.95 2.11 8.07 3.23 2.950 0.88 6.47 5.55 3.09 3.99 2.72 2.72 7.35 55.42 6.83 4.87 5.23 4.58 14.98 9.62 21.61 10.43 8.18 7.81 7.25 26.950 0.19 45.18 10.10 7.40 2.04 7.42 17 247 989 6181 24727 19.57 3.31 2.01 4.46 4.40 4.52 6.28 4.02 6.05 3.68 3.92 2.98 26.76 3.24 3.76 4.64 2.55 4.74 3.09 3.50 5.80 3.62 13.10 3.43 9.35 21.92 3.61 2.84 3.49 4.72 3.71 3.74 5.89 5.82 4.16 3.17 5 3.05 26.39 5.18 2.33 4.70 3.91 2.16 3.990 0.98 15.47 34.35 4.71 6.40 2.42 199.40 19.07 3.37 2.18 6.64 2.39 198.75 2.94 4.99 6.26 8.76 6.66 4.92 43.67 14.98 8.65 3.30 7.17 199.43 39.990 0.09 4.37 6.69 3.48 4.25 39.27 2.94 14.91 4.73 3.73 4.24 5.52 43.42 3.96 5.46 5.54 6.39 10.23 2.92 8.52 3.91 5.42 5.39 2.47 16 246 987 6170 24681 19.44 15.84 2.57 6.84 8.05 4. DISTRIBUCIÓN ACUMULATIVA F: de libe rtad de l nume rador 10 11 12 13 14 242 243 244 245 245 969 973 977 980 983 6056 6083 6106 6126 6143 24224 24334 24426 24505 24572 19.38 19 2.60 6.71 3.15 4.21 3.31 4.74 4.44 5.20 2.975 0.44 99.49 6.02 6.01 8.63 3.89 5.70 4.73 14.87 7.91 27.10 8.26 3.995 1 4.03 11.90 3.42 5.60 3.58 3.09 2.01 7.54 6.38 6.18 6.37 39.07 2.78 10.62 3.15 2.26 2.88 3.73 3.79 3.39 43.28 5.48 3.96 4.68 3.975 0.12 5.12 3.22 4.950 0.995 0.21 4.10 4.61 12.86 5.25 2.89 9.00 16.56 14.68 10.60 2.995 0.94 6.00 19.67 2.22 2.68 2.47 6.68 2. De nom.86 8.41 19.77 3. siendo la probabilidad p el área acumulada en el extremos inferior.975 0.47 4.06 5.52 3.995 0.24 4.47 2.48 3.75 10.35 20 2.20 5.990 0.01 3.990 0.70 3.92 5.45 9.03 4.81 8.05 3.43 99.62 6.05 9.38 9.55 9.54 2.86 3.59 4.83 3.77 4.27 12.01 5.990 0.80 3.52 3.70 5.31 2.79 5.37 4.11 20.97 20.80 5.69 5.23 5.62 14.67 3.31 20 248 993 6209 24836 19.61 14.15 20.44 3.47 3.91 4.12 2.995 0.96 2.81 5.46 11.26 3.10 8.15 8.92 2.12 4.31 14.990 0.30 6.75 3.73 2.43 199.14 3.10 4.98 5.71 4.72 3.68 13.950 0.79 42.03 3.71 28.59 4.43 4.53 3.33 199.46 4.33 99.65 12.03 5.94 5.47 4.63 2.78 18.29 6.19 3.54 2.28 4.13 3.98 3.36 2.79 3.46 7.88 3.41 3.05 20.40 9.10 4.95 3.88 7.42 4.42 6.950 0.74 3.950 0.85 3.26 23.21 4.86 4.29 10.35 19.25 4.950 0.43 7.67 3.15 6.03 9.54 14.48 4.71 4.74 6.50 3.25 19.24 4.66 3.45 6.40 10.29 4.54 3.96 3.54 3.04 9.24 4.24 27.51 4.44 4. siendo la probabilidad p el área acumulada en el extremos inferior.05 9.87 2.25 5.21 14.88 5.29 2.52 4.49 2.49 2.03 3.60 2.70 4.16 2.20 4.59 3.51 2.66 7.86 2.59 6.51 3.29 3.71 14.29 2.83 5.14 3.17 2.96 3.25 9.42 14.00 199.67 3.34 9.83 3.36 11.06 11.32 4.66 5.52 2.44 199.82 5.82 12.75 6.17 7.44 99.51 3.54 5.23 7.33 9.54 4.69 6.68 16.41 6.07 3. G.56 6.990 0.30 7.77 3.53 3.11 3.55 3.16 4.950 0.81 3.950 0.56 2.64 5.17 2.33 2.36 3.88 5.00 2.05 4.56 2.57 3.60 20.79 2.34 5.06 3.60 3.60 8.17 26.46 2.41 5.09 3.58 3.995 0.950 0.66 14.49 4.82 2.42 4.42 39.88 3.03 2.07 4.66 3.96 7.08 3.13 5.43 5.23 3.77 3.51 5.46 3.92 3.18 4.57 6.51 5.37 199.57 10.32 4.15 3.950 0.21 5.79 2.37 2.65 4.22 4.92 3.10 3.38 4.29 3.40 2.98 2.48 6.94 5.79 7.66 3.85 3.89 5.990 0.51 39.27 2.03 3.35 2.59 3.89 2.43 5.66 4.85 3.975 0.87 3.18 7.06 6.16 3.56 5.12 2.28 2.81 4.43 8.10 4.14 2.14 4.79 2.10 14.28 24.990 0.17 4.58 12.45 199.995 0.90 5.41 2.37 3.08 20.62 3.54 2.950 0.36 99.47 6.990 0.38 2.44 39.97 10.96 6.47 5.34 4.94 12.70 3.28 3.27 43.67 6.91 5.91 3.28 3.37 14.66 4.72 2.50 6.50 199.30 3.94 2.54 6.41 2.94 2 3.78 9.23 3.86 4.995 0.06 4.23 3.38 8.975 0.76 2.12 30.26 4.94 2.94 2.41 2.20 20.975 0.15 3.20 4.34 5.55 5.30 5.56 4.42 18 2.47 8.00 3.60 5.33 4.46 2.54 4.23 3.55 15 2.18 2.50 16 2.87 8.51 14.26 3.01 6.18 5.85 8.10 6.03 3.21 7.39 10.99 5.42 2.53 2.20 2.52 6.07 3.08 5.77 2.20 26.41 39.93 8.12 5.60 4.64 3.26 6.83 9.58 3.27 2.88 5.31 2.90 3.86 11.06 3.18 2.91 3.975 0.95 5.990 0.98 2.45 8.79 3.30 99.21 4.12 4.08 2.89 3.01 5.01 4.83 3.46 5.81 3.66 14.33 3.84 3.72 4.48 2.76 3.03 4.41 4.13 3.61 14 2.87 4.67 2.09 2.44 2.37 4.96 3.05 3.87 3.05 3.00 99.15 3.995 0.72 3.66 2.48 2.77 4.42 199.05 5.62 3.91 2.84 8.40 199.24 12.32 3.28 5.82 4.73 2.35 3.31 3.57 2.15 4.96 3.85 3.46 4.10 7.31 2.39 6.47 46.89 4.36 4.89 2.32 4.78 4.26 5.96 3.66 4.995 0.72 4.68 2.78 4.51 3.43 39.60 4.85 2.43 3.04 8.12 4.53 2.990 0.72 2.35 3.79 4.16 22.56 2.68 4.27 3.89 5.13 3.94 5.37 3.45 8.08 5.75 5.42 19.49 13.30 199.93 3.76 2.50 3.14 4.20 18.55 4.27 4.94 3.89 5.69 4.24 2.59 4.25 20.33 19.26 13.76 7.21 6.18 2.76 8.42 9.24 7.56 6.53 4.15 3.45 14.46 21.80 47.23 26.91 3.44 8.61 2.71 5.72 4.92 5.01 2.59 2.61 5.64 3.40 39.35 3.53 10.79 2.63 14.76 2.78 2.34 2.45 199.68 8.31 6.34 5.77 4.39 2.81 17.34 2.00 4.11 7.92 12.69 7.29 2.52 9.71 3.75 4.60 6.43 199.85 7.975 0.52 4.30 3.66 3.70 4.72 9.84 3.45 4.17 3.04 2.62 4.69 2.61 3.74 4.65 3.00 3.58 3.49 6.74 3.39 4.52 5.95 7.55 8.64 5.91 2.51 3.74 4.56 6.37 2.82 9.79 3.46 2.90 3.85 2.86 5.45 7.77 6.975 0.24 7.82 4 3.36 8.60 9.01 6.71 2.18 7.98 3.40 2.97 3.995 0.76 3.69 14.58 5.67 5.37 5.50 7.46 5.975 0.55 49.13 9.79 3.36 9.60 5.21 3.23 2.21 2.71 8.40 99.04 15.05 3.19 5.79 8.70 8.99 4.00 3.77 10.82 8.75 42.68 4.88 14.50 2.76 3.44 39.97 21.75 4.44 8.33 4.52 15.50 2.39 7.35 2.47 4.10 5.52 13.72 16.51 4.63 4.15 22.56 2.57 3.57 6.43 3.42 2.39 2.02 2.38 18 247 990 6192 24767 19.33 5.18 4.50 4.21 7.52 6.36 4.67 2.41 5.47 7.61 4.64 2.85 6.21 4.97 3.53 3.26 8.72 2.34 6.51 4.96 3.39 44.49 4.68 3.30 4.54 3.99 5.73 5.85 3.29 10.37 19.81 8.84 3.94 3.25 2.55 3.93 2.52 4.13 27.86 3.33 2.85 3.65 7.87 6.20 3.00 12.07 3.07 11.51 19.19 4.42 99.17 99.51 4.01 5.20 9.89 8.59 14.69 11.12 3.86 3.25 2.14 2.88 3.43 99.94 6.72 42.44 199.64 2.88 10.60 2.69 2.28 2.55 3.69 3.46 17 2.92 3.975 0.84 3.77 2.62 5.62 6.25 3.48 2.06 4.72 7.18 8.950 0.71 3.00 5.90 3.39 7.94 3.56 3.42 39.42 99.74 4.36 6.83 3. 11 12 13 14 15 16 17 18 19 20 P 0.99 3.34 4.40 4.97 3.20 8.80 3.27 3.73 8.29 5.05 5.19 6.30 2.16 3.22 7.82 20.70 4.44 2.29 5.46 28.990 0.76 2.21 4.68 8.44 199.16 2.39 5.01 3.09 6.06 4.89 5.15 4.90 3.00 3.93 4.42 3.22 4.38 38.60 3.34 2.97 TABLA 4.95 3.990 0.58 4.41 5.950 0.60 4.39 98.82 4.16 6.39 4.20 13.14 4.89 5.30 4.93 3.41 2.84 6.37 2.39 5.08 4.37 3.94 5.05 3.63 5.43 44.10 3.990 0.20 2.86 3.990 0.30 8.50 2.82 5.18 4.975 0.67 27.45 99.15 5.17 4.27 2.995 0.69 15.46 2.76 4.93 3.28 3.95 3.64 3.95 9.65 3.38 13.44 8.950 0.33 39.67 5.93 3.29 4.34 2.77 5.83 5.21 8.28 4.52 4.38 2.16 8.13 3.63 6.03 3.32 2.48 6.97 3.60 6.41 199.13 6.59 7.L.19 2.59 5.82 2.38 2.28 7.995 0.97 2.98 3.87 3.46 2.51 2.19 3.975 0.00 3.995 Grados 1 2 3 4 5 6 7 8 9 161 200 216 225 230 234 237 239 241 648 799 864 900 922 937 948 957 963 4052 5000 5403 5625 5764 5859 5928 5981 6022 16211 20000 21615 22500 23056 23437 23715 23925 24091 18.45 2.45 3.10 5. 107 19 .222 35 195 .84 12 .531 207 .131 27 .219 61 .01 n 0.93 26 98 .117 28 116 .33 0 .158 37 .369 128 .356 7 2 .01 0.119 23 .447 11 10 -56 5 .435 159 .05 o 0. n 0.144 30 137 .556 220 .Tabla 5.205 34 182 . Valores críticos para la prueba del signo S: n ≤ 25 y  = 0.05 0.01 o 0.309 100 .05 n 0.315 40 264 .400 9 5 .257 37 221 .47 3 .253 75 .158 31 147 .52 22 65 .26 19 46 .271 83 .188 48 .01 0.05 0.173 42 .276 38 235 .130 29 126 .203 54 .189 33 170 .40 1 .413 148 .349 118 .105 27 107 .547 15 25 .05 1 - - 14 1 2 2 - - 15 2 3 3 - - 16 2 3 4 - - 17 2 4 5 - - 18 3 4 6 - 0 19 3 4 7 - 0 20 3 5 8 0 0 21 4 5 9 0 1 22 4 5 10 0 1 23 4 6 11 0 1 24 5 6 12 1 2 25 5 7 13 1 2 La hipótesis nula se rechaza si S es menor o igual al valor de la tabla.458 171 .521 14 21 . De Wilcoxon para n ≤ 40 y  = 0.423 10 8 .61 23 73 .05 6 0.290 91 .335 Fuente: Journal of the American Statistical Association.36 20 52 .01 n 0.173 32 159 .21 18 40 .71 24 81 .65 7 .506 194 . setiembre de 1965.144 32 .295 39 249 .482 182 .600 17 34 .95 15 .01.239 36 208 .378 8 3 .328 109 .391 138 .05 n 0.74 9 . Tabla 6.01 0 .236 68 .471 12 13 .573 16 29 .44 21 58 . 409 .495 13 17 .82 25 89 . Documents Similar To Ejercicios de Estadistica IISkip carouselcarousel previouscarousel nextUna Variable Aleatoria x Puede Tomar Los Valores 30Ejercicios de Intervalos de Confianza Resueltosejercicios propuestos MÉTODOS ESTADÍSTICOS de rossyUa4 Estadistica Inferencial CalificadoEjercicios Resueltos de Probabilidades2Distribucion de La Media MuestralArias Francisco Res 341 s3 TianovaEISP_U2_EA_GEGMLaboratorio I Inferencia EstadísticaEstadistica AplicadaProblemas de Inferencia EstadisticaDistribuciones Fundamentales Para El MuestreoPrueba de Hipotesis Una Sola ProporcionGuia de Estadística General03-PHipotesis-P3huaringaEstadisctica - Intervalos de ConfianzaEstadistica IISantos Rogelio RES 342 S5 TI5SalariosSolucionario Práctica 11 RepasoSemana 4 Martes (3)ESTADISTICA EXAMENestadistica parte dos.docxCUARTO-trabajo-estadistica.docxProblemas EstadísticaEstadísticaInferencial Hipotesis Melissa MinutodeDios1Rodríguez León RES 342 S1 TI2 EjerciciosEjercicios de Estadistica ResueltosPrueba de HipotesisMore From Samir Alexander Calvache SilvaSkip carouselcarousel previouscarousel nextVELAS JAPONESAS.pdfIntroduccion a la seguridad informatica.pdfConceptos generales de seguridad informatica.pdfQUE ES EL BLOCKCHAIN.pdfGuia de Las Ondas de ElliottGuia Elaboracion Instrumentos EvaluacionQue Es El BlockchainLo Que Debe Saber de Segurudad en RedesBOLSA PARA NOVATOS.pdfBOLSA PARA NOVATOS.pdfTeoría de Las Ondas de Elliottel_sorprendentemundodelabolsajosemeli_nueva_version.pdfIntroducción a Los Mercados de Futuros y Opciones, 4ta Edición - John C. HullONDAS DE ELLIOTT UNAL.pdfprobabilidad-y-estadistica-teoria-y-760-problemas-resueltos-murray-r-spiegel.pdfMatemáticos, espías y piratas informáticos - National Geographic-FREELIBROS.ORG.pdfPobreza en LatinoamericaFundamentos Sobre PymesPobreza en latinoamerica.pdfConstrucción de Modelos PL.pdfEl Bitcoin en Colombiahistoriacexterior.pdfglobalizacion economica.pdfLas Nuevas Tecnologías y Sus AlcancesInteligencia ArtificialPor La Paz MundialGLOBALIZACIONEl Liderazgo EfectivoDE LA INTERNET DE CONSUMO A LA INTERNET DE PRODUCCION.pdfPobreza en LatinoamericaFooter MenuBack To TopAboutAbout ScribdPressOur blogJoin our team!Contact UsJoin todayInvite FriendsGiftsSupportHelp / FAQAccessibilityPurchase helpAdChoicesPublishersLegalTermsPrivacyCopyrightSocial MediaCopyright © 2018 Scribd Inc. .Browse Books.Site Directory.Site Language: English中文EspañolالعربيةPortuguês日本語DeutschFrançaisTurkceРусский языкTiếng việtJęzyk polskiBahasa indonesiaYou're Reading a Free PreviewDownloadClose DialogAre you sure?This action might not be possible to undo. Are you sure you want to continue?CANCELOK

Comments

Description