UNIDAD I.DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO. 1.1 INTRODUCCIÓN A LA ESTADISTICA INFERENCIAL. Estadística inferencial: Describe los métodos que utilizan la información contenida en una muestra de la población para tomar decisiones o para obtener conclusiones sobre dicha población. La estadística inferencial se divide en dos grandes áreas: estimación de parámetros y prueba de hipótesis. Muestra aleatoria o probabilística: Muestra que se selecciona de modo que cada integrante de la población en estudio tenga una probabilidad conocida (no igual a cero) de ser incluido en la muestra, permitiendo que el azar determine los integrantes que se incluirán en la muestra. 2.1. MUESTREO: INTRODUCCION AL MUESTREO Y TIPOS DE MUESTREO. Necesidades del muestreo A menudo no es posible estudiar la población completa. Algunas de las principales razones por las que es necesario muestrear son: 1. La naturaleza destructiva de ciertas pruebas. 2. La imposibilidad física de revisar todos los integrantes de la población. 3. El costo de estudiar a todos los integrantes de la población a menudo es prohibitivo (muy alto). 4. Lo adecuado de los resultados de la muestra. 5. En ocasiones se necesitaría mucho tiempo para estudiar a toda la población. Métodos de muestreo probabilístico No hay un “mejor” método para seleccionar una muestra probabilística de una población de interés. La selección del método es de acuerdo a las características de la población. Principales métodos de muestreo probabilístico Muestreo aleatorio simple Muestreo aleatorio sistemático Muestreo aleatorio estratificado Muestreo aleatorio por conglomerados Muestreo aleatorio de etapas múltiples Muestreo aleatorio simple La muestra aleatoria simple es aquella en la que los elementos se escogen en forma individual y al azar de la totalidad de la población, cada integrante de la población tiene la misma probabilidad de quedar incluido en la muestra. La muestra aleatoria simple se selecciona de la siguiente manera 1. Se enumeran todos los elementos de la población en números sucesivos del 1 a N (número de los elementos de la población); se usan ceros antes de cada cifra significativa, para igualar el número de dígitos. Si N = 1000; 0001, 0002,..., 1000 2. Con una tabla de números aleatorios se seleccionan los elementos de acuerdo al tamaño de la muestra. Muestreo aleatorio sistemático Una muestra sistemática elige los elementos de la población (N) a intervalos uniformes a partir de un listado ordenado. El intervalo K se calcula dividiendo el total de los elementos de la población entre el tamaño muestral: K = N / n Para iniciar la selección; se elige un número al azar entre 1 y K; a partir de él se aplica a la lista el intervalo de K eligiendo cada k- ésimo elemento de la muestra. Muestreo aleatorio estratificado En éste tipo de muestreo la población se divide en subgrupos, denominados estratos, y se selecciona una muestra de cada estrato. Entre los posibles criterios de estratificación se cuenta la edad, sexo, la escolaridad, ocupación, etc..., ó cualquier otro criterio que sea relevante al problema de investigación. Pueden utilizarse dos ó más criterios simultáneamente. Después que la población se ha dividido en estratos, puede seleccionarse una muestra proporcional si en cada uno de los estratos se usa la misma fracción de muestreo ó no proporcional ó con fracción variable de muestreo. El muestreo estratificado tiene la ventaja, en algunos casos de reflejar con mayor precisión las características de la población, que el muestreo aleatorio simple ó sistemático. Para obtener la muestra de cada estrato se utiliza muestreo aleatorio simple ó sistemático. Ejemplos Supongamos que deseamos tomar una muestra estratificada proporcional de 200 estudiantes de un colegio de 1000 alumnos. Para esto dividimos a los estudiantes en tres estratos; utilizando como criterio de estratificación el grado. Primer estrato: 1° y 2° grado 560 Segundo estrato: 3° y 4° grado 290 Tercer estrato: 5° y 6° grado 150 1000 Fracción de muestreo f = 200 = 1 1000 5 Estratos de la población Estratos de la muestra I 560 (560)(1/5) = 112 II 290 (290)(1/5) = 58 III 150 (150)(1/5) = 30 1000 200 Una población de 5000 personas se estratificó en tres estratos de 3000, 1200 y 800, de los cuales se tomaron muestras con fracciones de muestreo 1/10, 1/5 y 1/4, respectivamente, por lo tanto se tomó la siguiente muestra: Estrato Fracción muestral Elementos de la muestra 3000 1/10 300 1200 1/5 240 800 ¼ 200 Muestreo aleatorio por conglomerados Este tipo de muestreo se aplica en poblaciones que están compuestas por un conjunto de grupos, cada uno de los cuales tiene más de una unidad de la población, tal grupo recibe el nombre de conglomerado. La muestra por conglomerado es aquella, en la cual la unidad de muestreo lo constituyen conglomerados. Los conglomerados de una población pueden ser agrupaciones naturales o artificiales. Conglomerados naturales: cursos de un colegio, grupos de trabajo, manzanas de una población, pueblos, etc... Conglomerados artificiales: los forma el investigador según necesidades prácticas o de otro tipo. Por ejemplo una lista de 1000 personas la puede dividir en 50 grupos de 20 personas cada uno. La selección de los conglomerados se efectúa en forma aleatoria simple o sistemática. Ejemplo Suponga que un colegio tuviese distribuidos sus 1000 alumnos en 40 cursos, cada uno de ellos con 25 alumnos, se desea tomar una muestra de 250 alumnos. f = n / N = 250 / 1000 = 1/ 4 Número de conglomerados = (1/ 4)(40) = 10 cursos, que se deberán seleccionar entre los 40 en forma aleatoria o sistemática. Muestreo aleatorio de etapas múltiples El muestreo de etapas múltiples se aplica en poblaciones divididas en conglomerados; los conglomerados construidos o definidos inicialmente llamados “unidades primarias” pueden ser divididos en grupos menores que reciben el nombre de “unidades secundarias”, las cuales a su vez, pueden ser subdivididas en conglomerados menores. La subdivisión se repite hasta un nivel que el investigador considere apropiado. La selección de los conglomerados se efectúa en forma aleatoria simple o sistemática. 1.3. TEOREMA DEL LÍMITE CENTRAL. Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media y varianza finita 2 , entonces la forma límite de la distribución de X Z= / n Conforme n , es la distribución normal n (Z; 0,1) Conclusión: Lo que nos dice este teorema es que si tomamos muestras de una población con distribución desconocida, finita o infinita, la distribución muestral de X aún será aproximadamente normal con 2 media y varianza siempre que el tamaño de la muestra sea n grande (n 30), cuando “n” es grande se puede estimar. 2 Si n<30 y conocemos la aproximación es buena, la distribución 2 muestral de la media puede ser casi normal. Cuando “n” es pequeña no se puede estimar . 2 Si se sabe que la población es normal, la distribución muestral de X seguirá una distribución normal exacta, no importa qué tan pequeño sea el tamaño de la muestra. X X X1 X2 X Distribución normal original =1 Z -3 z1 z2 0 3 Distribución normal transformada (estandarizada) 1.4. DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO. 1.4.1. DISTRIBUCIÓN MUESTRAL DE LA MEDIA. Suponga que una muestra aleatoria de n observaciones se toma de una población normal con media y varianza 2. Cada observación xi , i = 1,2,........,n de la muestra aleatoria tendrá entonces la misma distribución normal que la población que se muestrea, por la propiedad reproductiva de la distribución normal, la combinación lineal: x 1 x 2 ... x n 1 1 1 X x 1 x 2 ... x n n n n n Tiene una distribución normal con media: 1 1 1 1 X ... n n n n n Varianza y desviación estándar: Para población infinita o muestreo con reemplazo: 2 2 2 1 2 1 2 1 2 1 2 2 X2 ... n 2 n n n n n X n Para poblaciones finitas, muestreo sin reemplazo o cuando n 0.05 (fracción de muestreo) se aplica un factor de corrección: N N n X * n N 1 Si recordamos a la distribución normal, esta es una distribución continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica. Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la variable aleatoria, mediante la siguiente fórmula: 𝒙−𝒖 𝒛= 𝝈 En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribución z. Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño de una población normal, la distribución muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución normal con x m = m y x s = s, entonces la fórmula para calcular la probabilidad del comportamiento del estadístico, en este caso la media de la muestra, quedaría de la siguiente manera: 𝒙−𝒖 𝒛= 𝝈/√𝒏 Y para poblaciones finitas y muestreo con reemplazo. 𝒙−𝒖 𝒛= 𝝈 √𝑵 − 𝒏 √𝒏 𝑵 − 𝟏 Ejercicios Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Un banco calcula que sus cuentas individuales de ahorro tienen una distribución normal con una media de $2,000.00 y con una desviación estándar de $600.00. Si el banco toma una muestra aleatoria de 100 cuentas. ¿Cuál es la probabilidad de que la media se halle entre $1,900.00 y $2,050.00? En una Compañía llantera el control de calidad del proceso es estricto, la duración del “piso” de las llantas producidas tiene distribución normal, con un promedio de 25,000 millas y una desviación estándar de 5,000 millas. Si se selecciona al azar una muestra de 100 llantas para análisis y se calcula la duración promedio para esta muestra. a) Encuentre la probabilidad de que la muestra de 100 llantas tendrá una media entre 24000 y 25000 millas. Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine: a) El número de las medias muéstrales que caen entre 172.5 y 175.8 centímetros. b) El número de medias muéstrales que caen por debajo de 172 centímetros. 1.4.2. DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE MEDIAS Si se extraen al azar muestras independientes de tamaño n1 y n2 de dos poblaciones con medias 1 y 2 y varianzas 1 y 2 2 2 respectivamente, entonces la distribución muestral de la diferencia de medias X 1 X 2 esta distribuida aproximadamente de forma normal con media, varianza y desviación estándar dadas por: X1 X 2 1 2 12 22 2 X1 X 2 n1 n2 12 22 X1 X 2 n1 n2 por lo tanto: Z = X 1 X 2 1 2 ( 12 / n1 ) ( 22 / n2 ) Es aproximadamente una variable normal conforme n1 y n2 Ejercicios Se llevan a cabo dos experimentos independientes en los que se comparan dos tipos diferentes de pintura. Se pintan 18 especímenes con el tipo de pintura A y en cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estándar de la población son ambas 1. Suponga que el tiempo medio de secado es igual para los dos tipos de pintura, encuentre P ( X A X B 1 ) , donde X A y X B son los tiempos promedio de secado. Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B. Los cinescopios para televisión del fabricante A tienen una duración media de 6.5 años y una desviación estándar de 0.9 años, mientras que los del fabricante B tienen una duración de media de 6 años y una desviación estándar de 0.8 años. ¿Cuál es la probabilidad de que una muestra aleatoria de 36 cinescopios del fabricante A tenga una duración media que sea al menos de un año más que la duración media de una muestra de 49 cinescopios del fabricante B?. Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1? La vida eficaz de un componente utilizado en la turbina de una aeronave es una variable aleatoria con media de 5,000 horas y una desviación estándar de 40 horas. La distribución de la vida eficaz es muy próxima a una distribución normal. El fabricante de la turbina introduce una mejora en el proceso de fabricación de este componente, que aumenta el tiempo de vida útil promedio a 5,050 horas y disminuye la desviación estándar a 30 horas. Supóngase que se toma del proceso “antiguo” una muestra aleatoria 1 de 16 componentes, y una muestra aleatoria 2 del proceso “mejorado” de 25 componentes. ¿Cuál es la probabilidad de que la diferencia entre las dos medias muéstrales X 2 X 1 sea al menos 25 horas? Supóngase que los procesos antiguo y mejorado pueden considerarse como poblaciones independientes. 1.4.3. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN. APROXIMACIÓN NORMAL DE LA DISTRIBUCIÓN BINOMIAL. Supóngase que en una población la probabilidad de ocurrencia de un suceso (conocido como su éxito) es p, mientras que la probabilidad de no ocurrencia del suceso es q = 1 – p. Se consideran todas las posibles muestras de tamaño n extraídas de esta población (distribuida binomialmente – muestreo con reemplazo) y para cada muestra se determina su proporción de éxito. Entonces se obtiene una Distribución muestral de proporciones cuya media p y desviación estándar p viene dadas por: pq p p p n para grandes valores de n (n≥30) la distribución muestral de proporciones se aproxima a la distribución normal, en particular cuando np 5 y n(1-p) 5 entonces: ps p Z= pq n Dónde: ps es la proporción muestral p es la proporción poblacional Ejercicios. (Resolverlos con la distribución muestral de proporciones) Hallar la probabilidad de que en 120 lanzamientos de una moneda el número de caras: a) Esté comprendido entre el 40% y el 60%. b) Sea 5/8 o más del número de lanzamientos c) 1/4 o menos del número de lanzamientos El gerente de una mueblería ha determinado que el 20% de las ventas del año pasado incluyeron la entrega de muebles en un plazo de 30 días después de la compra. Si se selecciona una muestra aleatoria de 400 ventas. Determine la probabilidad de que la proporción muestral de los pedidos entregados dentro de los 30 días siguientes sea: a) Entre 0.20 y 0.25 b) Sea menos del 0.15 c) Mayor de 0.24 Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55. Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%. Se sabe que la verdadera proporción de los componentes defectuosos fabricados por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga: a) Menos del 3% de los componentes defectuosos. b) Más del 1% pero menos del 5% de partes defectuosas. 1.4.4 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE PROPORCIONES. Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos: - Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban inglés? - Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de ese tipo? - Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales. - Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A a los que genera la máquina B? Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muéstrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n1p1≥5, n1q1≥5, n2p2≥5 y n2q2≥5). Entonces p1 y p2 tienen distribuciones muéstrales aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución muestral aproximadamente normal. La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de proporciones es: (𝒑𝟏 − 𝒑𝟐 ) − (𝑷𝟏 − 𝑷𝟐 ) 𝒛= 𝑷𝟏 𝒒𝟏 𝑷𝟐 𝒒𝟐 √ + 𝒏𝟏 𝒏𝟐 Ejercicios. Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres. Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más? Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina: a) ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10? b) ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15? 1.4.5 DISTRIBUCIÓN T-STUDENT. (TEORÍA DE PEQUEÑAS MUESTRAS) Distribución muestral de la media X con varianza desconocida. Si X es la media de una muestra aleatoria de tamaño pequeño n (n<30) tomada de una población normal con media y varianza 2 desconocida, entonces la variable aleatoria: X T = S/ n Tiene una Distribución t con v = n - 1 grados de libertad. Donde la media y la varianza son: X Xi n y S 2 n xi X 2 i 1 n i 1 n1 Cuando n es la misma distribución que la normal. Distribución normal 0 , 2 1 Distribución t 0 , 2 1 t t 0 t v = 10 v=5 v=1 - t t -3 -2 -1 0 1 2 3 Ejercicios Un jefe de producción afirma con un 90% de seguridad que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación muestrea 25 lotes cada mes. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar muestral de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal. Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal. Al fabricante de un agente propulsor utilizado en sistemas de escape de emergencia de aeronaves le gustaría afirmar que su producto tiene una tasa promedio de combustión de 40 pulgadas por minuto. Para investigar esta afirmación, el fabricante prueba 25 gramos de propulsor seleccionado al azar, y si el valor calculado de T cae entre – t 0.05 y t 0.05, entonces queda satisfecho. ¿A qué conclusión debe llegar el fabricante si tiene una muestra con una media de 42 pulgadas por minuto y una desviación estándar de 0.75 pulgadas por minuto? Supóngase que la tasa de combustión tiene una distribución normal. La resistencia a la tensión para cierto tipo de alambre se distribuye normalmente con una media desconocida y una varianza desconocida 2 . Se seleccionaron al azar 6 segmentos de alambre de un rollo grande y se midió x i , la resistencia a la tensión para el segmento i, en donde i = 1, 2, 3, 4, 5, 6. La y de la población pueden estimarse por X y S2 2 respectivamente. Encuentre la probabilidad de que X esté a lo más a 25/ n de la verdadera media poblacional: P (-2S / n < X - < 2S / n ). 1.4.6. DISTRIBUCIÓN MUESTRAL DE LA VARIANZA S2. DISTRIBUCIÓN Ji CUADRADA. La distribución Ji cuadrada es un caso especial de la distribución gama con v / 2 y 2 , donde v es un entero positivo. La distribución tiene un solo parámetro v llamado grados de libertad. Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene varianza 2 , entonces el estadístico: X2 = n 1S 2 “muestras pequeñas” 2 Tiene una Distribución Ji cuadrada con v = n - 1 grados de libertad. f(X2) X2 0 X2 Exactamente 95% de una distribución Ji cuadrada yace entre X 02.975 y X 02.025 Ejercicios Un fabricante de baterías para auto garantiza con un 95% de seguridad que sus baterías durarán, en promedio, 3 años con una desviación estándar de 1 año. Si 5 de éstas baterías tienen duraciones de 1.19, 2.4, 3.0, 3.5 y 4.2 años, ¿el fabricante aún está convencido de que sus baterías tienen una desviación estándar de 1 año? Suponga que la duración de la batería sigue una distribución normal. Se toma una muestra aleatoria de 27 observaciones de una población normal con varianza de 16.8. Hallar la probabilidad aproximada de obtener una desviación estándar de la muestra: a).- entre 3 y 5.2 b).- mayor de 4 Calcule la probabilidad de que una muestra aleatoria de 25 observaciones, tomadas de una población normal con varianza 6 tendrá una varianza muestral: a).- mayor que 9.1 b).- entre 3.462 y 10.745 Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos en una ciudad grande forman una distribución normal con una desviación estándar de 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza de 6, tenga una varianza muestral: a) Mayor que 9.1 b) Entre 3.462 y 10.745 Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía, suponga una población normal. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estándar. En un estudio de la cantidad de calcio en el agua potable, el cual se efectúa como parte del control de calidad, se analizó seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por millón fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la población para este estándar, usando un nivel de confianza del 90%. 1.4.7. DISTRIBUCIÓN MUESTRAL DE LA COMPARACIÓN DE VARIANZAS MUESTRALES. DISTRIBUCIÓN F. 2 2 Si X 1 y X 2 son variables aleatorias independientes que tiene distribuciones ji cuadrada con v1 y v2 grados de libertad, respectivamente entonces: X 12 / v1 F= 2 donde X 2 n1 1S12 12 1 X 2 / v2 Y X 2 n2 1S 22 v1 = n1 -1 , v2 = n2 - 1 2 2 2 n1 1S 12 n1 1S 12 /( n1 1 ) 12 n1 1 12 S 12 / 12 F = n2 1 S 22 n2 1S 22 S 22 / 22 /( n2 1 ) 22 n2 1 22 2 2 Si S 1 y S 2 son las varianzas de muestras aleatorias independientes de tamaño n1 y n2 tomadas de poblaciones normales con varianzas 1 y 2 , respectivamente, entonces: 2 2 S12 / 12 22 S12 F= 2 2 2 “muestras pequeñas” S2 / 2 1 S2 2 Tiene una distribución F con v1 = n 1 -1 y v2 = n2 - 1 grados de libertad. DISTRIBUCIÓN F h(f) 6 y 24 g.l. 6 y 10 g.l. P(F> f ;v1 ,v2 ) 0 0 f 1 f 1 ;v1 ,v2 f ;v1 ,v2 f ;v2 ,v1 h(f) 15 y g.l. 15 y 50 g.l. 15 y 5 g.l. f 0 Ejercicios Si S 12 y S 22 representan las varianzas de muestras aleatorias independientes con tamaños n1 = 25 y n2 =25 tomadas de poblaciones normales con varianzas 12 = 10 y 22 = 15, respectivamente, determine P ( S 12 / S 22 > 1.26). Si tomamos dos muestras independientes de tamaño n 1 = 6 y n2 =10 de dos poblaciones normales con la misma varianza poblacional, encuentre el número “b” tal que P ( S 12 / S 22 b) = 0.95. Dos muestras de tamaños 8 y 10 se extraen de dos poblaciones distribuidas normalmente con varianza 20 y 36 respectivamente. Hallar la probabilidad aproximada de que la varianza de la primera muestra sea más de dos veces la varianza de la segunda. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran en la tabla: Método 1 Método 2 n1 = 31 n2 = 25 S12 = 50 S22 =24 Construya un intervalo de confianza del 90% para 𝜎 12/ 𝜎 22. Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviación estándar S1 = 4.7 micro pulgadas, y una muestra aleatoria de n 2=12 partes del segundo proceso, la cual tiene una desviación estándar S2 = 5.1 micro pulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas 𝜎 12/ 𝜎 22. Suponga que los dos procesos son independientes y que la rugosidad de la superficie está distribuida de manera normal.