BIOESTADÍSTICA APLICADA A LANUTRICIÓN SEMINARI O#5 INTERVALOS DE CONFIANZA INTEGRANTES (ESTIMACIÓN ESTADÍSTICA. ERROR Rod Josué Espin María TÍPICO DE LA Leonor MEDIA. INTERVALO Garófalo DE CONFIANZA PARA K. María José Gomero Jose AndrésDE Icaza COMPARACIÓN DOS MEDIAS. Mary Nicola INTERVALO DE CONFIANZA PARA Nelson Salas Yagual (Μ1- ΜGiancarlo 2). Contenido 1. INTRODUCCION......................................................................................................... 3 2. DESARROLLO............................................................................................................. 4 2.1. Estimadores puntuales e intervalos de confianza de una media...........................4 2.2. Intervalos de confianza de una media poblacional................................................5 2.2.1. Desviación estándar poblacional conocida (σ)...............................................5 2.2.2. Desviación estándar poblacional desconocida (σ).........................................7 2.3. Intervalos de confianza de una proporción..........................................................11 2.3.1. 2.4. Error típico de la media.......................................................................................15 2.4.1. 2.5. Ejemplo........................................................................................................13 Usos del error típico de la media..................................................................16 Elección del tamaño adecuado de una muestra..................................................17 2.5.1. Tamaño de la muestra para calcular una media poblacional........................18 2.5.2. Tamaño de la muestra para calcular la proporción de una población...........19 2.6. Intervalo de confianza para (µ 1−µ 2) ...........................................................20 2.6.1. Poblaciones normales..................................................................................21 2.6.2. Intervalo de confianza para la diferencia de medias....................................21 3. CONCLUSIONES......................................................................................................24 4. BIBLIOGRAFIA..........................................................................................................25 5. ANEXOS.................................................................................................................... 26 4.1. Distribución z......................................................................................................26 4.2. Distribución t de Student....................................................................................27 Escuela Superior Politécnica del Litoral 2 aunque finitas. El proceso de estimación implica calcular. suponga que elige una muestra de 50 ejecutivos de nivel medio y le pregunta a cada uno de ellos la cantidad de horas que laboró la semana pasada. como consecuencia decide examinar una muestra de los registros a partir de los cuales pueda calcular una estimación de la edad promedio de los pacientes admitidos ese año. El primer paso es el estudio del estimador puntual. si este es el caso existen dos buenas razones por las que se debe confiar en los procedimientos de estimación para obtener información respecto a dichos parámetros. a partir de los datos de una muestra. tienen interés en los parámetros de varias poblaciones. Segundo. Supóngase que el administrador de un hospital grande esta interesando en saber la edad promedio de los pacientes que fueron admitidos a su hospital durante un determinado año.1. La inferencia estadística es el procedimiento por medio del cual se llega a inferencias acerca de una población con base en los resultados obtenidos de una muestra extraída de esa población. INTRODUCCION En el trabajo a continuación se estudiaran diversos aspectos importantes del muestreo. Es posible que considere demasiado laborioso consultar todos los registros de todos los pacientes admitidos durante ese año y. Primero. no es posible estudiar por completo las poblaciones que son infinitas. La estimación. La explicación de las razones en que se funda la estimación en el campo de las ciencias de la salud se apoya en la suposición de que quienes trabajan en este campo. Por ejemplo. alguna estadística que se ofrece como una aproximación del parámetro correspondiente de la población de la cual se extrajo la muestra. Se calcula la media Escuela Superior Politécnica del Litoral 3 . Un estimador puntual consiste en un solo valor (punto) deducido de una muestra para estimar el valor de una población. son tan grandes que no se podría llevar a cabo un estudio del 100% desde el punto de vista del costo. muchas poblaciones de interés. la primera de las dos áreas generales de la inferencia estadística. desea calcular la cantidad de horas semanales que los empleados dedican al ejercicio. determina la edad de cada uno de ellos y calcula la edad media de los compradores de la muestra. DESARROLLO 2. Un enfoque que arroja más información consiste en presentar un intervalo de valores del que se espera que se estime el parámetro poblacional. La media de esta muestra es un estimador puntual de la media de la población.1. 2.3 horas aproxima la media poblacional desconocida. La media muestral de 3. ESTIMADOR PUNTUAL Estadístico calculado a partir de información de la muestra para estimar el parámetro poblacional. La media muestral.. fabricante importante de vidrio. Inc. la proporción poblacional. Los siguientes ejemplos ilustran los estimadores puntuales de medias poblacionales.de esta muestra de 50 y se utiliza el valor de la media muestral como estimador puntual de la media poblacional desconocida. Estudios médicos recientes indican que el ejercicio constituye una parte importante de la salud general de una persona. Escuela Superior Politécnica del Litoral 4 . Estimadores puntuales e intervalos de confianza de una media Un estimador puntual es un estadístico único para calcular un parámetro poblacional. la desviación estándar muestral.3. . desea estimar la edad media de los compradores de televisores de plasma de alta definición. no es el único estimador puntual de un parámetro poblacional. es un estimador puntual de σ. Ahora bien. selecciona una muestra aleatoria de 50 compradores recientes. Dicho intervalo de valores recibe el nombre de intervalo de confianza. p. Una muestra de 70 empleados revela que la cantidad media de horas de ejercicio de la semana pasada fue de 3. Por ejemplo. la media de horas de ejercicio de todos los empleados. una proporción muestral. un estimador puntual es un solo valor. y s. Suponga que Best Buy. El director de recursos humanos de OCF. la desviación estándar poblacional. es un estimador puntual de π. Consideraremos primero el caso donde se conoce σ. Se sabe que la desviación estándar es un estadístico importante. Cuando se calcula un intervalo de confianza. Por ejemplo: se cuenta con 90% de seguridad de que el ingreso anual medio de los trabajadores de la construcción en el área de Nueva York a Nueva Jersey se encuentra entre $81 000 y $89 000. Existen diferencias importantes en las suposiciones entre estas dos situaciones. Escuela Superior Politécnica del Litoral 5 . sería conveniente medir cuán próximo se encuentra en realidad. o la amplitud.1.2. Utilizamos los datos de la muestra para calcular µ con X. Aunque se espera que el estimador puntual se aproxime al parámetro poblacional. Un intervalo de este valor aproximado puede oscilar entre $81 000 y $89 000. 2. Desviación estándar poblacional conocida (σ) Un intervalo de confianza se calcula con el empleo de dos estadísticos: la media muestral y la desviación estándar. se estima que el ingreso anual medio de los trabajadores de la construcción en el área de Nueva York a Nueva Jersey es de $85 000. En este caso. un estimador puntual sólo dice parte de la historia. Para describir cuánto es posible confiar en que el parámetro poblacional se encuentre en el intervalo se debe generar un enunciado probabilístico. mientras que la desviación estándar de la población es desconocida.2. mientras que la • desviación estándar de la población (σ) es conocida. de una población o de una muestra de distribución. Por ejemplo. INTERVALO DE CONFIANZA Conjunto de valores que se forma a partir de una muestra de datos de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad específica. Un intervalo de confianza sirve para este propósito. La probabilidad específica recibe el nombre de nivel de confianza. consideraremos dos situaciones: • Utilizamos los datos de la muestra para calcular µ con X. Intervalos de confianza de una media poblacional Ahora bien. se utiliza la desviación estándar para estimar el rango del intervalo de confianza. Para calcular el intervalo de confianza.2. sustituimos la desviación estándar de la(s) muestra(s) por la desviación estándar de la población (σ). porque mide la dispersión. Noventa y cinco por ciento de las medias muestrales seleccionadas de una población se encontrará dentro de 1. Noventa y nueve por ciento de las medias muestrales se encontrará a 2. Escuela Superior Politécnica del Litoral 6 .58 errores estándares de la media poblacional.96 errores estándares (desviación estándar de las medias muestrales de la media poblacional. µ. 2.Los resultados del teorema central del límite permiten afirmar lo siguiente con respecto a los intervalos de confianza utilizando el estadístico z: 1. 2. al hacerlo no es posible utilizar la fórmula anterior.04 onzas. hay una solución: utilizar la desviación estándar de la media y sustituir la distribución z con la distribución t. 4.0098 Interpretación El nivel de confianza de 95% se encuentra entre 4. Escuela Superior Politécnica del Litoral 7 . Esto se debe a que la desviación estándar de la distribución t es mayor que la distribución normal estándar. La distribución t es más plana y que se extiende más que la distribución normal estándar.0248. Es decir. El intervalo de confianza de 95% de la media poblacional de esta muestra particular es: 4. la desviación estándar de la muestra. Algunas latas contendrán más y otras menos. Desviación estándar poblacional desconocida (σ) Se utiliza la desviación estándar de la muestra para estimar la desviación estándar poblacional. Del Monte establece que el proceso de llenado debe verter 4. La distribución t es una distribución de probabilidad continua. Ahora se selecciona una muestra aleatoria de 64 latas y se determina la media de la muestra. no puede utilizar la distribución z.01 onzas de duraznos y almíbar.Ejemplo Del Monte Foods. 2.2. También suponga que el proceso se rige por la distribución de probabilidad normal. Por supuesto. Suponga que la desviación estándar del proceso es de 0. se utiliza s. la desviación estándar de la población. Sin embargo. Así. Ésta es de 4. Para asegurarse de que cada lata contenga por lo menos la cantidad que se requiere. s es un estimador de σ.01 onzas de duraznos y almíbar en cada lata.96(. con muchas características similares a las de la distribución z.01 es la media poblacional.015 ± 1. Aquí.04 / √64)=4. distribuye duraznos en trozo en latas de 4 onzas.015 onzas de duraznos y almíbar. No obstante. no toda lata contendrá exactamente 4. Inc.015 ±.0052 y 4.01 onzas se encuentra en este intervalo.. para estimar σ. Como no conoce σ. La media de población de 4. Distribución normal estándar y distribución t de Student Como la distribución t de Student posee mayor dispersión que la distribución z. se ajusta la anterior de la siguiente manera. la distribución t es más plana o más amplia que la distribución normal estándar. Gráfico 2.Gráfico 1. Con el mismo nivel de confianza. Escuela Superior Politécnica del Litoral 8 . el valor de t en un nivel de confianza dado tiene una magnitud mayor que el valor z correspondiente. El siguiente grafico muestra los valores de z para un nivel de confianza de 95% y de t para el mismo nivel de confianza cuando el tamaño de la muestra es de n=5. Valores de z y t para el nivel de confianza de 95% Para crear un intervalo de confianza de la media poblacional con la distribución t. No se conoce la desviación estándar de la población. Se aplica la fórmula De acuerdo con la información dada. Si se conoce. se supone que la distribución de la población es normal. se debe utilizar t.La decisión de utilizar t o z se basa en el hecho de que se conozca σ. se utiliza z.32 pulgadas de cuerda restante con una desviación estándar de 0.30 pulgadas? Solución Para comenzar.32. En este caso no hay muchas evidencias. =0. Construya un intervalo de confianza de 95% de la media poblacional. Ejemplo#1 Un fabricante de llantas desea investigar la durabilidad de sus productos. Para hallar el valor de t El primer paso para localizar t consiste es desplazarse a lo largo de las columnas identificadas como “Intervalos de confianza” Escuela Superior Politécnica del Litoral 9 . que es de 0.09 pulgadas. la desviación estándar poblacional. s=0. ¿Sería razonable que el fabricante concluyera que después de 50 000 millas la cantidad media poblacional de cuerda restante es de 0. pero tal vez la suposición sea razonable.09 y n =10. Una muestra de 10 llantas que recorrieron 50 000 millas reveló una media muestral de 0. pero sí la desviación estándar de la muestra.09 pulgadas. Si no se conoce. desea el nivel de confianza de 95%.384 pulgadas. ¿Cómo interpretar este resultado? la media poblacional se encuentra en este intervalo. esto es. Estas palabras se refieren al número de grados de libertad.Gráfico 3. En este caso es de 10-1=9 Para determinar el intervalo de confianza se sustituyen los valores en la fórmula Interpretación Los puntos extremos del intervalo de confianza son 0.256 y 0. Una parte de distribución t En este caso.256 y 0. La columna del margen izquierdo se identifica como “gl”. Escuela Superior Politécnica del Litoral 10 . es posible que la media de la población sea de 0. Como el valor de 0. El fabricante puede estar seguro (95% seguro) de que la profundidad media de las cuerdas oscila entre 0. así que vaya a la columna con el encabezamiento “95%”.30 se encuentra en este intervalo. el número de observaciones incluidas en la muestra menos el número de muestras.384.30 pulgadas. el cual se escribe n-1. Al desplazarse por el renglón con 19 grados de libertad a la columna del intervalo de confianza de 95%. Una muestra de 20 clientes revela las siguientes cantidades. el valor de esta intersección es de 2. Hay n-1 = 20-1=19 grados de libertad. El valor de t se localiza en la tabla de distribución t. desea estimar la cantidad media que gastan los clientes que visitan el centro comercial. ¿Cuál es la mejor estimación de la media poblacional? Determine un intervalo de confianza de 95%.35) constituye la mejor aproximación de dicho valor. Ahora se considerarán casos como los siguientes: Escuela Superior Politécnica del Litoral 11 . Intervalos de confianza de una proporción El material hasta ahora expuesto en este capítulo utiliza la escala de medición de razón.Ejemplo #2 El gerente de Inlet Square Mall. ¿Concluiría de forma razonable que la media poblacional es de $50? ¿Y de $60? Solución El gerente del centro comercial no conoce la media poblacional. Resulta razonable que la media poblacional sea de $50. Es decir. Myers. Florida. Interpretación Los puntos extremos del intervalo de confianza son $45. De ahí que se concluya que no es probable que la media poblacional sea de $60.093. La media muestral ($49. Se aplica la fórmula establecida para determinar el intervalo de confianza. pesos. distancias y edades. El valor de $50 se encuentra dentro del intervalo de confianza.3. El gerente de Inlet Square se preguntaba si la media poblacional podría haber sido $50 o $60.57.13 y $53. cerca de Ft. 2. Interprete el resultado. El valor de $60 no se encuentra en el intervalo de confianza. se emplean variables como ingresos. Resulta razonable concluir que la media poblacional se encuentra en dicho intervalo. X el número de éxitos y n el número de elementos de la muestra. o 92%.• Un representante de ventas afirma que 45% de las ventas de Burger King se lleva • a cabo en la ventana de servicio para automóviles. Un estudio de las casas del área de Chicago indicó que 85% de las construcciones • nuevas cuenta con sistema de aire acondicionado central. Si p representa la proporción de la muestra.92. y el resultado debe clasificarse en uno de los dos grupos. razón o porcentaje que indica la parte de la muestra de la población que posee un rasgo de interés particular. Esta proporción de la muestra se utiliza como el estimador puntual de la proporción de la población. p. La proporción de la muestra es de 92/100. PROPORCIÓN Fracción. Cuando se mide con una escala nominal. o 0. una encuesta reciente indicó que 92 de cada 100 entrevistados estaban de acuerdo con el horario de verano para ahorrar energía. Sólo hay dos posibilidades. se determina una proporción muestral de la siguiente manera: PROPORCIÓN MUESTRAL Para estimar la proporción de una población se procede en la misma forma que cuando se estima la media de una población. Para crear el intervalo de confianza de una proporción de población se aplica la fórmula: Escuela Superior Politécnica del Litoral 12 . Estos ejemplos ilustran la escala de medición nominal. una observación se clasifica en uno de dos o más grupos mutuamente excluyentes. Una encuesta reciente entre hombres casados de entre 35 y 50 años de edad descubrió que 63% creía que ambos cónyuges deben aportar dinero. Se extrae una muestra de la población de interés y se calcula su proporción. Como ejemplo de proporción. Ejemplo De acuerdo con el reglamento del sindicato de BBA.96.782 y 0.80 n 2000 Por consiguiente. El punto extremo más bajo es mayor que 0. Además.80) 2000 .75. Determine el intervalo de confianza de 95% con ayuda de la fórmula (9-4). Un repaso de la interpretación del intervalo de confianza: si la encuesta fue aplicada 100 veces con 100 muestras distintas. es probable que se apruebe la propuesta de fusión. Escuela Superior Politécnica del Litoral 13 .80.818. Cliff Obermeyer se postula para representar ante el Congreso al 6o. los intervalos de confianza construidos a partir de 95 de las muestras contendrán la verdadera proporción de la población. El valor z correspondiente al nivel de confianza de 95% es de 1. se calcula que 80% de la población favorece la propuesta de fusión. ¿Qué es el estimador de la proporción poblacional? Determine el intervalo de confianza de 95% de la proporción poblacional.2.1.96 √ . por lo menos tres cuartas partes de los miembros del sindicato deben aprobar cualquier fusión.018 Los puntos extremos del intervalo de confianza son 0.80 ±1. Así.80 ±. p± z √ p (1− p) n . y desempeña un papel muy importante en especial la noche de las elecciones. Suponga que se entrevista a los electores que acaban de votar y 275 indican que votaron por Obermeyer. la interpretación de un intervalo de confianza resulta de mucha utilidad en la toma de decisiones. Fundamente su decisión en esta información de la muestra: ¿Puede concluir que la proporción necesaria de miembros del BBA favorece la fusión? ¿Por qué? Solución Primero calcule la proporción de la muestra de acuerdo con la fórmula (9-3). pues el estimador del intervalo incluye valores superiores a 75% de los miembros del sindicato. Por ejemplo. que se calcula de la siguiente manera: p= X 1600 = =. distrito de Nueva Jersey.3.80 (1−. Ésta es de 0. Una muestra aleatoria de 2 000 miembros actuales de BBA revela que 1 600 planean votar por la propuesta. 55 ±1.044 =0.506 y 0. En este caso.5 . Escuela Superior Politécnica del Litoral 14 .50? Si se establece el intervalo de confianza de la proporción de la muestra y halla que 0.50 pertenece al intervalo? Entonces concluirá que es posible que 50% o menos de los electores apoyen su candidatura y no es posible concluir que será electo a partir de de la información de la muestra. distrito. Ahora bien. de la población de electores que votarán por él. no se conoce el porcentaje de la población que votará por el candidato. p= X 275 = =. En estas circunstancias.594. Obermeyer debe ganar más de 50% de los votos de la población de electores. -0. Esto significa que 55% de los electores de la muestra votó por Obermeyer.55 ±. si se utiliza el nivel de significancia de 95% y la fórmula se tiene que: p± z= √ p (1− p) n . se debe al azar. ¿Qué significa esto? Bien. Por lo tanto. se concluye que probablemente más de 50% de los electores apoya a Obermeyer. ¿Qué pasa si 0. ¿el error de muestreo.50 no se encuentra en el intervalo. o la población de electores que apoya a Obermeyer es superior a 0.50=0. que es p−π=.Considere que 500 electores es una muestra aleatoria de quienes votan en el 6o.044 =0.55.50 no pertenece al intervalo.55. significa que puede resultar electo.96= √ .55 n 500 Ahora. Siempre se utiliza este procedimiento en las cadenas de televisión.55−. lo cual es suficiente para que sea elegido. El valor de 0.55(1−. concluirá que la proporción de electores que apoya a Obermeyer es mayor que 0. revistas de noticias y sondeos en la noche de las elecciones. los puntos extremos del intervalo de confianza son: 0.55) 500 . la pregunta es: ¿es posible tomar una muestra de 500 electores de una población en la que 50% o menos de los electores apoye a Obermeyer para encontrar que 55% de la muestra lo apoya? En otras palabras.044 Así.50. En este momento se conoce un estimador puntual. que es de 0. para estar seguros de la elección.55 -0. Observando la fórmula del error típico de la media podemos ver que: 1. 2. como es normal hacerlo cuando se calcula la desviación típica como dato descriptivo de la muestra. si de cualquier población se extraen muestras aleatorias del mismo tamaño N. Esto quiere decir que las medias de las muestras son más estables y tienden a oscilar menos que las puntuaciones individuales. Ambas fórmulas son equivalentes y dan el mismo resultado.4. al aumentar el número de muestras sus medias se distribuyen normalmente. La desviación típica se ha calculado dividiendo por N. las medias de las muestras aleatorias extraídas de esa población sí tienden a tener una distribución normal. X. disminuirá el cociente. o error típico Esta distribución muestral de las medias es independiente de la distribución de la población: Aunque la distribución en la población no sea normal. Escuela Superior Politécnica del Litoral 15 . elevadas previamente al cuadrado). con media µ y una desviación típica. dicho de otra manera.X. Observando las fórmulas vemos también que el error típico de la media será más pequeño en la medida en que N sea grande: si aumentamos el denominador. Es claro que el error típico de la media será menor que la desviación típica de cualquier muestra: el cociente siempre será menor que el numerador. las medias de muestras de la misma población se parecen entre sí más que los sujetos (u objetos) de una muestra entre sí. Error típico de la media Según el teorema del límite central. El error típico de la media (desviación típica de la distribución muestral de las medias) podemos expresarlo de dos maneras: La desviación típica del numerador se supone calculada dividiendo por N-1 la suma de cuadrados (o la suma de las puntuaciones diferenciales. la única diferencia está en cuándo se ha restado 1 a N.2. un planteamiento típico y frecuente en • estadística inferencial.5.Es natural que al aumentar el número de sujetos (N) el error sea menor: la media de la muestra se aproximará más a la media de la población. en la práctica. necesitaremos más sujetos… por eso en las fórmulas para determinar el número de sujetos de la muestra entrará el error típico. Si N es muy grande. sino una decisión que se toma para que la estimación del parámetro de población sea bueno. Igualmente • podemos aplicarlo si la media es una proporción.1. no es una variable. Sin embargo. es también de interés y es simplemente una aplicación del anterior. • Usos del error típico de la media Establecer los límites probables (intervalos de confianza) entre los que se encuentra la media de la población. Cuando a partir de los datos de una muestra nos interesa extrapolar los resultados a la población (por ejemplo cuántos van a votar a un partido político en unas elecciones). lo hacemos con un margen de error (en cuyo cálculo tenemos en cuenta el error típico y nuestro nivel de confianza): si queremos un margen de error pequeño. el cociente será mayor.4. Determinar el número de sujetos que necesitamos en la muestra para extrapolar los resultados a la población. 3. y si N no comprende a una muestra sino a toda la población. Esta decisión se basa en tres variables: Escuela Superior Politécnica del Litoral 16 . 2. el error típico estimado de la media será también mayor: si aumentamos el numerador. 2. Elección del tamaño adecuado de una muestra Una variable importante cuando se trabaja con intervalos de confianza es el tamaño de la muestra. el error tiende a cero. Nos permite comprobar si una muestra con una determinada media puede considerarse como perteneciente a una población cuya media conocemos. Por otra parte si la desviación típica de la muestra es grande. el error sería cero: en este caso la media de la población coincide con la media de la muestra y no hay error muestral (o variación esperable de muestra a muestra). se requiere una muestra grande. Si la población se encuentra muy dispersa. El margen de error que tolerará el investigador. el tamaño de muestra que se requiere será menor. Note que las muestras más grandes (con su consecuente requerimiento de más tiempo y dinero para recolectarlas) corresponden a niveles de confianza más altos. Para calcular el tamaño de la muestra. se necesitará un estadístico z que corresponda al nivel de confianza elegido. La segunda elección es el nivel de confianza. observe que utilizamos un estadístico z. Existe una compensación entre el margen de error y el tamaño de la muestra. 3. si se encuentra concentrada (homogénea). es la magnitud que se suma y resta de la media muestral (o proporción muestral) para determinar los puntos extremos del intervalo de confianza. podemos decidir que deseamos calcular la proporción de la población con un margen de error de más o menos 5%. El margen de error es la magnitud del error que se tolerará al estimar un parámetro poblacional. Por ejemplo. La primera variable es el margen de error. El nivel de confianza deseado. El tercer factor en la determinación del tamaño de una muestra es la desviación estándar de la población. Por el contrario.58. Quizás se pregunte por qué no elegir márgenes pequeños de error. No obstante. lógicamente se elegirán niveles de confianza relativamente altos como de 95% y 99%. en un estudio de salarios. El máximo error admisible. Un margen de error pequeño requiere de una muestra más grande y de más tiempo y dinero para recolectarla. He aquí algunas sugerencias para determinar dicho estimador. El nivel de confianza de 95% corresponde al valor z de 1. Al trabajar con un intervalo de confianza. designado E. Escuela Superior Politécnica del Litoral 17 . podemos decidir que deseamos estimar el salario promedio de la población con un margen de error de más o menos $1000. La variabilidad o dispersión de la población que se estudia. 2. que son los más comunes. Un margen de error más grande permitirá tener una muestra más pequeña y un intervalo de confianza más amplio. Asimismo. a un valor z de 2. O en una encuesta de opinión.96. puede ser necesario utilizar un estimador de la desviación estándar de la población.1. y el nivel de confianza de 99%. 96. se acostumbra redondear cualquier resultado fraccionario.5. y el estimador de la desviación estándar. con un nivel de confianza de 95%. El error al calcular la media debe ser inferior a $100.2. Note que esta fórmula es el margen de error que se utiliza para calcular los puntos extremos de los intervalos de confianza para estimar una media poblacional.1. es de $100. El resultado de este cálculo no siempre es un número entero. ¿Cuál es el tamaño de la muestra que se requiere? Solución El error máximo admisible. Al sustituir estos valores en la fórmula se obtiene el tamaño de la muestra que se requiere: Escuela Superior Politécnica del Litoral 18 . El valor z de un nivel de confianza de 95% es de 1.21 se redondearía a 202. se puede expresar la interacción entre estos tres factores y el tamaño de la muestra se expresa con la fórmula siguiente. $1 000. Cuando el resultado no es un entero. E es el error máximo admisible. E=z σ √n Al despejar n en esta ecuación se obtiene el siguiente resultado: Donde: n es el tamaño de la muestra. E. z es el valor normal estándar correspondiente al nivel de confianza deseado. 201. Ejemplo Un estudiante de administración pública desea determinar la cantidad media que ganan al mes los miembros de los consejos ciudadanos de las grandes ciudades. Tamaño de la muestra para calcular una media poblacional Para calcular una media poblacional. El estudiante encontró un informe del Departamento del Trabajo en el que la desviación estándar es de $1 000. σ es la desviación estándar de la población. Por ejemplo. por ejemplo. El margen de error. Esto puede incrementar mucho el costo del estudio.16 E 100 ( ) ( n= ) El valor calculado de 384.6 =384. 2 ( 2.58 ) (1000 ) zσ 2 n= n= =25. a 99%. Un incremento del nivel de confianza de 95% al de 99% dio como resultado un incremento de 281 observaciones o 73% [(666/385)*100]. Si el estudiante desea incrementar el nivel de confianza.2 2 ( 1. en términos de tiempo y dinero.82=665. 2.64 E 100 ( ) ( ) Se recomienda una muestra de 666. Se requiere una muestra de 385 para satisfacer las especificaciones.5. Observe cuánto modificó el tamaño de la muestra el cambio en el nivel de confianza. es necesario especificar estas mismas tres variables: 1. 3.16 se redondea a 385. La variación o dispersión de la población a estudiar. se requerirá una muestra más grande. El nivel de confianza deseado. El valor z correspondiente al nivel de confianza de 99% es 2. En el caso de la distribución binomial. Tamaño de la muestra para calcular la proporción de una población Para determinar el tamaño de la muestra en el caso de una proporción.96 ) (1000 ) zσ 2 n= =19.58.2. De ahí que deba considerarse con cuidado el nivel de confianza. 2. el margen de error es: E=z √ π ( 1−π ) n Si se resuelve la ecuación para despejar n se obtiene lo siguiente: Escuela Superior Politécnica del Litoral 19 . 50. Escuela Superior Politécnica del Litoral 20 . puede presentar al menos una distribución aproximadamente normal. 2. Intervalo de confianza para (µ 1−µ 2) A veces surgen casos en los que se tiene interés en estimarla diferencia entre la media de dos poblaciones.65 2 =68. Ejemplo En el estudio del ejemplo anterior también se calcula la proporción de ciudades que cuentan con recolectores de basura privados. de los datos de cada una. π es la proporción de la población.10. z es el valor normal estándar correspondiente al nivel de confianza deseado. El estimador 1 . El nivel de confianza deseado es de 0. que corresponde a un valor z de 1.5 )( 1−. la distribución muestral de 1-2.10 ( ) El investigador necesita una muestra aleatoria de 69 ciudades. de modo que en muchos casos se utiliza la teoría pertinente a las distribuciones normales para calcular un intervalo de confianza para µ1-µ2. se calculan las medias de las muestras 1 y 2 respectivamente. El estudiante desea que el margen de error se encuentre a 0.10. y no se encuentra disponible ningún estimador de la proporción de la población. ¿Cuál es el tamaño de la muestra que se requiere? El estimador de la proporción de la población se encuentra a 0.90.0625 .65. el nivel de confianza deseado es de 90%. A partir de cada población se extrae una muestra aleatoria independiente y.5 ) 1. por lo que E=0. E es el máximo error tolerable.10 de la proporción de la población.2 proporciona una estimación insesgada de µ 1−µ2 . Como no se encuentra disponible ningún estimador de la población. se utiliza 0. El número de observaciones que se sugiere es n=( .Donde: n es el tamaño de la muestra. Dependiendo de las condiciones. la diferencia entre las medias de las poblaciones.6. ❑21) X 2 N ( μ2. veremos cómo X 1 N (μ1. lo que implica independencia entre las medias muestrales 1 y 2. En este caso. 2. y α =1−γ : Escuela Superior Politécnica del Litoral 21 .2. ❑2 X2 N ( ¿) .2 En el caso de que ambas poblaciones sean normales. ❑21) ¿ ¿ obtener intervalos de confianza para la diferencia de las medias de las varianzas. ❑22) y Y tenemos una muestra de X1 (de tamaño n1) y una muestra de X2 (de tamaño n2).6. 2. μ 2. donde como es habitual S 21 y S 22 son las varianzas muestrales de las dos muestras. Poblaciones normales Las variables correspondientes a las dos poblaciones son: X 1 N ( μ1.1. a partir de la función correspondiente tenemos el intervalo de confianza de nivel de confianza para (µ 1−µ 2) . Intervalo de confianza para la diferencia de medias Suponemos que las muestras de las dos poblaciones son independientes entre sí.6. 4.96. el 95% de los intervalos construidos de esta manera incluirían la diferencia entre las medias reales.95 es de 1. al repetir el muestreo. una muestra de 12 individuos con síndrome Down proporcionó una concentración media de ácido úrico en suero de 1= 4. En un hospital general. se encontró que una muestra de 15 individuos normales de la misma edad y sexo tenía un valor medio de 2= 3.4=1.2=4.3 ±1.96(. µ 1−µ2 esté entre . Si resulta lógico suponer que las dos poblaciones de concentraciones presentan una distribución normal con variancias iguales a 1. Escuela Superior Politécnica del Litoral 22 .5 mg/100 ml. encuentre el intervalo de confianza del 95% para µ 1−µ2 Solución Para una estimación puntual de µ 1−µ2 . utilícese 1 .3 y 1.5-3.1± 1.9. El intervalo de confianza del 95% es entonces 1. El error estándar está dado por la expresión.Ejemplo#1 En un hospital grande para el tratamiento de retrasados mentales.1 El coeficiente de confiabilidad que corresponde a .39) 1.8 . porque.1± 1.9 El 95 por ciento de confianza de que la diferencia real. 96 Escuela Superior Politécnica del Litoral 23 y . Respectivamente. cada una de ellas del ritmo cardíaco en reposo de 10 personas. 70. Tenemos. 75. 62.Ejemplo#2 Se llevó a cabo un estudio sobre el ritmo cardíaco (en pulsaciones por minuto) de los deportistas. por ejemplo. 74. Para ello. 78. para la diferencia de los ritmos cardiacos medios. 69. 1=72 y 2=64. 65. que podemos suponer con distribuciones aproximadas 2 N (μ1.95 es el α =1−γ =0. con nivel de confianza =0. a) Las varianzas poblacionales.05 . con nivel de confianza = 0. Vamos a encontrar un intervalo de confianza. 73. (µ 1−µ 2) . por lo tanto. ❑2 ) . comparándolo con el de los no deportistas. en reposo. α 1− =0. 63. ❑1 ) y 2 N (μ2. independientemente. conocidas.95. 68. la primera en la población de no deportistas y la segunda en la de los no deportistas (todos en edades comprendidas entre los 20 y 35 años) Los datos obtenidos fueron: No 65. una muestra de tamaño n1=10 de X1 y una muestra de tamaño n2=10 de X2. 60. deportistas Deportistas 73 71.975 2 Z 0.975=1. 64. teniendo en cuenta que 2 ❑1 =10 y 2 ❑2=9 . 61. son el intervalo de confianza para (µ 1−µ 2) siguiente. 72. 60 Identificamos con X1 la variable “ritmo cardiaco de los no deportistas” y con X 2 la variable “ritmo cardiaco de los deportistas”. se tomaron dos muestras aleatorias independientes. Para ello tenemos en cuenta que n1=n2=10. 65. En este caso. 72. b) Las varianzas son desconocidas pero se pueden suponer iguales. que µ 1> µ2 . En este caso. lo primero que necesitamos es calcular las varianzas de cada muestra s1 y s2 Escuela Superior Politécnica del Litoral 24 . podemos decir con una confianza de un 95% que podemos decir que que µ 1−µ2 >0 . además µ 1−µ2 >5 . o lo que es lo mismo. Como el intervalo es positivo. esto es.Redondeando al quinto decimal. ❑12=❑22 . con ese grado de confianza. 3. la variabilidad de los • datos y el tamaño de la muestra.. Juan Carlos González Q. esto es consecuencia de la aleatoriedad del muestreo.html. Texto Básico de Biometría. Pero se debe tener en cuenta que su amplitud está determinada por el nivel de confianza determinado. 4. En muchos estudios una estimación puntual no es suficiente ya que dar un numero como estimación de un parámetro nos indica el error que cometemos.med. Dr. CONCLUSIONES • Después de la investigación podemos decir que un intervalo de confianza aporta más información que un estimador puntual cuando se quiere hacer inferencias sobre parámetros poblacionales. Ed Corpus. Jacobo Díaz Portillo. Revisado 2007 [En línea] [fecha de acceso 18 de junio de 2015] URL disponible en: http://escuela. Madrid Guillermo Restrepo Ch.cl/recursos/recepidem/epianal9. Intervalos de confianza. Colombia. Univer. Estar conscientes del error de muestreo nos permite darle importancia a los resultados y no tomar decisiones ante la creencia de que los valores estimados están cercanos a la verdad. 2010 Escuela Superior Politécnica del Litoral 25 . BIBLIOGRAFIA • Tomás Merino. Guía Práctica del Curso de bioestadística Aplicada a las • Ciencias de la Salud. es aceptable hasta el 10% ya que variaciones • mayores reducirán la validez del estudio. Católica de • Chile.puc. 2013. Lind Douglas A. [En línea] [fecha de acceso 18 de junio de 2015] URL disponible en: http://es. Mexico: • LIMUSA. ANEXOS 4.1. Como calcular el interval de confianza. 2012 Wiley Jhon. Mexico: Mc Graw Hill. 1ª ed.• Ruth Henquin. • 2007. Intervalos de confianza: por qué usarlos. Bioestadística base para el análisis de las ciencias de salud. Epidemiologia y estadística para principiantes. Cir Esp.81(3):121-5. Wathen Samuel A. Escrig Sos J et al. 1991 Wikihow. Buenos Aires.wikihow. Estadistica aplicada a los negocios y la • economía. Distribución z Escuela Superior Politécnica del Litoral 26 . • Corpus Libros Médicos.com/calcular-el-intervalo-deconfianza 5. 2.4. Distribución t de Student Escuela Superior Politécnica del Litoral 27 . Escuela Superior Politécnica del Litoral 28 .