Modulo II_Inferencia estadística



Comments



Description

MÓDULO IIESTADÍSTICA INFERENCIAL Preparado por: RUBÉN DARÍO MEDINA RIVERA VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD Concepto de variable aleatoria. Los resultados de los experimentos que se llevan a cabo están sujetos a la casualidad. La prueba de un número de componentes electrónicos es un ejemplo de un experimento estadístico, término que se utiliza para describir cualquier proceso mediante el cuál se generan varias observaciones al azar. Con frecuencia es muy importante asignarle al resultado una descripción numérica. Por ejemplo, el espacio muestral en el que se consideran cada uno de los posibles resultados cuando se verifican tres componentes electrónicos, puede escribirse: S= {NNN. NND, NDN, DNN, NDD, DND, DDN, DDD} Donde N significa “no defectuoso” y D “defectuoso”. Naturalmente el interés está en el número de componentes defectuosos que ocurren. Entonces, a cada punto en el espacio muestral se le asigna un valor numérico de 0, 1, 2, o 3. Estos valores son, cantidades aleatorias determinadas por el resultado del experimento. Estos pueden considerarse como los valores que asume la variable aleatoria X, el número de artículos defectuosos cuando se prueban los tres componentes electrónicos. Una variable aleatoria es una función que asocia un número real a cada elemento del espacio muestral. La letra mayúscula designa la variable aleatoria y su correspondiente letra minúscula, para uno de sus valores (X =x.) Ejemplo: El experimento consiste en lanzar al aire tres monedas para observar el número de caras y cruces. E {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS} La variable aleatoria se define como X = número de caras, así: Espacio muestral X CCC CCS, CSC, SCC SSC, SCS, CSS SSS 3 2 1 0 Obsérvese que X no es una variable, sino una función (porque asocia un resultado a un número) y no es aleatoria por el hecho de que atribuya de modo imprevisible un valor cualquiera a un elemento, ya que este valor esta definido de forma precisa (determinista). Lo que es aleatorio en realidad es que, al hacer el experimento, no sabemos que elemento de E puede ocurrir. En función de los valores que tome la variable, esta puede ser clasificada como discreta o continua Si un espacio muestral contiene un número finito de posibilidades o una secuencia interminable con tantos elementos como números naturales existen, se le llama espacio muestral discreto. Si un espacio muestral contiene un número infinito de posibilidades igual al número de puntos en un segmento de línea, se le llama espacio muestral continuo. Una variable aleatoria se llama variable aleatoria discreta si se puede contar su conjunto de resultados posibles. Cuando una variable aleatoria puede tomar valores en una escala continua, se le llama variable aleatoria continua. VARIABLES ALEATORIAS DISCRETAS Una variable aleatoria discreta asume cada uno de sus valores con una cierta probabilidad. Por ejemplo, los valores posibles de x de X y sus probabilidades para el ejemplo del lanzamiento de las tres monedas es: X 0 1 2 3 P(X = x) 1/8 3/8 3/8 1/8 Con mucha frecuencia es necesario representar con una fórmula todas las probabilidades de una variable aleatoria X. Dicha fórmula debe ser una función de valores numéricos x, y se expresa por f(x), g(x),... etc. Por lo tanto se escribe: F(x) = P(X=x), es decir, f(3) = P(x=3) Definición: El conjunto de pares ordenados (x, f(x)) es una función de probabilidad, función masa de probabilidad o distribución de probabilidad de la variable aleatoria discreta X si, para cada resultado posible x i ) ( ) ( . 3 1 ) ( . 2 0 ) ( . 1 x f x X P x f x f x = = = ≥ ∑ Ejemplo. Consideremos el problema de determinar cuanto tiempo tendría que exhibirse un artículo en la vitrina de un almacén antes de ser vendido. Para un artículo de demanda relativamente baja, se estima que la probabilidad de que sea vendido en cualquier día dado es de 50%. La distribución acumulada F(x) de una variable aleatoria discreta X, cuya distribución de probabilidad es f(x) es: ∞ < < ∞ − = ≤ = ∑ ≤ x para t f x X P x F x t ) ( ) ( ) ( Volvamos al ejemplo de las tres monedas: [ ] [ ] [ ] [ ] 1 8 / 8 8 / 1 8 / 3 8 / 3 8 / 1 ) 3 ( ) 2 ( ) 1 ( ) 0 ( 3 ) 3 ( 8 / 7 8 / 3 8 / 3 8 / 1 ) 2 ( ) 1 ( ) 0 ( 2 ) 2 ( 8 / 4 8 / 3 8 / 1 ) 1 ( ) 0 ( 1 ) 1 ( 8 / 1 ) 0 ( ) 0 ( 0 ) 0 ( = = + + + = + + + = ≤ = = + + = + + = ≤ = = + = + = ≤ = = = = = ≤ = f f f f X P F f f f X P F f f X P F f X P X P F ¦ ¦ ¦ ¹ ¦ ¦ ¦ ´ ¦ ≥ < ≤ < ≤ < ≤ < = 3 1 3 2 8 / 7 2 1 8 / 4 1 0 8 / 1 0 0 ) ( x para x para x para x para x para x F ESPERANZA MATEMÁTICA De forma análoga a lo que se hizo en los capítulos sobre estadística descriptiva podemos definir medidas de centralización, dispersión, simetría y forma para variables aleatorias. Por ser las más interesantes y más usuales, nos vamos a centrar en dos medidas sobre variable aleatoria: la esperanza matemática, que desempeña un papel equivalente al de la media y la varianza. Así, el valor esperado puede entenderse como el valor promedio que tomaría una variable aleatoria sobre un número grande de repeticiones. Sea X una variable aleatoria con distribución de probabilidad f(x). La media o valor esperado de X y su varianza es: Para X es discreta ∑ = = x x f x X E ) ( . ) ( µ [ ] [ ] ∑ ∑ − = − = − = − = x x x f X X E también o x f X X E 2 2 2 2 2 2 2 2 ) ) ( ) ( ) ( ) ( µ µ σ µ µ σ Ejemplo 1. Se tiran dos monedas al aire 16 veces y X representa el número de caras que ocurre por lanzamiento, entonces los valores de x pueden ser 0, 1, 2. Supongamos: X 0 1 2 Número de veces 4 7 5 El promedio de caras por lanzamiento de las dos monedas será entonces: E[X] = 0(4/16) + 1(7/16) + 2(5/16) = 1.06 Así, el número medio de caras por lanzamiento sería 1.06, sin importar que el número total de lanzamientos sea de 16, 1000 o aun de 10.000. Ejemplo 2. Encuentre el número esperado de químicos que formen parte de un comité de 3 miembros que se seleccionan al azar de un grupo de 4 químicos y 3 biólogos. Solución. Sea que X represente el número de químicos en el comité. La distribución de probabilidad de X es: . 3 , 2 , 1 , 0 , 3 7 3 3 4 ) ( = | | ¹ | \ | | | ¹ | \ | − | | ¹ | \ | = x x x x f Si se realizan los cálculos correspondientes se tiene que f(0) = 1/35, f(1) = 12/35, f(2) = 18/35 y f(3) = 4/35. Por lo tanto, 7 . 1 7 / 12 ) 35 / 4 )( 3 ( ) 35 / 18 )( 2 ( ) 35 / 12 )( 1 ( ) 35 / 1 )( 0 ( ) ( = = + + + = = X E µ Entonces, si un comité de tres miembros se selecciona aleatoriamente, una y otra vez, de un grupo de 4 químicos y 3 biólogos, se tendrían, en promedio, 1.7 químicos. Ejercicio. En un juego de azar una persona podrá ganar $5 si cuando lance tres monedas ocurren tres caras o tres cruces, o perderá $3 si ocurren una o dos caras. ¿Cuánto espera ganar esta persona? PROPIEDADES DE LA ESPERANZA 1. E[k] = k El valor esperado de una constante, es la misma constante. 2. V[k] = 0 La varianza de una constante es cero. 3. E[kX] = kE[X] El valor esperado del producto de una constante por una Variable, es igual al producto de la constante por el valor esperado de la variable. 4. V[kX] = k2V[X] La varianza del producto de una constante por una variable es igual al producto del cuadrado de la constante por la varianza de la variable. 5. E[a ± bX] = a ± bE[X] El valor esperado de (a ± bx) es igual a mas o menos b por la esperanza de X 6. V[a ± bX] = b2V[X] La varianza de (a ± bx) es igual a b 2 por la varianza de X. Ejemplo 3. Supóngase que se jugará a la vez dos monedas y un dado no cargado. Sea X el número de caras obtenidas, sea Y el número de puntos que muestra el dado. Supóngase además que se recibe como paga el doble del número de caras obtenidas y tres veces el número de puntos del dado. ¿Cuál es el pago esperado por cada jugada? Solución. El pago es una función de X y Y, esto es: Pago = 2X + 3Y, por la propiedad 5, se tiene E[Pago] = 2 E[X] + 3 E[Y] X = 0, 1, 2 con probabilidad 1/4, 2/4, 1/4 Y = 1, 2, 3, 4, 5 ,6 con probabilidad 1/6 cada uno E[Pago] = 2[0(1/4) + 1(2/4) + 2(1/4)]+ 3[1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)+6(1/6)] E[Pago] = 12.5 dólares. Ejercicio. Un contratista esta interesado en conocer el coste total de un proyecto sobre el que intenta hacer una oferta. Estima que los materiales costarán 25.000 dólares y su trabajo 900 dólares diarios. Si se necesitan X días para terminar el proyecto, el coste total del trabajo será 900X dólares y el coste total del proyecto en dólares será C = 25.000 + 900X El contratista construye unas probabilidades subjetivas sobre la duración del proyecto así: Duración X (días) 10 11 12 13 14 f(X) 0.1 0.3 0.3 0.2 0.1 Encontrar la media y la varianza del coste total. DISTRIBUCIONES DE PROBABILIDAD DISCRETA Distribución de Bernoulli. Consiste en realizar un experimento aleatorio una sola vez y observar si un cierto suceso ocurre o no, siendo P la probabilidad de que ocurra (“éxito”) y q =1-P la probabilidad de que no ocurra (“fracaso”) Este experimento puede ser descrito mediante una variable aleatoria discreta X que toma los valores X = 0 si el suceso no ocurre, y X =1 en caso contrario. La media y la varianza de una variable aleatoria Bernoulli es: [ ] [ ] ∑ ∑ − = − + − − = − = − = = + − = = = x x x x x x P P P P P P x P x x E P P P x P X X E ) 1 ( ) ( ) 1 ( ) 1 ( ) 0 ( ) ( ) ( ) ( ) )( 1 ( ) 1 )( 0 ( ) ( . 2 2 2 2 2 µ µ σ µ Ejemplo. Un agente de seguros piensa que en un contacto concreto, la probabilidad de conseguir una venta es 0,4. Si definimos la variable aleatoria X que toma el valor 1 si consigue la venta y 0 si no, entonces, X tiene distribución Bernoulli con probabilidad de éxito P igual a 0,4, es decir, la función de probabilidad de X es: P x (o) = 0,6 P x (1) =0,4 La media de esta distribución es P = 0,4, y la varianza σ 2 x =P(1-P) = (0.4)(0.6) = 0.24. Una generalización importante de la distribución Bernoulli consiste en considerar el caso en el que un experimento aleatorio, con dos resultados posibles, se repite varias veces. Supongamos que un experimento aleatorio tiene sólo dos resultados posibles mutuamente excluyentes y conjuntamente exhaustivos “éxito” y “fracaso” y que P es la probabilidad de obtener éxito en cada repetición. Si se realizan n repeticiones independientes, la distribución del número de éxitos, X, resultante se denomina distribución Binomial. Su función de probabilidad es: )! ( ! ! 2 , 1 , 0 ) 1 ( ) ( x n x n x n donde n x para p p x n x P x n x x − = | | ¹ | \ | = − | | ¹ | \ | = − L Supongamos ahora que el agente de seguros del ejemplo anterior tiene cinco contactos, y piensa que para cada uno la probabilidad de conseguir una venta es 0.4. La distribución del número de ventas X es entonces, una binomial, con n =5 y P =0.4, es decir, 5 2 , 1 , 0 ) 6 . 0 ( ) 4 . 0 ( 5 ) ( 5 L = | | ¹ | \ | = − x para x x P x x x Las probabilidades para el número de éxitos (ventas logradas) son: P x (0) = 0.078 P x (1) = 0.259 P x (2) = 0.346 P x (3) = 0.230 P x (4) = 0.077 P x (5) = 0.010 Función de probabilidad binomial (n=5, p=0.4) 0 0,1 0,2 0,3 0,4 1 2 3 4 5 6 X P ( x ) Media y varianza de la distribución Binomial [ ] ) 1 ( ) ( ) ( 2 2 p np x E np x E x x x − = − = = = µ σ µ Ejercicio. Se estima que el 55% de los estudiantes de primer curso de cierta universidad se graduará en cuatro años. a) Para una muestra aleatoria de cinco estudiantes de primer curso, ¿cuál es la probabilidad de que exactamente tres se gradúen en cuatro años. b) Para una muestra aleatoria de cinco estudiantes de primer curso, ¿cuál es la probabilidad de que la mayoría se gradúe en cuatro años. C) Se eligen 80 estudiantes de primer curso aleatoriamente. Hallar la media y la desviación típica de la proporción de ellos que se graduará en cuatro años. La distribución hipergeométrica En los casos en los que el número de elementos de la muestra no es una proporción muy pequeña del número total de artículos en la población, la distribución Binomial es inapropiada. Esto debido a que en estas situaciones no hay independencia entre el resultado de un elemento particular de la muestra y los restantes, mientras que si el número total de elementos en la población es muy grande en relación al tamaño de la muestra, la influencia de la dependencia es tan pequeña que puede ser ignorada y en este caso podrá usarse la distribución Binomial. No obstante, cuando se presenta la primera situación mencionada, es posible utilizar la siguiente distribución Supongamos que se elige una muestra aleatoria de tamaño n de un conjunto de N elementos, S de los cuales son éxitos. La distribución del número de éxitos, X , en la muestra se denomina distribución hipergeométrica. Su función de probabilidad es: )! ( ! ! )! ( )! ( )! ( )! ( ! ! ) ( n N n N x n S N x n S N x S x S n N x n S N x S C C C x P n N x n S N x S x − + − − − − − = | | ¹ | \ | | | ¹ | \ | − − | | ¹ | \ | = = − − Donde x puede tomar valores enteros entre el máximo de 0 y [n-(N-S)] y el mínimo de n y S. La media y la varianza de esta distribución son [ ] ) 1 ( 1 ) ( ) ( 2 2 p np N n N x E y np X E x x x − | ¹ | \ | − − = − = = = µ σ µ Donde p = S/N es la proporción de éxitos en la población. Ejemplo. Una compañía recibe un pedido de 20 artículos. Dado que la inspección de cada artículo es cara, se sigue la política de analizar una muestra aleatoria de seis artículos de cada envío, aceptando la remesa si no hay más de un artículo defectuoso en la muestra. ¿Cuál es la probabilidad de que sea aceptado un pedido con cinco artículos defectuosos? Solución. Si identificamos “defectuoso” con “éxito” en este ejemplo, el pedido contiene N = 20 elementos, S = 5 de los cuales son éxitos. Se selecciona una muestra de n = 6 elementos. El número de éxitos X en la muestra tiene una distribución hipergeométrica con función de probabilidad ! 14 ! 6 ! 20 )! 9 ( )! 6 ( ! 15 )! 5 ( ! ! 5 6 20 6 15 5 ) ( 6 20 6 15 5 x x x x x x C C C x P x x x + − − = | | ¹ | \ | | | ¹ | \ | − | | ¹ | \ | = = − Se acepta el envío si la muestra contiene cero o un éxito (defectuoso), luego la probabilidad de aceptarlo es P(aceptar el envío) = P x (0) + P x (1) remplazando en la función se tiene P(aceptar el envío) = P x (0) + P x (1) = 0,129 + 0,387 =0,516 Ejercicio. Un embarque de 8 microcomputadoras similares que se envían a un distribuidor contiene 3 aparatos defectuosos. Si una escuela realiza una compra aleatoria de 2 de estas computadoras, encuentre la distribución de probabilidad para el número de microcomputadoras defectuosas. Además calcular la probabilidad de que en la compra se encuentre una computadora defectuosa. La distribución de Poisson Consideremos las siguientes variables aleatorias: El número de accidentes de tráfico mortales en una ciudad durante una semana concreta El número de llamadas telefónicas que se reciben en un día en la central de una empresa durante las 11:15 y 12:00 PM El número de veces que falla un pieza de un equipo durante un periodo de tres meses Cada una de estas cinco variables aleatorias se caracteriza por ser el número de ocurrencias de cierto suceso durante un periodo de tiempo. La experiencia indica que para una amplia gama de problemas de este tipo, la distribución de probabilidad Poisson representa adecuadamente la estructura de probabilidad de la variable aleatoria. Se dice que la variable aleatoria X sigue una distribución de Poisson si tiene una función de probabilidad K 2 , 1 , 0 ! ) ( = = − x para x e x P x x λ λ Donde “Lamda” es cualquier número > 0 La media y varianza de esta distribución esta dada por: [ ] λ µ σ λ µ = − = = = 2 2 ) ( ) ( x x x x E X E Ejemplo. Un estudio indica que el número de huelgas anuales en una fábrica con 2000 empleados, se puede representar por una distribución Poisson con media de 0.4. La función de probabilidad del número de huelgas anuales X es, entonces, K 2 , 1 , 0 ! ) 4 . 0 ( ) ( 4 . 0 = = − x para x e x P x x A partir de lo anterior, podemos calcular ahora probabilidades para números concretos de huelgas anuales, por ejemplo, la probabilidad de que no haya huelgas o la probabilidad de que haya más de una huelga en un año. Ejercicio. Una fábrica tiene dos cadenas de montaje, cada una de las cuales se para un promedio de 2,4 veces semanales, de acuerdo a una distribución Poisson. Asumir que el comportamiento de una cadena es independiente del de la otra. ¿Cuál es la probabilidad de que una cadena se para al menos una vez durante una semana concreta? VARIABLES ALEATORIAS CONTINUAS Una variable aleatoria continua tiene una probabilidad cero de asumir cualquiera de sus valores exactamente. Consecuentemente su distribución de probabilidad no puede darse en forma tabular. Para este caso, por ejemplo, no se habla de seleccionar a una persona que tenga una altura exactamente de 168 centímetros, sino mas bien de la probabilidad de seleccionar una persona que al menos mida 168 centímetros pero no mas de 170. Ahora se esta tratando de un intervalo más que de un valor puntual de la variable aleatoria. Nótese que cuando X es continua, ) ( ) ( ) ( ) ( b X a P b X P b X a P b X a P < < = = + < < = ≤ < Esto es, no importa que se incluya o no un punto final del intervalo. Si embargo, esto no es verdad cuando X es discreta. A pesar de que la distribución de probabilidad de una variable aleatoria continua no puede presentarse en forma tabular, si puede tener una fórmula; ésta, necesariamente debe ser una función de los valores numéricos de la variable continua X y como tal, será expresada por la notación funcional f(x). A esta función se le conoce como función de densidad de probabilidad, o simplemente función de densidad de X. Una función de densidad de probabilidad se construye de tal manera que el área comprendida bajo su curva es igual a 1, cuando se calcula para el rango de X para el cuál se define f(x). En la siguiente figura, la probabilidad de que X asuma un valor entre a y b es igual al área sombreada bajo la función de densidad, entre las ordenadas x=a y x=b, y utilizando el cálculo integral, esa área esta dada por: dx x f b X a P b a ∫ = < < ) ( ) ( f(x) a b P(a<x<b) La función f(x) es una función de densidad de probabilidad para la variable aleatoria continua X, definida en el conjunto de los números reales, si 1. R x toda para x f ∈ ≥ 0 ) ( 2. 1 ) ( = ∫ ∞ ∞ − dx x f 3. ∫ = < < b a dx x f b X a P ) ( ) ( Ejercicio. Suponga que el error en la temperatura de reacción, en ºC, para un experimento controlado de laboratorio es una variable aleatoria continua X, que tiene la función de densidad de probabilidad: ¦ ¹ ¦ ´ ¦ < < − = . , 0 2 1 , 3 ) ( 2 caso otro cualquier en X x x f a) verifique la condición 2 de la definición de función de densidad de probabilidad b) Encuentre ) 1 0 ( ≤ < X P La distribución acumulada F(x) de una variable aleatoria continúa X con una función de densidad f(x) es: ∞ < < ∞ − = ≤ = ∫ ∞ ∞ − x para dt t f x X P x F ) ( ) ( ) ( Ejercicio Para la función de densidad del ejemplo de la temperatura, encuentre F(x) y utilícela para evaluar P(0<X<1) Esperanza de variables aleatorias continuas Recordemos que cuando se trabajo con variables aleatorias discretas, mencionamos el concepto de esperanza para una variable aleatoria X y la esperanza de una función de dicha variable aleatoria. Estos conceptos pueden extenderse a variables aleatorias continuas. Así: El valor esperado de X será ∫ ∞ ∞ − = = dx x f x X E ) ( . ) ( µ y el valor esperado de la función g(x) es: [ ] ∫ ∞ ∞ − = dx x f x g X g E ) ( ). ( ) ( Nótese, que en este caso la integral juega el mismo papel que el operador sumatoria en el caso discreto. DISTRIBUCIONES DE PROBABILIDAD CONTINUA Distribución normal Función de densidad de una distribución normal. Si la variable aleatoria X tiene densidad ∞ < < ∞ − = − − x para e X f x x 2 2 2 / ) ( 2 2 1 ) ( σ µ πσ Donde µ y σ 2 son números tales que ∞ < < ∞ < < ∞ − 2 0 σ µ y donde e y π son las constantes, entonces se dice que X sigue una distribución normal. Propiedades de la distribución normal. Supongamos que la variable aleatoria X sigue una distribución normal con parámetros µ y σ 2 . Se cumplen las siguientes propiedades, (i) La media de la variable aleatoria es µ, es decir, [ ] µ = X E (ii) La varianza de la variable aleatoria es σ 2 , es decir, [ ] [ ] 2 2 ) ( σ µ = − = X E X V (iii) La forma de la función de densidad es una curva simétrica con forma de campana centrada en la media µ. La distribución normal estándar. Sea Z una variable aleatoria normal con media 0 y varianza 1; es decir, Z~N(0,1) entonces, se dice que Z sigue una distribución normal estándar σ µ − = X Z Ejercicios. 1. Hallar las áreas bajo la curva normal de Z a) P(Z<1,20) b) P(Z>1,33) c) P(Z< -1,70) d) P(Z> -1,0) e) P(1,20 < Z < 1,33) f) P(-1,70 < Z < 1,20) 2. a) Hallar el número Z tal que Z es menor que Z con probabilidad 0,7 b) Hallar el número Z tal que Z es mayor que con probabilidad 0,6. 3. La demanda anticipada de un producto en el próximo mes puede representarse mediante una variable aleatoria normal con media 1200 unidades y desviación típica 100 unidades. a) ¿Cuál es la probabilidad de que las ventas superen las mil unidades? b) ¿Cuál es la probabilidad de que las ventas estén entre 1000 y 1300 unidades? c) ¿Cuántas unidades deben venderse como mínimo para estar en el 10% más alto?. ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES. I. DISTRIBUCIONES MUESTRALES. Es necesario destacar la importancia de un entendimiento claro de estas distribuciones, ya que este concepto es la clave para comprender la inferencia estadística. Definición: La distribución de todos los valores posibles que puede asumir una estadística, calculados a partir de muestras del mismo tamaño, extraídas aleatoriamente de la misma población, se llama distribución muestral de esa estadística. Las distribuciones muestrales pueden construirse empíricamente a partir de poblaciones finitas y discretas. Para ello, se procede como sigue: 1. De una población finita de tamaño N, se extraen de manera aleatoria todas las muestras posibles de tamaño n. 2. Se calcula la estadística de interés para cada muestra. 3. Listar en una columna los distintos valores observados de la estadística, y en otra columna las frecuencias correspondientes de cada valor observado. Normalmente, para una distribución muestral, se tiene interés en conocer tres cosas: media, variancia y forma funcional (apariencia gráfica). DISTRIBUCIONES DE LA MEDIA DE LA MUESTRA Sea una población de tamaño N =5, la cual se compone de las edades de cinco niños que son pacientes externos de una clínica de salud mental. Las edades son las siguientes: x 1 =6, x 2 =8, x 3 =10, x 4 =12, x 5 =14. La media µ para esta población es igual a Σx i /N = 10 y la variancia es: σ 2 = Σ(x i - µ) 2 / Ν = 40/5 = 8 Se extraen todas las muestras posibles de tamaño n = 2 a partir de esta población utilizando un muestreo con reemplazo. Cuando el muestreo se efectúa con reemplazos, hay 25 muestras posibles. En general, cuando el muestreo se lleva a cabo con reemplazos, el número de muestras posibles es igual a N n . Para elaborar una distribución muestral para x se listan los diferentes valores de x en una columna y sus frecuencias de ocurrencia en otra, Tabla 1. Distribución muestral de x calculada a partir de las 25 posibles muestras aleatorias de tamaño 2. x Frecuencia Frecuencia relativa 6 1 1/25 7 2 2/25 8 3 3/25 9 4 4/25 10 5 5/25 11 4 4/25 12 3 3/25 13 2 2/25 14 1 1/25 Total 25 25/25 En un párrafo anterior se estableció que para una distribución muestral se tiene interés en la forma funcional de la distribución, su media y su variancia. En la figura 1, se muestra el histograma de x junto con la distribución de la población. Es notable la diferencia entre la apariencia del histograma de la población y la del histograma de la distribución muestral de x. Mientras que el primero esta distribuido uniformemente, el segundo crece gradualmente hasta un punto máximo y después decrece formando una figura simétrica. Distribución de los datos de la población 0 1 2 6 8 10 12 14 Edades Distribución muestral de medias 0 1 2 3 4 5 6 6 7 8 9 10 11 12 13 14 Medias muestrales Figura 1. Distribución de los datos de la población y de las medias muestrales El siguiente paso es obtener la media, representada por µ x de la distribución muestral. Para hacerlo, se suman las 25 medias de la muestra y se dividen entre 25. Así : µ x = Σx i / N n = (6+7+7+8+ ··· +14)/25 = 250/25 = 10 Es interesante notar que la media de la distribución muestral para x tiene los mismos valores que la media de la población original. Finalmente, el cálculo de la variancia de x, representada por σ 2 x , se calcula como sigue : σ x 2 = Σ(x i - µ) 2 / N n σ x 2 = (6-10) 2 + (7-10) 2 + (7-10) 2 + ··· + (14-10) 2 / 25 σ x 2 = 100/25 = 4 También se puede advertir que la variancia de la distribución muestral no es igual a la variancia de la población. Sin embargo, es interesante observar que la variancia de la distribución muestal es igual a la variancia de la población dividida entre el tamaño de la muestra dividida entre el tamaño dela muestra utilizada para obtener la distribución muestral. Esto es : σ x 2 =σ 2 /n = 8/2 = 4 Los resultados anteriores, son ejemplos de las características de las distribuciones muestrales en general cuando el muestreo es con reemplazo o cuando se efectúa a partir de una población infinita. • Características de la distribución de la media de la muestra cuando el muestreo se realiza a partir de una población que sigue una distribución normal. 1. la distribución de X será normal. 2. La media, µ de la distribución de X será igual a la media de la población de la cual se extrajo. 3. La variancia, S 2 x de la distribución de X será igual a la variancia de la población, dividida entre el tamaño de la muestra. • Cuando el muestreo se efectúa a partir de una población que no sigue una distribución normal, se utiliza el teorema del límite central. La importancia de este teorema en la inferencia estadística se resume en el siguiente párrafo : Dada una población de cualquier forma funcional no normal con una media µ, y variancia finita σ 2 , la distribución muestral de x, calculada a partir de muestras de tamaño n de dicha población, será casi normal con media µ y variancia σ 2 /n, cuando la muestra es muy grande. Todo lo anterior se ha dado bajo la premisa de que el muestreo es con reemplazos o que la muestra fue extraída de una población infinita. Ejercicio. Aplicar un muestreo sin reemplazo con muestras de tamaño 2, al ejercicio de los cinco niños que son pacientes externos de una clínica de salud mental. NOTA: Cuando el muestro es sin reemplazos a partir de una población finita, la distribución muestral de x tendrá una media µ y variancia σ 2 /n * (N-n) / (N-1) El factor (N-n)/(N-1) se llama corrección por población finita y se puede omitir cuando el tamaño de la muestra es pequeño en comparación con el tamaño de la población. Es decir la corrección para población finita generalmente se ignora cuando n / N <= 0.05. Las características de la distribución muestral de x se resume en las siguientes condiciones: 1. Cuando el muestreo se realiza a partir de una población distribuida normalmente con una variancia de población conocida : a) µ x = µ b) σ x = σ//n c) La distribución muestral de x es normal. 2. El muestreo se efectúa a partir de una población que sigue una distribución no normal, con una variancia de una población conocida : a) µ x = µ b) σ x = σ//n* / (N-n)/(N-1), si n/N es <= 0.05 σ x = σ//n, cuando la población es infinita o el muestreo se hace con reposición. c) La distribución muestral de x es aproximadamente normal. APLICACIONES Ejercicio 1. Supóngase que en una población grande de seres humanos, la dimensión del radio craneal sigue una distribución aproximadamente normal, con una media de 185.6 mm y una desviación estándar de 12.7 mm. ¿Cual es la probabilidad de que una muestra aleatoria de tamaño 10 de esta población tenga una media mayor que 190? Ejercicio 2. El consumo de combustible, en kilómetros por litro, de todos los coches de cierto modelo tiene media diez y desviación típica dos. Puede asumirse que la distribución poblacional es normal. Se toma una muestra aleatoria de éstos coches. a) Hallar la probabilidad de que la media muestral del consumo de combustible sea menor que diez kilómetros por litro si i) se ha tomado una muestra de dos observaciones ii) se ha tomado una muestra de cuatro observaciones iii) se ha tomado una muestra de dieciséis observaciones b) Explicar por qué las tres respuestas de (a) difieren de este modo. Hacer un gráfico para ilustrar el razonamiento. Ejercicio 3. Suponer que los salarios por hora de cierto tipo de empleados de un hospital tienen distribución aproximadamente normal, con una media y desviación estándar de $4.50 y $0.50, respectivamente. Si se obtiene una muestra aleatoria de tamaño 16 a partir de esa población, calcular la probabilidad de que la media del salario por hora para dicha muestra sea: a) Mayor que $4.25. b) Entre $4.25 y $4.75. c) Menor que $4.20. Considérese la distribución muestral de la media de la muestra para n =16. d) Suponer para este problema que NCn = 100.000. ¿Cuantas medias muestrales son mayores que 4.30? Ejercicio 4. Una compañía produce cereales para el desayuno. La media del peso que contienen las cajas de estos cereales es de 200 gramos y su desviación típica de seis gramos. La distribución de los pesos en la población es normal. Se eligen cuatro cajas, que pueden ser consideradas como una muestra aleatoria del total de la producción. a) ¿Cuál es el error estándar de la media muestral del peso de estas cuatro cajas? b) ¿Cuál es la probabilidad de que, como media, el peso de estas cuatro cajas sea menor que 197 gramos? c) ¿Cuál es la probabilidad de que, como media, el peso de estas cuatro cajas esté entre 195 y 205 gramos? d) Se eligen al azar dos cajas, ¿Cuál es la probabilidad de que, como media, el contenido de estas dos cajas pese entre 195 y 205 gramos? DISTRIBUCIÓN DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS MUESTRAS Con frecuencia, el interés en una investigación se enfoca hacia dos poblaciones. Específicamente, puede ser que un investigador desee saber algo acerca de la diferencia entre las medias de dos poblaciones. Por ejemplo, un equipo de investigación médica, requerirá saber si el nivel medio de colesterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros. Si los investigadores concluyen que las medias de la población son diferentes, es posible que deseen saber qué tanto difieren. El conocimiento acerca de la distribución muestral de la diferencia entre dos medias es muy útil en investigaciones de este tipo. Dadas las poblaciones con una distribución normal, con medias µ 1 y µ 2 , respectivamente, y variancias σ 1 y σ 2 , respectivamente, la distribución muestral de la diferencia de x 1 – x 2 , entre las medias de muestras independientes de tamaño n 1 y n 2 extraídas de esas poblaciones siguen una distribución muestral con media y desviación estándar: 2 1 2 1 µ µ µ − = −x x y 2 2 2 1 2 1 2 1 n n x x σ σ σ + = − para transformar en una distribución normal estándar se utiliza la siguiente formula: 2 2 2 1 2 1 2 1 2 1 ) ( ) ( n n x x Z σ σ µ µ + − − − = Ejemplo. Supóngase que se tienen dos poblaciones de individuos. Una de ellas (la población 1) ha experimentado alguna condición que se considera esta asociada al retardo mental, y la otra (la población 2) no ha experimentado tal condición. Se cree que la distribución de puntajes de inteligencia de cada una de las poblaciones presenta una distribución aproximadamente normal con una desviación estándar de 20. Supóngase también que se toma una muestra de 15 individuos de cada población y se calcula en cada muestra la media de los puntajes de inteligencia, con los siguientes resultados: x 1 =92 y x 2 = 105. Si no hay diferencia entre las dos poblaciones con respecto a la media real de los puntajes de inteligencia, ¿Cuál es la probabilidad de observar una diferencia de esta magnitud (x 1 – x 2 ) o mayor entre las medias de las muestras? Solución. Es importante notar que se busca la probabilidad asociada a la diferencia entre las medias de dos muestras en lugar de la de una sola media. Para el presente ejemplo habría una distribución normal con una media igual a 0 (si no hay diferencia entre las medias reales de la población) y una variancia de [(20) 2 /15]+[(20) 2 ]= 53,33. La gráfica de la distribución muestral de x 1 -x 2 cuando no existe diferencia entre las medias de las poblaciones es la siguiente: 33 , 53 2 2 2 1 2 1 2 2 1 = + = − n n x x σ σ σ 0 2 1 2 1 = − = − µ µ µ x x 2 1 x x − El área bajo la curva de 2 1 x x − que corresponde a la probabilidad buscada es el área a la izquierda de 13 105 92 2 1 − = − = − x x . El valor de Z corresponde a –13, suponiendo que no hay diferencia entre las dos poblaciones, es 78 . 1 3 . 7 13 3 . 53 13 15 20 15 20 0 13 2 2 − = − = − = + − − = Z Al consultar la tabla de distribución normal, se encuentra que el área bajo la curva normal unitaria a la izquierda de –1.78 es igual a 0.0375. Para responder a la pregunta original, se puede decir que, si no hay diferencia entre las medias poblacionales, la probabilidad de obtener una diferencia mayor o igual que 13 entre las medias de las muestras es de 0.0375. El procedimiento anterior es válido incluso cuando el tamaño de las muestras n 1 y n 2 son diferentes y cuando las variancias σ 1 2 y σ 1 2 tienen valores diferentes. MUESTREO DE POBLACIONES NO NORMALES. Cuando la forma funcional de una distribución poblacional se desconoce o es no normal; una solución consiste en tomar muestras grandes, dado que, cuando el tamaño de las muestras es grande, el teorema del límite central es aplicable y la diferencia entre las dos medias de las muestras sigue una distribución aproximadamente normal. Ejemplo. Supóngase que se ha establecido que para cierto tipo de pacientes el tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviación estándar de 15 minutos y para un segundo tipo de paciente, el promedio de visita domiciliaria es de 30 minutos con una desviación estándar de 20 minutos. Si la enfermera visita al azar a 35 clientes del primer tipo y 40 del segundo tipo, ¿cuál es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos o más? Solución. No se menciona nada respecto a la forma funcional de las poblaciones, por lo que se supone que esta característica se desconoce, o que las poblaciones no presentan una distribución normal. Puesto que las muestras son grandes (mayores que 30) en ambos casos, se hace uso de los resultados del teorema del límite central. La media y la variancia son las siguientes: 15 30 45 2 1 2 1 = − = − = − µ µ µ x x 4286 . 16 40 ) 20 ( 35 ) 15 ( 2 2 2 2 2 1 2 1 2 2 1 = + = + = − n n x x σ σ σ El área bajo la curva de 2 1 x x − que se busca se encuentra a la derecha de 20. El valor correspondiente de Z en la distribución normal unitaria es: 23 . 1 05 . 4 5 4286 . 16 15 20 ) ( ) ( 2 2 2 1 2 1 2 1 2 1 = = − = + − − − = n n x x Z σ σ µ µ El área a la derecha de Z=1.23 es 1 – 0.8907=0.1093. Por lo tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieren entre las dos medias con 20 o más minutos es de 0.1093. La curva de 2 1 x x − es como sigue: 15 2 1 = −x x µ 20 0.1093 EJERCICIOS. 1. Un investigador se siente inclinado a creer que los niveles de vitamina A en el hígado de dos poblaciones de seres humanos tiene, cada una, distribución normal. Se supone que las variancias de las dos poblaciones son las siguientes: Población 1: 19.600 Población 2: 8100 ¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 15 de la primera población y otra de tamaño 10 de la segunda población proporcionen un valor de 2 1 x x − mayor o igual a 50, si no hay diferencia entre las dos medias de la población? 2. Dadas dos poblaciones con distribución normal y con medias iguales y variancias de σ 2 1 =100 y σ 2 2 =80, ¿cuál es la probabilidad de que dos muestras de tamaño n 1 =25 y n 2 =16, respectivamente, proporcionen un valor de 2 1 x x − mayor o igual que 8?. 3. Dadas dos poblaciones con distribución normal y con medias iguales y variancias de σ 2 1 =240 y σ 2 2 =350, ¿cuál es la probabilidad de que dos muestras de tamaño n 1 =40 y n 2 =35, respectivamente, proporcionen un valor de 2 1 x x − mayor o igual que 12?. ESTADÍSTICA INFERENCIAL Antes se hizo mención acerca de la inferencia estadística, la cual toma como base las relaciones existentes entre las muestras y la población para “inferir” acerca de ésta a partir de las muestras, es decir, hace generalizaciones a partir de las muestras. La Estadística Inferencial pretende resolver dos problemas fundamentales: la estimación de parámetros poblacionales a partir de estadígrafos muestrales conocidos, y la toma de decisiones estadísticas acerca de hipótesis establecidas sobre la población, también con base al conocimiento de sus muestras. ESTIMACIÓN Puede ser a través de un número simple, generalmente el estadígrafo correspondiente llamado estimación puntual o por medio de dos valores numéricos que definen un intervalo, el cual contiene el parámetro estimado con cierto grado de confiabilidad llamado intervalo de confianza. CARACTERÍSTICAS DE UN BUEN ESTIMADOR PUNTUAL Antes de emplear algún estadístico de muestra como estimador puntual, se debe comprobar si tiene ciertas propiedades asociadas con los buenos estimadores puntuales. En vista que se pueden obtener diversos estadísticos de muestra como estimadores puntuales de distintos parámetros poblacionales, usaremos la siguiente notación: θ = el parámetro poblacional de interés θ^ = el estadístico de muestra o estimador puntual de θ En general, θ representa cualquier parámetro de población, como la media poblacional, desviación estándar poblacional, proporción poblacional, etc.; θ^ el estadístico de muestra correspondiente, como la media de la muestra, la desviación estándar de muestra y la proporción muestral. Son cuatro las características que debe tener un buen estimador puntual. a) Insesgabilidad o imparcialidad: Un estimador puntual es insesgado si, en promedio, tiende a tomar valores que están por encima del parámetro de la población que se esta estimando con la misma frecuencia y la misma extensión con la que tiende a asumir valores por debajo del parámetro de población que se esta estimando. Por consiguiente, el valor esperado o media, de todos los valores posibles de un estadístico de muestra insesgado es igual al parámetro de población que se estima. Distribución muestral de θ θθ θ θ θ E(θ) En la ilustración del estimador insesgado, la media de la distribución muestral es igual al valor del parámetro poblacional. En el caso de un estimador sesgado, la media de la distribución muestral es menor que, o mayor que el parámetro poblacional. En la figura (b), el estadístico de muestra tiene una gran probabilidad de sobrestimar el valor del parámetro poblacional. b) Consistencia o coherencia: Estimador que produce valores que se acercan mas al parámetro de la población conforme aumenta el tamaño de muestra. Generalmente, un estimador no es idéntico al parámetro que se estima, debido a error de muestreo, que es la diferencia lθ - θl ; pero, si aumentamos el tamaño de la muestra suficientemente, la probabilidad de que esta diferencia lθ - θl sea mayor que un número fijo ε > θ tenderá a cero. Esto es : P[Iθ - θl > ε]--- 0 Claramente, x es un estimador consistente de µ, así como S 2 y S 2 n lo son de σ 2 . c) Eficiencia : Se dice que un estimador θ 1 es mas eficiente que otro estimador θ 2 de θ si la variancia del primero es menor que la del segundo ; esto es : σ 2 n < σ 2 n , entonces θ 1 es mas eficiente que θ 2 . d) Suficiencia : Intuitivamente, decimos que un estimador es suficiente, si transmite tanta información de la muestra como es posible acerca del parámetro, de modo que no será proporcionada mayor información por cualquier otro estimador calculado de la misma muestra; y si se obtiene el valor de un estadígrafo suficiente, los valores de muestra mismos no proporcionan mas información sobre el parámetro. Por ejemplo, tanto la Media ( X ) como la Mediana (Me), como el centro de amplitud (C.A.) pueden ser usados como estimadores de µ; sin embargo, solo la media X toma en cuenta cada valor o toda la información de la muestra, mientras que el centro de amplitud solo toma en cuenta el primer y último valor, y la mediana es una medida de tendencia central de posición. Así pues, la media X es un estimador suficiente para µ. θ El parámetro θ está ubicado en la media de la distribución muestral; E(θ) = θ (a) Estimador insesgado θ El parámetro θ no está ubicado en la media de la distribución muestral; E(θ) ≠ θ (b) Estimador sesgado Sesgo ESTIMACIONES PUNTUALES Y DE INTERVALO DE CONFIANZA Estimación puntual. Es un sólo número que se utiliza para estimar un parámetro de población desconocido. Estimaciones de intervalo. Describe un intervalo de valores dentro del cual es posible que este un parámetro de población. Ejemplo. Si decimos que una distancia se ha medido como 5.28 metros, estamos dando una estimación de punto. Por otra parte, si decimos que la distancia es 5.28+0.03 m (o sea, que esta entre 5.25 y 5.31 m), estamos dando una estimación de intervalo. El margen de error (o la precisión) de una estimación nos informa de su fiabilidad. Nivel de confiabilidad. La probabilidad que asociamos con una estimación de intervalo se conoce como el nivel de confiabilidad. Esta probabilidad indica qué tanta confianza tenemos de que la estimación de intervalo incluya al parámetro de la población. Intervalo de confianza. Es el alcance de la estimación que estamos haciendo. Por ejemplo, si informamos que tenemos 90% de confianza de que la media de la población del ingreso de las personas que viven en una cierta comunidad estará entre $8.000 y $24.000, entonces el intervalo ($8.000 - $24.000) será nuestro intervalo. RELACIÓN ENTRE EL NIVEL DE CONFIABILIDAD E INTERVALO DE CONFIANZA. Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99%, en todos los problemas sobre estimaciones. Después de todo, parece ser que un alto nivel de confianza significa un alto grado de precisión en lo que a la estimación concierne. En la práctica, sin embargo, altos niveles de confianza producen intervalos de confianza grandes, y estos no son precisos. CALCULO DE ESTIMACIONES DE INTERVALO DE LA MEDIA A PARTIR DE MUESTRAS GRANDES: *Cuando se conoce la desviación poblacional: x z x σ ± , Donde: n x σ σ = Error estándar de la media para una población infinita. *Cuando no se conoce la desviación estándar de la población: x z x σ ˆ ± , Donde: n x σ σ ˆ ˆ = y 1 ) ( ˆ 2 − − ∑ = = n x x s i σ CALCULO DE ESTIMACIONES DE INTERVALO DE LA PROPORCIÓN A PARTIR DE MUESTRAS GRANDES: *Cuando se conoce la proporción poblacional: p z P σ ± , Donde: n q p p * = σ *Cuando no se conoce la proporción poblacional: p z P σ ˆ ± , Donde: n q p p * ˆ = σ ESTIMACIÓN DE INTERVALOS MEDIANTE LA DISTRIBUCIÓN t. El uso de la distribución t para hacer estimaciones se requiere siempre que el tamaño de la muestra sea menor o igual a 30 y la desviación estándar de la población no se conoce. Además, al utilizar la distribución t, suponemos que la población es normal o aproximadamente normal. CARACTERÍSTICAS DE LA DISTRIBUCIÓN t Sin derivar la distribución t de manera matemática, podemos obtener un entendimiento intuitivo de la relación de la relación que existe entre la distribución t y la distribución normal. Ambas son simétricas. En general, la distribución t es más plana que la distribución normal y hay una distribución t diferente para cada tamaño posible de muestra. Incluso con esto, conforme el tamaño de muestra se hace mas grande, la forma de la distribución t pierde su horizontalidad y se vuelve aproximadamente igual a la distribución normal. GRADOS DE LIBERTAD Anteriormente, afirmamos que existe una distribución t diferente para cada tamaño de muestra. En un lenguaje estadístico apropiado, diríamos: Existe una distribución t distinta para cada uno de los posibles grados de libertad. ¿Que son los grados de libertad? Podemos definirlos como el número de valores que podemos escoger libremente. Suponga que estamos tratando con dos valores de muestra, a y b, y sabemos que tienen una media de 18. Simbólicamente, la situación es: Error estándar estimado de la proporción. (a + b)/2 = 18 ¿Cómo podemos encontrar los valores que a y b pueden tomar en la situación? La respuesta es que a y b pueden ser cualesquiera dos valores cuya suma sea 36, ya que 36 entre 2 es 18. Suponga que sabemos que a tiene un valor de 10. Ahora b ya no es libre de tomar cualquier valor, sino que debe tomar el valor de 26. Este ejemplo nos muestra que cuando existen dos elementos de una muestra y solo conocemos la media de la muestra de esos dos elementos, entonces somos libres de especificar solamente uno de tales elementos, pues el otro estará determinado por el hecho de que los dos elementos suman el doble de la media de la muestra. En un lenguaje estadístico decimos: tenemos un grado de libertad. RESUMEN DE LAS FORMULAS PARA LÍMITES DE CONFIANZA EN LA ESTIMACIÓN DE LA MEDIA Y LA PROPORCIÓN. Cuando la población es finita (n/N > 0.05) Cuando la población es infinita (n/N < 0.05) *Estimación de la media de la población (µ): Cuando la desviación estándar de la población se conoce. 1 * − − ± N n N n z x σ n z x σ ± *Cuando la desviación estándar de la población no se conoce (σ = s). Cuando n>30 1 * ˆ − − ± N n N n z x σ n z x σ ˆ ± *Cuando n<=30 y la población es normal o aproximadamente normal y no se conoce la desviación estándar de la población. Este caso esta mas allá del objetivo del curso; consulte a un especialista en estadística. n t x n σ α ˆ ) ; 1 ( − ± *Estimación de proporción de la población (P): Cuando n>30. n q p p * ˆ = σ Este caso esta mas allá del objetivo del curso; consulte a un especialista en estadística. p z p σ ˆ ± INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIÓN NORMAL Supongamos que tenemos una muestra de n observaciones procedentes de una población normal con varianza σ 2 y representemos por S 2 la varianza muestral. Es posible demostrar que la relación existente entre la varianza muestral y la varianza de la población presenta una distribución Chi-Cuadrado con N-1 libertad Así, 2 2 2 1 ) 1 ( σ χ S n n − = − Sigue una distribución Chi-cuadrado con (n-1) grados de libertad. Para derivar la fórmula que nos permite el cálculo de intervalos de confianza para la varianza, se requiere ampliar la notación α χ χ α = > ) ( 2 , 2 v v P donde 2 v χ es la variable aleatoria que tiene una distribución Chi-cuadrado con v grados de libertad. 2 ,α χ v Será el valor para el cuál α χ χ α = > ) ( 2 , 2 v v P Para una probabilidad dada α necesitaremos el correspondiente valor 2 ,α χ v , el cuál se puede encontrar entre los valores de la función de distribución acumulada de la variable aleatoria Chi-Cuadrado recogidos en la tabla. Ejemplo. Supongamos que queremos hallar un número para el cuál la probabilidad de que una variable aleatoria Chi-cuadrado con 6 grados de libertad sea mayor que dicho número es igual a 0.05 05 . 0 ) ( 2 05 . 0 , 6 2 6 = > χ χ P de la tabla se tiene que 59 . 12 ) ( 2 05 . 0 , 6 = χ P 2 ,α χ v 1- α α f( 2 v χ ) 2 v χ Utilizando la notación que se acaba de definir tenemos que 2 / ) ( 2 2 / , 2 α χ χ α = > v v P De manera similar, se define 2 2 / 1 , α χ − v como el valor que verifica 2 / 1 ) ( 2 2 / 1 , 2 α χ χ α − = > − v v P y, por tanto, 2 / ) ( 2 2 / , 2 α χ χ α = < v v P Finalmente, α α α χ χ χ α α − = − − = < < − 1 2 / 2 / 1 ) ( 2 2 / , 2 2 2 / 1 , v v v P Para calcular intervalos de confianza para la varianza poblacional, tenemos que para la distribución Chi-cuadrado con (n-1) grados de libertad ( ( ¸ ( ¸ − < < − = ( ¸ ( ¸ < − < = < < = − − − − − − − − − − 2 2 / 1 , 1 2 2 2 2 / , 1 2 2 2 / , 1 2 2 2 2 / 1 , 1 2 2 / , 1 2 2 2 / 1 , 1 ) 1 ( ) 1 ( ) 1 ( ) ( 1 α α α α α α χ σ χ χ σ χ χ χ χ α n n n n n v n S n S n P S n P P Por tanto, si S 2 es el valor observado de la varianza muestral, un intervalo de confianza del 100(1- α)% vendrá dado por: 2 2 / 1 , 1 2 2 2 2 / , 1 2 ) 1 ( ) 1 ( α α χ σ χ − − − − < < − n n S n S n NOTA. Se puede advertir sobre el peligro de seguir este procedimiento cuando la distribución de la población no es normal. La validez del estimador por intervalos para la varianza depende en mayor medida de la hipótesis de normalidad. 2 2 / ,α χ v 1- α α/2 f( 2 v χ ) 2 v χ α/2 2 2 / 1 , α χ − v DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA LA ESTIMACIÓN DE MEDIAS. La pregunta de qué tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta o experimento. Esta es una pregunta importante y no se debe tratar a la ligera. Tomar una muestra mas grande de lo necesario para obtener los resultados deseados es un desperdicio de recursos, mientras que, por otro lado, las muestras demasiado pequeñas con frecuencia dan resultados que carecen de uso práctico. El objetivo de la estimación por intervalos es el de obtener intervalos estrechos con alta confiabilidad. Si se observan los componentes de un intervalo de confianza, se ve que su dimensión esta determinada por la magnitud de la cantidad: (Coeficiente de confiabilidad) x (error estándar) ya que la magnitud total del intervalo es el doble de esta cantidad. Para un determinado error estándar, el aumento de confiabilidad implica un coeficiente de confiabilidad mayor. Sin embargo, un coeficiente de confiabilidad mayor, para un error estándar fijo, produce un intervalo de mayor dimensión. Por otra parte, si se fija el coeficiente de confiabilidad, la única forma de reducir la dimensión del intervalo es la reducción del error estándar. Dado que el error estándar es igual a σ//n y como σ es una constante, la única forma de obtener un error estándar menor es tomar una muestra grande. ¿Qué tan grande debe ser la muestra? Esto depende del tamaño de la desviación poblacional, así como el grado de confianza y dimensión del intervalo deseado. TAMAÑO DE MUESTRA EL ESTIMAR LA MEDIA DE LA POBLACIÓN 2 2 2 ε σ z n = , TAMAÑO DE MUESTRA EL ESTIMAR LA PROPORCIÓN DE LA POBLACIÓN 2 2 ) 1 ( * ε p p z n − = , MUESTREO CUANDO LA POBLACIÓN ES FINITA Para estimar µ µµ µ Para estimar P 2 2 2 2 2 ) 1 ( σ ε σ z N Nz n + − = ) 1 ( ) 1 ( ) 1 ( 2 2 2 p p z N p p Nz n − + − − = ε n--- Tamaño necesario de la muestra. z--- Número de unidades de desviación estándar de la distribución Normal que producirá el nivel deseado de confianza. ε--- Error o diferencia máxima entre la media muestral y la media de la población. σ--- Desviación estándar de la población P--- Es la proporción de población que posee la característica de interés. Si no se puede estimar la proporción P, se puede igualar P a 0.5 y resolver para n. PRUEBAS DE HIPÓTESIS Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la población implicada. Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas. Son en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones. *Hipótesis nula (H 0 ) En muchos casos formulamos una hipótesis estadística con el único propósito de rechazarla o invalidarla. Así, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de que no hay diferencia entre ellos (o sea, que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma población. *Hipótesis Alternativa (H 1 ) Toda hipótesis que difiera de una dada. Por ejemplo: Si una hipótesis es H 0 : µ = 200 (la media de la población es igual a 200) Consideramos tres hipótesis alternativas posibles: • H 1 : µ = 200 La media de la población no es igual a 200 • H 1 : µ > 200 La media de la población es mayor a 200 • H 1 : µ < 200 La media de la población es menor a 200 CONTRASTES DE HIPÓTESIS Y SIGNIFICACIÓN, O REGLAS DE DECISIÓN Son los procedimientos que nos capacitan para determinar si las muestras observadas difieren significativamente de los resultados esperados, y por tanto nos ayudan a decidir si aceptamos o rechazamos hipótesis. Por ejemplo, si lanzáramos una moneda 20 veces, y salieran 16 caras, estaríamos inclinados a rechazar la hipótesis de que la moneda es buena. ERRORES DE TIPO DE I Y DE TIPO II • ERROR TIPO I: Es el rechazo de una hipótesis nula cuando es cierta, y su probabilidad es el nivel de significación de la prueba (α) • ERROR DE TIPO II: Es aceptar una hipótesis nula cuando es falsa y su probabilidad se simboliza (β) INTERPRETACIÓN DEL NIVEL DE SIGNIFICACIÓN. En la práctica, es frecuente un nivel de significación de 0.05 ó 0.01. Si por ejemplo, se escoge el nivel de significación 0.05(5%), entonces hay unas cinco oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso la hipótesis tiene una probabilidad 0.05 de ser falsa. a) Nivel de significancia de 0.01 b) Nivel de significancia de 0.10 c) Nivel de significancia de 0.50 *Preferencia por el error tipo I. Cometer el error tipo I, implica el tiempo y los problemas de volver a trabajar un lote de compuestos químicos que debieran haber sido aceptados. Cometer un error tipo II significa arriesgarse a que todo un grupo de consumidores de este compuesto químico se envenenen. Esta compañía preferirá el error de tipo I sobre el de tipo II, estableciendo niveles de significancia muy altos en sus pruebas para obtener (β) bajas. *Preferencia por el error tipo II. Cometer un error tipo I implica desarmar un motor, pero cometer un error tipo II implica realizar reparaciones de garantía relativamente baratas por parte del comerciante. (Se establecen menores niveles de significancia). µ H0 0.99 del área 0.005 del área 0.005 del área µ H0 0.90 del área 0.05 del área 0.05 del área µ H0 0.50 del área 0.25 del área 0.25 del área x HIPÓTESIS Decisión sobre el tipo de distribución a utilizar en la prueba de hipótesis: Después de decidir el nivel de significancia a utilizar, se debe determinar la distribución de probabilidad adecuada (Z o t). Se utiliza t cuando no se conoce la desviación estándar de la población y/o el tamaño de muestra es menor o igual a 30. Además se debe recordar utilizar el multiplicador para población finita. PRUEBAS DE HIPÓTESIS DE DOS EXTREMOS Y DE UN EXTREMO. • Contrastes de dos colas o bilaterales: Cuando la región critica se divide en dos partes, generalmente con iguales probabilidades en cada cola de la distribución del estadístico de prueba. H 0 : θ = θ 0 , H 1 : θ ≠ θ 0 • Contrastes unilaterales o de una cola: Cuando estamos interesados en valores extremos a un lado de la media, tal como sucede cuando se contrasta la hipótesis de que un proceso es mejor que otro. H 0 : θ = θ 0 H 0 : θ = θ 0 H 1 : θ < θ 0 H 1 : θ > θ 0 Algunas líneas guías son deseables para determinar cuál hipótesis deberá ser establecida como H 0 y cual como H 1 . Primero, debe leerse el problema cuidadosamente para determinar la afirmación que desea probarse. La afirmación debe sugerir una sola dirección como, por ejemplo, más que, menos que, superior a, inferior a, etc., entonces H 1 se establecerá utilizando el símbolo de desigualdad (< ó >) correspondiente a la dirección sugerida. Si, por ejemplo, al probar un nuevo medicamento se desea presentar fuerte evidencia de que se ayudará a mas del 30% de la gente, de inmediato se escribe H 1 : p > 0.3 y entonces la hipótesis nula se escribe H 0 : p = 0.3. Si la afirmación sugiere una dirección compuesta (igualdad y dirección) como, por ejemplo, al menos, igual que o mayor que, no mayor que, etc., entonces, esta dirección compuesta completa (≤ o ≥) se expresa como H 0 , pero utilizando únicamente el signo igual, y H 1 se da en la dirección opuesta. Por fin, si no se sugiere dirección alguna en la afirmación, entonces H 1 se establece utilizando el signo diferente que (≠). Ejemplo 1: El fabricante de una marca de cigarrillos afirma que el contenido de nicotina promedio no excede de 2.5 miligramos. Plantee la hipótesis nula y alternativa a ser utilizadas para probar esta afirmación y determine donde se localiza la región crítica. Solución. La afirmación del fabricante deberá rechazarse solo si µ es mayor que 2.5 miligramos y deberá aceptarse si µ es menor que o igual que 2.5 miligramos. Dado que la hipótesis nula siempre especifica un solo valor del parámetro. Se prueba: H 0 : µ = 2.5, H 1 : µ > 2.5. No obstante que se ha establecido la hipótesis nula con el signo igual, se entiende que se incluye cualquier valor no especificado por la hipótesis alternativa. En consecuencia, la aceptación de H 0 no implica que µ sea exactamente igual a 2.5 miligramos, sino que no se tiene evidencia suficiente para estar a favor de H 1 . Ya que se tiene una prueba de una cola, el símbolo mayor que indica que la región crítica cae por completo en la cola derecha de la distribución del estadístico de prueba X. Ejemplo 2: Un agente de bienes raíces afirma que el 60% de todas las residencias privadas que se construyen hoy en día son casas de tres recamaras. Para probar esta afirmación, se inspecciona una muestra grande de nuevas residencias; se registra la proporción de los hogares con tres recamaras y se utiliza como el estadístico de prueba. Plantee la hipótesis nula y alternativa a ser utilizadas en esta prueba y determine la localización de la región crítica. Solución. Si el estadístico de prueba es mucho más grande o más pequeño que p=0.6, se rechaza la afirmación del agente. De aquí que debe realizarse la prueba: H 0 : p = 0.6, H 1 : p ≠ 0.6. La hipótesis alternativa implica una prueba de dos colas con la región critica dividida por igual en ambas colas de la distribución de P, el estadístico de prueba. Se considera apropiado en este momento resumir los procedimientos para la prueba de hipótesis. Para este resumen, supóngase que la hipótesis es H 0 :θ = θ 0 . 1. Establecer la hipótesis nula H 0 de que θ = θ 0 . 2. Seleccionar una hipótesis alternativa apropiada H 1 de una de las alternativas θ < θ 0 , θ > θ 0 ó θ ≠ θ 0. 3. Seleccionar un nivel de significancia de tamaño α. 4. Seleccionar el estadístico de prueba apropiado y establecer la región crítica. (Si la decisión se va a basar en un valor P no es necesario establecer la región crítica.) 5. Calcular el valor del estadístico de prueba de los datos muestrales. 6. Decidir: rechazar H 0 si el estadístico de prueba tiene un valor en la región crítica (o si el valor calculado de P es menor igual que el nivel de significancia deseado α); de otra forma, no rechazar H 0 . CONTRASTES ESPECIALES 1. Medias: x ~ Media muestral x ~ µ = µ Media de la población n x σ σ = ~ Desviación. El valor Z viene dado por: n x Z / ~ σ µ − = Cuando sea necesario, se utilizará la desviación muestral S como estimación de σ. 2. Proporciones: P Proporción de éxitos en una muestra p p = µ , donde p es la proporción de éxitos de la población. n pq n p p p = − = ) 1 ( σ El valor de Z viene dado por: n pq p P Z / − = En el caso P = x/n, donde x es el numero real de éxitos en una muestra , Z es npq N x Z − = Esto es, npq np x x = = = = σ σ µ µ ~ ~ Ejemplos: 1. Una muestra aleatoria de 100 muertes registradas en los Estados Unidos durante el año pasado mostró una vida promedio de 71.8 años. Suponiendo una desviación estandar poblacional de 8.9 años, ¿parecería esto indicar que la vida promedio hoy en día es mayor que 70 años? Utilice un nivel de significancia del 0.05. Solución. Siguiendo el procedimiento de los seis pasos, se tiene: 1. H 0 : µ = 70 años. 2. H 1 :µ > 70 años. 3. α = 0.05. 4. Región crítica: Z > 1.645, donde: n x Z / ~ 0 σ µ − = 5. Cálculos: 8 . 71 ~ = x años, 9 . 8 = σ años, y 02 . 2 100 / 9 . 8 70 8 . 71 = − = Z 6. Decisión: se rechaza H 0 y se concluye que la vida promedio hoy en día es mayor que 70 años. P Z El valor P correspondiente a Z = 2.02 está dada por el área de la región sombreada. Al utilizar la tabla de distribución normal, se tiene: P = P(Z>2.02) = 0.0217. Como resultado, la evidencia a favor de H 1 es incluso mas fuerte que la sugerida por un nivel de significancia del 0.05. PRUEBAS SOBRE UNA SOLA MEDIA (VARIANCIA DESCONOCIDA) La estructura de la prueba es idéntica que para el caso de σ conocida con la excepción de que el valor σ en el caso estadístico de prueba se reemplaza por la estimación calculada S y la distribución normal estándar se reemplaza por un distribución t . Como resultado, para la hipótesis bilateral: H 0 : µ = µ 0 H 1 : µ ≠ µ 0 El rechazo de Ho en un nivel de significación α resulta cuando una estadística t calculada: n s x t 0 µ − = Excede a tα/2,n-1 o es menor que - tα/2 ,n-1. De esta manera, esta región critica de doble cola se aplica en un estilo similar al del caso de σ conocida. Para la hipótesis bilateral en un nivel de significancia α , se aplican las regiones criticas de doble cola. Para H 1 : µ >µ 0 el rechazo resulta cuando t > tα , n-1. Para H 1 : µ < µ 0 , la región critica esta dada por t < tα ,n-1. 0 2.02 Ejemplo: El Edison Electric Institute ha publicado cifras acerca de la cantidad anual de kilowatts hora consumida por varios aparatos para el hogar. Se afirma que la aspiradora consume un promedio de 46 kilovatios hora al año. Si una muestra aleatoria de 12 hogares incluidos en un estudio planeado indica que las aspiradoras consumen un promedio de 42 kilovatios hora al año con una desviación estandar de 11.9 kilovatios hora. Sugiere esto con un nivel de significancia de 0.05 que las aspiradoras consumen, en promedio, menos de 46 kilovatios hora al año?. Suponga que la población de kilovatios hora es normal. SOLUCION: 1. H 0 : µ =46 kilowatts hora . 2. H 1 :µ < 46 kilowatts hora 3. α = 0.05. 4. Región crítica: t < -1.796, donde: n s x t / ~ 0 µ − = Con v = 11 grados de libertad. 5. Cálculos: 42 ~ = x kilovatios hora, 9 . 11 = s kilovatios hora y n=12. De aquí que: 16 . 1 12 / 9 . 11 46 42 − = − = t P = P(t<-1.16) = 0.135. 6. Decisión: Se acepta Ho y se concluye que la cantidad promedio de kilovatios consumidos anualmente por aspiradoras para el hogar no es significativamente menor que 46. DISTRIBUCIÓN CHI-CUADRADA La Distribución Normal se utiliza en todos aquellos casos que ofrecen dos resultados posibles; cuando se presentan mas de dos resultados posibles debe aplicarse la prueba Chi-Cuadrado. Esta prueba es realizada en todos aquellos casos en los cuales el análisis de los datos están basados en el conteo, es decir, provienen de una característica cualitativa (atributos) por no ser medidas tal como ocurre con la variable. TABLAS DE CONTINGENCIA. Un cuadro de contingencia, es un arreglo en el cual un conjunto de observaciones se dispone conforme a dos criterios de clasificación, uno de los cuales se expresa en las columnas y el otro en los renglones. Primer nivel del criterio de clasificación Segundo nivel de criterio de clasificación 1 2 3 ... c Total 1 n 11 n 12 n 13 n 1c n 1. 2 n 21 n 22 n 23 n 2c n 2. 3 n 31 n 32 n 33 n 3c n 3. : r n r1 n r2 n r3 n rc n r. Total n .1 n .2 n .3 n .c n • Esta tabla se denominará tabla de rxc. (Renglones xColumnas) • A los totales de renglones y columnas se les denomina frecuencias marginales. PRUEBA DE INDEPENDENCIA. Para esta prueba nos interesa saber si un atributo o clasificación es independiente del otro y generalmente corresponde a resultados obtenidos a traves de una muestra de una población. Se prueba la hipótesis nula de que dos criterios de clasificación son independientes. Ejemplo. Un grupo de investigadores, al estudiar la relación entre el tipo sanguíneo y la severidad de una afección en la población, reunió los datos de 1500 personas, los cuales se presentan en la tabla de contingencia. Los investigadores desean saber si estos datos son compatibles con la hipótesis de que el grado de la afección y el tipo sanguíneo son independientes. Tipo de sangre Severidad de la condición. A B AB O Total Ausente 543 211 90 476 1320 Moderada 44 22 8 31 105 Severa 28 9 7 31 75 Total 615 242 105 538 1500 Solución 1. Hipótesis. H 0 : El tipo sanguíneo y la severidad de la afección son independientes H 1 : Las dos variables no son independientes. Sea α= 0.05 2. Estadística de prueba: ( ) ∑ ( ¸ ( ¸ − = i i E E O 2 1 2 χ 3. Punto Crítico: 2 α χ , con v=(r-1)(c-1) grados de libertad. Si 2 χ > 2 α χ , se rechaza la hipótesis nula de independencia. Para calcular el estadístico de prueba es necesario encontrar las frecuencias esperadas (E i ) para cada celda: GranTotal nglon Total na TotalColum esperada Frecuencia ) Re ( * ) ( = A partir de las frecuencias esperadas y observadas es posible calcular: ( ) 90 . 26 ) 90 . 26 31 ( ... 96 . 212 ) 96 . 212 211 ( 2 . 541 ) 2 . 541 543 ( 2 2 2 2 1 2 − + + − + − = ( ¸ ( ¸ − = ∑ i i E E O χ = 0.0058987 + 0.018039 + ... + 0.624907 = 5.12 4. Decisión estadística. No se rechaza H o porque 5.12 no es mayor que 12.592. 5. Conclusión. No se rechaza H 0 . Estos datos son compatibles con la hipótesis de que el grado de la afección y el tipo sanguíneo son independientes. TABLA DE CONTINGENCIA DE 2X2. A veces, cada uno de los dos criterios de clasificación puede dividirse en sólo dos categorías o niveles. Cuando los datos se clasifican cruzados de esta manera, el resultado es una tabla de contingencia que consta de dos renglones y dos columnas. Esta tabla se conoce como tabla de 2x2. Ejemplo. Una muestra de 500 niños de una escuela primaria se clasificó en forma cruzada respecto a su estado de nutrición y desempeño académico. Los resultados se muestran en la siguiente tabla: Estado de nutrición Desempeño académico. Malo Bueno Total Ausente 105 15 120 Moderada 80 300 380 Total 185 315 500 Los investigadores desean saber si es posible concluir que existe una relación entre el estado de nutrición y el desempeño académico. Solución. 1. Hipótesis. H o : El estado nutricional y el desempeño académico son independientes H 1 : Las dos variables no son independientes. Sea α = 0.05. 2. Estadístico de prueba: Se obtiene como se mostró en el ejemplo anterior. Sin embargo, en el caso de la tabla de contingencia de 2x2, Chi-Cuadrado puede obtenerse de la siguiente manera: ) )( )( )( ( ) ( 2 2 d c b a d b c a cb ad n + + + + − = χ 3. Punto crítico. 2 α χ , con v=(r-1)(c-1)=1 grado de libertad. 4. Regla de decisión: Rechazar H 0 si 2 χ > 2 ,v α χ Estadístico de prueba: ( )( ) ( )( ) [ ] 746 , 172 380 * 120 * 315 * 185 80 15 300 105 500 2 = − = χ 5. Conclusión. Los investigadores pueden concluir que existe una relación entre las características de estudio. PRUEBAS DE HOMOGENEIDAD Se utiliza para determinar si dos o más muestras aleatorias provienen de la misma población o de poblaciones diferentes. Cuando se dice que las clasificaciones son homogéneas, se quiere dar a entender que tienen algo de común. Suponer, por ejemplo, que se decide seleccionar a 200 demócratas, 150 republicanos y 150 independientes de los votantes de un estado y se registra si están a favor de una ley de aborto propuesta, en contra de ella o indecisos. Afiliación política Ley de aborto. Demócrata Republicano Independiente Total A favor 82 70 62 214 En contra 93 62 67 222 Indecisos 25 18 21 64 Total 200 150 150 500 Ahora bien, mas que probar la independencia, se prueba la hipótesis de que las proporciones de la población en cada renglón son iguales, esto es, se prueba la hipótesis de que las proporciones de Demócratas, Republicanos e Independientes a favor de la ley de aborto son iguales; y las proporciones de los que en cada afiliación política están indecisos son las mismas. Suponiendo homogeneidad, se encuentra de nuevo las frecuencias esperadas de celdas multiplicando los totales correspondientes de renglón y de columna y luego dividiendo entre el gran total. El análisis continúa entonces utilizando el mismo estadístico Chi-Cuadrado de antes. Ejercicio. Con referencia a los datos de la tabla, probar la hipótesis de que las opiniones relacionadas con la ley de aborto propuesta son las mismas en cada afiliación política. Utilizar un nivel de significación de 0.05. Solución 1. Hipótesis: H 0 : Para cada opinión, las proporciones de Demócratas, Republicanos e Independientes son las mismas. H 1 : Para al menos una opinión, las proporciones de Demócratas, Republicanos e Independientes no son las mismas. α = 0.05 2. Estadístico de prueba: Primero se realiza el cálculo de los valores esperados en cada celda utilizando la fórmula vista anteriormente. GranTotal nglon Total na TotalColum esperada Frecuencia ) Re ( * ) ( = Ahora bien, ( ) 2 . 19 ) 2 . 19 24 ( ... 2 . 64 ) 2 . 64 59 ( 2 . 64 ) 2 . 64 70 ( 6 . 85 ) 6 . 85 82 ( 2 2 2 2 2 1 2 − + + − + − + − = ( ¸ ( ¸ − = ∑ i i E E O χ = 2,90 3. Punto crítico: 2 α χ , Con v=(r-1)(c-1)=4 grados de libertad. 488 , 9 2 = α χ Decisión: No se rechaza H 0 , y se concluye que las proporciones de Demócratas, Republicanos e Independientes son las mismas para cada opinión establecida. Esto es, las tres afiliaciones políticas son homogéneas con respecto a la opinión expresada por los votantes. Ejercicio 1. En un consultorio se trató a un grupo de personas que se quejaban de insomnio, dándole a unos pastillas para dormir y a otros pastillas de azúcar (que hacían creer que eran para dormir). Después de someterlos a observación se obtuvo el siguiente resultado: Durmieron No durmieron Total Pastillas para dormir 35 5 40 Pastillas de azúcar 45 15 60 Total 80 20 100 Pruebe a un nivel del 5% que no existe diferencia. Ejercicio 2. Varios estudios proporcionan la evidencia suficiente para apoyar la hipótesis de que el manejo o “amansamiento” de las ratas durante las primeras etapas de su vida produce resultados benéficos. Suponer que en un estudio se compara una muestra de ratas manipuladas y una muestra de ratas no manipuladas, comparadas con respecto al estado general de salud. Los resultados son los siguientes: Grupo Estado de salud Manejadas No manejadas Total Alto 37 23 60 Bajo 13 27 40 Total 50 50 100 ¿Apoyan estos datos la hipótesis? Sea α = 0.05. BIBLIOGRAFÍA BERENSON, M L., LEVINE, D.M. Estadística para Administración y Economía. CANAVOS, G.C. Probabilidad y Estadística. Aplicaciones y métodos. McGraw-Hill, 1993 CHOW, Y.L.; Análisis estadístico.1977. MENDENHALL, WILLIAM, Estadística matemática con aplicaciones, Grupo editorial ibero América. NEWBOLD, PAUL. Estadística para los negocios y la economía, editorial Prentice Hall. Cuarta edición. WALPOLE, R.E, MYERS, R. Probabilidad y Estadística para Ingenieros. Prentice Hall WAYNE W. D., Bioestadística: base para el análisis de las ciencias de la salud. México: Editorial Limusa Wiley.2002
Copyright © 2024 DOKUMEN.SITE Inc.