ESTADISTICA GENERALUNIVERSIDAD CESAR VALLEJO AUTOR: MG. HUGO VICUÑA SALVADOR CHIMBOTE - 2009 SEMESTRE ACADEMICO 2009-I Mg.HERMILIO HUGO VICUÑA SALVADOR ASIGNATURA ESTADÍSTICA GENERAL CICLO III Y IV MÓDULO DE PROBABILIDAD Y SUS APLICACIONES Estimados ALUMNOS: En el marco destinada a los ALUMNOS del nivel SUPERIOR, de todas las Escuelas Profesionales se hace importante trabajar un tema útil e indispensable en la labor del FUTURO PROFESIONAL y el curso de ESTADÍSTICA GENERAL esta relacionado con las ESTADÍSTICA INFERNCIAL Y LAS PROBABILIDADES. En esta oportunidad abordaremos el estudio de Las PROBABILIDADES y SUS APLICACIONES, asimismo se presentan casos prácticos de la vida real con la finalidad de tomar decisiones razonables de acuerdo a un análisis de datos. Estimados ALUMNOS: En el marco destinada a los ALUMNOS del nivel SUPERIOR, de todas las Escuelas Profesionales se hace importante trabajar un tema útil e indispensable en la labor del FUTURO PROFESIONAL y el curso de ESTADÍSTICA GENERAL esta relacionado con las ESTADÍSTICA INFERNCIAL Y LAS PROBABILIDADES. En esta oportunidad abordaremos el estudio de Las PROBABILIDADES y SUS APLICACIONES, asimismo se presentan casos prácticos de la vida real con la finalidad de tomar decisiones razonables de acuerdo a un análisis de datos. Aprendizajes esperados ESTADISTICA GENERAL SEMESTRE ACADEMICO 2009-I Mg.HERMILIO HUGO VICUÑA SALVADOR La Probabilidad nos enseña a determinar el grado de certeza de que pueda ocurrir o no un suceso o evento a partir de un experimento aleatoria con la finalidad de obtener conclusiones válidas y tomar decisiones razonables. La Probabilidad nos enseña a determinar el grado de certeza de que pueda ocurrir o no un suceso o evento a partir de un experimento aleatoria con la finalidad de obtener conclusiones válidas y tomar decisiones razonables. Estimados ALUMNOS: En el marco destinada a los ALUMNOS del nivel SUPERIOR, de todas las Escuelas Profesionales se hace importante trabajar un tema útil e indispensable en la labor del FUTURO PROFESIONAL y el curso de ESTADÍSTICA GENERAL esta relacionado con las ESTADÍSTICA INFERNCIAL Y LAS PROBABILIDADES. En esta oportunidad abordaremos el estudio de Las PROBABILIDADES y SUS APLICACIONES, asimismo se presentan casos prácticos de la vida real con la finalidad de tomar decisiones razonables de acuerdo a un análisis de datos. Estimados ALUMNOS: En el marco destinada a los ALUMNOS del nivel SUPERIOR, de todas las Escuelas Profesionales se hace importante trabajar un tema útil e indispensable en la labor del FUTURO PROFESIONAL y el curso de ESTADÍSTICA GENERAL esta relacionado con las ESTADÍSTICA INFERNCIAL Y LAS PROBABILIDADES. En esta oportunidad abordaremos el estudio de Las PROBABILIDADES y SUS APLICACIONES, asimismo se presentan casos prácticos de la vida real con la finalidad de tomar decisiones razonables de acuerdo a un análisis de datos. PROBABILIDAD Toma decisiones pertinentes frente a fenómenos aleatorios usando Probabilidad ¹ ¹ ¹ ¹ ¹ ) ¹ ¹ ¹ ¹ ¹ ¹ ' ¹ · ) 6 , 6 ( ), 5 , 6 ( ), 4 , 6 ( ), 3 , 6 ( ), 2 , 6 ( ), 1 , 6 ( ), 6 , 5 ( ), 5 , 5 )( 4 , 5 ( ) 3 , 5 ( ), 2 , 5 ( ), 1 , 5 ( ), 6 , 4 ( ), 5 , 4 ( ), 4 , 4 ( ), 3 , 4 ( ), 2 , 4 ( ), 1 , 4 ( ) 6 , 3 ( ), 5 , 3 ( ), 4 , 3 ( ), 3 , 3 ( ), 2 , 3 ( ), 1 , 3 ( ), 6 , 2 ( ), 5 , 2 ( ), 4 , 2 ( ) 3 , 2 ( ), 2 , 2 ( ), 1 , 2 ( ), 6 , 1 ( ), 5 , 1 ( ), 4 , 1 ( ), 3 , 1 ( ), 2 , 1 ( ), 1 , 1 ( ( EM ESTADISTICA GENERAL PROBABILIDAD EXPERIMENTO.- Es un proceso mediante el cual se obtiene el resultado de una observación. Experimento Deterministico.- Cuando el resultado de la observación es determinado en forma precisa. Ejemplo: 1. Lanzar una pelota en un tanque de agua y ver si flota o se hunde. 2. Soltar una piedra en el aire. Experimento Aleatorio (EA).- Cuando los resultados de la observación no se pueden predecir con exactitud, antes de realizar el experimento. Ejemplos: 1. EA: Resultado del examen final en el curso de estadística por parte de un estudiante. 2. EA: Resultado del lanzamiento de una moneda. 3. EA: Lanzar un dado y ver el número aparece en la cara superior. Espacio Muestral.- Es el conjunto de todos los resultados posibles de un EA. Ejemplos: 1. EM = {A, D} 2. EM = {C, S} 3. EM = {1,2,3,4,5,6} 4. EA = Si lanzamos 2 monedas al mismo tiempo; Hallar el EM. EM = {cc, cs, sc, ss} Método del Árbol 5. EA: Si lanzamos 3 monedas al mismo tiempo. Hallar EM EM = {ccc, ccs, csc, css, scc, scs, ssc, sss} Por el método del árbol es: 6. Si lanzamos 2 dados al mismo tiempo Hallar EM Evento.- Es cada resultado del experimento aleatorio o una combinación de resultados además son subconjuntos de un espacio muestral. Ejemplo: Sea el exp: Lanzar una moneda dos veces. Determinar los siguientes eventos. A 1 : Ocurre cara en el primer lanzamiento. A 2 : Ocurre sello en el segundo lanzamiento. A 3 : Ocurre por lo menos una cara. A 4 : Ocurre los mismo en ambos lanzamientos. Solución EM = {CC, CS, SC, SS} los eventos son: A 1 = {(c,c),(c,s)} A 2 = {(c,s),(s,s)} A 3 = {(c,c),(c,s), (s,c)} A 4 = {(c,c),(s,s)} Tipos de Eventos A) Evento Seguro (U).- De todas maneras debe ocurrir B) Evento Imposible ( φ ).- Es el evento que no va a ocurrir. SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR sss s ssc c s scs s scc c c s css s c s ccs s ccc c c c → → → → → → → → • csc 1 M 2 M 3 M ss s sc c s cs s cc c c · · · · • ESTADISTICA GENERAL C) Evento Complementario ( _ A ).- Si A es un evento del espacio muestral, se llama complemento del evento A, al evento que ocurre si A no ocurre. D) Eventos Mutuamente Excluyentes.- Dos o mas eventos son mutuamente excluyentes si la ocurrencia de uno de ellos anula la ocurrencia de los demás. Ejemplo: Selección de un profesor de la universidad “x” según categoría docente. EM = {Principal, Asociado, Auxiliar, A 1 A 2 A 3 Jefe de Practica} A 4 Los 4 son mutuamente excluyentes, porque al seleccionar un docente, anulando el resto de los eventos. Eventos Independientes.- Dos eventos son independientes si ambos no tienen ninguna relación entre si. Ejemplo: Sean los eventos X = 1 er alumno apruebe el examen de Estadística Y = 2 do alumno apruebe el examen de Estadística X e Y son independientes porque al ocurrir el vento x, este no influye para que el vento Y ocurra. Probabilidad.- Es una disciplina abstracta que se usa como modelo para hacer deducciones relativas a eventos que posiblemente pueden ocurrir. Tipos de Probabilidad A) Probabilidad Clásica o Apiori.- Es posible conocer el resultado con anterioridad, es decir sin llevar a cabo el experimento y sólo basado en un razonamiento lógico. Formula: P(A)=___Casos Favorables__ Total de Cosas Posibles Ejemplo 1: Hallar la probabilidad de obtener cara en el lanzamiento de una moneda. Solución EM = {c, s} A 1 = {c} P(A) = 2 1 = 50% Ejemplo 2: Hallar la probabilidad de obtener el nº 2 en el lanzamiento de un dado. Sol. EM = {1,2,3,4,5,6} P(B) = % 17 17 . 0 6 1 · · Ejemplo 3: Hallar la probabilidad de obtener al menos un sello en el lanzamiento de 2 monedas. Sol. EM = {cc, cs, sc, ss} P(A) = % 75 4 3 · Ejemplo 4: Hallar la probabilidad de obtener 2 caras y 1 sello en el lanzamiento de 3 monedas. Sol. EM = {ccc, ccs, csc, css, scc, scs, ssc, sss} P(A) = % 5 . 37 375 . 0 8 3 · · Ejemplo 5: Si lanzamos 2 dados ¿Cuál es la Probabilidad de obtener, a) la suma sea igual a 7? b) Que la suma sea ≤ 6? c) Que la suma sea > 8? B) Probabilidad de Frecuencia Relativa o A posteriori.- Se basa en la repetición de la ocurrencia de un evento, al realizar una gran cantidad de pruebas o experimentos. P(A) = Nº de veces que ocurre el evento A Nº total de veces que se repito el exp. Axiomas básicos i) P(A) > 0 ii) 0 < P(A) < 1 iii) P(EM) = 1 iv) P( φ )= 0 Ejemplo En una encuesta realizada a 500 vendedores ambulantes de Lima SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR ESTADISTICA GENERAL cuadrada, se encontró que 325 de ellos se dedicaban a esta actividad porque habían sido despedidos de su trabajo. Hallar la probabilidad de que al seleccionar aleatoriamente un vendedor ambulante, este haya sido despedido de su trabajo. Solución P(B) = % 65 65 . 0 500 325 · · 1. Regla de la Suma de Probabilidades A) Si los eventos A y B son mutuamente excluyentes la Probabilidad de ocurrencia de A o B es: P(AUB) = P(A) + P(B) φ · ∩ ) ( B A P Ejemplo: De 200 niños examinados por una nutricionista se encontró que 80 padecían de desnutrición leve; 50 padecían de desnutrición (crónico) y 70 normales. Si de los niños examinados se selecciona uno al azar ¿Cuál es la probabilidad de que padezca de desnutrición leve o crónica? Solución B) Si los eventos no son mutuamente excluyentes, la probabilidad de ocurrencia de A o B es: P(AUB) = P(A) + P(B) - ) ( B A P ∩ Gráficamente P(A ∩ B) = Ø Ejemplo: De 100 pacientes examinados, 20 padecían de artritis, 32 padecían de gastritis y 8 tenían ambos males. Hallar la Probabilidad de seleccionar un paciente que padezca de artritis o gastritis Solución 2. Regla sobre Probabilidad Condicional Es utilizada cuando se desea conocer la probabilidad de ocurrencia de un evento condicionado a la aparición previa de otro. Su formula es: ) ( ) ( ) ( A P A B P P A B ∩ · si P(A) 0 ≠ Ejemplo: En una comunidad se llevó a cabo una encuesta a 600 familias para determinar si la leche subsidiada por el estado es consumida por la población de bajos recursos. Los resultados son; 420 familias perciben ingresos igual o por debajo de IMV, 70 familias solo consumían leche subsidiada por el estado y 30 familias de las que perciben IMV, consumían leche subsidiada por el estado. Si se selecciona una familia al azar ¿Cuál es la probabilidad de que esta familia consuma leche subsidiada, dado que perciben ingresos iguales o inferiores al IMV. Solución SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR A B ESTADISTICA GENERAL 3. Regla de la Multiplicación de Probabilidad Se utiliza para calcular la probabilidad de ocurrencia simultáneamente de dos eventos A) Si los eventos A y B son dependiente: Su fórmula es: ) / ( ) ( ) ( A B P A P B A P ⋅ · ∩ Ejemplo: En un estudio se encontró que la probabilidad deque se incremente el empleo en el asentamiento humano “X” es de 35%, de que se incremente el consumo de artículos de 1 era necesidad es de 5% y el incremento el consumo de artículos de 1 era necesidad dado el incremento del empleo, es de 10% ¿Cuál es la probabilidad de que se incrementa el empleo y el consumo de artículos de 1 era necesidad? Solución B) Si los eventos A y B son independiente : Se debe cumplir P(B/A) = P(B) P(A∩B)= P(A). P(B) Ejemplo: En la urbanización “Los Pinos” la probabilidad de que una persona sea mayor de 18 años de edad es de 45% y la probabilidad de que consuma carne es de 15% y la probabilidad de que consuma carne, dado que es mayor de 18 años de edad es de 15%. Si seleccionamos una persona al azar. ¿Cuál es la probabilidad de que consuma carne y tenga más de 18 años de edad? Solución ACTIVIDAD Nº 09 1.- Sean los eventos A, B y C SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR B ESTADISTICA GENERAL a) Hallar P(AUBUC) b) Hallar P(B/C); P(A/C) 2.-Sean los eventos A, B y C a) Hallar P(AUBUC) b) Hallar P(B/A); P(A/C) 3.- Sean los eventos A, B y C a) Hallar P(AUBUC) b) Hallar P(B/C); P(A/B) 4.- Sean los eventos A, B y C a) Hallar P(AUBUC) b) Hallar P(C/B); P(C/A) DISTRIBUCIONES DE PROBABILIDAD DE TIPO CONTINUO SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR A C 10 50 8 14 12 60 40 10 A B C 12 55 11 14 12 65 45 A B C 11 56 12 14 13 80 66 20 A B C 14 55 10 18 15 70 48 ESTADISTICA GENERAL DISTRIBUCIÓN NORMAL.- Es la más importante en todo el campo de la Estadística, así como en las industrias, científicos y en la vida diaria. Una variable aleatoria continúa x, se dice que está distribuida normalmente, con media μ y varianza σ 2 ; si su función de densidad de Probabilidad está dado por: y -∞ < x < ∞, π = 3.1415; e = 2.7182 Su grafica es: 1) 2) P (a ≤ x ≤ b) = Área bajo la curva normal entre a y b es: LA DISTRIBUCIÓN NORMAL ESTÁNDAR Se puede convertir esta escala real a una relativa o estandarizada, mediante la variable normalizada donde: = x – μ ; σ x n (μ, σ 2 ) Por ejemplo n (0, 1), μ=0, σ = 1 USO DE LA TABLA NORMAL ESTÁNDAR La tabla ayuda a resolver 2 problemas. 1) Conocido hallar el área : a) P ( < 0) b) P (– 0 ≤ ≤ 0) Ejemplo: obtener el área para • < 1.25. Solución P ( < 1.25) = 0.8944 Según tabla de DN 2) Obtener el área para –1.96 ≤ ≤ 1.96 los puntos son simétricos: Sol: 2) Conocido el área Hallar Ej.: Hallar tal que P ( ≤ 0) = 0.9382 Sol.: PROPIEDADES DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR a) P ( > 0) = 1 – P ( ≤ 0) Su gráfico es: b) P ( < - 0) = 1 – P ( ≤ 0) Su gráfico es: c) P ( > - 0) = 1 – P ( < 0) Su gráfico es: d) P ( 0 ≤ ≤ 1) = P ( ≤ 1) – P ( ≤ 0) Su gráfico es: Ejemplos: Graficar: 1) Hallar P ( > 2.32) 2) Hallar P ( < - 0.03) 3) Hallar P ( > - 1.30) 4) Hallar P (- 2.05 ≤ ≤ 1.36) 5) Hallar P (2.58 ≤ ≤ 3.32) SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR x n (μ, σ 2 ) x = algunos valores de interés μ = media P (–1.96 ≤ ≤ 1.96) = 0.950 Según tabla de D. N. 0 = 1.5 + 0.04 0 = 1.54 ESTADISTICA GENERAL Distribución de la D. N. E Las ventas diarias en un restaurante tiene una distribución de Probabilidad que es aproximadamente normal con media igual a $ 530 y una desviación estándar de $ 120. ¿Cuál es la Probabilidad de que las ventas excedan de $ 700 en un día dado? Solución: Variable aleatoria X : Entonces: X n (530, 14400) donde μ = $ 530; σ = $ 120 P (X > 700) = P ( X - μ > 700 - μ ) σ σ P ( > 700 – 530) P ( > 1.42) = 120 = 1 – P ( ≤1.42) = 1 – 0.9222 = 0.0778 D. N. G. D. N. E. DISTRIBUCIÓN T DE STUDENT Se dice que una variable T tiene una distribución t de Student con V grados de libertad, si su función de densidad de Probabilidad esta dada por: ; t Є R v = 1, 2, ... Se denota como T t o Su gráfica es: Uso de la Tabla t Student : Calcular la probabilidad que la variable aleatoria t tome valores menores o iguales a una constante t 0 = t1 - α es decir: P (T ≤ t 1 -α ) = 1 – α Su gráfica es: Ejemplos: 1) Si T t 18 Hallar: a. P (T < 2.101) d. P (T > - 1.330) b. P (T > 1.330) e. P (-2.101<t< 2.101) c. P (T ≤ -1.330) f. P (-2.878 ≤ T ≤ 2.878) Solución: a) P (T < 2.101) = 0.975 DISTRIBUCION CHI – CUADRADO Se dice que la variable aleatoria X tiene una distribución Chi – Cuadrado con V – grados de Libertad, si su función de Densidad es: ; X ≥ o Notación: ; X < 0 USO DE LA TABLA CHI – CUADRADO La probabilidad que la variable aleatoria X tiene una distribución X 0 2 (1 ≤ v ≤ 30) sea menor o igual a un valor constante. X 0 2 = X 2 1-α representado por: P(X ≤ X 2 1-α, v ) = 1 - α, además no existe simetría es desde X 0 2 = 0 hasta X 0 2 α Su gráfica es: Ejemplos: 1) Si X X 20 2 Hallar: a) P (X ≤ 28.4) b) P (X ≥12.4) c) P (12.4 ≤ X ≤ 28.4) d) P (15.5 ≤ X ≤ 34.2) ACTIVIDAD Nº10 SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR x n (μ, σ 2 ) ESTADISTICA GENERAL 1.-Las ventas diarias en un restaurante tiene una distribución de Probabilidad que es aproximadamente normal con media igual a $ 630 y una desviación estándar de $ 140. ¿Cuál es la Probabilidad de que las ventas excedan de $ 800 en un día dado? Desarrollo Variable aleatoria X : Entonces: X n (630, 19600) donde μ = $ 630; σ = $ 140 P (X > 800) = P ( X - μ > 800 - μ ) σ σ P ( > 800 – 6 30 ) = 140 2.- El promedio de las alturas de 800 alumnos de una unidad escolar es 1.50mt y la desviación estándar es 0.30mt, asumiendo que las alturas están normalmente distribuidas, encontrar cuántos alumnos miden: a) Entre 1.30m y 1.70m. b) más de 1.65m. Desarrollo 3.- Las ventas diarias en un restaurante tiene una distribución de Probabilidad que es aproximadamente normal con media igual a $ 700 y una desviación estándar de $ 120. a) ¿Cuál es la Probabilidad de que las ventas excedan de $ 850 en un día dado? b) ¿Cuál es la Probabilidad de que las ventas estén entre $ 620 y $ 880 en un día dado? Desarrollo 4.- Los pesos de 600 paquetes están normalmente distribuidos con medias 65.3 kgs. Y desviación estándar 5.51 kgs. Encuentre el número de paquetes que pesan: a) Entre 60 y 70kgs. b) más de 63.2 kg. Desarrollo PRUEBA DE HIPOTESIS SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR x n (μ, σ 2 ) 1) 2) 3) 1) 2) 1) 2) 3) 1) 2) ESTADISTICA GENERAL Definición.- Se toma una muestra de una población, con el fin de aceptar o rechazar una hipótesis respecto a la población; bajo un procedimiento estadístico. Hipótesis.- Afirmación de que algo es verdadero. Hipótesis Nula (Ho).- Es la hipótesis que se quiere probar. Hipótesis Alternativa (H1).- Es una suposición contraria a la que se quiere probar y es aceptada en el caso de que la primera sea rechazada. Ejemplos: Hallar Ho y H1 1) La altura media del estudiante Vallejiano es de 1.6 m 2) El tiempo de vida promedio de una determinada pieza usada en el ensamblaje de una marca de computadoras es de 20000 horas. 3) El porcentaje de personas atacadas por cierta epidemia, es no más del 10% Ho: μ = 1.60 m H1:μ >1.60 m o H1:μ<1.60 m o H1:μ≠<1.60 m Ho: μ = 20000 hrs H1: μ ≠ 20000 hrs; H1:μ<20000 hrs ó μ>20000 hrs Ho: μ : p ≤ 0.10 H1: μ : p > 0.10 PRUEBAS UNILATERALES Y BILATERALES 1) Prueba Unilateral o de una cola A) Prueba de Cola inferior o del lado izquierdo; las hipótesis son: Ho : θ = θ0 H1 : θ < θ0 Del ejemplo anterior: Ho : μ = 1.60 m Ho:μ = 20000 hrs H1 : μ < 1.60 m H1:μ < 20000 hrs B) Prueba de la cola superior o del lado derecho, las hipótesis son: Ejemplo: Ho : θ = θ0 H1 : θ > θ0 Ejemplo: Ho : μ = 1.60 m Ho:μ = 20000 hrs H1 : μ > 1.60 m H1:μ > 20000 hrs Ho : p = 0.10 H1 : p > 0.10 2) Prueba de dos colas o bilateral las hipótesis son: Ho : θ = θ0 H1 : θ ≠ θ0 Ejemplos: Ho : μ = 1.60 m Ho:μ = 20000 hrs H1 : μ ≠ 1.60 m H1:μ ≠ 20000 hrs TIPOS DE ERRORES Al realizar una prueba de hipótesis no sabemos si en una determinada acción (rechazo o aceptación de la hipótesis nula) cometemos un error o no. Tenemos dos tipos de errores. Error tipo I.- Consiste en rechazar la hipótesis nula cuando es verdadera. Error tipo II.- Consiste en aceptar la hipótesis nula cuando es falsa. Tabla de Hipótesis según tipo de error: DECISIÓN Estado de la Naturaleza H o Verdadera H o Falsa Aceptar H o 1 – α Decisión correcta β error tipo III Rechazar H o (aceptar H 1 ) α Error tipo I 1 – β decisión correcta SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR η σ µ − · Ζ X 05 . 0 · α 05 . 0 · α ESTADISTICA GENERAL Nivel de Significación (α).- Se denomina nivel de significación de una prueba de hipótesis a la probabilidad de cometer un error tipo I. · · ) (ETI P α P [Rechazar H / H es verdadera] · · ) (ETI P α P [Aceptar 1 H / 1 H es falsa] La probabilidad de cometer un error tipo II se representa por B, es decir: · · ) (ETII P β P [Aceptar H / H es falsa] · · ) (ETII P β P [Rechaza 1 H / 1 H es verdadera] Región Crítica o Región de Rechazo.- Es la región que contiene a los valores para los cuales se rechaza la hipótesis H y se denota por RC o RR. Región de aceptación.- Es la región que contiene los valores para los cuales no se rechaza H , es decir H es aceptada. Se denota por R.A. Graficando tipo de prueba ubicando RA y RR Prueba de cola izquierda.- Si la región de rechazo esta a la izquierda del punto critico C. 1 - α α RR RA Prueba de cola derecha.- Si la región de rechazo esta a la derecha del punto critico C. 1 - α α RA RR Prueba de dos colas.- Si la región de aceptación es un intervalo cerrado entre los puntos critico 1 C y 2 C α/2 1 - α α/2 RR RA RR Los niveles de significancia más usados son: 05 . 0 · α y 0.01 Pasos de una prueba de Hipótesis 1.- Formulación de la hipótesis H y 1 H de acuerdo a la probabilidad. 2.- Especificación del nivel de significación. 3.- Selección de la estadística de prueba. 4.- Establecimientos de los criterios de decisión. 5.- Realización de cálculos. 6.- Toma de decisiones. Prueba de hipótesis sobre una media poblacional Caso A: Cuando la varianza poblacional es conocida.- Cuando 2 σ es conocida y el tamaño de muestra es “grande” y la estadística de prueba a considerarse es: η σ µ − · Ζ X n (0,1) Ejemplo 1: Dado x =6; σ = 1 y η =4 pruebe la µ =5 Si el nivel de significancia es: Solución: ¸ · 5 : 5 : 1 µ µ H H n (0,1) 4 1 5 6 − · Ζ = 2 1 1 =2 , 2 RC ∈ H Se rechaza ó sea que 5 µ Gráficamente 0.95 . 0.05 RA Z= 1.65 RR Ejemplo 2: SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR ESTADISTICA GENERAL En una prueba de aptitud académica, las personas que han concluido sus estudios secundarios deberían tener un promedio de 76.7 puntos. Si se sabe por una investigación anterior sobre el caso, su σ era de 8,6 puntos y si 45 personas que concluyeron estudios secundarios son elegidos al aleatoriamente y alcanza un promedio de 73.2; pruebe la hipótesis: · µ 76.7 contra la hipótesis alternativa de que 7 . 76 ν , con un nivel de significancia de 0,01. Solución: 99 . 0 1 01 . 0 · − · α α n(0,1) 73 . 2 45 6 . 8 7 . 76 2 . 73 − · − · Ζ 73 . 2 − · Ζ RR ∈ ( H se rechaza y se acepta 1 H ) Grafica RR RA 0.1 0.99 Z=-2.33 Ejemplo 3: De una población normal, constituida por la edad de 500 personas adultas que participan en un programa de lucha contra la drogadicción, se extrajo una muestra aleatoria de 16 edades. Se sabe que la 10 · σ años, pero suponemos desconocida la media. Con 05 . 0 · α ; pruebe la hipótesis de que la media poblacional es igual a 49 años. Las muestras son: Solución: Caso B: Cuando no se conoce la varianza poblacional.- En este caso el procedimiento es el mismo, solo cambia la estadística por: η µ s x t − · ; t(n-1) (t de studen con n-1 grados de libertad) Ejemplo 1: Un estudio relativo a 28 familias de la urb. Laderas arrojó un ingreso familiar medio durante 2001 de S/. 6548.00 con σ de S/. 6000.00, frente a la alternativa de que no fue S/. 6000.00, use un nivel de significancia del 5%, s = S/.952.00 Solución: 05 . 0 · α 00 . 6548 . / S X · s = S/.952.00 n=28 η µ s x t − · 07 . 3 28 952 6000 6548 · − · ⇒ t Como el pto 3,07 ⇒ ∈ RR se rechaza H es decir 00 . 6000 . / S ≠ µ RR RA RR SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR 62 43 60 49 72 56 45 46 37 56 41 43 36 45 56 49 ¸ · ptos H ptos H 7 . 76 : 7 . 76 : 1 µ µ η σ µ − · Ζ x ¸ ≠ · 00 . 6000 . / : 00 . 6000 . / : 1 S H S H µ µ ESTADISTICA GENERAL 0.025 0.95 0.025 t = -2.052 t = 2.052 Ejemplo 2: En una muestra aleatoria de 10 sacos de arroz extra, se obtuvo: . 4 . 9 kg X · con . 8 . 1 kg S · ¿contiene esta muestra suficiente evidencia para indicar que el peso medio es menor que 10 Kg. de arroz, a un nivel de significancia de 0.10? Solución Prueba de hipótesis para la proporción poblacional: P La prueba de hipótesis acerca de la proporción “P” de elementos con cierto atributo en una población y es de la forma: P P H ≠ : ó P P H : 1 Su formula es: η / ) 1 ( P P P P − − · Ζ Donde P= η x p · ˆ (Proporción muestral ); n (0,1) si n≥30 Ejemplo 1: Se realizó una encuesta con el fin de estudiar las prácticas sanitarias dentales y las actitudes, de cierta población, de 300 adultos entrevistados, 123 dijeron que regularmente se sometían a una revisión dental dos veces al año. Pruebe la hipótesis nula para P= 0.50 Solución: Si α no indico ⇒ elegimos 05 . 0 · α n=300 (es una muestra grande) η / ) 1 ( 41 . 0 300 123 P P P P P − − · Ζ ⇒ · · 12 . 3 300 / ) 50 . 0 1 ( 50 . 0 50 . 0 41 . 0 − · − − · Ζ Decisión: 0.025 0.95 0.025 - 1.96 1.96 RR RA RR H se rechaza y se puede concluir por tanto que el 50% de la población no se hace una revisión dental dos veces al año. Ejemplo 2: El porcentaje de artículos buenos producidos por un cierto proceso es solo el 90%. Se elige una muestra aleatoria de 625 artículos en un cierto momento y se encuentran que 550 son buenos. Si usted desea rechazar una hipótesis verdadera no más de una vez en 100 ¿concluiría que el porcentaje de artículos buenos producidos por el mencionado proceso es exagerado? Solución: Ejemplo 3: SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR ¸ · P P H P P H : : 1 ¸ ≠ · 50 . 0 : 50 . 0 : 1 P H P H ESTADISTICA GENERAL Los directivos de un determinado programa de televisión pretenden modificar si, por lo menos, un cuarto de los que tienen Tv. No ven el programa regularmente. Una investigación encomendada a una especialización mostró que de 400 familias entrevistadas, 80 ven el programa regularmente. En base a estos datos ¿Cuál debe ser la decisión de los productores? % 5 · α Solución: ACTIVIDAD Nº 11 Para los ejercicios del 1al 4 responda a las siguientes preguntas: a) ¿Es ésta una prueba de una o dos colas? b) ¿Cuál es la regla de decisión? b) ¿Cuánto vale la magnitud estadística de prueba? d) ¿ Cuál es su decisión respecto a H0 e) ¿Cuál es el valor de p? interprete el resultado. 1.-Se ha dado la siguiente información H0 : U = 50 H1 : U ≠ 50 La media muestral es 49 y el tamaño de la muestra es 36. La desviación estándar de la población es 5. Utilice el nivel de significancia de 0.05 2.-Se ha dado la siguiente información H0 : U ≤ 10 H1 : U > 10 La media muestral es 12 y el tamaño de la muestra es 36. La desviación estándar de la población es 3. Utilice el nivel de significancia de 0.02. 3.-Una muestra de 36 observaciones se selecciona de una población normal. La media muestral es 21 y la desviación estándar de la muestra es 5. Efectúe la siguiente prueba de hipótesis utilizando el nivel de significancia de 0.05. H0 : U ≤ 20 H1 : U > 20 4.-Una muestra de 64 observaciones se selecciona de una población normal. La media muestral es 215 y la desviación estándar de la muestra es 15 realice la siguiente prueba de hipótesis utilizando el nivel de significancia de 0.03. H0 : U ≥ 220 H1 : U < 220 5.-La gerencia del banco de crédito está planeando basar los cargos a las cuentas corrientes en el saldo diario promedio, el gerente de cuentas preferenciales desea probar la hipótesis de que las cuentas tienen un promedio de $ 312.00 . Selecciona una muestra de 200 cuentas, dando una media de $ 298.10 con s= $ 97.30 con α = 0.01 6.- En una reunión informativa para una oficina corporativa, el gerente del hotel Presidente de Chimbote, reportó que el número promedio de habitaciones alquiladas por noche es de por lo menos 212. Es decir U ≥ 212. Uno de los funcionarios corporativos considera que esta cifra puede estar algo sobrestimada. Una muestra de 150 noches produce una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. si estos resultados sugieren que el gerente SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR ESTADISTICA GENERAL ha inflado su reporte será amonestado severamente. A un nivel de 1% ¿ Cuál es el destino del Gerente.? 7.- Una encuesta realizada por la Asociación Nacional de Estudiantes Colegiados mostró que los estudiantes de las universidades de la nación gastan en promedio más de $75.00 mensuales en entrenamiento. Si usted puede hallar evidencias para confirmar esta afirmación, podría utilizarla para solicitar a su casa ayuda monetaria adicional. De los 100 estudiantes que tomo como muestra usted halla una media de % 80.23 con una desviación estándar de $45.67 ¿ A un nivel de significancia del 2%, se encuentra justificación para la solicitud? 8.- Un distribuidor de bebidas plantea la hipótesis de que las ventas por mes promedian $12000. Diez meses seleccionados como muestra reportan una media de $ 11277 y una desviación estándar de $ 3772. Si se utiliza el valor α del 5%. ¿ Qué puede concluir acerca de la impresión que tiene el distribuidor sobre las condiciones del negocio? 9.-Una encuesta realizada en 1982 reveló que el 78% de quienes respondieron consideraron que estaban mejor financieramente que sus padres. Una encuesta mas reciente encontró que 370 de las 500 personas quienes respondieron pensaron que sus fortunas financieras eran mejores que la de sus padres. ¿Esto sugiere un descenso en la proporción de personas que consideran que están financieramente más estables de lo que estaban sus padres? Pruebe la hipótesis a un nivel de significancia del 1%. 10. Los directi8vos de un programa de televisión pretender modificar si, por lo menos, un cuarto de los que tienen televisor no ven el programa regularmente. Una investigación encomendada a una empresa especializada mostro que, de 400 familias entrevistadas, 80 ven el programa regularmente. En base a estos datos ¿Cuál debe ser la decisión de los productores? Α = 5% 11.-de una lista de 2000 Clientes de un Banco Comercial se seleccionó una muestra aleatoria para obtener opinión acerca del servicio. En la muestra se halló que 215 no tenían quejas del servicio, 25 tienen quejas y 10 no opinan al respecto. Tradicionalmente el 5% tenían quejas del servicio, sin embargo se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si se quiere una probabilidad de 0.05 de cometer error de tipo I? 12.-En la industria cervecera, los salarios mensuales, siguen una distribución normal con media de $ 600.00 y la desviación estándar $ 40.00. Una compañía cervecera, que emplea a 44trabajadores, les paga un promedio de $ 550.00 al mes. Al nivel de significación del 0.01, se puede decir que la compañía , paga salarios inferiores en el medio.? 13.-en un experimento realizado con un nuevo tranquilizante, se determinó el pulso cardiaca de 12 pacientes antes de administrárseles y una vez más cinco minutos después, se descubrió que su pulso cardiaco se redujo en promedio en 7.2 pulsaciones, con una desviación estándar de 1.8 .Suponiendo que las pulsaciones tienen un nivel de significación de 0.05 se puede concluir que el promedio este tranquilizante reducirá el pulso cardiaco de un paciente en menos de 9.0 pulsaciones 14.- Una industria lechera está estudiando la posibilidad de cambiar sus envases de lata por otro tipo de envases . Pero el cambio no se hará , a no ser que por lo menos 70% de sus clientes lo prefieran. Se hizo una encuesta a 200 de sus clientes, 120 de ellos están a favor del cambio. Hará el cambio de envases a un nivel de significación del 0.05 SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR ESTADISTICA GENERAL Prueba de hipótesis para la diferencia de dos medias poblacionales 1.-Tienes una muestra aleatoria de tamaño n de una población normal. Prueba la siguiente hipótesis al nivel de significancia de 0.01. Indica claramente el valor de la estadística de prueba y la decisión tomada. H0: µx = µy H1: µx ≠ µy nx = 45, ny = 60, x = -2.1, y = -1, σx = 2, σy = 8 2.-El Ministerio de Vivienda ha encargado un estudio a una empresa del mercado sobre el precio de las viviendas nuevas en dos distritos de Lima: A y B. La empresa encargada de realizar el estudio ha recogido información sobre el precio del m2 de 45 viviendas de promotoras distintas seleccionadas al azar en el distrito A y de 40 viviendas, también elegidas aleatoriamente en las promociones de vivienda nueva existente, en el distrito B. En la muestra aleatoria de viviendas del distrito A, el precio medio del m2 ha resultado ser de 980 soles con una desviación estándar de 90 soles, mientras que en la muestra B, el precio del m2 y la desviación estándar son respectivamente de S/. 950 y 70 soles. ¿Puede aceptarse que en los dos distritos no hay diferencia en el precio del m2 de las viviendas diferencia en el precio de nueva construcción parea un nivel de significación del 5%? ¿Proporciona estos datos evidencia suficiente como para fundamentar la opinión del investigador al nivel de significancia del 5%? 3.-. Una agencia de publicidad realizó un estudio para comparar la efectividad de un anuncio en el radio en dos distritos. Después de difundir dicho aviso, se realizó una encuesta telefónica con 600 personas seleccionadas al azar, que viven en cada uno de los distritos resultando proporciones 20% y 18% respectivamente. Verificar, al nivel de significación del 5%, si son iguales las proporciones de personas que escucharon dicho aviso en los dos distritos mediante una prueba unilateral SOLUCIÓN PRUEBA DE INDEPENDECIA CHI- CUADRADO Es un procedimiento de contrastación que utiliza para determinar la dependencia ( relación o asociación ) o independencia entre dos variables categóricas. Los datos pueden disponerse en una tabla de doble entrada llamada Tabla de Contingencia de r filas y k columnas. Pasos a seguir: 1.- Formulación de Hipótesis: H0 : Existe independencia entre las características. H1 : No existe independencia entre las características. 2.- Nivel de significancia: α = 0.05 ó α = 0.01 3.- Estadística de prueba: r k ( fij – eij ) 2 X 2 = ∑ ∑ ---------- --- X 2 i=1 j=1 eij Donde: V = (r-1)(k-1) grados de libertad fi xfj e ij = ------- ; c= √ X0 2 /(n+ X0 2 ) coeficiente n Contingencia. fij : frecuencia observadas eij : frecuencia esperadas. ________ 4.-Si X0 2 ≤ X 2 (1 – α), v se acepta H0 Si X0 2 > X 2 (1 – α), v se rechaza H0 5.- Cálculos: 6.- Decisión: SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR ESTADISTICA GENERAL EJEMPLO 01: Se ha realizado una encuesta entre madres que han establecido una nueva relación de pareja. Se ha preguntado a las mujeres acerca de la relación entre sus hijos y sus nuevas parejas y se ha obtenido los siguientes datos: Se pide: a) Realizar una prueba de Hipótesis para conocer si la percepción de las madres sobre las relaciones de sus hijos y su nueva pareja depende del tipo de unión , con un nivel de confianza del 95 %. b) Calcular e interpretar el coeficiente de contingencia para medir el grado de asociación entre las variables. Solución : 1.-Formulación de Hipótesis H0: La percepción de las madres sobre las relaciones de sus hijos y su nueva pareja es independiente del tipo de unión. H1: La percepción de las madres sobre las relaciones de sus hijos y su nueva pareja dependen del tipo de unión. 2.- Nivel de significancia α = 0.05 3.- Estadística de prueba: 2 3 ( fij – eij ) 2 X 2 = ∑ ∑ ---------- --- X 2 i=1 j=1 eij Donde: r = 2, k = 3 V = (r-1)(k-1) grados de libertad V = 2 4.- Establecimiento de los criterios de decisión 1 – α = 0.95 ; α= 0.05 y el punto Xt 2 = X 2 0.95,2 =5.99 Si X 2 0.95,2 ≤ 5.99; se acepta H0 Si X 2 0.95,2 > 5.99 ; se rechaza H0 fi xfj e ij = ------- ; e 11 = 175x115/373 =54 n e 12 = 175x116/373 = 54.4 e 13 = 175x142/373 = 66.6 e 21 = 198x115/373 = 61.0 e 22 = 198x116/373 = 61.6 e 23 = 198x142/373 = 75.4 Hallando X 2 0 X 2 0 = (60-54) 2 /54 +(60-54.4) 2 /54.4+… + (87-75.4) 2 / 75.4 = 6.15 6.- Decisión Como X 2 0 = 6.15 > 5.99, rechazamos H0, lo que quiere decir que la percepción de la madre sobre las relaciones de sus hijos y su nueva pareja dependen del tipo de SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR Tipo de unión La madre considera a su nueva pareja como total Un verdadero padre Un segund o padre Un ami go Matrim onio 60 60 55 175 Unión de hecho 55 56 87 198 total 115 116 142 373 Tipo de unión La madre considera a su nueva pareja como fi Un verdadero padre Un segund o padre Un amigo Matri monio 60 (54) 60 (54.4) 55 (66.6) 175 Unión de hecho 55 (61) 56 (61.6) 87 (75.4) 198 fj 115 116 142 373 ESTADISTICA GENERAL unión ( la asociación obtenida en la muestra es significativa) b) Calculando el coeficiente de contingencia c= √ X0 2 /(n+ X0 2 ) = √ 6.15/ (6.15+373) =0.13 GUÍA DE TRABAJO Nº12 PRUEBA DE INDEPENDECIA CHI- CUADRADO 1.- Se selecciona una muestra de 800 votantes y se les califica de acuerdo a su nivel de ingresos como : bajo, medio, alto, y según su opinión a una reforma impositiva en : a favor, en contra, sin decisión. Las frecuencias observadas se dan en la siguiente tabla: Son independientes la opinión de los votantes y su nivel de ingresos. Use α = 0.05 2. –Se realizó un estudio para determinar si el tamaño de la familia depende del nivel de educación del padre. La muestra se clasificó de acuerdo al nivel de educación y al número de hijos, en la siguiente tabla : Con estos datos ¿ Se puede inferir que el tamaño de la familia es independiente del nivel de educación del padre ? Use α = 0.05. 3.-Con la finalidad de averiguar si las bajas notas finales obtenidas en el curso de estadística general es producto de las pocas horas dedicadas al estudio del curso durante el ciclo, se obtuvo la siguiente información : Horas dedica das al curso [ 0-5) [5-10) [10-15) [15 -20) Total [ 0 –3 ) 25 15 8 1 49 [ 3 –6 ) 20 10 11 3 44 [ 6 –9 ) 15 8 15 10 48 Total 60 33 34 14 141 Prueba la hipótesis correspondiente, Use α = 0.05 4.-Una encuesta para evaluar la política educativa del ramo se llevó a cabo con 218 padres de familia de 3 estratos sociales A, B y C de una pequeña comunidad. Ante la pregunta ¿ Esta usted de acuerdo con la política educativa del ministerio ? se obtuvieron las siguientes respuestas : Respuesta Estrato Total A B C SI 22 24 20 66 NO 50 42 60 152 Total 72 66 80 218 Realice la prueba de hipótesis correspondiente. Use α = 0.05. SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR OPINIÓN INGRESOS BAJO MEDIO ALTO A favor 200 130 70 En contra 60 60 80 Sin decisión 40 60 100 Nivel de Educación Número de hijos 0- 1 2 3 4 5 a más Primaria 20 18 12 14 30 Secundaria 50 25 18 16 24 Superior 12 6 4 8 12 ESTADISTICA GENERAL SEMESTRE ACADÉMICO-2009-I MG. HERMILIO HUGO VICUÑA SALVADOR