Apuntes de Estadistica II.doc

March 25, 2018 | Author: Sicem Capacitación | Category: Sampling (Statistics), Statistical Hypothesis Testing, Standard Deviation, Probability, Hypothesis


Comments



Description

Estadística IILic. José Francisco Acuña Rendón Estadística Inferencial 0.- Distribución Normal. 1.- Hipótesis nula. Lo que dice la historia. A partir de una encuesta hay que saber si la hipótesis nula es cierta o falsa y así se saca la posibilidad. 2.- Hipótesis alterna.Para la anterior hay que tener Ho: x mayor a 5 o Hi: x menor a 5, o sea que siempre tendremos estas dos posibilidades. 3.- Error tipo I. Rechazar la nula cuando es verdadera. 4.- Error tipo II. Rechazar la nula cuando es falsa. Nivel de significancia –alfa- me da un porcentaje y me dice que tan confiable es la prueba que estoy haciendo v. gr. tomaré una significancia de 5% según la significancia de mi prueba. En una curva normal si coloco los datos a la derecha al 5%, ahí es donde se rechaza la hipótesis nula, si le pongo un 10% entonces le estoy dando más chance a la hipótesis nula. Prueba de correlación lineal. Regresión. Me duele el callo, va a llover. La capacidad productiva del trabajador contra el medio ambiente. Esto seda con un coeficiente de correlación, si tiende a 1 si están relacionados, si tiende a 0 andamos por la casa de la amargura. Relación de causalidad. Que cosa nos hizo llevar a la otra. No importa si tiende a 1, están relacionadas. Y si tiende a 0 no está mal, sólo nos dice que no están relacionadas. Nos podemos encontrar con problemas lineales: y=2x+1 donde x=7 y=15 o cuadráticas donde y= 2x2-13x+15 o peor! Y=ex. Después de esto, vendrá el examen. Examen Tareas Participaciones Acts. Sobresalientes 60% 20% 20% Puntos extra En la segunda parte veremos la té de student y la shi cuadrada, la bondad de ajuste y la homogeneidad. V. gr. acaban de sacar una vacuna y queremos ver si es efectiva. Sacamos una curva de independencia y concluimos si sirve o no, o si influye o no en los resultados. En la tercera parte veremos la estadística no paramétrica, método no muy formal, sencillo, tipo turístico. Tip: Libro: probabilidad y estadística de Walpole, Ronald E. Mc Graw Hill. Apuntes de Ernie Pág. 1 Estadística II Lic. José Francisco Acuña Rendón Ejercicios: Usando las tablas provistas por el maestro. 1.- Entre Z = 0 y Z = 1.2 2.- Entre Z = -0.68 y Z = 0 3.- Entre Z = 0.46 y Z = 2.21 Apuntes de Ernie Pág. 2 Estadística II Lic. José Francisco Acuña Rendón 4.- Entre Z = 0.81 y Z = 1.94 5.- A la derecha de Z = 1.28 6.- Entre Z = -1.62 y Z = 2.31 7.- Entre Z = 0 y Z = 0.3770 se redondea a 0.38 y según la tabla nos da 0.1480 Apuntes de Ernie Pág. 3 Estadística II Lic. José Francisco Acuña Rendón 8.- A la izquierda de Z = 0.8621 9.- Entre Z = -1.5 y Z = 0.022 Ejercicios varios Apuntes de Ernie Pág. 4 Estadística II Lic. José Francisco Acuña Rendón Apuntes de Ernie Pág. 5 Estadística II Lic. José Francisco Acuña Rendón Por lo que para “traducir” las Z´s en X´s se aplica la fórmula, por ejemplo: Z = 98 – 100 = -2 = -0.4 5 5 Z = 110 – 100 = 10 = 2 5 5 El peso medio de 500 estudiantes varones de una Universidad es de 68.5 kg. y la desviación estándar es de 10 kg. Suponiendo que los pesos están distribuidos normalmente, hallar el número de estudiantes que pesan entre 48 y 71 kg. N = 500 estudiantes m = 68.5 kg. t = 10 kg. Entre 48 y 71 kg. Por lo que X1 = 48 X2 = 71 Apuntes de Ernie Pág. 6 Estadística II Lic. José Francisco Acuña Rendón Z = 48 – 68.5 = -2. 05 10 Z = 71 – 68.5 = 0.25 10 por lo que 500 x 0.5785 = 289.25 redondeando 289 estudiantes están entre 48 y 71 kg. En un exámen m = 78 y t = 10 determinar: a) las calificaciones tipificadas para 93 y 62 respectivamente b) determinar los puntajes cuyas calificaciones tipificadas fueron -0.6 y 1.2 para a) Z=x–m t Z1 = 93 - 78 = 1.5 10 Z2 = 62 - 78 = -1.6 10 para b) x=tz+m X1 = 10 (-0.6) + 78 = 72 X2 = 10 (1.2) + 78 = 90 Hallar el área bajo la curva normal entre: a) Z = 1.20 y Z = 2.40 b) Z = 1.23 y Z = 1.87 c) Z = -2.35 y Z = 0.50 a) Apuntes de Ernie Pág. 7 Estadística II Lic. José Francisco Acuña Rendón b) c) Si X está distribuida normalmente con m = 5 y t = 2 hallar la probabilidad de que X sea mayor que 8. entonces: Tarea: Z1 = 8 - 5 = 1.5 2 0.5 – 0.4332 = 0.0668 Si las estaturas de 500 estudiantes están distribuidas normalmente con m = 1.70 m. y t = 10 cm. (0.1 m.) a) ¿cuantos estudiantes tienen estaturas mayores a 1.85 m.? b) ¿cuantos estudiantes tienen estaturas menores a 1.55 m.? c) ¿cuantos estudiantes tienen entre 1.59 m. y 1.81 m.? Apuntes de Ernie Pág. 8 Estadística II Lic. José Francisco Acuña Rendón a) Z = 1.85 – 1.70 = -1.5 (0.4332) 0.1 por lo tanto: 0.5 – 0.4332 = 0.0668 x 500 = 33 estudiantes b) Z = 1.55 – 1.70 = 1.5 (0.4332) 0.1 por lo tanto: 0.5 – 0.4332 = 0.0668 x 500 = 33 estudiantes c) Z1 = 1.59 – 1.70 = -1.1 (0.3643) 0.1 Z2 = 1.81 – 1.70 = 1.1 (0.3643) 0.1 por lo que: (0.3643 x 2 = 0.7286) 0.7286 x 500 = 364 estudiantes La calificación media de un examen final es de 72 puntos y la desviación es de 9 puntos. El 10% superior de los estudiantes recibirán una calificación de excelente: a) ¿cuál es la calificación mínima que debe obtener un estudiante para recibir el calificativo de excelente? b) ¿y si queremos sacar la calificación correspondiente al 25%? Apuntes de Ernie Pág. 9 Estadística II Lic. José Francisco Acuña Rendón La media es 72, la desviación estándar es 9: a) entre 72 y 81 b) 50 y 72 c) mayor a 90 d) menor a 30 e) 60 y 85 f) 75 y 90 g) 30 7 50 a) b) Apuntes de Ernie Pág. 10 Estadística II Lic. José Francisco Acuña Rendón c) d) e) Apuntes de Ernie Pág. 11 Estadística II Lic. José Francisco Acuña Rendón f) g) Tarea: La media es 72, la desviación estándar es 9: a) Entre 72 y 85 b) 40 y 72 c) mayor a 85 d) menor a 45 e) 65 y 78 f) 78 y 87 g) 40 y 55 Apuntes de Ernie Pág. 12 Estadística II Lic. José Francisco Acuña Rendón Apuntes de Ernie Pág. 13 Estadística II Lic. José Francisco Acuña Rendón Real Suponer F I. II. V F Ho Ho II. Error Beta Ho I. Error Alfa Ho El error es suponer que la hipótesis nula es falsa siendo verdadera El error es suponer que la hipótesis nula es verdadera siendo falsa Alfa: probabilidad de rechazar la hipótesis nula siendo verdadera Beta: probabilidad de aceptar la hipótesis nula siendo falsa Apuntes de Ernie Pág. 14 Estadística II Lic. José Francisco Acuña Rendón Los estadísticos usan la palabra población no solo para referirse a personas sino a todos los elementos que se han escogido para el estudio. Los estadísticos usan la palabra muestra para describir una porción escogida de la población. Una estadística es una característica de una muestra Un parámetro es una característica de la población T = característica = muestra X = parámetro = población Tipos de muestreo Hay dos métodos para seleccionar las muestras, a partir de las poblaciones: 1.- Muestreo no aleatorio o a juicio. 2.- Muestreo aleatorio o no probabilístico En el muestreo probabilístico todos los elementos de la población tienen la misma oportunidad de ser escogidos en la muestra. En el muestreo a juicio se usa el conocimiento y la opinión personal para identificar aquellos elementos de la población que deberán estar incluidos en la muestra. Como hacer un muestreo aleatorio La mejor manera para seleccionar aleatoriamente a una muestra, es usando números aleatorios. Estos se pueden generar por un computador, programa para mezclar números o por una tabla de números aleatorios. Definición de muestreo aleatorio simple Selecciona las muestras por métodos que le permiten a cada muestra tener igual probabilidad de ser tomada y a cada elemento de toda la población de tener un chance igual de ser incluido en la muestra. Introducción a las distribuciones muestrales Una distribución de probabilidad de todas las medias posibles, de las muestras es una distribución de la media muestral. Los estadísticos las llaman una distribución muestral de la media. Apuntes de Ernie Pág. 15 Estadística II Lic. José Francisco Acuña Rendón “Si aumentamos el tamaño de la muestra la dispersión baja porque se acerca ala media de la población” Las medias de las muestras tienden a la media de la población. 9 / raíz de 9 = 3 9 / raíz de 64 = 1.125 9 / raíz de 100 = 0.9 9 / raíz de 144 = 0.062 al subir el n la desviación baja. Apuntes de Ernie Pág. 16 Estadística II Lic. José Francisco Acuña Rendón Apuntes de Ernie Pág. 17 Estadística II Lic. José Francisco Acuña Rendón Supóngase que el contenido de alquitrán en los cigarrillos se distribuye normalmente con una media de 10 y una desviación estándar de 2.4 mg. Se desarrolla un nuevo proceso de manufactura para disminuir el contenido de alquitrán a 8 mg. Sin que cambie la desviación típica. Una muestra de 16 cigarrillos producidos mediante el mismo proceso proporciona una media de 8.8 mg. Se preguntan ¿se rechazaría la Ho si tomamos una alfa de 0.05? Sea x el salario mensual inicial para alguien que acaba de graduarse de una universidad. Se sospecha que el salario medio mensual es de más de $1,200.00 y no $1,200.00 o menos como alguien predijo. Considérese que se sabe que la desviación estándar es de $50.00. se toma una muestra aleatoria de 1,000 graduados y se determina la media de $1,200.00 dólares. ¿Qué podemos afirmar con un nivel de significación del 1%? Apuntes de Ernie Pág. 18 Estadística II Lic. José Francisco Acuña Rendón Considérese un fabricante que suministra los ejes traseros para un modelo de automóvil. Por un lado, estos ejes deben estar en condiciones de soportar 80,000 lb/sq.in. en pruebas de resistencia. También un eje excesivamente fuerte eleva los costos de producción. La experiencia indica que la desviación estándar de la resistencia de los ejes es de 4,000 lb/sq.in. El fabricante selecciona una muestra de 100 ejes de la última producción, los prueba y encuentra que la capacidad de resistencia media de la muestra es de 79,000 lb/sq.in. Si el fabricante de ejes usa un nivel de significancia de 0.05 en sus pruebas ¿Sus ejes cumplirán sus requisitos de resistencia? M = 80,000 lb/sq.in. T = 4,000 lb/sq.in. Ho: m = 80,000 lb/sq.in. Hi: m no es igual a 80,000 lb/sq.in. N = 100 X = 79,000 lb/sq.in. Alfa = 0.05 Tarea: El resultado promedio sobre una prueba de aptitud administrada nacionalmente fue de 76 y la desviación correspondiente fue de 8. Con el fin de evaluar el estado del sistema de educación, se escogieron al azar a 100 estudiantes del estado de Guanajuato; estos estudiantes tuvieron un resultado promedio de 72. a) El estado desea conocer si hay una diferencia significativa entre los resultados locales y los nacionales. b) Pruebe su hipótesis a un nivel de significación del 5% Apuntes de Ernie Pág. 19 Estadística II Lic. José Francisco Acuña Rendón C7 = 5 7! = 7! = 6 * 7 5! (7-5)! 5! 2! 2 = 21 =6/2*7 = 42 / 2 C6 = 3 = 21 = 21 6! = 6! = 20 3! (6-3)! 3! 3! = 4*5*6 = 4*5 = 20 3*2*1 Binomios Reciben su nombre del binomio de Newton (x+y)2 = x2 + 2xy + y2 (x+y)3 = x3 + 3x2y + 3xy2 + y2 (x+y)4 = x4 + 4x3y + 6x2y2 + 4xy3 + y4 3*4/2=6 6*2/3=4 (x+y)4 = (x+y)2 (x+y)2 = (x2 + 2xy+y2) (x2 + 2xy+y2) = x4 + 2x3y + x2y2 2x3y + 4 x2y2 + 2x y3 x2y2 + 2x y3 + y4 _____________________________________ = x4 + 4 x3y + 6 x2y2 + 4 x y3 + y4 Binomio de Newton N n (x+y) = E i=0 n–i C X i Y n i (x+y)4 = (4C0 X4-0 Y0) +(4C1 X4-1 Y1) +(4C2 X4-2 Y2) +(4C3 X4-3 Y3) + (4C4 X4-4 Y4) = esto se lee: combinación de 4 objetos tomados de 3 en 3 x4 + 4x3y + 6x2y2 + 4xy3 + y4 C0 X4-0 Y0 = 1 * X4 * Y0 = 1 * X4 * 1 = X4 4 De aquí se desarrolla la distribución binomial para experimentos donde solo hay éxito o fracaso; solo 2 opciones; v. gr. lanzar una moneda (cara o cruz); dos dados para sacar 7 (o saco 7 o no saco 7). Apuntes de Ernie Pág. 20 Estadística II Lic. José Francisco Acuña Rendón Clase de Chely en sustitución del Ing. Acuña. y = aciertos p = probabilidad de aciertos q = probabilidad de falla (q=1-p) n = total de ensayos Cerveza si: i i i i i no: i i i i i Cota de error 2Op = 2  pq / n Estimador: p=y/n Op =  pq / n por lo de las 2s de la regla empírica P = 5 / 10 = 0.5, esto no es exacto, aún no podemos decir que el 50% del salón chupa; por eso hay que buscar la cota de error. Op =  0.5 * (1-0.5) / 10 =  0.025 = 0.158; por lo tanto la cota de error es igual a: 2Op = 2  pq / n 2OP = 2 (0.158) = 0.316, esta es la cota de error, ahora se le sumará y/o restará a p, por lo que: 0.5 – 0.316 = 0.184 0.5 + 0.316 = 0.816 Ejercicio: Una liga nacional de sindicatos obreros, necesita estudiar la población de obreros no sindicalizados que estarían a favor de una huelga nacional. 60 de 200 obreros entrevistados se encontraron a favor de la huelga. Estimar la proporción de obreros que está a favor de la huelga y determinar una cota de error de estimación. 1 5 y = 60 n = 200 Op =  0.3 * 0.7 / 200 =  0.00105 = 0.03240 2 p= 0.3 (q=1-p) 6 3 2 Op = 2 (0.03240) = 0.064 q = 0.7 4 p = y / n = 60 / 200 = 0.3 7 0.3 – 0.064 = 0.23 0.3 + 0.064 = 0.36 Apuntes de Ernie Pág. 21 Estadística II Lic. José Francisco Acuña Rendón Clase del profe: B(x, n, p) = nCx px qn-x M=np t =  npq =  npq / n =  npq / n2 =  pq / n t =  pq / n ************************ n = 75 p = 0.4 = 40% q = 0.6 = 60% (q=1-p) m = np = 75 (0.4) = 30 t =  pq / n =  0.4 * 0.6 / 75 = 0.056 p = 26 alfa = 0.10 En una campaña gubernamental una encuesta previa a las elecciones, hecha entre 100 votantes, dio al Sr. Hernández el 60% del electorado a su favor. a) estime el error estándar de la proporción de votantes a favor del Sr. Hernández. b) Determine si podemos sostener que el tiene el 62% del electorado a su favor con un nivel de significación del 5% n = 100 p = 60%, este es p poblacional por que nos lo dio la muestra p = 62% = 0.62 q = 38% = 0.38 alfa = 5% = 0.05 Apuntes de Ernie Pág. 22 Estadística II Lic. José Francisco Acuña Rendón m = np = 100 * 0.62 = 62 Tp =  pq / n =  0.62 * 0.38 / 100 = 0.048 Ho: p = 62 Hi: p no es igual a 62 Supóngase que cierto programa de noticias generalmente atrae el 50% de todos aquellos que ven la televisión durante el periodo de que el programa sale al aire. El conductor normal ha renunciado y se ha contratado a una mujer para reemplazarlo. La gerencia de la red televisiva desea determinar si con la nueva conductora ha aumentado el porcentaje de personas que ven el programa. Se realiza una encuesta telefónica. Se descubre que 55 de 100 personas que ven la televisión mientras el programa de noticias está al aire ven este programa en particular. Pruébese la hipótesis de que el porcentaje de los que ven el programa ha permanecido sin cambio contra la alternativa de que ha aumentado bajo un nivel de significación del 5%. Apuntes de Ernie Pág. 23 Estadística II Lic. José Francisco Acuña Rendón Un banco seleccionó aleatoriamente a 225 clientes con cuenta de cheques y determinó que 90 de ellos también tenían una cuenta de ahorros en el banco. El objetivo del banco es que al menos el 45% de sus clientes con cuenta de cheques tengan una cuenta de ahorros simultáneamente. ¿ha proporcionado la muestra suficiente evidencia de que el banco ha logrado este objetivo para alfa igual a 0.05? Tarea: Se ha insinuado que los maestros se han vuelto más despreocupados al calificar a sus estudiantes. En el pasado 80% de todos los estudiantes universitarios de primer año obtenían C o calificaciones superiores. Una encuesta de la clase más reciente de estudiantes universitarios de primer año muestra que 8,100 de los 10,000 estudiantes universitarios de primer año de la muestra recibieron calificaciones de C o mayores. ¿es verdad que los profesores se han vuelto más despreocupados si el nivel de significación es del 1%? Apuntes de Ernie Pág. 24 Estadística II Lic. José Francisco Acuña Rendón Registros anteriores muestran que el 20% de todas las mujeres se casan en el año siguiente a su graduación de preparatoria se sospecha que el porcentaje ha cambiado. Se seleccionaron y entrevistaron 225 muchachas y se determinó que 54 de ellas se casaron al año siguiente de su graduación de preparatoria. Pruébese la hipótesis de que la proporción de muchachas que se casan en el año siguiente a su graduación de preparatoria sigue siendo el 20% contra la hipótesis alternativa de que ha cambiado para un alfa igual al 5%. Regresión lineal El objetivo principal al evaluar la relación entre dos variables es realizar predicciones más precisas si se ha establecido una relación entre los valores de dos variables, entonces, conocer el valor de una variable ayudará a conocer el valor de la otra. Es importante recordar que las relaciones entre dos variables no necesariamente son relaciones de causa – efecto o causales. Una relación causal implica que la variable independiente es la causa y la variable dependiente el efecto. Y = a + b x su gráfica será una línea recta Y=7+3x Y = 7 + 3 (-2) Y=7–6=1 X 2 0 1 5 7 Y 1 7 10 22 28 Apuntes de Ernie Pág. 25 Estadística II Lic. José Francisco Acuña Rendón X 0 2 4 6 8 10  30  X Fórmula X2 0 4 16 36 64 100  220 2  X Y 5 0 -8 -13 -22 -25  -63  Y XY 0 0 -32 -78 -176 -250  -536  XY Y* 5.28 -1.02 -7.32 -13.62 -19.92 -26.22  Y* a = ( x2)( y) – ( x)( xy) n ( x2 ) - ( x)2 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 a = (220 (-63) – 30 ( -536) 6 (220) - 900 = 13,860 – 16,080 = -2220 420 420 a = 5.2857 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 = 6 (-536) – 30 (-63) = -3216 + 1890 = -1326 6 (220) – (30)2 420 420 b = -3.157 entonces: Apuntes de Ernie Pág. 26 Estadística II Lic. José Francisco Acuña Rendón y* = a + b x y* = 5.28 + (-3.15) x por lo tanto para x = 6 y* = 5.28 + (-3.15)(6) = 5.28 – 18.9 y* = -13.62 i 1 2 3 4 5 6 7  X -1 1 3 2 4 7 5 21 Y -1.5 5.2 10 7.5 12 24 17.5 75.7 X2 1 1 9 4 16 49 25 105 XY 1.5 5.2 30 15 52 168 87.5 359.2 Y* -1.78 4.52 10.82 7.67 13.97 23.42 17.12 --- a = ( x2)( y) – ( x)( xy) n ( x2 ) - ( x)2 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 y = a + bx por lo tanto … a = 105 (75.7) – 21 (359.2) = 7948.5 – 7543.2 = 405.3 = 1.3785 7 (105) – (21)2 735 – 441 294 b = 7 (8359.2) – 21 (75.7) = 2514.4 – 1589.7 = 924.7 = 3.1452 redondeado = 3.15 7 (105) – (21)2 735 – 441 294 y = 1.37 + 3.15 (-1) = -1.78 y = 1.37 + 3.15 (1) = 4.52 y = 1.37 + 3.15 (3) = 10.82 y = 1.37 + 3.15 (2) = 7.67 y = 1.37 + 3.15 (4) = 13.97 y = 1.37 + 3.15 (7) = 23.42 y = 1.37 + 3.15 (5) = 17.12 Ahora podremos predecir si x = 10 y sería igual a 32.87 porque y = 1.37 + 3.15 (10) = 32.87, y así si x = 6; y = 20.27 Apuntes de Ernie Pág. 27 Estadística II Lic. José Francisco Acuña Rendón i 1 2 3 4 5 6 7  X -1 1 3 2 4 7 5 21 Y -1.5 5.2 10 7.5 12 24 17.5 75.7 X2 1 1 9 4 16 49 25 105 XY 1.5 5.2 30 15 52 168 87.5 359.2 Y* -1.78 4.52 10.82 7.67 13.97 23.42 17.12 --- (Y – Y*)2 0.0784 0.4624 0.6724 0.0289 0.9409 0.3364 0.1444 2.6638 Mucho cuidado con los signos; por ejemplo: [-1.5 - (-1.78)]2 = (-1.5+1.78)2 = (0.28)2 = 0.0784 T = raíz de 2.6638 / 7 – 1 = raíz de 2.6638 / 6 = raíz de 0.4439 = 0.6663 = redondeado 0.67; por lo tanto Y* = 1.37 + 3.15x más menos 0.67 (error estimado en nuestros cálculos) “la palabra perro no es la que muerde” x = 10 (porque él quizo) y* = 1.37 + 3.15 (10) más menos 0.67 y* = 32.87 más menos 0.67 (osea y es mayor a 32.2 o menor a 33.54) hasta aquí determinamos la fórmula de regresión y el margen de error, nos falta correlacionar. Ejemplos de aplicación; rendimiento, donde: Y = ½ gt2 T = raíz de 2y / g = raíz de 2(0.15) / 9.81 = 0.1748 mi tiempo de reacción; al agarrar una regla o tomamos a dos personas y tomamos sus tiempos de reacción. Si x = 6 y* = 1.37 + 3.15 (6) más menos 0.67 y* = 20.27 más menos 0.67 (osea y es mayor a 19.6 o menor a 20.94) Si x = 4 y* = 1.37 + 3.15 (4) más menos 0.67 y* = 13.97 más menos 0.67 (osea y es mayor a 13.30 o menor a 14.64) Apuntes de Ernie Pág. 28 Estadística II Lic. José Francisco Acuña Rendón En una compañía de seguros se desea determinar la relación entre la experiencia en ventas y el volumen de las mismas. Se selecciona una muestra aleatoria de 9 vendedores. Se encuentra que sus años de experiencia “x” y ventas anuales “y” son los siguientes: i 1 2 3 4 5 6 7 8 9 X 1 2 3 4 5 6 7 8 9 Y 2 1 3 3 4 5 6 5 7 Estímese el volumen de ventas anuales para un vendedor que tiene una experiencia en ventas de 10 años. a = ( x2)( y) – ( x)( xy) n ( x2 ) - ( x)2 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 y = a + b(x) por lo tanto … a = 285 (36) – 45 (220) = 10260 – 9900 = 4360 = 0.6666 = redondeado = 0.667 9(285) – (45)2 2565 - 2025 540 b = 9(220) – 45(36) = 1980 - 1620 = 360 = 0.6666 = redondeado = 0.667 9(285) – (45)2 2565 - 2025 540 i X 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 45  Y $100,000.00 2 1 3 3 4 5 6 5 7 36 X2 XY Y* (Y – Y*)2 1 4 9 16 25 36 49 64 81 285 2 2 9 12 20 30 42 40 63 220 1.334 2.001 2.668 3.335 4.002 4.669 5.336 6.003 6.670 - 0.4436 1.0020 0.1102 0.1122 0.0000 0.1096 0.4409 1.0060 0.1089 3.3334 Y* = a + b x = 0.667 + 0.667 x Apuntes de Ernie Pág. 29 Estadística II Lic. José Francisco Acuña Rendón (y – y*)2 (2 – 1.334)2 = 0.4436 (1 – 2.002)2 = 1.0020 (3 – 2.668)2 = 0.1102 (3 – 3.335)2 = 0.1122 (4 – 4.002)2 = 0.0000 (5 – 4.669)2 = 0.1096 (6 – 5.336)2 = 0.4409 (5 – 6.003)2 = 1.0060 (7 – 6.670)2 = 0.1089 2  (y – y*) = 3.3334 Y=a+bx Y* = 0.667 + 0.667 (1) = 1.334 Y* = 0.667 + 0.667 (2) = 2.001 Y* = 0.667 + 0.667 (3) = 2.668 Y* = 0.667 + 0.667 (4) = 3.335 Y* = 0.667 + 0.667 (5) = 4.002 Y* = 0.667 + 0.667 (6) = 4.669 Y* = 0.667 + 0.667 (7) = 5.336 Y* = 0.667 + 0.667 (8) = 6.003 Y* = 0.667 + 0.667 (9) = 6.670 T = raíz de  (y – y*)2 / n – 1 = raíz de 3.3334 / 8 = 0.65 por lo que … Y* = 0.667 + 0.667 (x) más menos 0.65 Y* = 0.667 + 0.667 (10) más menos 0.65 Y* = 0.667 + 6.67 más menos 0.65 Por lo tanto: Y es mayor o igual a 6.687 o menor o igual a 7.987, en otras palabras 6.687 x $10,000.00 y 7.987 x $100,000.00 y será mayor o igual a $668,700.00 o menor o igual a $798,700.00 Tarea para entregar: Se realiza una experimento para determinar la relación entre la precipitación pluvial y el rendimiento del trigo. Se obtienen los siguientes datos; la “x” representa la precipitación pluvial y la “y” el rendimiento del trigo en toneladas. i 1 2 3 4 5 6 7 8 9 10 X 1 2 3 4 5 5 6 7 8 9 Y 1 3 2 5 5 4 7 6 9 8 Haga una estimación acerca del rendimiento del trigo, si la precipitación pluvial es de 4.5. a = ( x2)( y) – ( x)( xy) Apuntes de Ernie Pág. 30 Estadística II Lic. José Francisco Acuña Rendón n ( x2 ) - ( x)2 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 y = a + b(x) por lo tanto … a = 310(100) – 50(306) = 31000 – 15300 = 15700 = 26.1666 = redondeado = 26.17 10(310) – (50)2 3100 - 2500 600 b = 10(306) – 50(100) = 30600 - 5000 = 25600 = 42.6666 = redondeado = 42.67 10(310) – (50)2 3100 - 2500 600 i X Y X2 XY Y* 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 5 6 7 8 9 50 1 3 2 5 5 4 7 6 9 8 100 1 4 9 16 25 25 36 49 64 81 310 1 6 6 20 25 20 42 42 72 72 306 -  (Y – Y*)2 Y* = a + b x = 26.17 + 42.67 x Y=a+bx Y* = 26.17 + 42.67 (1) = 68.84 Y* = 26.17 + 42.67 (2) = 111.15 Y* = 26.17 + 42.67 (3) = 154.18 Y* = 26.17 + 42.67 (4) = 196.85 Y* = 26.17 + 42.67 (5) = 239.52 Y* = 26.17 + 42.67 (5) =239.52 Y* = 26.17 + 42.67 (6) = 282.19 Y* = 26.17 + 42.67 (7) = 324.86 Y* = 26.17 + 42.67 (8) = 367.53 Y* = 26.17 + 42.67 (9) =410.20 (y – y*)2 (1 – 68.84)2 = 4,602.26 (3 – 111.15)2 = 11,696.42 (2 – 154.18)2 = 23,158.75 (5 – 196.85)2 = 36,806.42 (5 – 239.52)2 = 54,999.63 (4 – 239.52)2 = 55,469.67 (7 – 282.19)2 = 75,729.53 (6 – 324.86)2 = 101,671.69 (9 – 367.53)2 = 128,543.76 (8 – 410.20)2 = 161,764.84 2  (y – y*) = 654,442.97 Apuntes de Ernie Pág. 31 Estadística II Lic. José Francisco Acuña Rendón T = raíz de  (y – y*)2 / n – 1 = raíz de 654,442.97/10 = 255.82 por lo que … Y* = 26.17 + 42.67 (x) más menos 255.82 Y* = 26.17 + 42.67 (4.5) más menos 255.82 Y* = 26.17 + 192.015 más menos 255.82 Por lo tanto: Y es mayor o igual a -37.63 o menor o igual a 474.005 -37.63 x TONELADA y 474.005 x TONELADA y será mayor o igual a -37.63 TONELADAS o menor o igual a 474.005 TONELADAS Coeficiente de correlación r = ____________n( xy) - ( x)( y)______________ [(raíz de n ( x2 ) - ( x)2 ] [(raíz de n ( y2) – ( y)2 ] r = _______________10(306) - (50)(50)_______________ [(raíz de 10 (310) - (2500) ] [(raíz de 10(310) – (2500) ] r = ________3060 – 2500________ (raíz de 600) (raíz de 600) r = ___560____ 24.49 (24.49) r = 560 / 599.76 = 0.933 “Y es mayor o igual a -1 y Y es menor o igual a 1”    Si se acerca a 1 o -1 están relacionadas Si sale 0 no están relacionadas Si sale -1 una crece y la otra decrece Cálculo de la regresión del aprovechamiento en la universidad, con respecto al aprovechamiento del bachillerato para 20 estudiantes. Apuntes de Ernie Pág. 32 Estadística II Lic. José Francisco Acuña Rendón Estudiantes bachillerato universidad i var. indep. var. dep. –x–y1 3 5 2 2 4 3 4 4 4 12 9 5 11 8 6 8 9 7 9 7 8 7 8 9 6 5 10 5 6 11 4 8 12 8 4 13 3 7 14 12 6 15 9 8 16 8 5 17 11 10 18 7 7 19 8 6 20 10 5 Sumatoria 147 131 X2 Y2 XY Y* (y – y*)2 9 4 6 144 121 64 81 49 36 25 16 64 9 144 81 64 121 49 64 100 1261 25 16 16 81 64 81 49 64 25 36 64 16 49 36 64 25 100 49 36 25 921 15 8 16 108 88 72 63 56 30 30 32 32 21 72 72 40 110 49 48 50 1012 5.36 5.09 5.63 7.79 7.52 6.71 6.98 6.44 6.17 5.90 5.63 6.71 5.36 7.79 6.98 6.71 7.52 6.44 6.71 7.25 - 0.1296 1.1881 2.6569 1.4641 0.2304 5.2441 0.0200 2.4336 1.3689 0.0100 5.6169 7.3441 2.6896 3.2041 1.0404 2.9241 6.1504 0.3136 0.5041 5.0625 49.5759 a = ( x2)( y) – ( x)( xy) n ( x2 ) - ( x)2 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 y = a + b(x) por lo tanto … a = 1261(131) – 147(1012) = 1261(131) – 147(1012) = 165191 - 148764 = 16427 = 4.55 20(1261) – (147)2 20(1261) – 21609 25220 – 21609 3611 b = 20(1012) – 147(131) = 320248 - 19257 = 983 = 0.27 20(1261) – (147)2 20(1261) – 21609 3611 por lo tanto … Y* = 4.55 + 0.27 (x) 4.55 + 0.27 4.55 + 0.27 (x) 3 = Y* = 5.36 (y - y*) 5 -5.36 2 2 = 0.1296 Apuntes de Ernie Pág. 33 Estadística II Lic. José Francisco Acuña Rendón 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 4.55 + 0.27 2 4 12 11 8 9 7 6 5 4 8 3 12 9 8 11 7 8 10 = = = = = = = = = = = = = = = = = = = 5.09 5.63 7.79 7.52 6.71 6.98 6.44 6.17 5.90 5.63 6.71 5.36 7.79 6.98 6.71 7.52 6.44 6.71 7.25 4 4 9 8 9 7 8 5 6 8 4 7 6 8 5 10 7 6 5 -5.09 -5.63 -7.79 -7.52 -6.71 -6.98 -6.44 -6.17 -5.90 -5.63 -6.71 -5.36 -7.79 -6.98 -6.71 -7.52 -6.44 -6.71 -7.25 2 = 1.1881 = 2.6569 2 = 1.4641 2 = 0.2304 2 = 5.2441 2 = 0.0200 2 = 2.4336 2 = 1.3689 2 = 0.0100 2 = 5.6169 2 = 7.3441 2 = 2.6896 2 = 3.2041 2 = 1.0404 2 = 2.9241 2 = 6.1504 2 = 0.3136 2 = 0.5041 2 = 5.0625 Sumatoria = 49.5759 2 T = raíz de  (y – y*)2 / n – 1 = raíz de 49.5957 / 19 = 1.62 por lo que … Y* = 4.55 + 0.27 x más menos 1.62 Coeficiente de correlación r = ____________n( xy) - ( x)( y)______________ [(raíz de n ( x2 ) - ( x)2 ] [(raíz de n ( y2) – ( y)2 ] r = _______________20(1012) - (147)(131)_______________ [(raíz de 20 (1261) - (147)2 ] [(raíz de 20(921) – (131)2 ] r = ______________20240 – 19257____________ (raíz de 25220 - 21609) (raíz de 18420 - 17161) r = ___983____ 60.09 (35.48) r = 983 / 2131.99 = 0.4610 “Y es mayor o igual a -0.5 y Y es menor o igual a 0.5” Apuntes de Ernie Pág. 34 Estadística II Lic. José Francisco Acuña Rendón Un psicólogo realiza un experimento para determinar si existe relación entre la edad de los niños y el no. de respuestas correctas que proporcionan. Se obtienen los siguientes datos totales. Sumatorias, de: X = 550, XY = 45,900, Y = 680, X2 = 38,500, N = 10, Y2 = 56,000. En donde N es el tamaño de la muestra, X es la edad del niño y Y son las respuestas correctas del psicólogo durante el experimento; determínese: a) el coeficiente de correlación b) diga si existe alguna relación entre la edad del niño y el no. de respuestas correctas. Coeficiente de correlación r = ____________n( xy) - ( x)( y)______________ [(raíz de n ( x2 ) - ( x)2 ] [(raíz de n ( y2) – ( y)2 ] r = _______________10(45,900) - 550(680)_______________ [(raíz de 10 (38,500) - (550)2 ] [(raíz de 10(56,000) – (680)2 ] r = ______________459,000 – 374,000____________ (raíz de 385,000 – 302,500) (raíz de 560,000 – 462,400) r = ___85,000____ 287.22 (312.40) r = 85,000 / 89,727.52 = 0.947 = 0.95 Sí se acerca a 1, por lo que si están relacionadas las edades de los niños con el numero de respuestas correctas. Tarea para el próximo martes, en papel milimétrico el diagrama de dispersión. Sean X y Y las estaturas de padre e hijo; los siguientes datos muestran las estaturas de 10 padres y de sus hijos. a) grafíquense los datos en un diagrama de dispersión b) obtenga la recta de mínimos cuadrados y grafíquense sobre el diagrama de dispersión c) calcúlese el coeficiente de correlación d) ¿existe una relación significativa entre X y Y? Apuntes de Ernie Pág. 35 Estadística II Lic. José Francisco Acuña Rendón b) i 1 2 3 4 5 6 7 8 9 10 Sumatoria X cm 162 158 168 177 170 155 175 157 150 178 1650 Y cm 165 160 160 180 172 155 170 160 155 173 1650 X2 Y2 XY 26,244 27,225 26,730 24,964 25,600 25,280 28,224 25,600 26,880 31,329 32,400 31,860 28,900 29,584 29,240 24,025 24,025 24,025 30,625 28,900 29,750 24,649 25,600 25,120 22,500 24,025 23,250 31,684 29,929 30,794 273,144 272,888 272,929 Y* 162.80 159.76 167.36 174.20 168.88 157.48 172.68 159.00 153.68 174.96 (y – y*)2 4.8400 0.0576 54.1696 33.6400 9.7344 6.1504 7.1824 1.0000 1.7424 3.8416 122.3584 a = ( x2)( y) – ( x)( xy) n ( x2 ) - ( x)2 b = n ( xy) – ( x)( y) n ( x2) – ( x)2 y = a + b(x) por lo tanto … a = 273,144 (1650) – 1650 (272,929) = 450,687,600 - 450,332,850 = 354,750 = 39.68 10 (273,144) - (1,650) 2 2,731,440 - 2,722,500 8,940 b = 10 (272,929) – 1650 (1650) = 2,729,290 - 2,722,500 = 6790 = 0.7595 = 0.76 10 (273,144) - (1,650) 2 2,731,440 - 2,722,500 8,940 por lo tanto … Y* = 39.68 + 0.76 (x) 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 39.68 + 0.76 (x) 162 158 168 177 170 155 175 157 150 178 = = = = = = = = = = = Y* 162.80 159.76 167.36 174.20 168.88 157.48 172.68 159.00 153.68 174.96 (y 165 160 160 180 172 155 170 160 155 173 - y*) 2 162.80 2 = 4.8400 2 159.76 = 0.0576 2 167.36 = 54.1696 174.20 2 = 33.6400 2 168.88 = 9.7344 157.48 2 = 6.1504 2 172.68 = 7.1824 159.00 2 = 1.0000 2 153.68 = 1.7424 2 174.96 = 3.8416 Sumatoria = 122.3584 T = raíz de  (y – y*)2 / n – 1 = raíz de 122.3584 / 9 = 3.687 = 3.69 por lo que … Apuntes de Ernie Pág. 36 Estadística II Lic. José Francisco Acuña Rendón Y* = 39.68 + 0.76 x más menos 3.69 c) Coeficiente de correlación r = ____________n( xy) - ( x)( y)______________ [(raíz de n ( x2 ) - ( x)2 ] [(raíz de n ( y2) – ( y)2 ] r = _______________10(272,929) - (1650)(1650)_______________ [(raíz de 10 (273,144) - (1650)2 ] [(raíz de 10(272,888) – (1650)2 ] r = _________________2,729,290 – 2,722,500________________ (raíz de 2,731,440 – 2,722,500) (raíz de 2,728,880 – 2,722,500) r = ___6790____ 94.55 (79.87) r = 6,790 / 7,551.7085 = 0.8991 d) r es igual a 0.8991 por lo que se acerca a uno y podemos deducir que se relacionan significativamente X y Y osea las estaturas de padres e hijos. Ya vimos que para la población tenemos a: m, T y para una muestra está: x, S donde z = x – m entre la raíz cuadrada de T sobre la raíz de n que nos llevaba a la fórmula de x = Z por T entre la raíz de n más m. Ahora no tenemos T y en lugar de Z´s tendremos T´s. por lo que ahora T = x – m entre s sobre la raíz de n. Ahora usaremos la desviación estándar de la muestra S. Relacionaremos el apéndice D, que nos dio el maestro. Prueba “T” En este caso se continúa el análisis de las técnicas para pruebas de hipótesis. En ejemplos anteriores se han tenido situaciones en donde el investigador conoce la varianza de la población (s2) [si conocemos el cuadrado como dijo el compadre, pos sácale la raiz]. Sin embargo en la mayor parte de los casos el investigador posee solamente datos muestrales y no conoce la desviación típica o estándar de la población. Distribución “T” Recuerde que en problemas anteriores se utilizó la letra Z como estadístico de prueba, esto lo hacíamos al conocer la desviación estándar de población. Apuntes de Ernie Pág. 37 Estadística II Lic. José Francisco Acuña Rendón Ahora utilizaremos la letra T en la prueba de hipótesis con respecto a una media de la población m, considérese la naturaleza de la distribución T, la cuál proporciona el valor crítico … La cara de las Z´s por lo general es más puntiaguda que las T´s. (estas son expresiones matemáticas y no nos vamos a acalambrar con ellas) Supóngase que cierto problema implica un nivel de significación del 5% (0.05) y una muestra de 20 observaciones (o elementos) obténgase los valores críticos de T para a) una prueba de una cola o de extremo superior b) una prueba de extremo inferior c) una prueba de dos extremos alfa = 0.05 n = 20 v = n – 1 = 20 – 1 = 19 grados de libertad a) Apuntes de Ernie Pág. 38 Estadística II Lic. José Francisco Acuña Rendón b) c) alfa = 0.05 n=6 extremo superior alfa = 0.05 n = 11 2 extremos Apuntes de Ernie Pág. 39 Estadística II Lic. José Francisco Acuña Rendón alfa = 10% n = 16 Extremo inferior alfa = 40% n = 21 extremo inferior alfa = 25% n = 31 extremo superior Apuntes de Ernie Pág. 40 Estadística II Lic. José Francisco Acuña Rendón Debido a las ciertas ventajas que un vendedor de automóviles ofrece a sus clientes, se sospecha que su margen promedio de beneficio por auto vendido está por abajo del promedio nacional de 500 dólares. Se realiza un estudio para determinar si realmente este es el caso. Una muestra aleatoria de 25 ventas muestra una media de 485 dólares y una desviación típica de 45 dólares. Considerando que el margen de beneficio por cada auto vendido se distribuye normalmente ¿puede llegarse a la conclusión de que su margen promedio de beneficio es en realidad significativamente menor de 500 dólares para un nivel de significación del 5%? 1. m = 500 n = 25 x media = 485 ………… * alfa = 5% = 0.05 2. Ho: m = 500 Hi: m menor a 500 3. v = n-1 = 25-1 = 24 4. y 5. 6. Xc= Tc S/raíz de n + m = (-1.71)(45/raíz de 25)+500 = 484.61 7. Regla de rechazo si X media es menor a Xc entonces la Ho se rechaza 8. Conclusión como 485 no es menor a 484.61 la Ho se acepta Apuntes de Ernie Pág. 41 Estadística II Lic. José Francisco Acuña Rendón La oficina federal de alimentos y drogas está realizando una prueba para determinar si una nueva medicina tiene el indeseable efecto lateral de elevar la temperatura del cuerpo. Se entiende que la temperatura del cuerpo. Se entiende que la temperatura del cuerpo del humano se distribuye normalmente con una media de 98.6 grados. Se administra la nueva medicina a 9 paciente. Se toma la temperatura a 5 personas y se obtiene una media de 99 grados y una desviación típica de 0.36 grados. ¿debería permitirse a la compañía poner ala venta la nueva medicina si tomamos un nivel de significancia del 1%? 1. m = 98.6 n=9 x media = 99 …………….. * alfa = 1% = 0.01 2. Ho: m = 98.6 Hi: m mayor a 98.6 3. v = n-1 = 9-1 = 8 4. y 5. 6. Xc= Tc S/raíz de n + m = (2.90)(0.36/raíz de 9)+98.6 = 98.95 7. Regla de rechazo si X media es mayor a Xc entonces la Ho se rechaza 8. Conclusión como 99 es mayor a 98.95 la Ho se rechaza y la medicina no se debe poner ala venta. Apuntes de Ernie Pág. 42 Estadística II Lic. José Francisco Acuña Rendón Un psicólogo desea determinar si el tiempo de reacción tiene un promedio de 0.30 seg. Una muestra aleatoria de 25 observaciones proporciona una media de 0.27 seg. Y una desviación estándar de 0.075 seg. ¿puede llagarse a la conclusión de que el tiempo promedio de reacción es de menos de 0.30 seg. Para una significancia de 1%? 1. m = 0.30 n = 25 x media = 0.27 …………… * alfa = 1% = 0.01 2. Ho: m = 0.30 Hi: m menor a 0.30 3. v = n-1 = 25-1 = 24 4. y 5. 6. Xc= Tc S/raíz de n + m = (-2.49)(0.075/raíz de 24)+0.30 = 0.262 7. Regla de rechazo si X media es menor a Xc entonces la Ho se rechaza 8. Conclusión como 0.30 es mayor a 0.262 la Ho se acepta por lo que el tiempo de reacción es de 0.30 seg. Apuntes de Ernie Pág. 43 Estadística II Lic. José Francisco Acuña Rendón Cierto vendedor proporciona pavo a una cadena de restaurantes; afirma que el peso promedio de los pavos es mayor a 15 libras. Una muestra de 20 pavos proporciona una media de 18 libras. Con una varianza de 80 y una significación del 0.5% ¿debemos rechazar la afirmación del vendedor? 1. m = 15 n = 20 x media = 18 ……… * alfa = 1% = 0.01 2. Ho: m = 15 Hi: m mayor a 15 3. v = n-1 = 20-1 = 19 4. y 5. 6. Xc= Tc S/raíz de n + m = (1.73)(8.9/raíz de 20)+15 = 18.46 7. Regla de rechazo si X media es mayor a Xc entonces la Ho se rechaza 8. Conclusión como 18 no es mayor a 18.46 Ho se acepta por lo que la afirmación del vendedor es falsa porque el promedio sigue siendo 15, no mayor al promedio de 15 que él decía. Apuntes de Ernie Pág. 44 Estadística II Lic. José Francisco Acuña Rendón Distribución X2 (chi) Prueba de hipótesis para la desviación estándar. Son pruebas para determinar si una varianza poblacional es igual a cierto valor, mientras que una distribución observada de frecuencia es significativamente diferente a la distribución esperada o teórica. 1. Ho: T2=40,000 Hi: T2 mayor a 40,000 N = 10 S2 = 50,000 ………… * Alfa = 0.01 2. gráfica 3. v = 10 – 1 = 9 4. Xc(T) = (v=9, 0.99) = 21.7 5. S2c= X2c T2 V 6. Regla de rechazo Si S2 es mayor a Sc se rechaza la Ho 7. Conclusión Como 50,000 no es mayor a a 96,444.44 se acepta la Ho. Apuntes de Ernie Pág. 45 Estadística II Lic. José Francisco Acuña Rendón Tarea para entregar: La S2 de las estaturas en pulgadas de todos los estudiantes universitarios sale que es 30. se cree que debido a las condiciones climatológicas de Guanajuato la S2 de las estaturas pueden ser diferentes. Una muestra aleatoria de 51 estudiantes de sexo masculino tiene una varianza de 25. pruébese la Ho de que la varianza de las estaturas es la misma que la de todos los estudiantes contra la Hi de que son diferentes para una alfa de 5%. Entregada. Gris asst. Pruebas para la bondad de ajuste Utilizando la X2 de bondad de ajuste, se aprenderá a realizar inferencias acerca de la distribución de toda una población en base a la distribución obtenida en la muestra. La prueba implica la clasificación de los datos maestrales en una distribución de frecuencias observadas, están se comparan con las frecuencias esperadas que se obtienen a partir de la distribución teórica especificada. Si cierta prueba implica n observaciones; las cuáles se clasifican en j clases. Y si se utiliza la letra O para denotar la frecuencia esperada, entonces el estadístico de prueba X2 está definido por: X2 = Sumatoria de (O-E)2 E En donde la sumatoria es sobre J clases. La variable X2 como se define aquí se utiliza comúnmente como una medida de la diferencia entre las distribuciones observadas y esperadas. Cuando el tamaño de la muestra es tan grande que ninguna frecuencia esperada es menor que 5, X2 se distribuye siguiendo la distribución estándar de la X2 con (J-1) grado de libertad. A mayor desviación no se ajusta a la distribución que yo plantee. Apuntes de Ernie Pág. 46 Estadística II Lic. José Francisco Acuña Rendón V. gr. Se desea decidir si un dado cúbico está perfectamente balanceado. Con este fin se arroja 300 veces el dado. Se registran y se anotan los resultados de las tiradas. En este experimento hay 6 posibles resultados. Esto es 1, 2, 3, 4, 5, y 6. si las frecuencias observadas para estas 6 categorías son 35, 40, 32, 60, 68 y 65 respectivamente, ¿debería llegarse a la conclusión de que el dado está perfectamente balanceado con un nivel de significación del 1%? No. Clases Prob. 1 2 3 4 5 6 Sumatoria 1 2 3 4 5 6 - 1/6 1/6 1/6 1/6 1/6 1/6 6/6 = 1.0 Muestra O 35 40 32 60 68 65 300 E (O-E) (O-E)2 50 50 50 50 50 50 - -15 -10 -18 10 18 15 - 225 100 324 100 324 225 - (O-E)2 E 4.50 2.00 6.48 2.00 6.48 4.50 25.96 * 300 porque se lanzó 300 veces. Apuntes de Ernie Pág. 47 Estadística II Lic. José Francisco Acuña Rendón Actualmente los investigadores están estudiando el nivel de todos los posibles votantes en los USA, considérese que hace 12 años todos los votantes estaban clasificados en 5 categorías mutuamente excluyentes y en conjunto exhaustivas de nivel de escolaridad: 6º grado menos de 30% entre 7º y 9º grado 35% entre 10º y 12º grado 20% estudios universitarios inconclusos 10% y estudios universitarios 5% se desea decidir si los votantes hoy en día tienen el mismo patrón de nivel de escolaridad que tenían hace 12 años. Con este fin se selecciona aleatoriamente una muestra de 1,000 votantes y se encuentra que las frecuencias observadas para las 5 categorías son 270, 315, 230, 125 y 60 respectivamente. Si se tienen un nivel de significación del 5% ¿puede llegarse a la conclusión de que el patrón del nivel de escolaridad de los votantes ha cambiado? No. Clases 1 - 6º 2 7º - 9º 3 10º - 12º 4 Univ. In. 5 Univ. Sumatoria - Prob. 0.30 0.35 0.20 0.10 0.05 1.00 1,000 x c/u. Muestra O 270 315 230 125 60 1,000 E (O-E) (O-E)2 300 350 200 100 50 - -30 -35 -30 25 10 - 900 1225 900 625 100 - (O-E)2 E 3.00 3.50 4.50 6.25 2.00 19.25 * Apuntes de Ernie Pág. 48 Estadística II Lic. José Francisco Acuña Rendón Se supone que una tabla de dígitos aleatorios no es sesgada; esto es cada uno de los 10 dígitos debe tener la misma probabilidad de aparecer. Para probar si este es o no en realidad el caso, se selecciona una muestra de 100 dígitos y se obtiene los siguientes resultados: Dígitos Frecuencia 0 8 1 11 2 10 3 14 4 7 5 12 6 6 7 9 8 13 9 10 ¿Debería rechazarse la hipótesis de que los dígitos de la tabla está arreglados aleatoriamente para un alfa igual al 5%? No. Clases Prob. 1 2 3 4 5 6 7 8 9 10 Sumatoria 0 1 2 3 4 5 6 7 8 9 1 / 10 1 / 10 1 / 10 1 / 10 1 / 10 1 / 10 1 / 10 1 / 10 1 / 10 1 / 10 10/10=1.0 Muestra O 8 11 10 14 7 12 6 9 13 10 100 E (O-E) (O-E)2 10 10 10 10 10 10 10 10 10 10 - -2 1 0 4 -3 2 -4 -1 3 0 - 4 1 0 16 9 4 16 1 9 0 - (O-E)2 E 0.4 0.1 0 1.6 0.9 0.4 1.6 0.1 0.9 0 6.0 Apuntes de Ernie Pág. 49 Estadística II Lic. José Francisco Acuña Rendón Apuntes de Ernie Pág. 50
Copyright © 2024 DOKUMEN.SITE Inc.